Hi, 请问可以解释一下为什么Conv2D中: weights_scale = math.sqrt(reduce(lambda x, y: x * y, shape) / self.output_channels), 这个weights_scale的作用和它为什么这么计算吗?
Hi,
请问可以解释一下为什么Conv2D中:
weights_scale = math.sqrt(reduce(lambda x, y: x * y, shape) / self.output_channels),
这个weights_scale的作用和它为什么这么计算吗?