سلام
در شبکه های cnn در هنگام تعریف فیلتر ها» مقادیر وزنها را رندم و معمولا از تابع truncated_normal با میانگین صفر و واریانس 0.1 استفاده می شود. آنگاه تابع truncated_normal نمونه ها را از توزیع نرمال با میانگین صفر با واریانس 2sigma- و 2sigma+ تولید می کند. این یعنی وزن ها نرمال و با میانگین صفر هستند. و این به عمل یادگیری کمک میکند.
می توان حالت های دیگر را هم اعمال کرد مثلا (2-و2) یا (1+ و0) ولی اگر وزن ها با میانگین صفر و بین (1+و1-) باشد عمل یادگیری سریعتر انجام می شود.