اول از هر چیز، خیلی ممنونم بابت وقتی که گذاشتید.
1- منظور شما از ضریب، همون فاکتور لاندایی هست که به مجموع مربعات وزن ها ضرب میشه!؟
و اما لینکی که گذاشته بودید رو کامل مطالعه کردم حتی لینکهای داخل همون مطلب رو هم مطالعه کردم که یکیش فصل دو کتاب آقای نیلسن بود. ولی جوابی برای سوال دومم پیدا نکردم! ببینید در متد BP، در رابطه محاسبه مقدار بروزرسانی وزن ها، متغیری به نام Z (که برابر W * X است) موجوده. یعنی این که ورودی تاثیر مستقیم روی این مقدار داره. حالا سوال من اینجاس ( شاید هم من Parameter sharing رو بد متوجه شدم!) که اگر منظور ما از Parameter Sharing این هست که بجای استفاده از بفرض مثال 20 تا نورون با وزن های متفاوت در هر برش از عمق فیلتر ها،20 نورون با وزن مشترک بکار ببریم، پس تو بروزرسانی وزن ها به یک تناقض میخورم. تناقض اینجاست که در صورت استفاده از یک نورون، میاییم نورون رو روی عکس لغزش میدیم (با فاکتور Stride). پس عملا برای هر وزن نورون، موقع پیمایش یک عکس چند تا ورودی خواهیم داشت. امیدوارم منظورم رو تونستم برسونم! یعنی اینکه پس توی رابطه مقدار بروزرسانی وزن(Delta W)، بجای Z (که ورودی هست) چه چیزی رو قرار میدیم؟ میانگین ورودی به اون نورون یا ... ؟؟
باز هم ممنون از وقتی که میذارید.