سلام و درود
در تکمیل و واضحتر کردن توضیحات دوستمون آقای http://qa.deeplearning.ir/user/siavashbigdeli
شما فرض کنید روی تصویر ورودی که 5050 هشتش فیلتر هایی با ابعاد 33 اعمال میکنید. واضح هستش که این فیلتر ها تنها از پنجره ای با ابعاد 33 از تصویر ورودی تاثیر میپذیرد. با توجه به فرمولی که دوستمون بیان کردند.
receptive width = number_of_layers (kernel_width-1) + 1
receptive width = 1 * (3-1) + 1= 3
و بعد از اینکه فیلترها بر روی تصویر اعمال شد و خروجی های لایه اول تشکیل شد حال اگر بار دیگر در لایه دوم فیلتر های 33 اعمال کنیم آنگاه خروجی این فیلتر که یک عددمی باشد با توجه به فرمول از پنجره ای با ابعاد 55 از تصویر ورودی تاثیر میپذیرد.
receptive width = 2 * (3-1) + 1= 5
و همچنین با ادامه کار درصورتی که سه لایه کانواوشن با فیلتر های 33 بر روی تصویر ورودی اعمال شود هرکدام از نورونهای خروجی از این سه لایه از پنجره ای با ابعاد 77 از تصویر ورودی تاثیر میپذیرد.
receptive width = 3 * (3-1) + 1= 7
باید توجه کنید که عملیات max-pooling و stride هم بر روی receptive-field تاثیر گذار هستش.
برای توضیحات تکمیلی به آدرس زیر سر بزنید.
https://medium.com/@nikasa1889/a-guide-to-receptive-field-arithmetic-for-convolutional-neural-networks-e0f514068807