سلام و وقتتون بخیر
چندتا سوال دارم از مقاله ای که توی وبلاگ زیر قرار داده شده:
سال 2016 در یک نگاه-SqueezeNet-.بخش پنجم
1-در این متن نوشته شده که
در این مقاله از سه استراتژی برای کاهش تعداد پارامتر ها و افزایش دقت استفاده میشود که در نتیجه حجم شبکه به کمتر از یک مگابایت کاهش پیدا میکند.
این سه استراتژی کامل بیان نشده ؟!!!!! الف) جایگزین کردن فیلتر های 3×3 با فیلتر های 1×1 ب) کاهش تعداد کانال های ورودی برای فیلتر های3×3 باقیمانده. استراتژی سوم چیه؟
2- این که نوشته " فیلتر های3×3 باقیمانده." منظور از باقی مانده چیه ؟ کدوم فیلترها ! لطفا بیشتر توضیح دهید.
3- " در این مقاله به جای استفاده از لایه تماما متصل سنتی آنها روشی به نام global average pooling را پیشنهاد دادند ، در شبکه هایی که از لایه تماما متصل برای کلاسهای بندی استفاده میکنند خروجی feature maps بعد از الحاق به یکدیگر به sofmax داده میشوند اما در این روش به ازای هر کلاس یک feature map بعد از آخرین لایه mlpcov تولید میشود به جای اضافه کردن یک لایه تماما متصل در بالای feature map ها آنها از feature map ها سود میبرند و نتایج بردار ویژگی مستقیما به softmax داده میشوند . یکی از ویژگی هایش این لایه نبودن مشکل بیش بر ارزش به علت عدم وجود پارامتری برای بهینه سازی است و از طرفی این لایه نسبت به تغییرات محلی مقاوم تر و با اصل شبکه هایش کانولوشن سازگارتر است." این پاراگراف رو متوجه نمی شم می شه لطفا بیشتر توضیح بدید
4-در جواب به تفاوت ایده در معماری ها این مطلب نوشته شده که: " این تفاوت ها را میتوان از سه دیدگاه بررسی کرد". کدام سه دیدگاه لطفا واضح تر بیان کنید . 1- معماری و چی؟!!!(مابقی دیدگاه ها چه هستند؟)
متشکرم