ببینید من درست متوجه شدم که در در بلاک های متراکم و لایه انتقال چه اتفاقاتی می افته.
1- لایه L ام نقشه های ویژگی همه لایه های قبلی را به عنوان ورودی دریافت می کند و آنها به صورتی کنار هم قرار می دهد(کنار هم ردیف می کنه) که همه ان ماتریس ها به یک تک تنسور (منظورش همون ماتریس سه بعدیه؟؟؟ می شه توضیح بدید چه طوری این اتفاق می افته ؟؟؟)تبدیل می شوند .
2- سپس در همان بلوک متراکم, تابع مرکبی شامل نرمالیزاسیون , relu و کانولوشن 3*3 روی آن تنسور اعمال می کند( با اینکار ابعاد تنسور را نیز کاهش می دهد درسته؟؟؟؟؟) البته برای اینکه بتواند به نتیجه این الحاق (تنسورسازی) اعتماد کند از عملیات پولینگ نیز در این میان (قبل از ورود به بلوک متراکم و در لایه انتقال) استفاده می کند تا بتواند سایز نقشه های ویژگی را یکی کند.
3- در لایه انتقال علاه بر اعمال نرمالیزاسیون و پولینگ, از کانولوشن 1*1 هم استفاده شده است (آیا دلیل استفاده از این سایز از کانولوشن (1*1)کم کردن عمق همان تعداد نقشه ویژگی است؟؟؟؟ (یعنی هرچندتا که بودند به 12 عدد برسند!!!!! ) )
4- در ادامه توضیحات مقاله یک نرخ رشد تعریف شده به اسم k , که ظاهرا حرفی از اینکه این تعداد (12) چه طور انتخاب شده زده نشده و به نظر یک عدد تجربی می رسه . درسته ؟؟!! (چه جوری می شه تعداد خروجی رو روی یک عدد مثل 12 فیکس کرد؟؟؟/)
5-در ادامه نیز برای فشرده سازی بیشتر مدل ضریب تتایی که عددی بین 0 و 1 است تعریف کرده و هربار در لایه انتقال تعداد نقشه های ویژگی را در آن ضرب کرده و نتیجتا تعداد آنها را کاهش داده است .