سلام.
رفته رفته فیچرهای بعدی روی خروجی فیچرهای قبلی کار میکنن در این بین ما یه سلسله مراتب از ویژگی ها بدست میاریم یک فیلتر یک سری فیچر ورودی دریافت میکنه که اینها هر کدوم نسبت به یک چیزی حساسیت دارن . مثلا یک فیلتر منحصرا نسبت به وجود سر و گردن حساسیت نشون میده در مرحله بالاتر یک فیلتر دیگه بدست میاد که ورودیش این فیچر و مثلا فیچر دم و... هست و بر اساس ورودی ای که دریافت میکنه یک پترنی رو بدست میده. هیچ الزامی برای وجود لایه FC وجود نداره و اینکه ما لایه FC داریم در معماری هایی مثل الکس نت یا Vggnet و امثالهم فقط بخاطر دید سنتی سابق اونهاست. قبلا در روشهای سنتی به این شکل بود که یک پایپ لاین شامل یک بخش فیچر اکستکتور بوده و یک دسته بند یا شبکه عصبی . بعد از LeNet که مبتنی بر این طرح بود مابقی هم همین مسیر رو رفتن . تو این دیدگاه به لایه های کانولوشن صرفا بعنوان بخشی برای استخراج ویژگی مناسب از ورودی نگاه میشد و بعدش یک شبکه عصبی قرار میگرفت. بعد از 2013 این طرح تقریبا کنارگذاشته شده (هرچند هنوز بعضی ها عموما ندونسته و به تقلید از معماری های اولیه یا اینتویشن سنتی این کارو میکنن) . پس وجود لایه FC هیچ ضرورتی نداره. وقتی نداشته باشه میبینید که لایه های کانولوشن هم دارن در سطح ویژگی کار میکنن . و کلا در داخل شبکه عصبی ما با مفهوم distributed representation مواجه ایم. این یعنی وجود ویژگی های مختلف در داخل شبکه و بعد ایجاد مسیر یا ارتباط بین اون ویژگی ها برای ارائه یک مفهوم جدید توسط شبکه انجام میشه. قبلا گفتیم که یکسری ویژگی های جانبی بدست داده میشن در حین ترینینگ که از اینها برای تمایز یک شی یا کلاس نهایتا استفاده میشه. اینجا دقیقا همین ویژگی ها بکار میان. شما بعنوان مثال یک شی خاص رو ندارید که شبکه بگه این یک تایر هست یا سر یک انسان اما ویژگی های جانبی دیگه (در سطوح انتزاع مختلف) ایجاد شده و از طریق این ویژگی ها شبکه براحتی میتونه ویژگی سطح بالاتر رو بدست بده برای مفاهیم جدید.
تنظیم وزنها بر اساس میزان تاثیراونها در پاسخ نهایی صورت میگیره به همین دلیل هم هست وقتی لایه اخر رو تماما رندوم میکنید و لایه قبلی رو فریزنمیکنید و شروع به فاین تونینگ میکنید شبکه بهم نمیریزه. درسته اگر لایه های قبلی فریز بشن یا میزان تغییرات در اونها با ضریب کم انجام بشه (نسبت به لایه جدید) همگرایی ممکنه سریعتر اتفاق بیوفته و این مطلب هم تو فاین تونینگ رایجه. اما ترین به صورتی که صحبتش رو کردیم هیچ موردی نداره و میتونه بسرعت به نتیجه خوب برسه. یعنی استارت اولیه رو میتونید اینطور بزنید به بیس لاینی برسید بعد میتونید استراتژی های مختلف رو استفاده کنید تو مثالهای کفی در مورد فاین تونینگ در سایت فک کنم مطلب داریم و در مورد ضرایب و.. صحبت شده اونو ببینید خوبه.
خوندن مقاله
https://arxiv.org/abs/1802.06205 پیشنهاد میشه. بطور خاص تو ورکشاپ سال قبل من بطور مفصل در مورد لایه FC و انتخاب های دیگه صحبت کردم اون رو هم گوش کنید یا ببینید خوبه.یا اگر نه خوندن مقالات NIN و سری مقالات Inception حداقلش پیشنهاد میشه تا دید بهتری در مورد پایپ لاینها و شیوه طراحی بدست بیارید.