با سلام و تشکر از عزیزانی که وقت گرانبهاشون رو برای پاسخ گویی در اختیار قرار میدن...
چندتا سوال در مورد شبکه کانولوشنی داشتم که ممنون میشم راهنمایی بفرمایید.
1-چرا در معماری الکس نت از 5 تا لایه کانولوشنی و 3 تا لایه تماما متصل استفاده شده؟ مثلا چرا از 2 تا لایه کانولوشنی استفاده نشده؟ و همچنین چرا در لایه تماما متصل آخر از 2 تا لایه تماما متصل استفاده شده ؟ اون لایه اخر که 1000 تا خروجی میده ، از نوع تماما متصل هست ؟ آیا با این کار ویژگی ها بهتر تفکیک میشن؟
2-loss در این معماری الکس نت به چه صورت هست؟ فرقش با cost function در چی هست و از چه تابعی برای محاسبه خطای دسته بندی استفاده میشه؟ اینکه softmax کار دسته بندی را انجام میدهد یا فقط دسته برنده توسطش اعلام میشه؟ دسته بندی توسط fully connected هست ؟
3-در این معماری الکس نت معمولا تصاویر به صورت 3 بعد به شبکه داده میشوند ، اما در کارهای پزشکی از این شبکه استفاده میشه و تصاویر پزشکی به صورت gray scale هستند و تنها یک کانال دارند ، اما میان و این یک کانال رو 3 بار تکرار میکنن و به شبکه به عنوان وروردی میدهند ، خب این کار چه توجیهی داره که تصویر پزشکیمون 3 کاناله بشه ؟
4-در آموزش سایت نوشته شده که فیلترها در مقابل بعضی فعال سازی ها ویژگی ها رو یاد میگیرند و نورون ها یاد میگیرند که برای ویژگی های مختلف فعال شوند ... این جمله یعنی چی و اینکه چطوری یاد میگیرند ؟ مثلا در لایه اول که 96 برش عمقی داریم و 55 * 55 تا نورون در هر برش عمقی که اینها تماما از یک مجموعه وزن استفاده میکنند و به همین دلیل بهشون فیلتر میگیم و 96 تا فیلتر داریم و بعد از اینکه تصویر ورودی با تمام این 96 تا فیلتر کانوالو شد ، و 96 توده فعال سازی آماده شد ، روی هم قرار میگیرند و تشکیل یک توده خروجی رو میدهند و بعد به لایه رلو میروند...فیلترها چه چطوری یاد میگیرند؟ چه چیزی یاد میگیرند؟ میشه یه مقدار جزئی تر توضیح بدید...