آقای حسن پور خسته نباشید
بنده مقاله مربوط به شافل نت رو چندین مرتبه خوندم ولی هنوز خیلی برام گنگه از آخرین جوابی که بهم دادی متوجه شدم شما می تونید به بنده کمک کنید . سوالات خودمو رو می پرسم لطفا کمکم کنید .
1- ببینید شکل شماره دو مقاله در قسمت سوم که واحد شافل نت رو معرفی کرده رو درست متوجه شدم. یک مسیر میانبر داریم و یک مسیر اصلی, در مسیر میانبر فقط یک ادغام کننده میانگیر(ave pooling) با گام 2 قرار داده(stride)، در مسیر اصلی مثلا اگر فرض کنیم تصویر ورودی ما 7*7 با عمق 5 باشد خروجی بلوک اول که یک کانولوشن نقطه ای است یک تصویر 5*5 با عمق یک خواهد بود بعد از نرمالسازی مقادیر این خروجی و عبور آن از یک تابع غیر خطی ؛ مقادیر این ماتریس بر (shuffel)می خورند(به صورت تصادفی قاطی می شوند) خروجی آن نیز یک ماتریس با سایز 7×7 با عمق یک است سپس کانولوشن گروهی با سایز 3×3 و با طول گام 2 روی آن اعمال می شود که نتیجه یک ماتریس 2×2 خواهد بود که مجددا نرمالسازی شده و بعد از آن یکبار دیگر کانولوشن نقطه ای رو اعمال کرده تا بگفته خودش از لحاظ اندازه با مسیر میانبر انطباق داشته باشه . ولی الان که اینطور نیست میانبر تصویر 5×5 با عمق 3 است در حالیکه مسیر اصلی یک تصویر 2×2 با عمق یک است؟ (فکر کنم مفهوم Gconv چیزه دیگه ای می شه توضیحش بدید)
2- Concat یا پیوند زدن به چه مفهومی است؟ یعنی دو خروجی را درون یک ماتریس می ریزد؟
3- می شه لطفا یه توضیح هم راجع به جدول 1 بدید
3-1- سایز K چیه؟
3-2- منظورش از اون شماره 2 ،3و 4 ی که جلوی استیج گذاشته چیه؟ اگه منظور طول گام اون کانولوشن عمقی است پس اون طول گامی که توی یک ستون مجزا نوشته چیه ؟
3-3- منظورش از g تعداد کدوم گروهه؟ ایا همون عمق است ؟
4- ویه سوال دیگه ،این مدل شبکه الان در دسترس هست که بشه فقط با یه تیون کردن و یه سری تغییرات کوچیک روی واحد های شافلش اون رو استفاده کرد؟
لینک مقاله
https://arxiv.org/abs/1707.01083
بسیار ممنون