به بخش پرسش و پاسخ یادگیری عمیق خوش آمدید,
این نسخه آزمایشی سایت است.
لطفا به نکات زیر توجه کنید:
  • برای ارتباط با مدیران میتوانید از صفحه مدیران اقدام کنید.
  • سوال و جواب ها باید به زبان فارسی باشند. استفاده از زبان انگلیسی یا فینگلیش برای پاسخ دادن مجاز نیست.
  • لطفا بعد از پرسش سوال لینک سوال خود را در گرو تلگرام (Iran Deep Learning Group) معرفی کنید تا سریعتر به جواب برسید. برای دسترسی به آخرین لینک از منابع یادگیری استفاده کنید
  • لطفا بجای عکس از متن استفاده کنید. اگر متون طولانی هستند از سایت pastebin.com برای اپلود استفاده کرده و لینک حاصل را در سوال خود قرار دهید. برای قرار دادن تصویر ، از بخش ارسال تصویر ادیتور سایت استفاده کنید.
  • بعد از دریافت پاسخ، بهترین پاسخ را از طریق کلیک بر روی علامت تیک انتخاب کنید
  • اگر با خطا و یا مشکلی مواجه شدید از بخش تماس با ما در انتهای صفحه و یا ایمیل Coderx7@gmail.com موضوع را اطلاع دهید.

با تشکر

دسته بندی ها

0 امتیاز

با عرض سلام و وقت بخیر
پیرو مطالعاتی که در مورد معماری جدید شافل نت انجام دادم متوجه شدم که در این معماری ا ز نوعی کانولوشن نقطه ای استفاده کرده که آن را کانولوشن گروهی نقطه ای تعریف نموده . حالا می خواستم بدونم آیا این دو لفظ با هم فرق دارند ؟ تفاوت آنها در چیست؟

توسط (219 امتیاز)
ویرایش شده توسط
لینک به مقاله رو هم لطفا قرار بدید
لینک مقاله مورد نظر:
https://arxiv.org/abs/1707.01083

1 پاسخ

+1 امتیاز
 
بهترین پاسخ

سلام pointwise group convolution همون group convolutionیی هست که روی کرنلهای با اندازه 1در1 اعمال میشه
pointwise convolution هم اشاره به همون کانولوشن 1در1 داره .
در معماری هایی مثل موبایل نت و... گروپ کانولوشن یا همون depth wise convolution روی کرنل های 1در1 اعمال نمیشدن اینجا اومدن این کارو انجام دادن و اینطور سربار محاسباتی رو بیشتر کاهش دادن

توسط (4.3k امتیاز)
انتخاب شده توسط
سلام . بله عمق یک توده مساوی تعداد کانال ها یا تعداد فیچرمپ های اون توده  است . و وقتی صحبت از شافل میکنه منظورش شافل همین فیچرمپهاست.
اون عددها تعداد کانال خروجی هستن . مثلا یک عکس ۳ کانال داره. لایه کانولوشن اول ۲۴ فیچرمپ تولید میکنه
به همین ترتیب در ادامه ۱۴۴ در استیج  ۲ تعداد فیچرمپها رو نشون میده و الی اخر
اون ۲۴ هم تعداد فیچرمپهای اون لایه اس که بالا عرض کردم
ردیف سوم منظور چیه ؟‌همونایی که همه ۲۴ هستن ؟ اونا همه تعداد فیچرمپ ها هستن. بالای هرکدوم از اون ۲۴ ها رو که نگاه کنید میبینید هرکدوم اونا مخصوص یه پیکربندی جداگانه اس. یکی g=1 یکی g=2 و همینطور الی اخر که اخری g=8 هست
بله اونا همه شافل یونیت هستن که پشت سر هم قرار گفتن
بله خروجی اون واحد ۲۸در۲۸ بوده که رفته به یونیت بعدی و الی اخر
نتیجه ای که من گرفتم اینکه اعداد زیر ستونی مثل g=3 که عبارتند از 3,24,240,480و960در واقع تعداد فیلترهایی است که اعمال کرده(این درسته که بگم 24 تا گروه 3 تایی یا باید بگم 3 تا گروه 24 تایی , یا مثلا 240 تا گروه 3 تایی یا 3 تا گروه 240 تایی) و البته در مورد  چرایی و چگونگی (بر چه اساسی) انتخاب این تعداد فیلترحرفی زده نشده است . درسته؟
نه گروه شما مشخص هست . ۳ تا ست . اما ورودی اونها تقسیم میشن . مثلا ۲۴ تا بین سه گروه تقسیم بشه ۸ تا کانال ورودی به هر گروه وارد میشه . بقیه هم به همین شکل.
شما بخش 3.3 Network Architecture رو بخونید مشخص هست کاملا فیلترهای هر لایه رو دو برابر لایه قبلی انتخاب کرده. تقلید از resnet کرده و در ادامه هم خودشم توضیح داده اونجا که داستان چیه
...