به بخش پرسش و پاسخ یادگیری عمیق خوش آمدید,
این نسخه آزمایشی سایت است.
لطفا به نکات زیر توجه کنید:
  • برای ارتباط با مدیران میتوانید از صفحه مدیران اقدام کنید.
  • سوال و جواب ها باید به زبان فارسی باشند. استفاده از زبان انگلیسی یا فینگلیش برای پاسخ دادن مجاز نیست.
  • لطفا بعد از پرسش سوال لینک سوال خود را در گرو تلگرام (Iran Deep Learning Group) معرفی کنید تا سریعتر به جواب برسید. برای دسترسی به آخرین لینک از منابع یادگیری استفاده کنید
  • لطفا بجای عکس از متن استفاده کنید. اگر متون طولانی هستند از سایت pastebin.com برای اپلود استفاده کرده و لینک حاصل را در سوال خود قرار دهید. برای قرار دادن تصویر ، از بخش ارسال تصویر ادیتور سایت استفاده کنید.
  • بعد از دریافت پاسخ، بهترین پاسخ را از طریق کلیک بر روی علامت تیک انتخاب کنید
  • اگر با خطا و یا مشکلی مواجه شدید از بخش تماس با ما در انتهای صفحه و یا ایمیل Coderx7@gmail.com موضوع را اطلاع دهید.

با تشکر

دسته بندی ها

0 امتیاز

سلام
و با عرض تشكر از شما به خاطر مطالب مفيدتون .
متاسفانه من اين قسمت رو متوجه نمي شم ممنون مي شم اگه امكانش هست يكم بيشتر توضيح بديد
""شامل نورونهایی است که در سه بعد عرض, ارتفاع و عمق قرار گرفته اند(مرتب شده اند).(دقت کنید که کلمه عمق در اینجا اشاره به بُعد سوم یک توده فعال سازی (activation volume)[3] دارد و به معنای عمق یک شبکه عصبی کامل که به معنای تعداد لایه های موجود در آن است نمیباشد.""
يكم بيشتر شكل شبكه عصبي كانولوشن رو توضيح بديد ممنون مي شم

توسط (100 امتیاز)
برچسب گذاری دوباره توسط

3 پاسخ

+2 امتیاز

سلام .
عمق توی شبکه های عصبی عمیق به این نکته اشاره داره که ورودی شبکه مثلا یک تصویر است و یک تصویر دارای عمق هست و خب تصویر هم همان ورودی شبکه یا توده فعال ساز به حساب میاد . بنابراین عمق در این جا به تعداد لایه های شبکه اشاره نداره .

توسط (128 امتیاز)
0 امتیاز

سلام .
در شبکه کانولوشن ما با توده های سه بعدی سرو کار داریم . در شبکه های عصبی معمولی (mlp) ما تو هر لایه فقط یکسری نورون داشتیم . مثلا میگفتیم لایه اول ۱۰ تا نورون داره یا ۵ تا نورن داره . لایه دوم مثلا ۲۰ تا نورون داره و الی اخر . و این نورون ها هم همه بهم متصل بودن.
یعنی مثلا نورون شماره ۱ به همه نورونها از مرحله قبل وصل بود . و وقتی اسمی از عمق میومد به معنای تعداد لایه های موجود در شبکه عصبی ما بود.
در شبکه کانولوشن (لایه کانولوشن) اینطور نیست یکم ماجرا فرق میکنه. اینجا ما نورونهایی در سه بعد داریم . یعنی یه اندازه مکانی داریم که اشاره به ابعاد توده داره مثلا ۳*۳ و یک عمق داریم که اشاره به عمق این توده داره مثلا ۱۲ که میشه ۳x3x12 . اون ۱۲ یا عمق در اصل تعداد فیچرمپهای خروجی لایه کانولوشن هست (به عبارت دیگه میشه گفت تعداد نورون هایی که در آن واحد به یک ناحیه خاص از ورودی نگاه میکنن هست که نتیجه اش میشه یک فیچر مپ به ازای هر نورون)
بعد این نورون ها هم با یک مکانیزم محلی روی ورودی اعمال میشن و خروجیشون هم تشکیل یک توده سه بعدی دیگه رو میده .
ادامه آموزش رو بخونید همه اینها مشخص میشه. خصوصا وقتی به بخش دوم برسید یک مثال عملی هم هست که میتونید ببینید عینا چه اتفاقی داره میوفته تقریبا.

نکته مهم:
این سه بعدی بودن توده ها ربطی به سه کاناله بودن تصویر ورودی نداره. عمق لایه کانولوشن یک فراپارامتر هست که توسط ما مشخص میشه و بطور موثر مشخص کننده تعداد فیلترهای اعمال شونده روی توده ورودی هست.(توده ورودی میتونه یک عکس سیاه و سفید باشه میتونه یک سیگنال باشه و... و میتونه نتیجه حاصل از محاسبات از مرحله قبل (لایه های کانولوشن و یا تماما متصل قبل از خودش باشه)

این مثال بخشی از بخش دوم آموزش شبکه کانولوشن هست :

در این قسمت ما نحوه فعالیت صورت گرفته در یک لایه کانولوشن را گام بگام
توسط تصویر نشان میدهیم . بخاطر اینکه نمایش حجم های سه بعدی کمی مشکل
است تمام توده های سه بعدی (توده ورودی (با رنگ آبی ) , توده وزن ها ( با
رنگ قرمز) و توده خروجی (با رنگ سبز) ) بصورت برش هایی نمایش داده شده
اند. اندازه توده ورودی برابر با W1 = 5, H1 = 5,D1= 3 میباشد( به ترتیب
معرف عرض, ارتفاع و عمق) , پارامترهای لایه کانولوشن نیز به ترتیب برابر
با K=2 , F = 3 , S = 2 و P =1 میباشند که به معنای آن است که ما دو
فیلتر با اندازه ۳×۳ داریم که با گام (stride) S =2 بر روی توده ورودی
اعمال میشوند. بنابر این اندازه توده خروجی ما هم برابر با ۳=۱+
۲/(۲+۳-۵) خواهد بود. علاوه بر این , توجه کنید که عمل Padding با مقدار
P=1 بر روی توده ورودی اعمال شده که این عمل باعث ۰ شدن مرز های بیرونی
توده ورودی شده است. در تصاویر زیر میبینید که تعداد تکرار عملیات به
اندازه تعداد عناصر موجود در توده خروجی( به رنگ سبز) است در تصویر
مشاهده میکنید که هر عنصر در توده خروجی از ضرب عنصر به عنصر توده وزن
(ماتریس وزن برنگ قرمز ) با توده ورودی (برنگ آبی) و سپس جمع تمامی عناصر
با هم و نهایتا افزودن بایاس به نتیجه نهایی بدست می آید.(Convolution)
بعنوان مثال برای عنصر اول توده خروجی داریم :

( (۰*-۱)+(۰*-۱)+(۰*۰)+(۰*-۱)+(۲*۰)+(۱*-۱)+(۰*-۱)+(۱*۰)+

(۰*۰))+( (۰*۱)+(۰*۱)+(۰*-۱)+(۰*-۱)+(۰*۰)+(۰*۰)+(۰*۰)+(۲*۱)+

(۰*۰))+( (۰*۰)+(۰*-۱)+(۰*۱)+(۰*۱)+(۲*۱)+(۱*۰)+(۰*۱)+(۰*۰)+

(۰*-۱) )+۱=۴

enter image description here

توسط (4.3k امتیاز)
0 امتیاز

تصویر سه کانال رنگ دارد و ماتریس ما می‌تواند سه‌بعدی باشد. یعنی همزمان درایه‌های سه رنگ ضرب داخلی می‌شوند و یک خروجی تولید می‌کنند. برای فیلترهای دیگر هم همین کار می‌تواند انجام شود. پس ماتریس ما عمق هم دارد و سه‌بعدی است.

توسط (105 امتیاز)
نمایش از نو توسط
...