Deprecated: Function get_magic_quotes_gpc() is deprecated in /home/ustmbir/domains/deeplearning.ir/public_html/qa/qa-include/qa-base.php on line 1177
مشکل آموزش SSD در MatConvNet - پرسش و پاسخ یادگیری عمیق
به بخش پرسش و پاسخ یادگیری عمیق خوش آمدید,
این نسخه آزمایشی سایت است.
لطفا به نکات زیر توجه کنید:
  • برای ارتباط با مدیران میتوانید از صفحه مدیران اقدام کنید.
  • سوال و جواب ها باید به زبان فارسی باشند. استفاده از زبان انگلیسی یا فینگلیش برای پاسخ دادن مجاز نیست.
  • لطفا بعد از پرسش سوال لینک سوال خود را در گرو تلگرام (Iran Deep Learning Group) معرفی کنید تا سریعتر به جواب برسید. برای دسترسی به آخرین لینک از منابع یادگیری استفاده کنید
  • لطفا بجای عکس از متن استفاده کنید. اگر متون طولانی هستند از سایت pastebin.com برای اپلود استفاده کرده و لینک حاصل را در سوال خود قرار دهید. برای قرار دادن تصویر ، از بخش ارسال تصویر ادیتور سایت استفاده کنید.
  • بعد از دریافت پاسخ، بهترین پاسخ را از طریق کلیک بر روی علامت تیک انتخاب کنید
  • اگر با خطا و یا مشکلی مواجه شدید از بخش تماس با ما در انتهای صفحه و یا ایمیل Coderx7@gmail.com موضوع را اطلاع دهید.

با تشکر

دسته بندی ها

0 امتیاز

با سلام
من از طریق کد mcnSSD که برای MatConvNet نوشته شده سعی دارم شبکه SSD را آموزش بدهم و فعلا هم همان دیتاست استاندارد voc را برای اینکار استفاده می کنم. مشکلی که در حین آموزش به آن بر می خورم اینست که مقدار loss که به ازای هر batch نوشته می شود برابر با NaN است. من از فایل ssd_pascal_train که توسط نویسنده کد برای آموزش ارائه شده استفاده کرده ام و تمام تنظیمات هم همان پیش فرض خود کد هستند.
لطفا اگر کسی تجربه آموزش SSD در MatConvNet دارد مرا راهنمایی نماید.

با تشکر

تصویر زمان آموزش:

توسط (105 امتیاز)

1 پاسخ

0 امتیاز

سلام من شخصا کار نکردم اما از دلایلی که با nan برخورد میکنید میتونه مشکل در تصاویر شما (یا پیش پردازش) و یا نرخ یادگیری بالا و یا مقداردهی اولیه بد باشه (اگر از بچ نرم خصوصا استفاده نشه )
این موارد رو چک کنید و نهایتا یک ایشو همونجا ایجاد کنید تا زمان زیادی بابت دیباگش صرف نکنید

توسط (4.3k امتیاز)
سلام
تصاویر استفاده شده همان تصاویر voc هستند و خط به خط که دیباگ کردم مشکلی در لود کردن تصاویر و اطلاعاتش ندیدم. در مورد پیش پردازش و پارامترهای دیگری که شما گفتید من هیچ تغییری در کد اصلی نداده ام (تنها تفاوت اینست که من بجای GPU حالت CPU را انتخاب کردم چون کارت گرافیک ندارم) . نویسنده کد هم در  readme صفحه github گفته که با همین کد آموزش داده و به دقت  شبیه caffe رسیده است. به خودش که ایمیل زدم هم جوابی به من نداد.
کدهای بخش آموزش و محاسبه loss هم در مورد شبکه های object detection اینقدر تودرتو و پیچیده است که نتونستم با دیباگ بفهمم کجای کار داره Nan را تولید میکنه.
در مورد کاهش نرخ یادگیری هم من آن را تست کردم و مقادیر 0.0001 و 0.00001 را نیز بکار بردم اما فرقی نکرد.
و بجای ایمیل دادن یه issue جدید تو همون ریپازیتوری ایجاد کنید. ضمنا چندبار تکرار کنید اگه بواسطه مقداردهی اولیه باشه (این شایع هست) طی چند تکرار باید از این مساله رد بشید. یک نکته دیگه هم شاید دخیل باشه نصب مشکل دار مت کانونت هست. (یا به مشکل خوردن) یکی از کاربرا دقیقا بخاطر همین مشکل مت کانونت به مشکل اساسی خورده بود و معماری ای که باید دقت بالای 90 میگرفت بصورت رندم دسته بندی میکرد. حتما این بحث رو چک کنید چون مسبوق به سابقه اس در مورد مت کانونت
...