به بخش پرسش و پاسخ یادگیری عمیق خوش آمدید,
این نسخه آزمایشی سایت است.
لطفا به نکات زیر توجه کنید:
  • برای ارتباط با مدیران میتوانید از صفحه مدیران اقدام کنید.
  • سوال و جواب ها باید به زبان فارسی باشند. استفاده از زبان انگلیسی یا فینگلیش برای پاسخ دادن مجاز نیست.
  • لطفا بعد از پرسش سوال لینک سوال خود را در گرو تلگرام (Iran Deep Learning Group) معرفی کنید تا سریعتر به جواب برسید. برای دسترسی به آخرین لینک از منابع یادگیری استفاده کنید
  • لطفا بجای عکس از متن استفاده کنید. اگر متون طولانی هستند از سایت pastebin.com برای اپلود استفاده کرده و لینک حاصل را در سوال خود قرار دهید. برای قرار دادن تصویر ، از بخش ارسال تصویر ادیتور سایت استفاده کنید.
  • بعد از دریافت پاسخ، بهترین پاسخ را از طریق کلیک بر روی علامت تیک انتخاب کنید
  • اگر با خطا و یا مشکلی مواجه شدید از بخش تماس با ما در انتهای صفحه و یا ایمیل Coderx7@gmail.com موضوع را اطلاع دهید.

با تشکر

دسته بندی ها

0 امتیاز

حداقل تعداد تصاویر برای یادگیری عمیق به منظور آشکار سازی ساختمان (برای یک کلاس مانند ساختمان )چقدر باید باشدو Batch size چی هست آیا همون حداقل تعداد تصویر لازم برای یادگیری است . تفاوت error 1 و error50 و objective چی است. من هر کاری می کنم error1 به کمتر از 16 درصد نمی رسه. از معماری cifar و alex استفاده کردم ولی خطا کمتر نمیشه داده تصویری من حدود 16000 تصویر RGB است

توسط (100 امتیاز)

1 پاسخ

+2 امتیاز

سلام
زمانی که دیتای شما کم باشه (این کم بودن با توجه به مدل و نوع دیتا میتونه متفاوت باشه) از فاین تونینگ باید استفاده کنید
بچ سایز اشاره به اندازه دسته داره. منظور دسته ای از تصاویر هست یا به عبارت بهتر چندتا تصویر باهم به شبکه ارائه میشه بجای اینکه هربار یک تصویر به شبکه داده بشه و شبکه تنظیم بشه شما اندازه این دستهع یا در اصل تعداد تصاویری که باهم به شبکه ارسال میشن رو مشخص میکنید . اینکه چرا اینکارو میکنیم و یا داستانش دقیقا چی هست رو میتونید از سوالهای مشابه ای که قبلا پرسیده متوجه بشید.
خطای 1 و 50 رو درست متوجه نشدم اگه منظور شما iteration باشه که در اینصورت اون اشاره به خطای شبکه در تکرار اول و پنجاهم هست. در هر تکرار یک دسته از تصاویر به شبکه ارائه میشه و خطایی که میگیرید مربوط به اون دسته از تصاویر هست.
اگر خیلی ساده بخواییم بگیم ابجکتیو منظور همون تابع خطا یا هزینه شماست که با کاهش اون به هدف یا به دقت بالاتر میرسید.
سیفار معماری نداره . اگه منظور شما مثالهای خود کفی هست که اون یک معماری نمونه اس و برای اینکه دقت مناسب بگیرید باید موارد مختلفی رو رعایت کنید. معماری الکس نت هم نه تنها خیلی غیربهینه اس بلکه تعداد پارامتر خیلی زیادی داره که برای این تعداد داده شما اصلا مناسب نیست.
بهترین کار انجام فاین تونینگ هست . میتونید با استفاده از squeezenet که یک مدل خیلی سبک و همرده الکس نت هست فاین تون رو انجام بدید و بعد در صورت نیاز از معماری های بهتر استفاده کنید.

توسط (4.3k امتیاز)
من از کدهای  matconvnet  استفاده می کنم اونجا مدلی است به نام cifar که البته شبیه سازی شده کفی است
سلام .
فاین تونینگ یعنی استفاده از یک مدل از پیش اموزش داده شده که توضیحاتش در سایت اصلی و همینجا به کرات داده شده که میتونید مطالعه کنید.
ایده فاین تونینگ اینه که از مدلهایی که روی تصاویر مشابه شما اموزش دیدن استفاده بشه اما از اونجایی که مدلهای از پیش اموزش دیده روی دیتاست ایمیج نت دسته زیادی از اشیاء رو در برمیگیرن گستره خیلی خوب و با کیفیتی از فیلترهای مناسب رو هم یادگرفتن که در اکثر کارها مورد استفاده قرار میگیرند. به همین دلیل بدون استثنا اولین کاری که همیشه باید بکنید استفاده از فاین تونینگ هست.
در مورد مت کانونت هم همین الان پیشنهاد میکنم کنارش بزارید وگرنه بعدا پیشیمون میشید.
از نظر جامعیت قابل قیاس با سایر فریم ورکها و ترند روز نیست.  یادگیری و منابع برای پایتون و فریم ورکهای دیگه خیلی خیلی بیشتر هست در حدی که اصلا قابل قیاس با متلب نیست. و مهمتر از همه عدم پشتیبانی درست مت کانونت هست. خیلی ساده نگاهی به سوالات کسایی که اینجا یا در اینترنت در مورد مت کانونت داشتند بندازید تا متوجه بشید.
میتونید از همین سایت اقدام کنید یا از ایمیل coderx7@gmail.com استفاده کنید
...