به بخش پرسش و پاسخ یادگیری عمیق خوش آمدید,
این نسخه آزمایشی سایت است.
لطفا به نکات زیر توجه کنید:
  • برای ارتباط با مدیران میتوانید از صفحه مدیران اقدام کنید.
  • سوال و جواب ها باید به زبان فارسی باشند. استفاده از زبان انگلیسی یا فینگلیش برای پاسخ دادن مجاز نیست.
  • لطفا بعد از پرسش سوال لینک سوال خود را در گرو تلگرام (Iran Deep Learning Group) معرفی کنید تا سریعتر به جواب برسید. برای دسترسی به آخرین لینک از منابع یادگیری استفاده کنید
  • لطفا بجای عکس از متن استفاده کنید. اگر متون طولانی هستند از سایت pastebin.com برای اپلود استفاده کرده و لینک حاصل را در سوال خود قرار دهید. برای قرار دادن تصویر ، از بخش ارسال تصویر ادیتور سایت استفاده کنید.
  • بعد از دریافت پاسخ، بهترین پاسخ را از طریق کلیک بر روی علامت تیک انتخاب کنید
  • اگر با خطا و یا مشکلی مواجه شدید از بخش تماس با ما در انتهای صفحه و یا ایمیل Coderx7@gmail.com موضوع را اطلاع دهید.

با تشکر

دسته بندی ها

0 امتیاز

سلام
دوستانی که object detection کار میکنند لطف کنند به این سوال پاسخ دهند
اینکه چرا به این شبکه end-to-end گفته میشه ؟ مگه external region proposal در ترینینگ این دخیل نیست ؟ من تا جایی که درک میکنم به شبکه هایی باید end-to-end گفته شود که تمامی کامپونت های اون باهم دیگه از سر تا ته قابل یادگیری باشند وقتی اینجا region proposal بصورت external هست چرا باز هم end-to-end گفته میشود ؟
معماری این اینطوری هست
ابتدا فیچرها توسط CNN درآورده میشوند بعدش external region proposal اعمال میشود و بعدش میره قسمت svm , B.B reg
چجوری تریننیگ این end-to-end هست؟

توسط (389 امتیاز)

1 پاسخ

+1 امتیاز
 
بهترین پاسخ

سلام.
نسخه R-CNN اوایه برای طبقه بندی از SVM استفاده میکرد. در واقع به این صورت بود که شبکه کانولوشنی رو که روی imagenet قبلا pretrain شده بود دوباره روی دیتای detection (مثلا VOC که 20 کلاسه) با head نوع softmax ترین میکردن و بعدش از شبکه ترین شده به عنوان feature extractor برای SVM استفاده میکردن و تسک نهایی رو SVM انجام میداد.
تو نسخه Fast یه سری اصلاحات ایجاد کردن و کلا SVM رو حذف کردن. و در واقع از همون softmax استفاده کردن. در واقه ترین R-CNN عادی که چند مرحله ای بود (ترین با softmax به علاوه طبقه بندی با SVM) رو یک مرحله ای کردن و کل پروسه (به جز انتخاب region proposals) رو در یک شبکه یکپارچه کردن. (البته کماکان انتخاب ناحیه های پیشنهادی با روشهای قبلی انجام میشد ولی فرقش این بود که هر ناحیه رو جداگانه به شبکه forward نمیکرد و کل عکس رو یک بار فوروارد میکرد و در لایه آخرین کانولوشن(feature map) ناحیه ها رو جدا میداد به ادامه شبکه و با این کار در محاسبات لایه های کانولوشن صرفه جویی میکرد).
نسخه fast رو از این جهت که عملیات آموزش کلیه وزنهای شبکه به صورت یکپارچه انجام میشه (چون مرحله طبقه بندی جدا با SVM حذف شده) میشه end-to-end بهش گفت. ولی واقعیت اینه که همون طور که گفتید region proposals ها توسط شبکه انجام نمیشه و قبل ترین شبکه این نواحی با روشهای دیگه استخراج میشه در نتیجه اگه مرحله region proposals رو هم در نظر بگیرید و بخواهید این مرحله رو هم شبکه انجام بده خب در این صورت نمیشه به نسخه fast گفت end-to-end

نسخه faster بخش region proposals رو هم با یه شبکه RPN انجام میده و این نسخه رو میشه end-to-end تلقی کرد چون کل فرآیند یادگیری با backpropagation و شبکه عصبی صورت میگیره.

توسط (540 امتیاز)
انتخاب شده توسط
ممنون از توضیحات خوبتون
در واقع در نسخه فستر به جای SVM از FCها (MLP) استفاده کرده دیگه درسته ؟
خواهش میکنم.
به جای SVM از softmax با تابع هزینه negative log likelyhood استفاده کرده که بتونه خطا رو با بکپروپگیشن کل شبکه رو آموزش بده. (مشابه خطا و آموزش در MLP )
...