Fast RCNN detection

Question

سلام
دوستانی که object detection کار میکنند لطف کنند به این سوال پاسخ دهند
اینکه چرا به این شبکه end-to-end گفته میشه ؟ مگه external region proposal در ترینینگ این دخیل نیست ؟ من تا جایی که درک میکنم به شبکه هایی باید end-to-end گفته شود که تمامی کامپونت های اون باهم دیگه از سر تا ته قابل یادگیری باشند وقتی اینجا region proposal بصورت external هست چرا باز هم end-to-end گفته میشود ؟
معماری این اینطوری هست
ابتدا فیچرها توسط CNN درآورده میشوند بعدش external region proposal اعمال میشود و بعدش میره قسمت svm , B.B reg
چجوری تریننیگ این end-to-end هست؟

hamed_mohebbi · Answer 1 · 2017-11-09T11:35:15+0000

سلام.
نسخه R-CNN اوایه برای طبقه بندی از SVM استفاده میکرد. در واقع به این صورت بود که شبکه کانولوشنی رو که روی imagenet قبلا pretrain شده بود دوباره روی دیتای detection (مثلا VOC که 20 کلاسه) با head نوع softmax ترین میکردن و بعدش از شبکه ترین شده به عنوان feature extractor برای SVM استفاده میکردن و تسک نهایی رو SVM انجام میداد.
تو نسخه Fast یه سری اصلاحات ایجاد کردن و کلا SVM رو حذف کردن. و در واقع از همون softmax استفاده کردن. در واقه ترین R-CNN عادی که چند مرحله ای بود (ترین با softmax به علاوه طبقه بندی با SVM) رو یک مرحله ای کردن و کل پروسه (به جز انتخاب region proposals) رو در یک شبکه یکپارچه کردن. (البته کماکان انتخاب ناحیه های پیشنهادی با روشهای قبلی انجام میشد ولی فرقش این بود که هر ناحیه رو جداگانه به شبکه forward نمیکرد و کل عکس رو یک بار فوروارد میکرد و در لایه آخرین کانولوشن(feature map) ناحیه ها رو جدا میداد به ادامه شبکه و با این کار در محاسبات لایه های کانولوشن صرفه جویی میکرد).
نسخه fast رو از این جهت که عملیات آموزش کلیه وزنهای شبکه به صورت یکپارچه انجام میشه (چون مرحله طبقه بندی جدا با SVM حذف شده) میشه end-to-end بهش گفت. ولی واقعیت اینه که همون طور که گفتید region proposals ها توسط شبکه انجام نمیشه و قبل ترین شبکه این نواحی با روشهای دیگه استخراج میشه در نتیجه اگه مرحله region proposals رو هم در نظر بگیرید و بخواهید این مرحله رو هم شبکه انجام بده خب در این صورت نمیشه به نسخه fast گفت end-to-end

نسخه faster بخش region proposals رو هم با یه شبکه RPN انجام میده و این نسخه رو میشه end-to-end تلقی کرد چون کل فرآیند یادگیری با backpropagation و شبکه عصبی صورت میگیره.

ممنون از توضیحات خوبتون
در واقع در نسخه فستر به جای SVM از FCها (MLP) استفاده کرده دیگه درسته ؟ — DeeepNet, دی 11, 1395
خواهش میکنم.
به جای SVM از softmax با تابع هزینه negative log likelyhood استفاده کرده که بتونه خطا رو با بکپروپگیشن کل شبکه رو آموزش بده. (مشابه خطا و آموزش در MLP ) — hamed_mohebbi, دی 11, 1395

دسته بندی ها

Fast RCNN detection

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

لطفا وارد شده یا عضو شوید تا بتوانید سوال بپرسید

1 پاسخ

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

سوالات مشابه

دسته بندی ها

Fast RCNN detection

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

لطفا وارد شده یا عضو شوید تا بتوانید سوال بپرسید

1 پاسخ

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید