چندتا سوال در مورد معماری ssd

Question

سلام
1) در این معماری گفته شده که از الگوریتم atrous برای معماری vgg ایی کهبکار برده شده استفاده کردند یعنی اینکه همان atrous convolution هست ؟
۲) Sample a patch so that the minimum jaccard overlap with the objects is 0.1, 0.3,
0.5, 0.7, or 0.9.
یعنی چی ؟
۳) We keep the overlapped part of the ground truth box if the center of
it is in the sampled patch.
یعنی اینکه نمونه گیری ها طوری صورت میگیرد که حتما مرکز GT هم باشد ؟ اگر اینطوری هست فرضا فقط مختصات سمت چپ و راست در نمونه گیری باشند اونوقت تکلیف مختصات پایینی چی میشه ؟ چگونه در loss با prediction اختلاف سنجی میشود ؟

alireza.nrzi · Answer 1 · 2018-02-20T22:42:52+0000

سلام
1) بله، منظور atrous convolution هست

2) هنگام data augmentation که می خوان تعداد sample ها رو زیاد کنن، یه حالت اینه که بیان و از یه جای تصویر به صورت رندم و کورکورانه یه patch انتخاب کنن، اما حالت دیگه اینه که فقط patch هایی رو انتخاب کنن که یه overlapی با یکی از اشیا داخل تصویر داشته باشه.
حالا اینکه چقدر overlap داشته باشه رو گفته patch هایی رو انتخاب می کنیم که اگه معیار jaccard رو بین patch انتخاب شده با ground truth شی حساب کنیم بشه یکی از این اعداد
معیار jaccard خیلی مشابه dice یا f1 score ه که برای شباهت یا overlap دو تا ماسک توی segmentation یا توی detection استفاده میشه

https://en.wikipedia.org/wiki/Jaccard_index

3) نه اینکه حتما مرکز gt داخل patch باشه اما میگه اگه مرکز باکس داخل patch ی که به صورت رندوم تولید کردیم بود، نگهش می داریم. یه به عبارت دیگه یه جورایی داره می گه که اگه patch مون به اندازه کافی از gt داشت، اطلاعاتی از gt رو نگه می داریم و اگه overlapشون کم بود بی خیالش می شیم. یعنی اینطوری نیست که مثلا یه patch انتخاب کنیم، بعد یه گوشه کوچیک شی توش باشه و انتظار داشته باشیم شبکه بگه آهان ببین اون گوشه فلان object هم اینجاس
در مورد قسمت آخر سوالتون خیلی متوجه نشدم منظورتون چیه. الان فرض کنید که یه گربه توی تصویر بوده و ما توی sample کردن، یه patch گرفتیم که نصف گربه‌ توش هست و چون وسط gt هم داخل patch بوده بر فرض، انتظار داریم که شبکه بتونه گربه رو تشخیص بده و box رو هم براش مشخص کنه. یعنی اونقدری که از gt توی تصویر بوده رو براش یه box در بیاره.
توی حساب کردن loss هم ما فقط پیش بینی شبکه رو با همون مقداری از gt که توی patch بوده حساب می کنیم
برای روشن تر شدن موضوع یه نقاشی توی paint هم آماده کردم :)))

اون قسمت قرمز gt box که نشونگر box دقیق از شی هست و آبی چیزی هست که به صورت رندوم sample کردیم. حالا چون مرکز gt box داخل box آبی هست، پس اطلاعات gt box رو هم می خوایم نگه داریم و اون قسمت سبز رنگ که علامت زدم رو نگه می داریم و برای این patch آبی رنگ که انتخاب کردیم، انتظار داریم اون قسمت سبز رنگ به عنوان مکان شی پیش بینی بشه
حالا نمی دونم منظور شما همین بود یا نه. اگه نه لطفا بیشتر در مورد قسمت آخر توضیح بدید

ممنون از شما و اینکه یه سوال دیگه :
در SSD که گفته میشه ما از دیفالت باکس ها برای پیش بینی آبجکت ها استفاده میکنیم در این حالت ابتدا matching بین این دیفالت باکس ها و GT ها صورت میگیرد و اونکی بیشتر از معیار ۰.۵ jacard بود رو به عنوان positive حساب میشه حالا وقتی که میخاد پس انتشار انجام بشه این باکس ها مثبت مختصاتشون آپدیت میشن یا اینکه مختصات نهایی آبجکت ها همان دیفالت باکس ها هستند ؟
و سوال بعدی : atrous کانالوشن در تنسورفلو هست ؟ تابعش چیه ؟ — DeeepNet, دی 10, 1396

دسته بندی ها

چندتا سوال در مورد معماری ssd

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

لطفا وارد شده یا عضو شوید تا بتوانید سوال بپرسید

1 پاسخ

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

سوالات مشابه

دسته بندی ها

چندتا سوال در مورد معماری ssd

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

لطفا وارد شده یا عضو شوید تا بتوانید سوال بپرسید

1 پاسخ

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید