به بخش پرسش و پاسخ یادگیری عمیق خوش آمدید,
این نسخه آزمایشی سایت است.
لطفا به نکات زیر توجه کنید:
  • برای ارتباط با مدیران میتوانید از صفحه مدیران اقدام کنید.
  • سوال و جواب ها باید به زبان فارسی باشند. استفاده از زبان انگلیسی یا فینگلیش برای پاسخ دادن مجاز نیست.
  • لطفا بعد از پرسش سوال لینک سوال خود را در گرو تلگرام (Iran Deep Learning Group) معرفی کنید تا سریعتر به جواب برسید. برای دسترسی به آخرین لینک از منابع یادگیری استفاده کنید
  • لطفا بجای عکس از متن استفاده کنید. اگر متون طولانی هستند از سایت pastebin.com برای اپلود استفاده کرده و لینک حاصل را در سوال خود قرار دهید. برای قرار دادن تصویر ، از بخش ارسال تصویر ادیتور سایت استفاده کنید.
  • بعد از دریافت پاسخ، بهترین پاسخ را از طریق کلیک بر روی علامت تیک انتخاب کنید
  • اگر با خطا و یا مشکلی مواجه شدید از بخش تماس با ما در انتهای صفحه و یا ایمیل Coderx7@gmail.com موضوع را اطلاع دهید.

با تشکر

دسته بندی ها

0 امتیاز

سلام
1) در این معماری گفته شده که از الگوریتم atrous برای معماری vgg ایی کهبکار برده شده استفاده کردند یعنی اینکه همان atrous convolution هست ؟
۲) Sample a patch so that the minimum jaccard overlap with the objects is 0.1, 0.3,
0.5, 0.7, or 0.9.
یعنی چی ؟
۳) We keep the overlapped part of the ground truth box if the center of
it is in the sampled patch.
یعنی اینکه نمونه گیری ها طوری صورت میگیرد که حتما مرکز GT هم باشد ؟ اگر اینطوری هست فرضا فقط مختصات سمت چپ و راست در نمونه گیری باشند اونوقت تکلیف مختصات پایینی چی میشه ؟ چگونه در loss با prediction اختلاف سنجی میشود ؟

توسط (389 امتیاز)

1 پاسخ

+1 امتیاز
 
بهترین پاسخ

سلام
1) بله، منظور atrous convolution هست

2) هنگام data augmentation که می خوان تعداد sample ها رو زیاد کنن، یه حالت اینه که بیان و از یه جای تصویر به صورت رندم و کورکورانه یه patch انتخاب کنن، اما حالت دیگه اینه که فقط patch هایی رو انتخاب کنن که یه overlapی با یکی از اشیا داخل تصویر داشته باشه.
حالا اینکه چقدر overlap داشته باشه رو گفته patch هایی رو انتخاب می کنیم که اگه معیار jaccard رو بین patch انتخاب شده با ground truth شی حساب کنیم بشه یکی از این اعداد
معیار jaccard خیلی مشابه dice یا f1 score ه که برای شباهت یا overlap دو تا ماسک توی segmentation یا توی detection استفاده میشه

https://en.wikipedia.org/wiki/Jaccard_index

3) نه اینکه حتما مرکز gt داخل patch باشه اما میگه اگه مرکز باکس داخل patch ی که به صورت رندوم تولید کردیم بود، نگهش می داریم. یه به عبارت دیگه یه جورایی داره می گه که اگه patch مون به اندازه کافی از gt داشت، اطلاعاتی از gt رو نگه می داریم و اگه overlapشون کم بود بی خیالش می شیم. یعنی اینطوری نیست که مثلا یه patch انتخاب کنیم، بعد یه گوشه کوچیک شی توش باشه و انتظار داشته باشیم شبکه بگه آهان ببین اون گوشه فلان object هم اینجاس
در مورد قسمت آخر سوالتون خیلی متوجه نشدم منظورتون چیه. الان فرض کنید که یه گربه توی تصویر بوده و ما توی sample کردن، یه patch گرفتیم که نصف گربه‌ توش هست و چون وسط gt هم داخل patch بوده بر فرض، انتظار داریم که شبکه بتونه گربه رو تشخیص بده و box رو هم براش مشخص کنه. یعنی اونقدری که از gt توی تصویر بوده رو براش یه box در بیاره.
توی حساب کردن loss هم ما فقط پیش بینی شبکه رو با همون مقداری از gt که توی patch بوده حساب می کنیم
برای روشن تر شدن موضوع یه نقاشی توی paint هم آماده کردم :)))

اون قسمت قرمز gt box که نشونگر box دقیق از شی هست و آبی چیزی هست که به صورت رندوم sample کردیم. حالا چون مرکز gt box داخل box آبی هست، پس اطلاعات gt box رو هم می خوایم نگه داریم و اون قسمت سبز رنگ که علامت زدم رو نگه می داریم و برای این patch آبی رنگ که انتخاب کردیم، انتظار داریم اون قسمت سبز رنگ به عنوان مکان شی پیش بینی بشه
حالا نمی دونم منظور شما همین بود یا نه. اگه نه لطفا بیشتر در مورد قسمت آخر توضیح بدید

توسط (1.6k امتیاز)
انتخاب شده توسط
Model analysis ssd
ممنون از شما و اینکه یه سوال دیگه :
در SSD که گفته میشه ما از دیفالت باکس ها برای پیش بینی آبجکت ها استفاده میکنیم در این حالت ابتدا matching بین این دیفالت باکس ها و GT ها صورت میگیرد و اونکی بیشتر از معیار ۰.۵ jacard بود رو به عنوان positive حساب میشه حالا وقتی که میخاد پس انتشار انجام بشه این باکس ها مثبت مختصاتشون آپدیت میشن یا اینکه مختصات نهایی آبجکت ها همان دیفالت باکس ها هستند ؟
و سوال بعدی : atrous کانالوشن در تنسورفلو هست ؟ تابعش چیه ؟
...