به بخش پرسش و پاسخ یادگیری عمیق خوش آمدید,
این نسخه آزمایشی سایت است.
لطفا به نکات زیر توجه کنید:
  • برای ارتباط با مدیران میتوانید از صفحه مدیران اقدام کنید.
  • سوال و جواب ها باید به زبان فارسی باشند. استفاده از زبان انگلیسی یا فینگلیش برای پاسخ دادن مجاز نیست.
  • لطفا بعد از پرسش سوال لینک سوال خود را در گرو تلگرام (Iran Deep Learning Group) معرفی کنید تا سریعتر به جواب برسید. برای دسترسی به آخرین لینک از منابع یادگیری استفاده کنید
  • لطفا بجای عکس از متن استفاده کنید. اگر متون طولانی هستند از سایت pastebin.com برای اپلود استفاده کرده و لینک حاصل را در سوال خود قرار دهید. برای قرار دادن تصویر ، از بخش ارسال تصویر ادیتور سایت استفاده کنید.
  • بعد از دریافت پاسخ، بهترین پاسخ را از طریق کلیک بر روی علامت تیک انتخاب کنید
  • اگر با خطا و یا مشکلی مواجه شدید از بخش تماس با ما در انتهای صفحه و یا ایمیل Coderx7@gmail.com موضوع را اطلاع دهید.

با تشکر

دسته بندی ها

0 امتیاز

سلام
1- چرا yolo را به عنوان رگراسیون می باشد ؟ چونکه proposal-free هست ؟ بلاخره این هم classification انجام میدهد دیگه
2- Our base network runs at 45 frames per second with no batch processing on a Titan X GPU and a fast version runs at more than 150 fps. This means we can process streaming video in real-time with
less than 25 milliseconds of latency.
منظور از no batch processing یعنی چی ؟ در واقع batch size =1 منظورش اینه ؟

3-For data augmentation we introduce random scaling and
translations of up to 20% of the original image size. We
also randomly adjust the exposure and saturation of the image by up to a factor of 1:5 in the HSV color space.
منظورش چیه ؟ exposure ? saturation ? factor of 1.5 in HSV

توسط (389 امتیاز)
ویرایش شده توسط

1 پاسخ

+1 امتیاز
 
بهترین پاسخ

۱- پاسخ به این سوال بستگی به نسخهYOLO مورد نظر شمادارد مثلا در نسخه اول هیچ گونه عمل دسته بندی انجام نمی شود فقط احتمال وجود هرکدام از دسته ها در هر بلاک بدست می آید و با استفاده از این احتمال ها در بلاک های مختلف می توانیم وجود یک شی را در قسمتی از صفحه متوجه شویم به همین دلیل بیشتر regression هست تا classification.
۲- منظور از batch processing این هست که شما می تواند به صورت دسته ای داده را برای پردازش به شبکه عصبی عمیق بدهید که البته این موضوع بیشتر در هنگام استفاده از GPU یا کلاستر های پردازشی نتیجه مفیدی می دهد. در اینجا هم منظور این هست که اگر سایز دسته ۱ باشد و یا به عبارت دیگر دسته ها تکی باشند (یعنی اصلا دسته ای نداشته باشیم و داده ها را به صورت تکی به شبکه عصبی بدهیم) این نتیجه بدست می آید.
۳- برای افزایش داده های تعلیم به صورت رندوم اکسپوژر (روشنایی و حساسیت به نور) و اشباع رنگ را با نسبت گفته شده تغییر داده است. منظور از HSV هم این هست که این تغییرات در فضای رنگ HSV اعمال شده اند.

توسط (397 امتیاز)
انتخاب شده توسط
یه سوال دیگه
اینکه yolo بصورت یکجا به تصویر نگاه میکنه مگه در faster کامپونت RPN هم بصورت یکجا پروپوزال ها رو در نمیاره ؟ یعنی بصورت موازی تمامی پروپوزال ها رو استخراج نمیکنه از تصویر ؟
خب یعنی موقع pre-processing تصاویر از RGB به HSV تبدیل میشوند ؟
...