به بخش پرسش و پاسخ یادگیری عمیق خوش آمدید,
این نسخه آزمایشی سایت است.
لطفا به نکات زیر توجه کنید:
  • برای ارتباط با مدیران میتوانید از صفحه مدیران اقدام کنید.
  • سوال و جواب ها باید به زبان فارسی باشند. استفاده از زبان انگلیسی یا فینگلیش برای پاسخ دادن مجاز نیست.
  • لطفا بعد از پرسش سوال لینک سوال خود را در گرو تلگرام (Iran Deep Learning Group) معرفی کنید تا سریعتر به جواب برسید. برای دسترسی به آخرین لینک از منابع یادگیری استفاده کنید
  • لطفا بجای عکس از متن استفاده کنید. اگر متون طولانی هستند از سایت pastebin.com برای اپلود استفاده کرده و لینک حاصل را در سوال خود قرار دهید. برای قرار دادن تصویر ، از بخش ارسال تصویر ادیتور سایت استفاده کنید.
  • بعد از دریافت پاسخ، بهترین پاسخ را از طریق کلیک بر روی علامت تیک انتخاب کنید
  • اگر با خطا و یا مشکلی مواجه شدید از بخش تماس با ما در انتهای صفحه و یا ایمیل Coderx7@gmail.com موضوع را اطلاع دهید.

با تشکر

دسته بندی ها

+1 امتیاز

سلام
من در خیلی از مقالات دیدم که گفتند ورودی شبکه عمیق رو به جای تصویر RGB از ویژگی هایی مثل HOG استفاده می کنند. بعضی ها هم HOG رو محاسبه می کنند و در کنار RGB یا LUV به شبکه ورودی می دهند. با توجه به تعداد و فرمتی که ویژگی HOG داره، هر چه جست و جو کردم متوجه نشدم که چجوری این ویژگی رو به شکلی در میارند که به عنوان یک کانال از تصویر قابل استفاده باشه. اگر اطلاعاتی در این زمینه دارید ممنون می شم بیان کنید.
با تشکر

توسط (144 امتیاز)

1 پاسخ

0 امتیاز

سلام
میشه مقاله رو اینجا لود کنید

توسط (389 امتیاز)
مثلا این مقاله :
Learning Multilayer Channel Features for Pedestrian Detection
https://arxiv.org/pdf/1603.00124.pdf
ورودی که تو داری فرضا RGB هست 3 کاناله ، اینا میان برای هرکانال HOG اون رو حساب میکنند و سپس آنها رو concatenate میکنند که میشه 3 کاناله و بعد به شبکه میدن
...