به بخش پرسش و پاسخ یادگیری عمیق خوش آمدید,
این نسخه آزمایشی سایت است.
لطفا به نکات زیر توجه کنید:
  • برای ارتباط با مدیران میتوانید از صفحه مدیران اقدام کنید.
  • سوال و جواب ها باید به زبان فارسی باشند. استفاده از زبان انگلیسی یا فینگلیش برای پاسخ دادن مجاز نیست.
  • لطفا بعد از پرسش سوال لینک سوال خود را در گرو تلگرام (Iran Deep Learning Group) معرفی کنید تا سریعتر به جواب برسید. برای دسترسی به آخرین لینک از منابع یادگیری استفاده کنید
  • لطفا بجای عکس از متن استفاده کنید. اگر متون طولانی هستند از سایت pastebin.com برای اپلود استفاده کرده و لینک حاصل را در سوال خود قرار دهید. برای قرار دادن تصویر ، از بخش ارسال تصویر ادیتور سایت استفاده کنید.
  • بعد از دریافت پاسخ، بهترین پاسخ را از طریق کلیک بر روی علامت تیک انتخاب کنید
  • اگر با خطا و یا مشکلی مواجه شدید از بخش تماس با ما در انتهای صفحه و یا ایمیل Coderx7@gmail.com موضوع را اطلاع دهید.

با تشکر

دسته بندی ها

0 امتیاز

سلام
من یک مقاله بیس دارم که اومده و به تشخیص عکس سگ و گربه با شبکه های عصبی کانولوشنی پرداخته.من میخوام همه ی کارهایی که کرده را برای تشخیص صدای سگ و گربه یا ویدئو انجام بدم.از شبکه های عصبی RNN استفاده کنم یا گزینه ی بهتری هم وجود داره؟
و این که چقدر کارم نسبت به تشخیص تصویر سنگین تر و سخت تر میشه؟

توسط (100 امتیاز)

1 پاسخ

0 امتیاز

سلام
برای تشخیص صوت
1- از روی صوت خام : استفاده از شبکه های بازگشی مانند LSTM متداولتر هستش
2- تبدیل صوت به تصویر (تبدیل زمان-فرکانس): در این حالت بهتره از شبکه های عصبی کانولوشنی استفاده کنید

برای تشخیص ویدیو
ابتدا با استفاده از شبکه های کانولوشنی از فریمهای ویدیو ویژگی استخراج میکنید سپس با استفاده از شبکه LSTM ویژگی های زمانی را استخراج کنید.

موفق باشید majid_nasiri_ai@

توسط (830 امتیاز)
...