به بخش پرسش و پاسخ یادگیری عمیق خوش آمدید,
این نسخه آزمایشی سایت است.
لطفا به نکات زیر توجه کنید:
  • برای ارتباط با مدیران میتوانید از صفحه مدیران اقدام کنید.
  • سوال و جواب ها باید به زبان فارسی باشند. استفاده از زبان انگلیسی یا فینگلیش برای پاسخ دادن مجاز نیست.
  • لطفا بعد از پرسش سوال لینک سوال خود را در گرو تلگرام (Iran Deep Learning Group) معرفی کنید تا سریعتر به جواب برسید. برای دسترسی به آخرین لینک از منابع یادگیری استفاده کنید
  • لطفا بجای عکس از متن استفاده کنید. اگر متون طولانی هستند از سایت pastebin.com برای اپلود استفاده کرده و لینک حاصل را در سوال خود قرار دهید. برای قرار دادن تصویر ، از بخش ارسال تصویر ادیتور سایت استفاده کنید.
  • بعد از دریافت پاسخ، بهترین پاسخ را از طریق کلیک بر روی علامت تیک انتخاب کنید
  • اگر با خطا و یا مشکلی مواجه شدید از بخش تماس با ما در انتهای صفحه و یا ایمیل Coderx7@gmail.com موضوع را اطلاع دهید.

با تشکر

0 امتیاز

سلام، در شبکه های lstm با فرض اینکه کلمه کلمه داریم به شبکه میدیم یعنی تا زمانی که یه جمله تمام نشده وارد لایه های fully-connect نمیشه ؟ یعنی دسته بندی صورت نمیگیره ؟ این قسمتش که داره کلمه کلمه به شبکه میدیم و خروجی یعنی برچسب تمام متن میگیریم برام نامفهموم هستش.

سوال شده توسط (100 امتیاز)

1 پاسخ

+1 امتیاز

سلام.
متن کار نکردم ولی فکر نمیکنم مفهومش با کاربردهای دیگه مثل صوت و تصویر متفاوت باشه.
از lstm و در کل RNN به چند طریق میشه استفاده کرد. یه حالتش Sequence to sequence هستش که در این حالت ورودی یه دنباله از کلمات و خروجی هم باید یه دنباله از کلمات باشه. مثال کاربردیش توی متن machine translation توی صوت speech to text و تو تصویر Optical character recognition (OCR) هستش. در این حالت در هر time step یه خروجی پیش بینی میشه (البته هر کدوم از این تسکها ملاحظات خاص خودشون مثل استفاده از تابع هزینه CTC و ... دارند که توضیحش اینجا نمیگنجه).
کارکرد دیگه ی RNN که فکر کنم کارکرد مد نظر شماست کاربرد sequence to one label یا many to one هستش. در این حالت ورودی دوباره یه دنباله از کلماته ولی خروجی یه برچسب کلی در مورد اون دنباله هستش. باز هم این رویکرد تو صوت و تصویر هم کاربرد داره. مثل audio event detection. در این حالت میخواهیم برای کل جمله یه برچسب بزنم (مثلا برچسب محتوای ورزشی برای جمله). به علت این که ارتباط زمانی کلمات توی برچسب گذاری تاثیر داره برای مدل کردن ارتباط زمانی از RNN میشه استفاده کرد. تو این حالت بردار ویژگی نهایی خروجی RNN به عنوان ویژگی معمولا به یه لایه FC و لایه طبقه بندی متصل میشه تا کار طبقه بندی انجام بشه.
یکی از کاربردهاش تشخیص زبان یا spoken language identification هستش که تو لینک زیر میتونید توضیحات کمی و کیفی رو از چند نوع RNN مشاهده کنید. فقط چون این تسک مربوط به صوت میشه برای استخراج بردار ویژگی ورودی RNN از شبکه کانولوشنی استفاده کرده. ولی concept همونه.

https://yerevann.github.io/2016/06/26/combining-cnn-and-rnn-for-spoken-language-identification/

پاسخ داده شده توسط (535 امتیاز)
...