به بخش پرسش و پاسخ یادگیری عمیق خوش آمدید,
این نسخه آزمایشی سایت است.
لطفا به نکات زیر توجه کنید:
  • برای ارتباط با مدیران میتوانید از صفحه مدیران اقدام کنید.
  • سوال و جواب ها باید به زبان فارسی باشند. استفاده از زبان انگلیسی یا فینگلیش برای پاسخ دادن مجاز نیست.
  • لطفا بعد از پرسش سوال لینک سوال خود را در گرو تلگرام (Iran Deep Learning Group) معرفی کنید تا سریعتر به جواب برسید. برای دسترسی به آخرین لینک از منابع یادگیری استفاده کنید
  • لطفا بجای عکس از متن استفاده کنید. اگر متون طولانی هستند از سایت pastebin.com برای اپلود استفاده کرده و لینک حاصل را در سوال خود قرار دهید. برای قرار دادن تصویر ، از بخش ارسال تصویر ادیتور سایت استفاده کنید.
  • بعد از دریافت پاسخ، بهترین پاسخ را از طریق کلیک بر روی علامت تیک انتخاب کنید
  • اگر با خطا و یا مشکلی مواجه شدید از بخش تماس با ما در انتهای صفحه و یا ایمیل Coderx7@gmail.com موضوع را اطلاع دهید.

با تشکر

دسته بندی ها

+1 امتیاز

سلام
شبکه های DQN ترکیبی از Convolutional neural network و یادگیری تقویتی هست.
سوالم اینکه توی فرایند آموزش این شبکه، خروجی های شبکه برای آموزش چگونه تعیین میشه؟و تعامل شبکه با emulator بازی ها چگونه اس؟

توسط (107 امتیاز)

2 پاسخ

+1 امتیاز
 
بهترین پاسخ

خروجی شبکه‌های q learning در واقع اکشن‌ها یا عملکردهای قابل انجام توسط عامل هستند. تمامی اکشن‌ها به عنوان یکی از نورون‌های لایه خروجی در نظر گرفته می‌شوند. و فرایند آموزش و استنتاج مانند یک شبکه معمولی صورت می‌گیرد.

توسط (418 امتیاز)
انتخاب شده توسط
ممنون از راهنماییتون.
داده ی آموزش برای خروجی از کجا تامین میشه؟داده ی ورودی، تصویر صفحه ی بازی و جایزه ای هست که عامل گرفته ولیlabel خروجی برای ورودی چطوری بدست می آید؟و اینکه آیا ابتدا بازی سمت امولاتور انجام میشه و به اضای هر عمل انتخابی،جایزه و تصویر بدست می آید و توی یک دیتاست جمع می کنیم و سپس شبکه را بدون ارتباط با امولاتور و با داده های جمع آوری شده آموزش میدیم؟چیزی که متوجه شدم درسته؟
ممنون
داده ورودی دقیقا دیتای صفحه نمایش است که به شبکه کانولوشن داده میشود. دقیقا مانند روش reinforcement learning مراحل آموزش طی میشود. برای بروز رسانی وزن ها نیز اکشن انتخاب شده در خروجی سافت مکس به عنوان لیبل در نظر گرفته می شود تا فرایند اموزش شبکه عصبی به صورت یک اموزش با ناظر صورت گیرد.
بهتر است ابتدا در مورد reinforcement learning مطالعه کنید و سپس این وبلاگ را بخوانید گرچه در وبلاگ توضیحاتی در مورد یادگیری تقویتی ارایه شده است.
http://karpathy.github.io/2016/05/31/rl/
ممنون بابت توضیحاتتون
0 امتیاز

سلام
سوال اولتونو متوجه نشدم
در مورد سو ال دون باید بگم که یه عکس از صفحه بازی به شبکه داده می شود به عنوان ورودی و شبکه یه کنشی رو برای ایملاتور میفرسته

توسط (107 امتیاز)
...