Deep Q-network

Question

سلام
شبکه های DQN ترکیبی از Convolutional neural network و یادگیری تقویتی هست.
سوالم اینکه توی فرایند آموزش این شبکه، خروجی های شبکه برای آموزش چگونه تعیین میشه؟و تعامل شبکه با emulator بازی ها چگونه اس؟

Farhood Farahnak · Answer 1 · 2016-10-11T08:10:29+0000

ممنون از راهنماییتون.
داده ی آموزش برای خروجی از کجا تامین میشه؟داده ی ورودی، تصویر صفحه ی بازی و جایزه ای هست که عامل گرفته ولیlabel خروجی برای ورودی چطوری بدست می آید؟و اینکه آیا ابتدا بازی سمت امولاتور انجام میشه و به اضای هر عمل انتخابی،جایزه و تصویر بدست می آید و توی یک دیتاست جمع می کنیم و سپس شبکه را بدون ارتباط با امولاتور و با داده های جمع آوری شده آموزش میدیم؟چیزی که متوجه شدم درسته؟
ممنون

دارای دیدگاه دی 10, 1394 توسط hamedBK (107 امتیاز)

داده ورودی دقیقا دیتای صفحه نمایش است که به شبکه کانولوشن داده میشود. دقیقا مانند روش reinforcement learning مراحل آموزش طی میشود. برای بروز رسانی وزن ها نیز اکشن انتخاب شده در خروجی سافت مکس به عنوان لیبل در نظر گرفته می شود تا فرایند اموزش شبکه عصبی به صورت یک اموزش با ناظر صورت گیرد.
بهتر است ابتدا در مورد reinforcement learning مطالعه کنید و سپس این وبلاگ را بخوانید گرچه در وبلاگ توضیحاتی در مورد یادگیری تقویتی ارایه شده است.
http://karpathy.github.io/2016/05/31/rl/

دارای دیدگاه دی 10, 1394 توسط Farhood Farahnak (418 امتیاز)

negare · Answer 2 · 2016-10-11T00:09:19+0000

سلام
سوال اولتونو متوجه نشدم
در مورد سو ال دون باید بگم که یه عکس از صفحه بازی به شبکه داده می شود به عنوان ورودی و شبکه یه کنشی رو برای ایملاتور میفرسته

دسته بندی ها

Deep Q-network

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

لطفا وارد شده یا عضو شوید تا بتوانید سوال بپرسید

2 پاسخ

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

سوالات مشابه

دسته بندی ها

Deep Q-network

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

لطفا وارد شده یا عضو شوید تا بتوانید سوال بپرسید

2 پاسخ

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید