سلام
توی یه نگاه سطح بالا می تونید بگید ربطی بهم ندارن
چرا؟ چون میشه به شبکه (چه عمیق چه کم عمق و ....) به عنوان یه function approximator نگاه کرد
مثلا اینکه شما می خواید یه تابع پیدا کنید که وضعیت مفصل های ربات رو بگیره و نیروی مورد نیاز مثلا برای راه رفتن به هر مفصل رو بر گردونه
این تابع رو چطوری پیدا کنیم؟ یه کار اینه که جاش یه شبکه بذاریم که این تابع رو برامون تقریب بزنه
تا اینجاش ربط خاصی به RL نداشته و برای هر جا که قراره شما یه تابع پیچیده داشته باشید میشه یه شبکه گذاشت
RL اینجا وارد میشه که حالا چطوری پارامترهای این شبکه رو یاد بگیریم. توی حالت هایی مثل supervised learning که جواب رو می دونیم، سیگنال آموزش رو مستقیم داریم اما مثلا اینجا که نمی دونیم دقیق نیرو باید توی هر حالت چی باشه، میشه از ایده های RL استفاده کرد. اینجاس که این دو بزرگوار با هم دیدار می کنن
البته از دید RL هم میشه بررسی کرد که مثلا توی فلان تکنیک ها ما می تونیم وضعیت هر state رو توی یه جدول ذخیره کنیم. حالا اگه فضای state ها خیلی بزرگ باشه که نمیشه همه اش رو توی جدول ذخیره کرد. این جدول رو با چی تخمین بزنیم؟ مثلا با شبکه عصبی