سلام
راسیتش تعداد راه هایی که تا همین الان که ما داریم حرف می زنیم در اومده و امتحان شده خیلی زیاده و واقعا از دست آدم در میره که چه ایده هایی تست شده
اما تا جایی که بنده اطلاع دارم، فعلا عموم روشها بر این اساس بوده که شما برای هر بار تولید خروجی، یه noise به عنوان ورودی می دن. اما برای آپدیت وزنها، توی کارهای جدیتر، برای استبل کردن training و اینکه مثلا generator بین دو تا mode پرش نکنه و بتونه بیشتر توزیع داده ها رو یاد بگیره، هر تصویری که generator تولید می کنه رو هم ذخیره می کنن و discriminator رو هم باید تصاویر قدیمی تر و هم با تصاویری که جدیدا تولید شده آموزش می دن
این پست رو در مورد trick هایی که می زنن تا gan ها بهتر آموزش داده بشن رو ببینید، شماره 8 در مورد همین موضوعی که الان حرف زدیم:
https://github.com/soumith/ganhacks
اینم مقاله جالبیه در مورد ارتباط و اشتراکات سختی فرایند آموزش در gan و مدلهای reinforcement learning که در مورد تاثیر experience replay هم توضیح داده
Connecting Generative Adversarial Networks and Actor-Critic Methods
https://arxiv.org/pdf/1610.01945.pdf