کاهش مقدار RMSE در LSTM

Question

سلام
چطور میتوان میزان خطای RMSE رو در محاسبه LSTM کاهش داد؟
راهنمایی که ازش استفاده کردم به من RMSE= 40 رو میده
https://machinelearningmastery.com/time-series-forecasting-long-short-term-memory-network-python/

alireza.nrzi · Answer 1 · 2017-10-02T21:48:26+0000

سلام
در مورد خطای تست، بعد از اینکه شبکه آموزش دیده شده راه استانداردی برای کاهش این خطا وجود نداره
یعنی بهترین راهش اینه که شبکه رو بهتر آموزش بدید تا خطای کمتری روی دیتاهای تست تولید کنه
البته یه نکته خیلی مهم اینه که نباید آموزش بدید و نتیجه رو روی تست ببینید وگرنه احتمال خیلی زیاد روی مجموعه تست overfit می شین و باید تمامی کارهاتون روی validation set باشه

چند تا روش معمول و ساده هست که می تونید نتیجه بهتری بگیرید :
1- پارامترهای بهتری برای مرحله آموزش استفاده کنید(مثلا الگوریتم بهتر، learning rate بهتر، استفاده از data augmentation و ....)

2- استفاده از چندین مدل (ensemble). یعنی یا چند تا شبکه از اول با مقادیر اولیه متفاوت آموزش بدید و در نهایت هنگام تست جواب هاشون رو میانگین گیری کنید
یا توی مرحله آموزش از cyclic learning rate استفاده کنید، مثلا اول LR رو می ذارید 0.01 و توی 100 چرخه تا 0.0001 کم میشه، بعد این مدل فعلی توی این چرخه رو ذخیره می کنید و دوباره LR رو می ذارید همون 0.01 و دوباره این 100 تا چرخه رو تکرار می کنید و الی آخر

=================================

نکته مهم دیگه اینه که شبکه های Recurrent یه سری ریزه کاری هایی دارن تا بتونید حداکثر بهره رو ازشون ببرید، چند تا نمونه خیلی شناخته شده براتون مثال بزنم،
توی LSTM، بایاس forget gate خیلی مهمه که اول آموزش زیاد باشه که مشکل vanishing gradient تا حد امکان بوجود نیاد
یا اینکه وزندهی اولیه قسمت بازگشتی (hidden to hidden) اگه بصورت ماتریس I باشه، می تونه آموزش رو سریعتر کنه
که البته بسته به مساله و ساختار شبکه هم داره اما خلاصه کلی این وزندهی اولیه مهمه

در مقالاتی و پست هایی که روی اینترنت هست به دلیل اینکه موضوع آموزشه، خیلی روی جزئیات کار نمیشه و می خوان که تصویر کلی جا بیوفته، برای همین بقیه کارا و پیشرفت دادنش با خودتونه

سلام
البته من تست رو با استفاده از Multi-variant انجام دادم و کمی بهتر شد، بنا به نعداد لایه ها و نورون هایی که انتخاب میکنیم این مقدار تغییر میکنه.
ممنون از توضیح خوب ، و وقتی که گذاشتید، بله حق با شماست در منابع اینترنتی خیلی جزئیات در نظر گرفته نمیشه،
اگر ممکن هست منبع مناسبی که بتونم LSTM رو بصورت دقیق با جزییات بهتر یادبگیرم معرفی کنید. — fa_haydari, دی 11, 1395
یکی از بهترین پست هایی که من در مورد LSTM دیدم از وبلاگ olah بوده :
http://colah.github.io/posts/2015-08-Understanding-LSTMs — alireza.nrzi, دی 11, 1395

دسته بندی ها

کاهش مقدار RMSE در LSTM

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

لطفا وارد شده یا عضو شوید تا بتوانید سوال بپرسید

1 پاسخ

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

سوالات مشابه

دسته بندی ها

کاهش مقدار RMSE در LSTM

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

لطفا وارد شده یا عضو شوید تا بتوانید سوال بپرسید

1 پاسخ

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید