سلام . من یک نگاه جزئی کردم و بنظرم لاس سیر نزولی رو طی میکرد .منتها برای فاین تونینگ بنظر لاس ابتدایی بالا بود. نرخ یادگیری رو بیشتر کنیدو ببینید لاس شروع چقدر هست و بزارید شبکه کمی ترین بشه برای چند ایپاک. در زمان فاین تونینگ بسته به میزان تفاوت بین دیتاستها و لایه های تغییرنام پیدا کرده همگرایی ممکنه طول بکشه اما معمولا خیلی سریع لاس کم و دقت افزایش پیدا میکنه.
بعد از افزایش نرخ یادگیری و ترین برای چند ده ایپاک نوبت تغییر weight decay هست و مقدار اون رو افزایش بدید و ببینید تغییری مشاهده میکنید یا خیر. ضمنا اگر خارج از فاین تونینگ شبکه رو ترین کنید وضعیت لاس شما به چه صورتی هست (بدون ویت دیکی و با ویت دیکی 0.001 برای شروع تست کنید و نتیجه رو بفرمایید)