در حین فاین تون هم باید فعال باشه(در فاین تون شما هم دارید ترین میکنید به هر حال پس از قائده ترینینگ پیروی میکنه) فقط در زمان دیپلوی دیگه سه تا خروجی نداشته باشید هرکدوم دقت بالاتری داد از همون استفاده کنید (معمولا بعد از تکرار مناسب همون نود اخر بهترین دقت رو میده)
من یک توضیحی بدم شما رو سردرگم نکنم . ببینید به اونها میگن auxilary classifier که قبل از معرفی بچ نرم گوگل اینکارو کرد تا گرادیان رو بتونه بهتر به لایه های اول منتقل کنه و نتیجه شبکه رو بهبود بده بعدا در ورژن سوم اینسپشن گزارش کردن که(به این مضمون که) فکر ما اشتباه بود و تاثیری ندارن. برای همین در فاز ترینینگ لحاظ میشن و در فاز تست حذف(معمولش اینه). اینکه واگرا میشن نباید این اتفاق بیوفته اونا هم باید مثل نود اخر بخوبی اموزش ببینن حالا به دقت اون نمیرسن عموما ولی قرار نیست دایورج کنن . شما در قدم اول نرخ یادگیری رو کاهش بدید و بعد چک کنید.