کاهش نوسانات دقت یک مدل CNN

Question

در اینجا (حتما این لینک رو بخونید در این لینک مسئله شرح داده شده است) یک برنامه بسیار بد نوشتم که با راهنمایی یک از دوستان تبدیل به برنامه‌ی زیر شد. اما دقت مدل در طول اجرا دارای نوسانات زیادی بود و حتی در چند مورد بسیار کم شد.
چه راهکارهایی وجود داره برای اینکه نوسانات دقت مدل در مسیر رسیدن به جواب مطلوب کمتر بشه

model = Sequential()

model.add(Conv2D(filters=4,kernel_size=(5,5),strides=(3,3),input_shape = (100, 100, 1)))
model.add(Activation('relu'))
model.add(MaxPooling2D(2,1))
model.add(Dropout(0.25))

model.add(Conv2D(filters=8,kernel_size=(5,5),strides=(3,3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(2,1))
model.add(Dropout(0.25))

model.add(Conv2D(filters=16,kernel_size=(3,3),strides=(1,1)))
model.add(Activation('relu'))
model.add(MaxPooling2D(2,1))
model.add(Dropout(0.25))

model.add(Flatten())

model.add(Dense(20))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(2, activation='softmax'))

model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

model.fit(X_train, y_train, batch_size=64, epochs=500, verbose=1, validation_data=(X_test, y_test))

مجید نصیری · Answer 1 · 2018-01-19T08:43:58+0000

سلام
در بحث کلاسبندی هدف طراحی یک مدل با دقت زیاد بر روی دیتای تست (یعنی دیتایی که در حین آموزش ندیده) هستش. بعبارت دیگه مدلی که تعمیم پذیری خوبی داره.
در حین آموزش معمولا در epoch‌ های مختلف شبکه را ذخیره میکنند. و در نهایت از بین مدل های ذخیره شده مدل برگزیده شده مدلی هست که دارای دقت بیشتر بر روی دیتای تست باشد. و اینکه در حین آموزش دقت مدل نوسانات داشته اهمیتی نداره.
مگر اینکه شما هدف دیگه ای رو دنبال می کنید!! ؟

سید حسین حسن پور · Answer 2 · 2018-01-19T16:57:36+0000

سلام
همونطور که آقای نصیری خوب اشاره کردن اکثر مدلها دارای نوسان هستن اما قرار نیست این نوسانات خیلی زیاد باشه. (البته نگفتید نوسان شما چقدره تا بگیم طبیعی هست یا خیر)
وجود نوسان دلایل مختلفی داره یکی از بارزترین اونها مقداردهی اولیه اس. اگه شما از یک seed یکسان برای شبکه استفاده کنید باید هر بار یک رفتار مشابه رو ببینید.
وقتی نوسان زیاد نباشه (معمولا هر شبکه رو چند بار ترین میکنن و بعد بهترین نتیجه رو استفاده میکنن این بین تفاوت ها زیاد نباید باشه چون شبکه تغییری نکرده و این تفاوتها نشات گرفته از مقداردهی اولیه است) هموطنور که جناب نصیری اشاره کردن رفتارمیشه.
اما وقتی نوسان زیاد باشه یعنی یک مشکلی هست. اولین مشکل نرخ یادگیری و یا مومنتوم بالاتر هست که میتونه باعث این مساله بشه. مساله دوم اگر معماری عمیق باشه تعداد لایه ها و عدم استفاده از بچ نرمالیزیشن هست و هر مقداردهی اولیه بشدت تاثیرگذار هست روی کارایی شبکه .
حالا اینها مواردی بود در مورد زمان تست. در زمان ترینینگ شما دقت رو به ازای بچ ها معمولا دریافت میکنید و مشاهده نوسانات زیاد خصوصا در ابتدای ترینینگ زمانی که نرخ یادگیری بالاس اصلا عجیب و یا نگران کننده نیست و رفته رفته میبینید با کاهش نرخ یادگیری و همینطور گذشت تکرار های بیشتر این نوسانات خیلی کاهش پیدا میکنه.
پس برای رفع مشکل اول این موارد رو مورد بررسی قرار بدید.
ضمنا در شبکه هایی که تعداد پارامتر کمی دارید میتونید از دراپ اوت استفاده نکنید و یا نرخش رو خیلی کم کنید (بسته به میزان پارامتری که دارید)

در پاسخ به بچ نرمالیزیشن اشاره کردید درصورتی که تو کارهای جدید کمتر ازش استفاده میشه، دلیلش چیه؟ و در چه زمان‌هایی بهتره استفاده بشه — Muhammad, دی 10, 1396
سلام. تمام کارهای اخیر همه از بچ نرمالیزیشن استفاده میکنن. کدوم معماری رو دیدید که از بچ نرمالیزیشن استفاده نمیکنه؟ وجود بچ نرمالیزیشن بطور ویژه برای ترین بهتر معماری های عمیق یکی از ملزوماته چون تا حد امکان covariate shift رو کاهش میده که این هم به نوبه خودش باعث کاهش قابل توجه حساسیت نسبت به مقداردهی های اولیه و همینطور تاثیرات پارامترها بر روی توزیع ورودی لایه های داخلی میشه. — سید حسین حسن پور, دی 10, 1396

دسته بندی ها

کاهش نوسانات دقت یک مدل CNN

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

لطفا وارد شده یا عضو شوید تا بتوانید سوال بپرسید

2 پاسخ

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

سوالات مشابه

دسته بندی ها

کاهش نوسانات دقت یک مدل CNN

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

لطفا وارد شده یا عضو شوید تا بتوانید سوال بپرسید

2 پاسخ

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید