سلام
میتونید از این هم استفاده کنید.
اول باید نیازمندی های کارتون رو مشخص کنید. عموما اینطوریه که اول با بهترین مدلی که مثلا روی ایمیج نت تونسته دقت خوبی بدست بیاره شروع میکنید و روی دیتاست خودتون فاین تون میکنید. بعد دقتش رو ثبت میکنید. حالا میرید روی معماری های سبک تر که در عین حالی که دقت بالایی میدن (برابر یا نزدیک به مدل سنگین تر) سربار پردازشی خیلی کمتری داشته باشن.
مثلا یکی ممکنه با AlexNet استارت بزنه بببینه خوبه حالا میره میگیرده میبینه یک معماری دیگه هست به اسم Squeezenet که 50 برابر از الکس نت کوچیکتره و سربار کمتری داره ولی دقت بهتری نسبت به اون ارائه میده (الکس نت مثلا 200 مگ فضا میگیره و 60 میلیون پارامتر داره اما اسکویز نت دو سه مگابایت میگیره و 1 و نیم میلیون پارامتر داره)
یا یکی میره با VGGNet کار میکنه که دقتش بالاس ولی 500 600 مگ فضا اشغال میکنه و 130 140 میلیون پارامتر داره و خیلی سنگینه . بعد میبینه معماری های دیگه ای هستن مثل گوگل نت که 5 6 میلیون پارامتر داره اما دقت بهتری ارائه میده. یا باز دوباره معماری بنام MobileNet هست که 4 5 میلیون پارامتر داره و از دوتای قبلی بهتر عمل کرده مثلا.
به همین صورت در مورد CIFAR10 و امثالهم (دیتاست های متوسط و کوچیک ) میتونید پیش برید. میبینید مثلا معماری های مطرح چیان؟ میبنیید ResNet هست یا VGGNet و یا DenseNet که هرکدوم دقت های خیلی بالایی گرفتن . بعد میبینید مثلا DenseNet از بقیه خیلی بهتر بوده اما سربارش زیاد بود در همونجا میبینید یه معماری دیگه هست WRN که از ResNet خیلی بهتره اما کمی از دنزنت بدتر و به همین شکل به simpleNet میرسید که در همین قافیه هاست .
بعد بر اساس نیازتون نگاه میکنید کدوم رو انتخاب کنید.
بطور خلاصه .
1.عموما یک مدل که دقت خوبی روی ایمیج نت گرفته انتخاب میکنید (دقت و سربار رو نگاه میکنید و یک مدل که دقت خوب با سربار کمتر داره انتخاب میکنید. مثلا موبایل نت یا گوگل نت) و بعد رو دیتاست خودتون فاین تون میکنید.
2.اگه مدل کوچکتری مورد نیاز هست میرید روی مدلهایی که روی دیتاستهایی مثل سیفار10 و امثالهم ترین کردن و بعد مثل ایمیج نت رفتار میکنید یک مدلی که سربار کمتر و دقت بالاتری داره انتخاب میکنید.
شبکه ها اسم های مختلفی دارن . مثل DenseNet یا ResNet یا Wide Residual Network یا همون WRN .
سیفار خودش اسم یه موسسه اس (انستیتو Canadian Institute for Advanced Research ) و چندتا دیتاست داره یکیش CIFAR10 هست که خیلی معروفتره (CIFAR100 هم هست) . این دیتاست ها خیلی معروفن و معمولا قدم اول برای معرفی معماری ها هستن خصوصا برای کسایی که سخت افزار قوی برای ترین روی ایمیج نت ندارن .
اون معماری اولی که لینکشو دادید معماری Network in Network بود. که روی سیفار10 ترین شده بود.
به همین شکل پیش میرید. البته این مثالهایی که زدم بیشتر برای ایده دادن بودن وگرنه تعداد معماری ها خیلی زیاده و اینجا نمیشه بازش کرد و همه رو قیاس کرد یا توضیح داد
یک نکته بسیار مهم در مورد تصاویرتون. شما با ریسایز کردن به 32در32 اطلاعات خیلی زیادی رو از دست میدید. پیشنهاد من اینه که حتما روی مدلهایی که روی ایمیج نت ترین شدن مثل موبایل نت یا گوگل نت و.... فاین تون کنید. و از ریسایز تصاویرتون به اندازه خیلی کوچیک پرهیز کنید.
نکته بعدی اینکه بچ 32 در 32 یعنی چی ؟ چیکار کردید؟ تعداد کلاسهای شما زیاده و دیتای شما کم باید با دیتا اگمنتیشن سعی کنید دیتا رو کمی افزایش بدید و بعد سعی کنید حتما از مدلهای ترین شده روی ایمیج نت استفاده کنید تا نتیجه بهتر رو بگیرید.