سلام
1-
آ- افزایش تعداد لایه های کانولوشنی و fc ( البته لازمه این کار اینه که به اندازه کافی داده هم داشته باشید تا overfit رخ نده)
ب - معماری رو بگونه ای اصلاح کنید تا از تعداد پارامترهای استفاده شده بیشترین راندمان رو بگیرید.
پ - تست شبکه با پارامترهای متفاوت (نرخ یادگیری، تعداد فیلتر ها، سایر فیلترها، بچ سایز و ... )
ت - استفاده از loss function مناسبترو یا چند loss بطور همزمان.
ث - استفاده از batch_normalization
جیم - استفاده از فیلترهای با ابعاد مختلف در یک لایه بصورت موازی (Pyramid Pooling)
چیم - استفاده از چندین loss در جاهای مختلف (supervision ) هم میتونه کمک کننده باشه
صاد - ...
2- استفاده از max-pooling برای کاهش ابعاد ویژگیهای ورودی می باشد. همچنین این موضوع قدرت تشخیص اشیاء جابجا شده و چرخیده شده در تصویر را بیشتر می کند. بعلاوه هر چند بعد از چند مرحله کانولوشن و max-pooling ابعاد ویژگی ها کاهش می یابند ولی این ویژگی ها غلیظ تر (سطح بالاتر) هستند. بعبارت دیگر به مجموعه ویژگی های کمتر میرسید که ارائه دهنده ویژگی کل تصویر می باشد.
-- بهتره قبل از اینکه در سایت سوالی مطرح کنید این موضوعات پایه ای رو کامل مطالعه کرده باشید.
موفق باشید.