سلام
در لایه آخر که حتما باید تغییرات داشته باشیم، به دلیل تغییر تعداد خروجی ها و این طبیعی هستش
اما در لایه های وسطی، اولا چون دارید از fine tune استفاده میکنید، معمولا تغییری در تعداد فیلترها داده نمیشه
ممکنه شما بگید من از فلان شبکه، مثل ResNet، فقط 10 تا لایه اولش رو برمیداریم و یه softmax سی و دو تایی می چسبونم بهش و train می کنم(یعنی عمق دست خودتونه)، اما معمولش اینه که تعداد feature mapهای هر لایه رو عوض نکنید
البته نمیگم این کار نادرست، یا نشدیه ولی در واقعیت در عموم موارد نیازی به این کار نیست
در مورد لایه اول هم حقیقتش اینه که معمولا تمامی این اعداد با آزمون و خطا یا تجربه استفاده میشه و ربطی به تعداد کلاسها نداره
البته بعضی جاها میشه حسی استدلال کرد که چون من 32 تا کلاس در لایه آخر دارم، پس اگه توی لایهها 32 تا کلاس استفاده کنم، شاید شبکه یاد بگیره برای هر کلاس یه فیلتر جداگانه رو در نظر بگیره، اما در شبکههای معمولی که ما ازش استفاده میکنیم، این استدلال شکست خورده ایه (من خودم یکی از شکست خوردگان این موضوعم D; ) و شانس اتفاق افتادن همچین موضوعی خیلی کمه. برای اینکه شبکه رو مجبور کنید که به سمت این استدلال بره، باید ساختار شبکه رو مختص این موضوع طراحی کنید که یاد بگیره برای هر کلاس، یه سری feature خاص یاد بگیره