سلام
شبکه های کانولوشنی الگوهای موجود در تصویر ورودی را یاد می گیرند. ممکن است این الگوها به هم دیگر شبیه باشند ولی قطعا در آنها تفاوت هایی وجود دارد که انسان با دیدن آنها کلاس های مختلفی را تشخیص می دهند. هر چقدر برای انسان نیاز به دقت بیشتری برای تشخیص الگوها وجود داشته باشند در واقع متناسب با این موضوع است که الگو های موجود در کلاس های مختلف شباهت زیادی با هم دارند. به این نوع کارها که درون کلاسی شباهت زیادی وجود دارد fine-grained classification می گویند.
A survey on deep learning-based fine-grained object classification and semantic segmentation