جهت سوم برای رسیدن به مدل¬های قدرتمند تر طراحی شبکه های عمیق خاص است. در حال حاضر تقریبا تمام طرحهای مبتنی بر شبکه های عصبی کانولوشن از یک شبکه مشترک برای پیش¬بینی¬های خود استفاده می¬کنند که ممکن است به اندازه کافی متمایزکننده نباشد. یک جهت نوید بخش آموزش خاص¬تر شبکه عمیق است ؛ یعنی ما باید بیشتر بر روی نوع شیئی که علاقمند به آن هستیم تمرکز کنیم. تحقیق انجام شده در (۳۰-پیشینه و مرور روش های یادگیری عمیق) تایید کرد که حاشیه نویسی سطح شی مفیدتر از حاشیه نویسی سطح تصویر برای تشخیص اشیاء است. می¬توان به این به¬عنوان نوعی خاص از شبکه عمیق که بر روی اشیاء بجای کل تصویر تمرکز می¬کند نگاه کرد.
منظور از حاشیه نویسی و حاشیه نویسی سطح شیئ یا تصویر چیست؟