سلام
بنده با شبکه های CapsNet  که از واحد های Capsule تشکیل شده آشنایی کامل دارم و باهاشون کار دارم. این شبکه ها جایگرین خوبی برای لایه های fully-connected  هستند و در تسک های کلاسیفیکیشن بکار میرن.
برای object-detection  معمولا شبکه ها   از روش رگرسیون برای حل مسعله استفاده میکنند. در واقع مسعله شما رگرسیون هستش نه کلاسیفیکشن.
موفق باشید