معمولا یک تصویر با اندازه بزرگ به دو روش به یک شبکهی کانولوشنالی مثل VGG16 داده میشود
1. یا برابر اندازه ورودی شبکه تغییر اندازه داده میشود
2. یا تصویر برش میخورد و در چند مرحله به شبکه داده میشود
در هیچکدام از دو حالت فوق اندازهی خروجی شبکه فرقی نمیکند و بازم در لایهی آخر (البته به استثناء اون dropout آخر) به اندازهی 14در14 میرسیم.
چجوری در Faster RCNN اندازه آخرین لایهی ویژگی بزرگتر میشه؟( مقاله میگه 40در60)