معمولا یک تصویر با اندازه بزرگ به دو روش به یک شبکهی کانولوشنالی مثل VGG16 داده میشود
1. یا برابر اندازه ورودی شبکه تغییر اندازه میشود
2. یا تصویر برش میخورد و در چند مرحله به شبکه داده میشود
در هیچکدام از دو حالت فوق اندازهی خروجی شبکه فرقی نمیکند و بازم در لایهی آخر (البته به استثناء اون dropout آخر) به اندازهی 14در14 میرسیم. چجوری اندازه بزرگتر میشه؟