سلام . ببینید خیلی واضحه مثلا شما فرض کنید اصلا یک شبکه دیتکشن ساده ترین کردید خروجی این شبکه صرفا چندتا عدده که مختصات شی یا اشیاء رو میده . تصویر بهش بدید خروجی 4 تا عدد میگیرید! اما تو مقاله میبینید نه دور تصاویر همه مشخص شده کاملا تمیز همه چی سرجاشه. شما یک مرحله بعد باید انجام بدید تا از اون اعدادی که شبکه ارائه کرده استفاده کنید. خیلی از پروژه ها اینطوری هستن یعنی کار اصلی رو شبکه انجا م میده و بعد بقیه کار توسط اسکریپت یا اسکریپتهای دیگه انجام میشه که تحت عنوان دمو منتشر میشه. همین کلسیفیکیشن رو در نظر بگیرید . شبکه رو ترین میکنید اخرش بشما یک شماره میده! در اصل یک وکتور میده بعد شما اونو تفسیر میکنی . خشک و خالی چیزی قابل استفاده انچنانی نیست. این بحث مقالات هم همینطوره.