با سلام عرض ادب
چندتا سوال داشتم ممنون میشم راهنماییم کنید
در تاپ 5 ، طبقه بند 5 تا حدس میزنه که اگر ابجکت مورد نظر جز این 5 تا حدس باشد در واقع شبکه درست حدس زده هست این هم بخاطر این هست که چون در یک تصویر ممکن هست چندتا ابجکت های دیگری هم موجود باشد.
حالا در تاپ 1 ، یعنی حدس اولیه ( با بیشترین confidence ) به عنوان جواب درست حساب میشود ؟ حالا اگر تصویری که چندتا ابجکت توش باشد این شبکه از کجا بدونه کدوم اون حدسی که بشترین score رو دارد همان لیبلی هست که زده شده به عکس