با سلام
موضوع پایان نامه من تشخیص رویداد آنرمال در صحنه است و از یک شبکه اتواینکدر که فقط از کلیپ های آموزشی فاقد رویداد آنرمال برای آموزش شبکه استفاده کردم. دیتاستی که استفاده کردم چند کلیپ به عنوان تست داره که gt هم دارن. حالا سوال من اینکه برای ارزیابی مدل آیا باید تک به تک کلیپ های ویدئویی تست رو به مدل بدم و Tp , FP و... حساب کنم و در نهایت دقت و F1 و AUC مدل رو میانگین گیری کنم یا اینکه کل کلیپ های تست رو یکجا باید به مدل داد برای ارزیابی معیارهای ارزیابی؟
خیلی برام مهم و ضروریه ممنون میشم راهنمایی بفرمایید.