سلام
از انجایی که اطلاع دارم CNN فیچرهای رو از پایین ترین سطح یعنی لبه ها و منحنی ها و ... درمیاورد تا اینکه به سطح انتزاعی بالاتری برسد و این فیچرها طبق یک سری تصاویر که همان دیتاست هستند بدست میایند
سوال اول :
حالا در HOG ، که فیچرهای بصورت دستی حساب میشوند آیا اینجا هم طبق دیتاست فیچرها درآورده میشود یا اینکه یک استراتژی هست برای تمامی تصاویر ، تا جایی که اطلاع دارم بلاخره این فیچرها یادگیرنده نیستند پس نباید دیتاست اینجا دخیل باشد درسته ؟ و اینکه سطح انتزاعی فیچرها در اینجا در چه حدی هست ؟
سوال دوم :
وقتی یک CNN روی یک دیتاستی مثله ImageNet ترین میشه که در واقع هیچ دیتاستی به اندازه این بزرگ نیست فکر کنم 14 میلیون تصویر داره حالا بعد از اینکه ترین شد میاییم روش تست میزنیم فرضا به دقت بالای 90 درصد میرسیم . چرا وقتی میاییم رو یه دیتاست دیگه تست میکنیم میبنیم به دقت فرضا 80 رسیده است چرا اینجوری میشه ؟ اگه واقع محتوای این دیتاست ها فرق دارند چرا نمیایند این دیتاست ها رو ترکیب کنند ؟