تخمین زدن یک سری اعداد گسسته پشت سر هم با استفاده از شبکه عصبی کانولوشنی یک مساله کلاس بندی است یا رگرسیون؟

Question

با سلام
من یک سری تصاویر دارم که برچسب هر کدام یک عدد بین 0 تا 216 میتونه باشه. البته نه لزوما همه این اعداد استفاده شده باشند. مثلا در تصاویر آموزشی 0و 1و 2و 3 وجود ندارد و 4 موجود است و همینطور ممکن است برای 210 تا 215 هیچ تصویر معادلی وجود نداشته باشد.
با توجه به اینکه قائل شدن 217 کلاس برای حل مساله و با نگاه classification انرا حل کردن این مورد را به دنبال خواهد داشت که به طور مثال ما در train تصاویری برای کلاس 4 داریم اما برای کلاس 1 هیچ تصویری نداریم اما در تست ممکن است که یک تصویر برای کلاس 1 داشته باشیم و از طرفی این 217 کلاس یک مساله رشد را تعریف میکنند که در صورتی که امکانش بود این رشد با دقت بیشتر و به صورت پیوسته اتفاق میفته که ما discrete اش کردیم انگار، یعنی مثل cat و dog به عنوان دو کلاس مجزا نیستند بلکه رفته رفته در اثر رشد کلاس 1 به عدد 2 و در واقع به کلاس 2 با نگاه کلاس بندی میرسد، می توان آن را با رویکرد regression حل کرد؟
در صورتی که بخواهیم با رویکرد رگرسیون حلش کنیم باید بجای softmax در شبکه عصبی کانولوشنی از L2-squared norm استفاده کنیم؟
ممنونم

alireza.nrzi · Answer 1 · 2018-01-20T01:16:41+0000

سلام
با توجه به اینکه ما دیتاهای شما رو ندیدیم نظر دادن قطعی خیلی سخته (البته می دیدیم هم تا آدم آزمایش نکنه سخته D:)
اما با توجه به تجربه های مشابه به نظرم نزدیک شدن به حل این مساله فقط از دید classification یا regression شاید نتیجه دلخواه رو نده، به خصوص که مساله ای که مطرح کردید جز مساله های سخت حساب میشه ، به خصوص الان که نیازه در حد ماه سن تشخیص داده بشه

حالا ما میگیم نه classification به یه softmax نه regression، پس کدومش؟ جفتش با هم یا طبقه بندی توی یه ساختار سلسله مراتبی
یعنی اینطوری که شما توی پایپ لاین سیستمتون اول بازه سنی رو تشخیص می دید. برای مثال هر 1 سال رو داده هاش رو به عنوان یک کلاس در نظر بگیریم که فقط مثاله و بسته به دیتاهاتون خودتون بهتر می تونید تصمیم بگیرید
بعد از اینکه بازه اول مشخص شد، می تونیم برای مشخص کردن ماه، یه رگرسیون استفاده کنیم، یا اینکه بگیم یه مرحله دیگه هم تشخیص رو ادامه میدیم. برای مثال اول مشخص کردیم چند سال، بعد مشخص کنیم توی کدوم 3 ماهه سال(یه مساله طبقه بندی 4 کلاسه داریم ) و الی آخر
توی این حالت ممکنه حتی دیگه نیازی به رگرسیون نباشه و با همون classification سلسله مراتبی نتیجه دلخواه رو بگیرید
برای این مدل کارهای، مقالات مرتبط با hierarchical softmax رو بخونید هم می تونه خیلی کمکتون کنه
کد زدنش هم به نسبت یه مدل معمولی کار چندان زیادتری نداره، و اینکه مشکل اسپارس بودن کلاسهای مختلف هم به دلیل اشتراکات بین کلاسها می تونه نسبت به یه softmax خیلی بزرگ، کاهش پیدا کنه
چون این مشکل به خصوص توی nlp و بحث vocab های خیلی بزرگ، یه مشکل خیلی شایع هستش و زیاد هم روش کار شده و هنوزم خیلی مورد توجه هست که می تونید ازشون استفاده کنید

سلام
خیلی ممنون از توضیحات مفیدتون
به طبقه بندی با ساختار سلسله مراتبی(شروع با رده های سنی و سپس اختلاف یک سال و در نهایت اختلاف در حد ماه یا با شروع از یک سال و سپس با اختلاف یک ماه) که فکر میکنم، به مشکل نبود دیتا با برچسب های مربوط به خیلی از چند ماهگی ها برمیخورم به همین خاطر به حل شدن در قالب مساله رگرسیون فکر کردم. چون ممکن است همان طور که عرض کردم در بین تصاویر train تصویری با برچسب 14و15و16و17 ماهگی موجود نباشد اما در تصاویر تست تصویر با برچسب 16 ماهگی وجود دارد.
ایده ترکیب کلاس بندی و رگرشن ایده جالبی بود. ممنونم ازتون. یعنی بازم سلسه مراتبی، اول شبکه رو برای یه coarse classification با اختلاف مثلاً یک سال (با برچسب گذاری های جدید) آموزش بدم و بعد شبکه رو با loss function دیگه ای برای هدف رگرسیون مجددا آموزش بدم و برای مقدار دهی اولیه شبکه از وزن های آموزش دیده قبلی استفاده کنم و یا حتی وزن های لایه اول رو فریز کنم یا نه منظورتون از ترکیب رگرسیون و کلاس بندی چیز دیگه ای بود؟ اگر منظورتون همین رویکرد هست میتونید بفرمایید از همون اول شبکه رو برای رگرسیون این داده ها آموزش دادن چه معایبی نسبت به این حالت دو مرحله ای داره؟
متشکرم — Z_M, ژان 20, 2018
سلام
متشکرم از توضیحات بسیار خوبتون. خیلی لطف کردید که در مورد نحوه آموزش شبکه سلسه مراتبی با استفاده از چندین softmax توضیح دادید. خیلی ممنون میشم اگر براتون مقدور باشه عناوین مقالات مهمی که در زمینه hierarchical softmax کار شده رو بفرمایید تا مستقیم برم سراغ اون مقلاتی که بیس این ایده رو توش خوب و روشن توضیح دادن.
مجدداً سپاسگزارم از وقتی که گذاشتید — Z_M, ژان 23, 2018

دسته بندی ها

تخمین زدن یک سری اعداد گسسته پشت سر هم با استفاده از شبکه عصبی کانولوشنی یک مساله کلاس بندی است یا رگرسیون؟

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

لطفا وارد شده یا عضو شوید تا بتوانید سوال بپرسید

1 پاسخ

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

سوالات مشابه

دسته بندی ها

تخمین زدن یک سری اعداد گسسته پشت سر هم با استفاده از شبکه عصبی کانولوشنی یک مساله کلاس بندی است یا رگرسیون؟

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید

لطفا وارد شده یا عضو شوید تا بتوانید سوال بپرسید

1 پاسخ

لطفا وارد شده یا عضو شوید تا بتوانید دیدگاهی ارسال نمایید