سلام
فقط از روی دیتاست و حجمش نمیشه سریع تصمیم گرفت
براتون مثال می زنم، فرض کنید می خواید بین کار کردن روی تصاویر پزشکی، یا دیتاستهای غیرتصویری مثل سیگنالهای مغزی یکی رو انتخاب کنید
وقتی دارید با تصویر کار میکنید، "معمولا" حجم دیتاستهای بالاتره. پس شاید حس اولیه اینه که زمان بیشتری هم کار کردن باهاش می بره
اما واقعیت اینه که خیلی وقتها، اینقدر مدلهای آماده در انواع زمینهها هست که تنها کافیه که شما یه مدل رو دانلود کنید، یکم fine tuneش کنید برای دیتاهای خودتون و تمام. و چون بحث fine tune کردن هم هست، معمولا زمان لازم برای train خیلی کمتر از حالتیه که شما از اول بخواید یه شبکه رو آموزش بدید. همینطور شبکههای جدید معمولا با اینکه عمق زیادی دارن، اما اتفاقا تعداد پارامترهای خیلی معقولی دارن(مثلا مقایسه کنید resnet رو با alexnet یا vgg) و نگرانی از حجم شبکه کمتر شده. آماده بودن مدلهای از پیش آموزش داده شده، کنار شبکههای با دقت بالا اما حجم کم، نگرانی سخت افزار رو هم کمتر می کنه
حالا بریم سراغ سیگنالهای مغزی. خیلی میشه سناریو چید کنار هم، اما برای مثال فرض کنید میخوایم که یه بیماری رو تشخیص بدیم. یه روش اینه که یه تیکه از سیگنال رو جدا کنید، بدید به یه شبکه که پیش بینی کنه بر اساس این تیکه آیا بیماری هست یا نه. یا اینکه از شبکه های recurrent استفاده کنید و شبکه سیگنال رو دنبال هم پردازش می کنه.
توی همین مرحله، اولا دیگه به اندازه بحث روی تصویر، مدلهای آماده و از پیش آموزش داده شده نیست. اگه انتخابتون شبکه های recurrent باشه که نکات خیلی بیشتری برای آموزششون نسبت به شبکه های convolution نیازه که به دقت قابل قبول برسید.
از طرف دیگه، با اینکه دیتاستتون کوچیکتره، اما اگه می خواید از مدلهای عمیق استفاده کنید، همین کم بودن دیتا مشکل ایجاد می کنه. اما توی fine tune کردن مدلهای قبلی رو تصویر، حتی با دیتا کم هم به نتایج خوبی می رسیم
مثال من روی سیگنالهای مغزی بود، حالا اگه چیزایی از bio مثل تحلیل dna و rna و اینچیزا رو در نظر بگیرید، به دلیل ساختار دادهها، موضوع بازم ظرافتهای بیشتری پیدا می کنه
خلاصه اصلا فقط روی محدودیت سخت افزاری تصمیم نگیرید و پارامترهای دیگه مثل اینکه چقدر قبلا روی موضوع کار شده، چقدر جای پیشرفت داره، چندتا دیتاست برای هر موضوع هست، نقطه تمرکز مقالات اخیر روی چیه و .... رو هم در نظر بگیرید
یه سوال بپرسید مشخص می شه چی کار می خواید بکنید :
حاضرید 1 ماه با سخت افزاری که در دسترس تون هست یه مدل رو آموزش بدین، اما نقطه ابهام آنچنانی وجود نداشته باشه براتون
یا اینکه بدونید که با فلان حجم داده، شاید آموزش شما 2 ساعت بیشتر طول نکشه، اما برای رسیدن به یه مدل و شبکه خوب، 1 ماه وقت بذارید؟