به بخش پرسش و پاسخ یادگیری عمیق خوش آمدید,
این نسخه آزمایشی سایت است.
لطفا به نکات زیر توجه کنید:
  • برای ارتباط با مدیران میتوانید از صفحه مدیران اقدام کنید.
  • سوال و جواب ها باید به زبان فارسی باشند. استفاده از زبان انگلیسی یا فینگلیش برای پاسخ دادن مجاز نیست.
  • لطفا بعد از پرسش سوال لینک سوال خود را در گرو تلگرام (Iran Deep Learning Group) معرفی کنید تا سریعتر به جواب برسید. برای دسترسی به آخرین لینک از منابع یادگیری استفاده کنید
  • لطفا بجای عکس از متن استفاده کنید. اگر متون طولانی هستند از سایت pastebin.com برای اپلود استفاده کرده و لینک حاصل را در سوال خود قرار دهید. برای قرار دادن تصویر ، از بخش ارسال تصویر ادیتور سایت استفاده کنید.
  • بعد از دریافت پاسخ، بهترین پاسخ را از طریق کلیک بر روی علامت تیک انتخاب کنید
  • اگر با خطا و یا مشکلی مواجه شدید از بخش تماس با ما در انتهای صفحه و یا ایمیل Coderx7@gmail.com موضوع را اطلاع دهید.

با تشکر

دسته بندی ها

0 امتیاز

سلام
دوستان بنظرتون دیتااگمنتیشن علاوه بر مزیتی که داره بدی هم میتونه داشته باشه ؟ و اینکه این تکنیک در حین فرآیند آموزش صورت میگیرد منظورم اینکه از روی دیتاهای اصلی ، دیتاهای مصنوعی ساخته میشوند یا اینکه ابتدا دیتاهای مصنوعی ساخته میشوند بعدش یک دیتاست جدیدی که مجموعه دیتاهای اصلی و مصنوعی هست ساخته میشود بعدش فرآیند ترینینگ صورت میگیرد؟

توسط (389 امتیاز)

1 پاسخ

0 امتیاز
 
بهترین پاسخ

سلام
بسته به کاربردتون داره، مثلا توی کاربردهای حساس، مثل مهندسی پزشکی و تشخیص بیماری‌ها، هر تغییری روی تصویر، حتی الگوریتمهای خیلی ساده پردازش تصویر مثل فیلتر میانگین و این چیزا هم باید خیلی با احتیاط استفاده بشه
چه برسه به اینکه شکل تصویر تغییر بکنه و بقیه چیزهایی که ممکنه توی data augmentation روی تصویر اتفاق بیوفته
یعنی در این نوع کاربردها، استفاده کورکورانه از افزایش مصنوعی دیتاها از پایه اشتباهه و در استفادش خیلی باید دقت کرد

در بقیه موارد و کاربردهایی که اینقدر حساس نیستن، در حالت کلی و اگه درست استفاده بشه، معمولا به جز اینکه یه سربار محاسباتی اضافه میکنه، مشکل خاصی نداره و بسته به کاربرد و مساله، تا به بحث generalization مدل کمک میکنه. علاوه بر training حتی توی زمان test هم می تونید از data augmentation استفاده کنید و جوابها رو میانگین یا ... بگیرید.
یعنی به طور عمومی، در زمانی که بشه از data augmentation استفاده کرد، بهتره که استفاده بشه

در مورد اینم که در زمان training دیتا تولید بشه یا اول تولید بشه به طور جداگانه و بعدا استفاده بشه، هر دو صورت ممکنه، مثلا توی keras، با توابع flow یا flow_from_directory از ImageDataGenerator میشه هر کدوم از دو حالت رو که نیاز داشته باشید استفاده کنید

توسط (1.6k امتیاز)
انتخاب شده توسط
به نظر من اگر همزمان با ترین شبکه صورت بگیرد اونوقت باید بخشی از رم GPU بخاطر سربار محاسباتی دیتا اگمنتیشن پر بشه یا فرضا رم کامپیوتر درسته؟ ایراد محسوب نمیشه ؟
ببینید شما ساخت داده مصنوعی رو می تونید بر عهده CPU بزارید و صرفا از رم خود کامپیوتر استفاده کنید. و این ایراد نیست چون به هر حال برای داده سازی های تصادفی شما نیاز به اجرای همزمان با آموزش دارید. برای مثال در پایتورچ به راحتی این عملیات به صورت موازی با آموزش انجام می شه و هیچ محدودیت سرعتی برای کار GPU ها ایجاد نمی شه.
...