سلام
بسته به کاربردتون داره، مثلا توی کاربردهای حساس، مثل مهندسی پزشکی و تشخیص بیماریها، هر تغییری روی تصویر، حتی الگوریتمهای خیلی ساده پردازش تصویر مثل فیلتر میانگین و این چیزا هم باید خیلی با احتیاط استفاده بشه
چه برسه به اینکه شکل تصویر تغییر بکنه و بقیه چیزهایی که ممکنه توی data augmentation روی تصویر اتفاق بیوفته
یعنی در این نوع کاربردها، استفاده کورکورانه از افزایش مصنوعی دیتاها از پایه اشتباهه و در استفادش خیلی باید دقت کرد
در بقیه موارد و کاربردهایی که اینقدر حساس نیستن، در حالت کلی و اگه درست استفاده بشه، معمولا به جز اینکه یه سربار محاسباتی اضافه میکنه، مشکل خاصی نداره و بسته به کاربرد و مساله، تا به بحث generalization مدل کمک میکنه. علاوه بر training حتی توی زمان test هم می تونید از data augmentation استفاده کنید و جوابها رو میانگین یا ... بگیرید.
یعنی به طور عمومی، در زمانی که بشه از data augmentation استفاده کرد، بهتره که استفاده بشه
در مورد اینم که در زمان training دیتا تولید بشه یا اول تولید بشه به طور جداگانه و بعدا استفاده بشه، هر دو صورت ممکنه، مثلا توی keras، با توابع flow یا flow_from_directory از ImageDataGenerator میشه هر کدوم از دو حالت رو که نیاز داشته باشید استفاده کنید