سلام .
من متاسفانه تو این حوزه خودم کار نکردم برای همین کمک خاصی نمیتونم بکنم جز توصیه ها و کمک های کلی. در مورد دیتاست باید یادتون باشه که ملاک ارزیابی شما قیاس روش خودتون با روشهای دیگه اس. پس انتخاب دیتاست استانداردی که روشهای مختلف قبلا روی اون کار کردن بشما خیلی کمک میکنه وگرنه مجبورید خودتون اون روشها رو پیاده سازی کنید که بعضا ماه ها بعضی ها طول میکشه (اگه کد و... وجود نداشته باشه براش) . علاوه بر اون تو حوزه دیپ لرنینگ کسی دنبال دیتاست کم و کوچیک نیست . یه دیتاست 57 مگابایتی زیاد بنظر نمیاد و شما کمترین کاری که میتونید بکنید افزایش رم سیستمتون هست( بحث کارت گرافیک بکنار). پیشنهاد من اینه اول در مقالات ارکایو روشها و دیتاست هایی که براتون مقدور هست رو مشخص کنید بعد روی اونها کار کنید. کسایی که تو ارکایو مطلب میزارن معمولا ایمیل بزنید و درخواست کد یا راهنمایی کنید جواب میدن چون یکی از اصول اینه که در ارکایو قرار داده بشه و فیدبک گرفته بشه. (علاوه بر اینکه یک رکورد ثبت بشه برای اونها)
در مورد پیدا کرن دیتاست هم در سایت بخش دیتاست ها من دیتاستهای مختلفی رو معرفی کردم و علاوه بر اون لینک به یکسری منابع تو این بخش رو هم دادم که میتونید به اون منابع مراجعه و سوال کنید و شاید هم بتونید راهنمایی بگیرید .
علاوه بر اونها Academictorrent هم در بخش دیتاست ها وجود داره (یک پست جداگانه هم در سایت درموردش هست) که دیتاست های مختلف رو در خودش داره که میتونید دانلود کنید . پیشنهاد میکنم به اون هم سربزنید. البته بعد از برقراری تماس با نویسنده بعضی از مقالات جدید در ارکایو .