سلام
مساله شما دو بخش داره . یک بخش یادگیری و دوم بخش پیاده سازی . در مرحله اول شما باید یک الگوریتم حالا میتونه شبکه عصبی کانولوشن باشه یا انواع دیگه رو مشخص کنید بعد اونو خوب یاد بگیرید . در مرحله بعد نوبت پیاده سازی هست که میتونید ابتدا یک اموزش غیر برداری و ساده بنویسید بعد با توجه به قابلیت هایی که کارت گرافیک میده با استفاده از توابع اماده در تولکیت cuda پیاده سازی های اصلی رو انجام بدید .
آموزش های مرتبط با یادگیری عمیق خصوصا شبکه عصبی کانولوشن در سایت اومده .
در بخش منابع یادگیری هم یکسری لینک پیاده سازی هست که میتونید ببینید هرچند از فریم ورکهای معروف هم میتونید استفاده کنید.
برای بخش پیاده سازی هم کافیه یک آموزش در مورد cuda programming ببینید و بعد شروع بکار کنید. من یادم میاد قبلا دانشگاه ایلینویز یک کورس آموزشی داشت(توسط wen mei hwu) در اینترنت باید بتونید راحت پیدا کنید.