بیشتر کسانی که در رقابت های مختلف در رنکینگ بالا قرار میگیرند به صورت تیمی کار میکنند ، بهتره بگم بیشتر افرادی که در این رقابت ها شرکت میکنند شاید اونقدر به جایزه فکر نمیکنند چون برای یک متخصص داده جایزه ای که در نظر گرفته شده تقریبا مبلغی نیست چه برسه به یک تیم .چیزی که خیلی مهمه آشنا شدن با افراد مختلف یاد گرفتن تکنیک ها هست از طرفی مطالب خیلی جالبی در فروم های مربوط به هر رقابت مطرح میشه و افراد مختلف تجربیات خودشون در مورد هر مسیله ای رو به اشتراک میذارن.اگه کمی در این فرم ها جستجوی کنید اطلاعات خیلی مفیدی بدست میارید . در این مقاله گفتگویی که با Jeremy Howard یکی از بهترین های kaggle رو بخونید .
اکثر افرادی که به صورت انفرادی شرکت میکنند ابتدا مدلشون رو بر روی یک سیستم با مشخصات سخت افزاری پایین با حجم داده کم طراحی میکنند و در نهایت با استفاده از سرورهایی مثل آمازون برای آموزش استفاده میکنند ، اینکه شما چه سخت افزاری دارید در نهایت مهم نیست ، شما نتایج رو در قالب فرمتی که تعیین شده ثبت میکنید .
تقریبا تمامی کسانی که در رنکینگ های بالا قرار میگیرند از یک نوع متد ensemble خاص خودشون استفاده میکنند که از لحاظ سرعت «استفاده در برنامه هایش کاربردی » عملی نیستند اما به لحاظ کاهش خطا عالی هستند .
سه نکته اساسی در این رقابت ها وجود داره
یک Feature Engineering
دو Custom ensemble
سه DNN Structure