سلام.به منظور ایجاد ماشین حالت یک برنامه ی نرم افزاری باید از یادگیری تقویتی استفاده شود. این پروژه یک عملیات تست نرم افزار است که قرار است در آن تمامی حالات ممکنه پس از اعمال action های مختلف بصورت رندومی،مئلا کلیک کردن تصادفی button ها در رابط کاربری نرم افزار ،شناسایی شوند. کسی ایده یا نظری برای پیاده سازی چنین پروژه ای با استفاده از reinforcement learning دارد؟
در واقع تولید ماشین حالت یک نرم افزار در پروسه ی تست آن.
باتشکر