پاورپوینت یادگیری تقویتی

پاورپوینت یادگیری تقویتی

قابل ویرایش 23 اسلاید

 

قسمتی از متن اسلاید ها :

در یک مسئله یادگیری تقویتی با عاملی روبرو هستیم که از طریق سعی و خطا با محیط تعامل کرده و یاد میگیرد تا عملی بهینه را برای رسیدن به هدف انتخاب نماید.

یادگیری تقویتی از اینرو مورد توجه است که راهی برای آموزش عاملها برای انجام یک عمل از طریق دادن پاداش و تنبیه است بدون اینکه لازم باشد نحوه انجام عمل را برای عامل مشخص نمائیم.

دو استراتژی اصلی برای اینکار وجود دارد:

یکی استفاده از الگوریتم های ژنتیکی

و دیگری استفاده از روشهای آماری و dynamic programming

در RL روش دوم مد نظر است.

محیط مجموعه ای از S حالت ممکن است.

در هر لحظه t عامل میتواند یکی از A عمل ممکن را انجام دهد.

عامل ممکن است در مقابل عمل و یا مجموعه ای از اعمالی که انجام میدهد پاداش r را دریافت کند. این پاداش ممکن است مثبت و یا منفی )تنبیه(باشد




ارسال نظر

  1. آواتار


    ارسال نظر
اس تی یو دانلود یک مرجع برای دانلود فایل های دانشجویی و درسی
در صورت بروز هر گونه مشکل در فرآیند خرید با شماره 09010633413 تماس حاصل فرمایید
همچنین در پیام رسان ایتا پاسخگوی شما هستیم
آمار فروشگاه
  •   تعداد فروشگاه: 13
  •   تعداد محصول: 13,987
  •   بازدید امروز : 3,909
  •   بازدید هفته گذشته: 259,685
  •   بازدید ماه گذشته: 838,633