Машинное обучение: Обучение с подкреплением. Воронцов Константин
Воронцов Константин рассказывает об обучении с подкреплением. Задача о многоруком бандите Простая постановка задачи Жадные и полужадные стратегии Адаптивные стратегии Общий случай: среда с состояниями Общая постановка задачи Метод временных…
Поделиться