![]() |
Russian | English |
доводка вознаграждения | reward shaping (в обучении с подкреплением уточнение функции вознаграждения на основе знания предметной области Valeriy_Yatsenkov) |
предстоящее вознаграждение | reward-to-go (вознаграждение, ожидаемое за выполнение следующего действия в алгоритмах принятия решений Valeriy_Yatsenkov) |
разреженное вознаграждение | sparse reward (в обучении с подкреплением, когда лишь одно или несколько состояний системы приносят ненулевое вознаграждение Valeriy_Yatsenkov) |