Reinforcement Learning with Monte Carlo Methods
Uczenie przez wzmacnianie z metodami Monte Carlo to technika, która używa symulacji Monte Carlo do oceny i optymalizacji polityki decyzyjnej agenta na podstawie obserwowanych nagród. Technika ta jest szeroko stosowana w zadaniach, gdzie modelowanie przyszłych stanów jest trudne lub niemożliwe, jak w grach czy optymalizacji dynamicznych systemów.

