Soft Actor-Critic (SAC)
SAC to algorytm uczenia przez wzmacnianie, który wprowadza element losowości w wybór działań agenta, co prowadzi do bardziej efektywnego eksplorowania przestrzeni działań i lepszej stabilności trenowania. SAC jest szeroko stosowany w zadaniach związanych ze sterowaniem robotami, zarządzaniem zasobami i optymalizacją procesów decyzyjnych.

