Reward Function
Die Reward Function (Belohnungsfunktion) ist das Herzstück des Reinforcement Learning. Sie definiert, was der Agent erreichen soll. Wenn man die Funktion falsch definiert ('Maximiere Punkte im Spiel'), findet die KI oft Schlupflöcher ('Reward Hacking'), um Punkte zu bekommen, ohne das eigentliche Ziel zu erreichen (z.B. im Kreis drehen statt das Level zu beenden).