Reward Prediction Error

Reward Prediction Error beschreibt die Differenz zwischen erwarteter und tatsächlich erhaltener Belohnung. Dein Gehirn belohnt Dich nicht für Genuss. Es belohnt Dich für Überraschung. Wolfram Schultz zeigte 1997: Dopamin-Neuronen feuern am stärksten bei unerwarteten Belohnungen, nicht bei vorhergesagten. Im Körper spürst Du das als kurzen Kick, ein Aufflackern von Wachheit, leichtes Vorneigen, Augen weiter. Schon eine halbe Sekunde Abweichung zwischen Erwartung und Realität reicht. Wenn die Belohnung vorhersagbar wird, verstummt das Signal. Und genau das erklärt, warum Du bei bekannten Dingen Langeweile spürst und bei unberechenbaren Reizen nicht aufhören kannst.

Drei Zustände des Reward Prediction Error:

Positiver Fehler: Du bekommst mehr als erwartet. Dopamin feuert. Du willst mehr.
Kein Fehler: Die Belohnung entspricht der Erwartung. Kein Dopamin-Signal. Langweilig.
Negativer Fehler: Du bekommst weniger als erwartet. Dopamin sinkt unter Baseline. Enttäuschung.

Woher Reward Prediction Error kommt

Schultz untersuchte Affen, die auf einen Ton hin Saft bekamen. Anfangs feuerten die Dopamin-Neuronen beim Saft. Sobald der Affe lernte, dass der Ton Saft bedeutet, feuerten sie beim Ton, nicht mehr beim Saft. Die Belohnung selbst wurde irrelevant. Entscheidend war die Vorhersage. Und wenn der Saft ausblieb, obwohl der Ton kam: Dopamin-Einbruch. Enttäuschung. Das System reagiert nicht auf Genuss. Es reagiert auf Abweichung.

Deshalb sind Pull-to-Refresh, variable Likes und algorithmische Feeds so wirkungsvoll. Sie sind Überraschungs-Maschinen, gebaut für ein Gehirn, das auf Vorhersagefehler reagiert. Du weisst nie, was kommt. Manchmal 3 Likes, manchmal 300. Manchmal ein gutes Match, manchmal keins. Genau diese Variabilität hält Dich drin. Nicht der Content. Die Unberechenbarkeit.

Wie sich Reward Prediction Error bei Männern zeigt

Was ich beobachte: Männer, die ständig zwischen Apps wechseln, Dating-Plattformen endlos nutzen oder Gaming-Sessions nicht beenden können, sind selten süchtig nach dem Inhalt. Sie sind süchtig nach der Unvorhersagbarkeit. Der nächste Swipe könnte der Treffer sein. Das nächste Video könnte das lustigste sein. Das nächste Level könnte den Durchbruch bringen. Nicht die Belohnung hält Dich fest. Das Vielleicht hält Dich fest.

Das erklärt auch, warum feste Routinen sich langweilig anfühlen. Vorhersagbare Belohnungen erzeugen kein Dopamin-Signal. Dein System hat gelernt: Der Spaziergang ist nett, aber das Handy könnte überraschen. Also greifst Du zum Handy. Nicht weil es besser ist. Sondern weil es unberechenbarer ist. Und Unberechenbarkeit schlägt Qualität, wenn Dein Dopamin-System die Entscheidung trifft.

„Ein Mann, 29, Dating-Apps. Swipte viel, schrieb wenig. Ich fragte: Wie oft ist es wirklich gut? Selten. Warum bleibst du dran? Weil ich denke, gleich kommt ein gutes Match. Stille. Dann: Eigentlich warte ich die ganze Zeit. Nicht auf die Person. Auf das Gefühl, dass gleich was Gutes kommt. Er war nicht süchtig nach Dates. Er war süchtig nach der Möglichkeit.“

Im Körper zeigt sich das als leichte Spannung, Vorneigung, erhöhte Wachheit. Nicht Entspannung, nicht Genuss. Erwartung. Und genau diese Erwartung ist der stärkere Treiber als jede tatsächliche Belohnung.

Woher Reward Prediction Error kommt

Wie sich Reward Prediction Error bei Männern zeigt

Verwandte Begriffe