Klinisches Urteil oder Statistik? Prognostische Verfahren im Vergleich

Nehmen wir an, Sie hätten sich auf eine Wette eingelassen. Sie müssen ein Ereignis vorhersagen. Der Gewinn: € 1000. Sie verlieren jedoch € 1000, wenn Sie falsch liegen. Es gibt nun zwei Methoden der Prognose. Mit der Methode A können Sie das kritische Ereignis in 60 Prozent aller Fälle richtig vorhersagen. Der Methode B gelingt dies aber nur in 50 Prozent. Für welche Methode entscheiden Sie sich?

Nehmen wir an, Sie seien ein Richter. Sie stünden vor der Entscheidung, ob sie einen Menschen wegen psychischer Krankheit und Gefährlichkeit gegen seinen erklärten Willen in eine geschlossene Anstalt  einweisen lassen. Es gibt zwei Methoden zur Gefährlichkeitsprognose. Eine davon ist eindeutig (und durch viele Studien erhärtet) die bessere. Welche wählen Sie?

Und nun verbannen Sie die Auseinandersetzung mit diesen Fragen in Ihr Unterbewusstsein. Lassen sie Ihren unbewussten Geist arbeiten. Widmen Sie Ihre Aufmerksamkeit während dessen den folgenden Zeilen.

Wir unterscheiden zwei Grundformen der Prognose:

  • jene, die sich auf das klinische Urteil stützt und
  • jene, die auf einer standardisierten Verrechnung von objektiven Daten (Actuarial Judgment) beruht.

Das „Actuarial Judgment“, auf Deutsch: das versicherungsmathematische Vorgehen erfolgt auf Basis eines statistisch ermittelten Zusammenhangs zwischen einigen Kriterien und dem Phänomen, das vorhergesagt werden soll.1)Beispiel: Kriterien zur Vorhersage von gewalttätigem Verhalten: Vorgeschichte von Gewalttaten, Missbrauch von Alkohol und Drogen, Gebrauch oder Verweigerung verordneter Psychopharmaka u. ä.

Dieser Zusammenhang wird in eine mathematische Formel gefasst. Die Entscheider berechnen also ihre Entscheidung mit Hilfe dieser Formel. Die Kriterien werden in Zahlen ausgedrückt. Das Ergebnis ist ebenfalls eine Zahl. Liegt diese über einem vorher definierten Schwellenwert, ist die Entscheidung positiv, sonst negativ. Eine solche Entscheidung kann also auch ein Computer fällen, der zuvor mit den entsprechenden Daten der Kriterien und dem Schwellenwert gefüttert wurde.

Das „Clinical Judgment“, also das klinische Urteil stammt demgegenüber von einem Menschen, dem so genannten Experten. Ihm liegt eine gedankliche Auseinandersetzung mit dem Gegenstand der Entscheidung zugrunde.

Welche Form ist effektiver?

Seit rund sechzig Jahren wird diese Frage empirisch erforscht. Das Ergebnis ist eindeutig: Bereits die frühen Studien von Meehl zeigten die erhebliche und durchgängige Überlegenheit des „Actuarial Judgment“ gegenüber dem klinischen Urteil.2)Meehl P. E. (1954). Clinical versus statistical prediction: a theoretical analysis and a review of the evidence. Northvale, NJ: Jason Aronson / Meehl P. E. (1957). When shall we use our heads instead of the formula? Journal of Counseling Psychology, 4:268–73 / Meehl P. E. (1959). A comparison of clinicians with five statistical methods of identifying psychotic MMPI profiles. Journal of Counseling Psychology, 6:102–9

Im Verlauf der Jahrzehnte bestätigte eine große Zahl weiterer Untersuchungen diesen Befund. Eine Metaanalyse aus dem Jahre 1970 ergab beispielsweise, dass in 13 von 14 Vergleichsstudien die standardisierte statistische Methode das klinische Urteil ausstach.3)Sines J. O. (1970) Actuarial versus clinical prediction in psychopathology. Br J Psychiatry, 116:129–4

Es liegen inzwischen gut und gern rund 100 solide Studien vor, in denen sich die Einschätzungen Mehls aus den fünfziger Jahren widerspiegeln.4)Ægisdóttir, S. E al. (2006). The Meta-Analysis of Clinical Judgment Project: Fifty-Six Years of Accumulated Research on Clinical Versus Statistical Prediction. The Counseling Psychologist, May: 341-382

  • Das „Actuarial Judgment“ ist überlegen bei der Vorhersage des Rückfalls bei Bewährungsstrafen.5)Palmer W. R. (1997). Parole prediction using current psychological and behavioural predictors, a longitudinal criterion, and event history analysis [dissertation]. Kingston, ON: Queen’s Univ.
  • Es erwies sich als effektiver bei der Vorhersage „psychotischer Zustände“.6)Dawes, R. M. (1989). Experience and validity of clinical judgment: The illusory correlation. Behavioral Sciences & the Law, Volume 7, Issue 4, pages 457–467, Autumn (Fall)
  • In nahezu allen Bereichen, einschließlich der Vorhersage von Gewalt und individueller Psychopathologie, hatten die statistischen Methoden die Nase vorn.7)Dawes R.M., Faust D., Meehl P.E. (1993). Statistical prediction versus clinical prediction: improving what works. In: Keren, G. & Lewis, C.: A handbook for data analysis in the behavioral sciences: methodological issues. Hillsdale, NJ: Erlbaum Associations, 351–67

Dasselbe Bild zeigt sich auch in anderen Bereichen des Lebens, z. B. der Personalauswahl oder bei der Zulassung zu Hochschulstudiengängen. Auch hier erreicht man mit statistischen Methoden bessere Ergebnisse im Vergleich zu den Vorhersagen von Experten.8)Kuncel, N. R. Et al. (2013). Mechanical Versus Clinical Data Combination in Selection and Admissions Decisions: A Meta-Analysis. Journal of Applied Psychology, 2013, Vol. 98, No. 6, 1060 –1072

Die einschlägige Literatur ist umfassend und kann hier nicht einmal ansatzweise referiert werden.9)Einen guten Überblick bietet Robyn Dawes‘ Buch: House of Cards (Dawes, R. (1996). House of Cards. Psychology and Psychotherapy Built on Myth. New York: Free Press).

Deutsche Gutachter verlassen sich aber vor deutschen Gerichten immer noch auf ihr klinisches Urteil, auch wenn sie allen geltenden Qualitätsstandards genügen, und deutsche Richter erwarten dies auch so.

Man darf also festhalten, dass die psychiatrische Begutachtung vor deutschen Gerichten in jedem Fall schlechter ist, als sie sein könnte.

Dies gilt auch dann, wenn forensische Psychiater standardisierte Tests in ihr klinisches Urteil einbeziehen. Denn das klinische Urteil verzerrt, empirisch nachweisbar, die Interpretation der Tests.10)Dawes: House of Cards

Doch selbst die besten Gutachten sind nicht gut genug. Sogar mit den besten verfügbaren Methoden ausgearbeitete Gutachten sind immer noch nicht verantwortbar fehlerbehaftet.

Was aber soll mit den mutmaßlich gefährlichen Leuten geschehen? Sollen sie frei herumlaufen, solange sie keine Straftaten begehen? Soll man sie, obwohl vielleicht immer noch gefährlich, freilassen, wenn sie ihre Strafe abgesessen haben? Welch Art prognostischer Verfahren soll man den entsprechenden Entscheidungen zugrunde legen? Das Beste. Oder jene, bei denen man ein gutes Gefühl hat?

Es gibt Leute, auch kluge, für die ist dieses Thema so bedrohlich, dass sie ihren Verstand abschalten. Wider alle Vernunft und Empirie behaupten sie, dass niemand ungerechtfertigt hinter psychiatrischen Gittern sitzen müsse. Um dies zu verhindern, müssten nur die Gutachter einen vernünftigen Job machen und sich an die Kriterien zur Qualitätssicherung im Gutachterwesen halten.

So darf man m. E. angesichts des eindeutigen Forschungsstandes nicht argumentieren. Man kann doch nicht den Kopf in den Sand stecken, nur weil die Wahrheit mit einigen höchst unerwünschten Konsequenzen verbunden zu sein scheint. Die Überlegenheit der versicherungsmathematischen gegenüber der klinischen Prognose ist einer der am besten abgesicherten Befunde der empirischen Psychologie.

Wie würden Sie entscheiden?

Fußnoten   [ + ]

1.Beispiel: Kriterien zur Vorhersage von gewalttätigem Verhalten: Vorgeschichte von Gewalttaten, Missbrauch von Alkohol und Drogen, Gebrauch oder Verweigerung verordneter Psychopharmaka u. ä.
2.Meehl P. E. (1954). Clinical versus statistical prediction: a theoretical analysis and a review of the evidence. Northvale, NJ: Jason Aronson / Meehl P. E. (1957). When shall we use our heads instead of the formula? Journal of Counseling Psychology, 4:268–73 / Meehl P. E. (1959). A comparison of clinicians with five statistical methods of identifying psychotic MMPI profiles. Journal of Counseling Psychology, 6:102–9
3.Sines J. O. (1970) Actuarial versus clinical prediction in psychopathology. Br J Psychiatry, 116:129–4
4.Ægisdóttir, S. E al. (2006). The Meta-Analysis of Clinical Judgment Project: Fifty-Six Years of Accumulated Research on Clinical Versus Statistical Prediction. The Counseling Psychologist, May: 341-382
5.Palmer W. R. (1997). Parole prediction using current psychological and behavioural predictors, a longitudinal criterion, and event history analysis [dissertation]. Kingston, ON: Queen’s Univ
6.Dawes, R. M. (1989). Experience and validity of clinical judgment: The illusory correlation. Behavioral Sciences & the Law, Volume 7, Issue 4, pages 457–467, Autumn (Fall)
7.Dawes R.M., Faust D., Meehl P.E. (1993). Statistical prediction versus clinical prediction: improving what works. In: Keren, G. & Lewis, C.: A handbook for data analysis in the behavioral sciences: methodological issues. Hillsdale, NJ: Erlbaum Associations, 351–67
8.Kuncel, N. R. Et al. (2013). Mechanical Versus Clinical Data Combination in Selection and Admissions Decisions: A Meta-Analysis. Journal of Applied Psychology, 2013, Vol. 98, No. 6, 1060 –1072
9.Einen guten Überblick bietet Robyn Dawes‘ Buch: House of Cards (Dawes, R. (1996). House of Cards. Psychology and Psychotherapy Built on Myth. New York: Free Press).
10.Dawes: House of Cards