Klinische und statistische Vorhersagen

Ein Mensch ist krank; es gilt, den Verlauf seiner Erkrankung vorherzusagen. Ein Mensch hat eine Gewalttat begangen, seine Strafe verbüßt und steht vor der Entlassung; nun soll seine Gefährlichkeit prognostiziert werden.

Um Aufgaben dieser Art zu bewältigen, stehen grundsätzlich zwei Wege zur Auswahl, nämlich die klinische Beurteilung und die statistische Berechnung. Um zu einem klinischen Urteil zu gelangen, wird der Arzt, der Psychiater, der Psychologe im günstigen Fall mit dem Menschen sprechen, er wird einschlägige Akten studieren, eventuell auch Dritte befragen, dann alle Gesichtspunkte abwägen und schließlich eine abschließende Stellungnahme abgeben. In die statistische Berechnung fließt meist nur eine kleine Zahl von Daten ein, deren Zusammenhang mit dem interessierenden Merkmal oder Prozess empirisch erhärtet werden konnte. Die Daten sind die Ausprägungen beobachtbarer, mehr oder weniger gut messbarer Variablen. Die subjektive Sicht oder die Intuitionen der Anwender der statistischen Methode spielen dabei keine Rolle. Die statistische Methode wird in der amerikanischen Literatur häufig auch als versicherungsmathematische (actuarial judgment) bezeichnet, da üblicherweise Versicherungsgesellschaften ihre Risiken auf diese Weise abschätzen.

Der amerikanische Psychologe Paul E. Meehl sorgte 1954 für beträchtliches Aufsehen, als er in einem kleinen Buch Studien zur Effizienz der genannten Wege zur Prognose präsentierte und zu der Überzeugung gelangte, dass die versicherungsmathematische der klinischen Vorhersage in vielen Bereichen weit überlegen sei.1

Der amerikanische Psychologe und Nobelpreisträger für Wirtschaftswissenschaften, Daniel Kahneman erinnert sich daran, dass dieses Buch Schockreaktionen und Unglauben unter klinischen Psychologen provozierte. Doch seither habe ein Strom weiterer Forschungen Meehls Auffassung bestätigt, und zwar in einer Fülle zusätzlicher Bereiche. Er nennt u. a. die Lebensdauer von Krebspatienten, die Verweildauer in Krankenhäusern, die Diagnose von Herzkrankheiten, die Anfälligkeit von Säuglingen für den plötzlichen Kindestod – aber auch ökonomische Variablen wie beispielsweise den Erfolg neuer Unternehmen, die Bewertung von Kreditrisiken, die zukünftige berufliche Zufriedenheit von Angestellten – und nicht zuletzt politisch relevante Aspekte wie beispielsweise die Einschätzung der Eignung von Pflegeeltern, die Rückfallquote jugendlicher Delinquenten und die Wahrscheinlichkeit gewalttätigen Verhaltens.2

Die Überlegenheit des statistischen Ansatzes zeige sich also nicht nur in medizinischen oder psychiatrischen und psychologischen Arbeitsfeldern, sondern allgemein. Das Expertenurteil sei nicht besser, sondern häufig schlechter als der statistische Ansatz. Das klinische Urteil erfahrener Experten ist in vielen Fällen dem Urteil von Laien oder Berufsanfängern nicht überlegen; dies gilt insbesondere für den psychiatrischen und psychotherapeutischen Bereich, denn hier ist es besonders schwierig, aus Erfahrungen zu lernen, weil häufig die Rückmeldung zur Validität der Prognosen und zudem meist auch eine klare Definition von Urteilsfehlern fehlt.

Es ist daher leicht erklärlich, warum sich die Prognosegüte durch Berufsausbildung und Berufserfahrung in diesen Bereichen nicht verbessert. Empirische Belege für diese These finden sich beispielsweise in einer Schrift von Robyn Dawes.3

Aus diesem Grunde herrscht in der Wissenschaft weitgehende Einigkeit darüber vor, dass die versicherungsmathematische Methode der Prognose dem klinischen Urteil vorzuziehen sei, auch wenn sich die Praxis vielfach, trotz der Befunde aus 60-jähriger Forschung, immer noch gegen diese Einsicht sträubt. Viele Experten und Laien frönen nach wie vor dem Glauben, dass die Intuition und Erfahrung des Experten der kalten Mathematik und den dürren Zahlen überlegen sei. Dies jedoch ist ein Mythos, für den es nicht den Hauch eines Beweises gibt.

Man sollte allerdings den Wert der versicherungsmathematischen Methode nicht überschätzen; ihre Vorhersagen sind in vielen Fällen weit davon entfernt, präzise zu sein – auch wenn sie besser sind als die schieren Meinungen von Klinikern oder anderen Praktikern. Und mitunter sind sie genauso schlecht wie die Prognosen, die auf klinischer Erfahrung und Intuition beruhen.

So unterzogen beispielsweise Seena Fazel und Kollegen4 häufig eingesetzte Verfahren zur Vorhersage von Gewalt und antisozialem Verhalten einer systematischen Überprüfung. Zu diesen Verfahren zählten sowohl statistisch orientierten Methoden, als auch Leitfäden für strukturierte Interviews. Es stellte sich u. a. heraus, dass in der Gesamtschau die statistischen (versicherungsmathematischen) Verfahren nicht effektiver waren als die Vorhersagen, die auf strukturierten klinischen Interviews beruhten. Generell seien alle Instrumente untauglich zur Risikoeinschätzung, auch wenn sie Individuen mit einem niedrigen Gewaltrisiko recht akkurat einstufen könnten.

Sie schreiben:

Unsere Übersichtsarbeit legt jedoch nahe, dass Werkzeuge zur Risikoeinschätzung in ihrer gegenwärtigen Form nur zur groben Klassifikation von Individuen auf der Gruppenebene gebraucht werden können, und nicht um die Kriminalprognose im individuellen Fall zu determinieren.“

Auch wenn also statistisch fundierte Vorhersagen im Allgemeinen (jedoch keineswegs durchgängig) besser zu sein scheinen als „klinische“, also nur subjektive, intuitive Prognosen, sind die „versicherungsmathematischen“ Vorhersagen weit davon entfernt, eine solide Grundlage für gravierende Entscheidungen zu bilden.

Es mag zwar sein, dass wir menschliches Verhalten in Situationen recht gut prognostizieren können, die überschaubar, in denen die Zahl der relevanten Einflüsse klein ist und die relativ konstant sind. Aber auch in diesen Fällen ist die Prognose meist nur auf der Gruppenebene hinlänglich genau und nicht für das einzelne Individuum.

Überall da aber, wo menschliches Verhalten größere Freiheitsgrade besitzt und die relevanten Bedingungen sich häufig ändern, sind Prognosen oft kaum valider als eine Glaskugelschau – und dies unabhängig von der Methode, mit der sie gewonnen wurden.

Meehl, P. E. (1954). Clinical versus statistical prediction: A theoretical analysis and a review of the evidence. Minneapolis: University of Minnesota Press

Kahneman, D. (1911). Thinking – Fast and Slow. London: Macmillan

Dawes, R. (1996). House of Cards. Psychology and Psychotherapy Built on Myth. New York: Free Press

Fazel, S. (2012). Use of risk assessment instruments to predict violence and antisocial behaviour in 73 samples involving 24 827 people: systematic review and meta-analysis. BMJ 2012;345:e4692

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.