Die psychiatrisch forensische Prognostik

Im Licht der einschlägigen Forschung hat sich die Qualität psychiatrischer bzw. psychologischer Gefährlichkeitsprognosen als überaus fragwürdig erwiesen. Die mageren Befunde gaben seit den achtziger Jahren des vorigen Jahrhunderts Anlass zu einer Vielzahl von Studien. Sie sollten zur Verbesserung der Prognosegüte beitragen. Mit soziologischen, psychologischen, psychodiagnostischen und statistischen Methoden wurden mutmaßliche Risikofaktoren für Gewalttätigkeit identifiziert.

Nach wie vor gibt es jedoch keine einheitlichen Modelle, die das ganze Spektrum der potenziell relevanten Einflussgrößen berücksichtigen und die empirisch getestet werden könnten.1)Franklin, R. D. (ed.) (2003). Prediction in Forensic and Neurophysiology. Mahwah, N. J.: Lawrence Erlbaum

Kurz: Die Gefährlichkeitsprognostik fußt zum gegenwärtigen Zeitpunkt nicht auf einer entwickelten theoretischen Grundlage. Die Vielzahl verstreuter, oft widersprüchlicher Befunde erlaubt keine fundierte Ableitung solider Prinzipien für ein wissenschaftlich fundiertes Vorgehen in der gerichtlichen Praxis.

Vor allem gibt es keine naturwissenschaftlich untermauerten Tests oder objektive Untersuchungsmethoden (z. B. Brain Scans), die reif für die Praxis wären, also eine Gewaltneigung im Gehirn zuverlässig diagnostizieren könnten.

Man könnte natürlich einwenden, dass die forensische Prognostik eine Kunst sei. Offensichtlichen Fehlprognosen würden überwiegend von jungen, unerfahrenen Fachleuten produziert. Erfahrene Prognostiker seien zu besseren Leistungen in der Lage.

Doch dies ist keineswegs der Fall. Die Qualität des klinischen Urteils hängt definitiv nicht mit der Berufserfahrung zusammen. Dies ist das eindeutige Resultat der Untersuchungen von Robyn M. Dawes, eines Pioniers der psychologischen Entscheidungsforschung.

Seine Erklärung für dieses Phänomen erscheint plausibel. Bei der Prognose geht es ja um das Kategorisieren von Menschen – beispielsweise: gefährlich, nicht gefährlich.

Die Effektivität von Lernprozessen im Bereich der Kategorisierung hängt nun aber von zwei Faktoren ab:

  1. Kenntnis von Regeln zur Zuordnung von Exemplaren zu einer Kategorie
  2. systematisches Feedback über richtige und insbesondere falsche Kategorisierung.

Beide Voraussetzungen sind allerdings im Bereich der Gefährlichkeitsprognostik nicht erfüllt.

  1. ist es heute noch weitgehend unbekannt, anhand welcher Merkmale man zukünftige Gefährlichkeit abschätzen kann. Und
  2. darf auch von einer systematischen Rückmeldung nicht gesprochen werden.2)Dawes, R. M. (1989). Experience and validity of clinical judgment: The illusory correlation. Behavioral Sciences & the Law, Volume 7, Issue 4, pages 457–467, Autumn (Fall

Im Licht der empirischen Forschung betrachtet3)Hart, S. D., Michie, C., & Cooke, D. J. (2007). Precision of actuarial risk assessment instruments: Evaluating the ‚margins of error‘ of group versus individual predictions of violence. British Journal of Psychiatry, Supplement, 49, Vol 190 60-65 / Lidz, C., Mulvey, E., & Gardner, W. (1993). The accuracy of predictions of violence to others. Journal of the American Medical Association, 269, 1007-1011, ist die psychiatrische Gefährlichkeitsprognostik kaum treffsicherer als die Glaskugelschau.

Und wenn die Glaskugel von einer erfahrenen, lebensklugen Esoterikerin gehandhabt wird, dann ist es durchaus nicht auszuschließen, dass sie u. U. bessere Ergebnisse erzielt als die berühmtesten Kriminalpsychiater.4)Es erschüttert mich, wenn mir gesagt wird, diese Formulierung sei zynisch und übertrieben.

Psychiatrische Gutachter neigen notorisch dazu, die Gefährlichkeit von Straftätern zu überschätzen.5)Sue, D. et al. (2012). Understanding Abnormal Behavior. New York, N.Y.: Wadsworth Inc Fulfillment, Seite 527 Dies ist allerdings nicht auf persönliche Schwächen der einschlägig tätigen Experten zurückzuführen, sondern liegt in der Natur der Sache. Ich versuche dies in drei Schritten zu erklären:

  • Gewalttaten sind seltene Ereignisse. Aus wahrscheinlichkeitstheoretischen Gründen sind die Vorhersagen seltener Ereignisse zwangsläufig und unvermeidlich mit hohen Fehlerquoten verbunden.6)Mitunter wird die Wahrscheinlichkeit seltener Ereignisse auch gravierend unterschätzt (Taleb, N. N. (2012). Der schwarze Schwan – Konsequenzen aus der Krise. München: Dt. Taschenbuch-Verl.).
  • Außerdem unterliegt gewalttätiges Verhalten einem starken sozialen Kontexteinfluss. Es kann also nur teilweise durch persönliche Merkmale erklärt werden. Ob ein Mensch in Zukunft einem Kontext ausgesetzt sein wird, der Gewalt stimuliert, und wie er dann auf diese Herausforderung reagiert, ist selbst mit einer blank geputzten und mit Tachyonen aufgeladenen Glaskugel nur sehr bedingt prognostizierbar.
  • Gefährlichkeitsprognostiker sehen sich einem erheblichen sozialen Druck ausgesetzt, da ihnen die Verantwortung für Fehldiagnosen angelastet wird. Sozialer Druck bei hochgradiger Entscheidungsunsicherheit führt zu konservativen Urteilen (die sich zu Lasten des Beurteilten auswirken).

Salopp formuliert: Da Gefährlichkeitsprognostiker im Trüben fischen müssen, fehlt ihnen der feste Grund, der ihrer Voreingenommenheit entgegenwirken könnte.

Die meisten Gewalt-Prädiktoren7)Sachverhalte zur Vorhersage von Gewalt taugen nichts. Der Glaube daran entpuppt sich als Aberglaube, sobald man die angeblichen Zusammenhänge zwischen diesen Faktoren mit angeblicher Vorhersagekraft und dem tatsächlichen Verhalten einer seriösen empirischen Überprüfung unterzieht.

So mögen z. B. zwar paranoide Vorstellungen in Verbindung mit Alkohol oder Drogen durch eine leichte Erhöhung der Gewaltbereitschaft gekennzeichnet sein. Aber dieser Sachverhalt ist nur von akademischem Interesse und praktisch ohne jede Bedeutung.

Denn Suchtmittelabhängige ohne paranoide Vorstellungen zeichnen sich, verglichen mit der soeben genannten Personengruppe, durch eine allenfalls unwesentlich verminderte Gewaltneigung aus.8)Fazel, S. et al. (2009). Schizophrenia and Violence: Systematic Review and Meta-Analysis. PLOS Medicine, Published: August 11, 2009, DOI: 10.1371/journal.pmed.1000120

Der einzige Prädiktor, der sich als ziemlich stabil und aussagekräftig erwiesen hat, ist die Kriminalakte. Je häufiger ein Mensch zuvor bereits gewalttätig geworden ist, desto wahrscheinlicher ist seine zukünftige Gewalttätigkeit. Diese Korrelation bestätigt eine etablierte Erkenntnis der Sozialpsychologie allgemein:

Zukünftiges Verhalten sagt man am besten auf der Grundlage früheren Verhaltens voraus.

Diese Faustregel ist allerdings auch nur unter eingeschränkten Bedingungen tragfähig: Die Vorhersage ist kurzfristig. Das vorhergesagte Verhalten muss relativ häufig und in einer Vielzahl von Situationen auftreten. Die Person muss mit derartigen Situationen wieder konfrontiert werden. Ihre Persönlichkeit muss weitgehend unverändert geblieben sein. Sofern diese Einschränkungen zutreffen, kann man in der Regel die besten Ergebnisse erzielen, wenn man sich bei der Prognose auf das jeweils relevante Verhalten in der Vergangenheit stützt.

Dies gilt im Übrigen auch für die Vorhersage selbstschädigenden Verhaltens (Selbstverletzung, Suizid). Die Selbsteinschätzungen der Wahrscheinlichkeit selbstschädigenden Verhaltens beispielsweise korrelieren zwar mit dem späteren Handeln der befragten Personen. Aber darauf basierende Vorhersagen sind schlechter als Prognosen, die ausschließlich auf der beobachteten Häufigkeit selbstschädigenden Verhaltens in der Vergangenheit beruhen.9)Janis, I. B. & Nock, M. K. (2008). Behavioral Forecasts Do Not Improve the Prediction of Future Behavior: A Prospective Study of Self-Injury. Journal of Clinical Psychology, Vol. 64(10), 1–11

Häufig allerdings sind die Voraussetzungen für die Anwendung der Faustregel nicht gegeben. In jugendlichem Überschwang begangene Straftaten beispielsweise mögen fünfzehn Jahre später für die Vorhersage des künftigen Verhaltens eines Menschen, der sich nun in einem anderen Lebensabschnitt befindet, keinerlei Relevanz mehr besitzen.

Schauen wir uns nach diesem Referat wissenschaftlicher Befunde die praktischen Konsequenzen aus diesen nüchternen Studien und Zahlen etwas genauer an.

Zwei wichtige Kenngrößen zur Beurteilung der Qualität von Verfahren zur Vorhersage menschlichen Verhaltens sind „Sensitivity“ und „Specificity“.

  • „Sensitivity“ ist die Rate der richtig als Merkmalsträger klassifizierten Personen.
  • „Specificity“ ist der Prozentsatz der richtig als Nicht-Merkmalsträger eingestuften Probanden.
  • Beispiel für Sensitivity: Mensch wird als gewaltgeneigt beurteilt und begeht später eine Gewalttat.
  • Beispiel für Specificity: Mensch wird als nicht gewaltgeneigt beurteilt und begeht später keine Gewalttat

Einem Aufsatz von Alec Buchanan10)Buchanan, A. (2008). Risk of Violence by Psychiatric Patients: Beyond the “Actuarial Versus Clinical” Assessment Debate, Psychiatric Services 2008; doi: 10.1176/appi.ps.59.2.184 entnehme ich folgende Angaben:

Ein verhältnismäßig gutes Instrument zur Vorhersage gewalttätigen Verhaltens ist der „Violence Risk Assessment Guide“ (VRAG). Er hat eine „Sensitivity“ von .73 und eine „Specificity“ von .63.11)Dabei handelt es sich um Durchschnittswerte einer größeren Zahl von Studien

In der CATIE-Studie (Clinical Antipsychotic Trials of Intervention Effectiveness) wurde als Rate körperverletzender Gewalt bei den Studienteilnehmern (chronisch Schizophrene) ein Wert von 3,6 Prozent ermittelt. Das ist die so genannte Base Rate (Basisrate).

Wir haben nun alle drei Werte zusammen, um die „number needed to detain“ berechnen zu können. Unter diesen, sehr realistischen Bedingungen muss man 15 Leute hinter psychiatrische Gitter bringen, um eine Gewalttat zu verhindern.12)Die „number needed to detain“, also die Zahl der einzusperrenden Leute ist eine sehr aussagekräftige, auch für den Laien intuitiv nachvollziehbare Statistik. Richter sollten darauf bestehen, dass Gutachter ihnen diese Statistik für die von ihnen eingesetzten Verfahren nennen.

Es bringt bei niedrigen Basisraten13)Basisrate = Häufigkeit des Vorkommens eines Merkmals in der Grundgesamtheit im Übrigen nicht viel, die diagnostischen Verfahren zu verbessern. Im vorliegenden Fall würde beispielsweise eine Verbesserung der „Sensitivity“ um 20 Prozent, unter sonst gleichen Bedingungen, die „number needed to detain“ nur auf 13 verringern. Man müsste als 13 Leute wegschließen, um eine Gewalttat zu unterbinden.

Zu ähnlich ernüchternden Ergebnissen zur prognostischen Validität von Instrumenten zur Vorhersage gewalttätigen Verhaltens gelangten Jay P. Singh und Kollegen.14)Jay P. Singh, Seena Fazel, Ralitza Gueorguieva, and Alec Buchanan (2014). Rates of violence in patients classified as high risk by structured risk assessment instruments. Br J Psychiatry. 2014 Mar; 204(3): 180–187 Sie fassten 57 Studien mit mehr als 13.000 Teilnehmern zusammen. Sie gelangte zu dem Schluss, dass eine Bezifferung zukünftiger Gewaltwahrscheinlichkeit durch die augenblicklichen wissenschaftlichen Erkenntnisse nicht unterstützt wird.

Fazel und Mitarbeiter betonen, dass solche Instrumente als alleinige Grundlage einer Unterbringung, Verurteilung und Entlassung untauglich seien.15)Seena Fazel, Jay P Singh, Helen Doll, Martin Grann (2012). Use of risk assessment instruments to predict violence and antisocial behaviour in 73 samples involving 24 827 people: systematic review and meta-analysis. BMJ 2012;345:e4692

Es gibt neben der prognostischen Unzulänglichkeit noch einen weiteren Grund zum Verzicht auf das Einsperren von Leuten in psychiatrische Anstalten, weil man in Zukunft Gewalttaten von ihnen erwartet. Denn in diesen Einrichtungen sollen diese Menschen ja behandelt werden. Allein dies hat nur Sinn, wenn eine nennenswerte Erfolgsaussicht besteht.

Ein Beispiel: Die Behandlung von Männern, die ihre Frauen verprügelt haben. Eine Meta-Studie von Julia C. Babcock und Mitarbeitern16)Babcock, J. C. et al. (2004). Does batterers‘ treatment work? A meta-analytic review of domestic violence treatment. Clinical Psychology Review 23, 1023 – 1053 ergab, dass die heute üblichen Verfahren nur einen sehr geringen Einfluss auf die Rückfallwahrscheinlichkeit haben.

Generell gilt, dass die bisherigen Forschungen zur Verminderung des Rückfallrisikos von kriminellen und „psychisch kranken“ Gewalttätern insgesamt aufgrund ihrer Heterogenität keine solide Metaanalyse17)Eine Metaanalyse ist die möglichst vollständige statistische Zusammenfassung der bisherigen Studien zum einem Forschungsthema gestatten. Die bisherigen Befunde deuten zwar auf einen schwachen bis mäßigen Effekt hin, aber diese Resultate sind aus methodischen Gründen mit Vorsicht zu genießen.18)Hockenhull J. C. et al. (2012). A systematic review of prevention and intervention strategies for populations at high risk of engaging in violent behaviour: update 2002-8. Health Technol Assess., 16(3):1-152. doi: 10.3310/hta16030

Selbst wenn man wohlwollend einen nennenswerten Effekt solcher Maßnahmen unterstellt, so wäre doch zu fragen, ob dieser die zwangsweise Behandlung überwiegend harmloser Menschen rechtfertigen kann.

Ist es wirklich akzeptabel, sehr viele Menschen ohne zukünftiges Gewaltpotenzial wegzusperren, um ein paar Gewalttaten zu verhindern? Oder ist es der Preis der Freiheit, Gewalttaten hinzunehmen, die man, wenn überhaupt, nur durch Polizeistaatsmethoden verhindern könnte.

Denn es sind Polizeistaatsmethoden, Leute ohne vernünftigen Grund wegzusperren, auch wenn dies auf rechtlicher Grundlage erfolgt.
Je häufiger die Psychiatrie in den alltäglichen Umgang der Bürger miteinander eingreift, desto wahrscheinlicher ist es, dass ein Bürger zu unrecht auf Dauer hinter psychiatrischen Gittern landet, weil er als Gefahr für andere oder sich selbst eingestuft wird. Jeder, der die Polizei ruft, weil ein Mitmensch sich rätselhaft, befremdlich oder gar bedrohlich aufführt, sollte sich dies klarmachen. Die Psychiatrie hat keinerlei Möglichkeiten, hier die Spreu vom Weizen zu trennen.

Man kann es drehen und wenden, wie man will: Die psychiatrische Prognostik ist weit davon entfernt, ein fördernder Faktor im Prozess der Zivilisation zu sein. Auch wenn man ihr dies nicht zwingend vorwerfen kann, vermag sie nur zu oft der Barbarei nicht entgegenzuwirken.19)Dies ist, mit Rücksicht auf die vielen ehrenwerten Mitarbeiter in der Psychiatrie, mit äußerster Milde formuliert.

Der „Texas Defender Service“ vertritt die Insassen von Todeszellen in diesem Bundesstaat in Rechtsfragen. Der Service ließ eine Studie zur Validität von Gefährlichkeitsprognosen anfertigen. Grundlage bildeten die Gutachten von Experten, die im Auftrag der Staatsanwaltschaften die zukünftige Gefährlichkeit von angeklagten Straftätern, denen die Todesstrafe drohte, vor der Gerichtsverhandlung vorhergesagt hatten. Die Experten irrten sich in 95 Prozent aller Fälle.

Dies wurde anhand der Gefangenenakten festgestellt, in denen eventuelle Gewaltakte verzeichnet waren. Diese sind in Gefängnissen nicht gerade selten. Der Beobachtungszeitraum belief sich bei den zum Zeitpunkt der Untersuchung bereits Exekutierten auf zwölf Jahre. Die noch in der Death Row Einsitzenden waren dort durchschnittlich acht Jahre und die Gefangenen mit reduziertem Strafmaß hatten eine Haftzeit von durchschnittlich 22 Jahren verbüßt.

Der Forschungsbericht wurde 2004 unter dem Titel

„Deadly Speculations. Misleading Texas Capital Juries with False Predictions of Future Dangerousness“

veröffentlicht.20)Texas Defender Service (2004). Deadly Speculations. Misleading Texas Capital Juries with False Predictions of Future Dangerousness. Houston and Austin, Tx., Zusammenfassung

Die Gutachten der Forensischen Psychiatrie sind natürlich nicht immer tödliche Spekulationen, sofern damit der physische Tod des Angeklagten gemeint ist. Aber der soziale Tod kann auch in Ländern ohne Todesstrafe die Folge sein, wenn Menschen für viele Jahre in Psychiatrien eingekerkert werden.

Die überaus dürftige wissenschaftliche Basis solcher Gutachten kann auch dem interessierten Laien nicht verborgen geblieben sein. Dennoch regt sich nur verhältnismäßig wenig Widerstand gegen eine Gerichtspraxis, in der Richter in aller Regel im Sinne solcher fragwürdigen Gutachten urteilen. Allenfalls bei Justizskandalen mit Psychiatrie-Beteiligung kommt es vorübergehend zu Aufwallungen von Gefühlen. Auch Linke, die sich sonst herzergreifend für die Rechte von Minderheiten einsetzen, nehmen die Menschenrechtsverletzungen gegenüber „psychisch Kranken“ eher achselzuckend hin.

Fußnoten   [ + ]

1.Franklin, R. D. (ed.) (2003). Prediction in Forensic and Neurophysiology. Mahwah, N. J.: Lawrence Erlbaum
2.Dawes, R. M. (1989). Experience and validity of clinical judgment: The illusory correlation. Behavioral Sciences & the Law, Volume 7, Issue 4, pages 457–467, Autumn (Fall
3.Hart, S. D., Michie, C., & Cooke, D. J. (2007). Precision of actuarial risk assessment instruments: Evaluating the ‚margins of error‘ of group versus individual predictions of violence. British Journal of Psychiatry, Supplement, 49, Vol 190 60-65 / Lidz, C., Mulvey, E., & Gardner, W. (1993). The accuracy of predictions of violence to others. Journal of the American Medical Association, 269, 1007-1011
4.Es erschüttert mich, wenn mir gesagt wird, diese Formulierung sei zynisch und übertrieben.
5.Sue, D. et al. (2012). Understanding Abnormal Behavior. New York, N.Y.: Wadsworth Inc Fulfillment, Seite 527
6.Mitunter wird die Wahrscheinlichkeit seltener Ereignisse auch gravierend unterschätzt (Taleb, N. N. (2012). Der schwarze Schwan – Konsequenzen aus der Krise. München: Dt. Taschenbuch-Verl.).
7.Sachverhalte zur Vorhersage von Gewalt
8.Fazel, S. et al. (2009). Schizophrenia and Violence: Systematic Review and Meta-Analysis. PLOS Medicine, Published: August 11, 2009, DOI: 10.1371/journal.pmed.1000120
9.Janis, I. B. & Nock, M. K. (2008). Behavioral Forecasts Do Not Improve the Prediction of Future Behavior: A Prospective Study of Self-Injury. Journal of Clinical Psychology, Vol. 64(10), 1–11
10.Buchanan, A. (2008). Risk of Violence by Psychiatric Patients: Beyond the “Actuarial Versus Clinical” Assessment Debate, Psychiatric Services 2008; doi: 10.1176/appi.ps.59.2.184
11.Dabei handelt es sich um Durchschnittswerte einer größeren Zahl von Studien
12.Die „number needed to detain“, also die Zahl der einzusperrenden Leute ist eine sehr aussagekräftige, auch für den Laien intuitiv nachvollziehbare Statistik. Richter sollten darauf bestehen, dass Gutachter ihnen diese Statistik für die von ihnen eingesetzten Verfahren nennen.
13.Basisrate = Häufigkeit des Vorkommens eines Merkmals in der Grundgesamtheit
14.Jay P. Singh, Seena Fazel, Ralitza Gueorguieva, and Alec Buchanan (2014). Rates of violence in patients classified as high risk by structured risk assessment instruments. Br J Psychiatry. 2014 Mar; 204(3): 180–187
15.Seena Fazel, Jay P Singh, Helen Doll, Martin Grann (2012). Use of risk assessment instruments to predict violence and antisocial behaviour in 73 samples involving 24 827 people: systematic review and meta-analysis. BMJ 2012;345:e4692
16.Babcock, J. C. et al. (2004). Does batterers‘ treatment work? A meta-analytic review of domestic violence treatment. Clinical Psychology Review 23, 1023 – 1053
17.Eine Metaanalyse ist die möglichst vollständige statistische Zusammenfassung der bisherigen Studien zum einem Forschungsthema
18.Hockenhull J. C. et al. (2012). A systematic review of prevention and intervention strategies for populations at high risk of engaging in violent behaviour: update 2002-8. Health Technol Assess., 16(3):1-152. doi: 10.3310/hta16030
19.Dies ist, mit Rücksicht auf die vielen ehrenwerten Mitarbeiter in der Psychiatrie, mit äußerster Milde formuliert.
20.Texas Defender Service (2004). Deadly Speculations. Misleading Texas Capital Juries with False Predictions of Future Dangerousness. Houston and Austin, Tx., Zusammenfassung