Gute und schlechte Gutachten in der Forensischen Psychiatrie

Manche meinen, gute Gutachter verfassten gute und schlechte Gutachter schlechte Gutachten. Die Qualität eines Gutachters hänge von seiner Fähigkeit ab, Menschen auf die Schliche zu kommen. Daher seien Gutachter gefragt, die hinter den nackten Zahlen, Daten und Fakten den wahren Kern eines Individuums zu erkennen vermöchten. Statistiken seien wenig hilfreich. Wahre Menschenkenntnis könne man nicht durch Bücherstudium und graue Theorie erwerben. Sie sei eine Gabe, die ein ernsthafter Mensch durch achtsame Übung zur Reife bringe. Es komme stets auf den Einzelfall an. Der Einzelfall sei das unbedingt Einzigartige. Das Allgemeine im Besonderen des Einzelfalls könne nur der Erfahrene in tiefer Wesensschau entdecken und enthüllen.

An diesem Argument ist richtig, dass an großen Menschengruppen gewonnene Durchschnittswerte sich nicht auf den Einzelnen übertragen lassen. Man kann von einer Stichprobe nur auf andere Stichproben schließen.

Doch kann hier der Einzelfall-Diagnostiker helfen, der dank seiner Erfahrung und wissenschaftlichen Akribie Gutachten anzufertigen vermag, in denen sich eine realistische Prognose des Einzelfalles widerspiegelt?

Es gibt ja viele, die behaupten, genau dies zu können, Statistik hin oder her. Wenn sie diese Behauptung aber beweisen wollten, dann wären sie wieder auf die verpönte Statistik angewiesen. Denn im Einzelfall können wir ja nicht überprüfen, ob der Gutachter nur gut geraten oder das Verhalten seines Probanden richtig vorhergesagt hat.

Er müsste also eine größere Zahl von Menschen beurteilen und dann wäre zu prüfen, in wie vielen Fällen er richtig lag oder falsch. Liegt er über der Zufallswahrscheinlichkeit (der Ratewahrscheinlichkeit) richtig, dann bestätigt sich seine Behauptung im Verhältnis zu seiner Trefferquote.

Nehmen wir an, ein Gutachter, nennen wir ihn Rudolf, habe den Herrn Meyer zu beurteilen. Es habe sich in einem vorherigen Experiment gezeigt, dass Rudolf bei Menschen, die aus der Bezugsgruppe Herrn Meyers stammen, eine Trefferquote von 70 Prozent aufzuweisen vermag.

Dies bedeutet keineswegs, dass Rudolf, bezogen auf Herrn Meyer, zu siebzig Prozent richtig liegt. Nein, es bedeutet nur: Wenn Rudolf weiterhin Menschen aus dieser Bezugsgruppe begutachtet, dann liegt in bei dreißig pro hundert Probanden schief.

Wir haben daher auch keine Möglichkeit, die Qualität von Rudolfs Gutachten über Herrn Meyer, also auf der Ebene des Einzelfalls zu beurteilen.

Sicher: Rudolfs Gutachten sind akribisch. Sie gehorchen den Regeln der Kunst. Er bemüht sich, den Besonderheiten der Lebensgeschichte, den Tatumständen und anderen wesentlichen Faktoren gerecht zu werden.

All dies ist vorbildlich an Rudolfs Gutachten. Allein, das nützt nichts. Wir wissen nur, welche durchschnittlichen Ergebnisse Rudolf auf lange Sicht vermutlich erbringen wird. Wir wissen aber nicht, wie gut – hinsichtlich der relevanten Merkmale – sein Gutachten über Herrn Meyer ist.

Dies wäre etwas anderes, wenn Herrn Meyers Gefährlichkeit (oder ein anderes relevantes Merkmal) auf einem bekannten physiologischen oder psychologischen Mechanismus beruhte, der bei allen Mitgliedern der Bezugsgruppe Herrn Meyers vorhanden, aber mehr oder weniger stark ausgeprägt wäre.

Es gäbe einen Schwellenwert der Ausprägung dieses Mechanismus, jenseits dessen die Wahrscheinlichkeit einer Gewalttat (oder einer anderen relevanten Aktion) unverhältnismäßig hoch wäre, so dass man die Einkerkerung Herrn Meyers als ethisch vertretbar betrachten könnte.

Mechanismen dieser Art sind jedoch nicht bekannt; man weiß noch nicht einmal, wo man nach ihnen suchen sollte. Und erst recht gibt es keine objektiven Messinstrumente für diesen unbekannten und fraglichen Mechanismus. Gäbe es ihn, könnte man die Frage nach seiner Gefährlichkeit in etwa so präzise beantworten wie die Frage danach, ob ihm ein bestimmter Hut passen wird.

Ein solcher Mechanismus würde bei ausreichender Ausprägung dann unweigerlich dafür sorgen, dass Herr Meyer bei sich bietender Gelegenheit wieder gewalttätig wird. Könnten wir die Ausprägung und die Wahrscheinlichkeit der entsprechenden Gelegenheiten exakt bestimmen, dann dürften wir Herrn Meyer guten Gewissens einsperren.

Wir könnten dann z. B. sagen: Meyers Gewaltmechanismus ist so stark, dass er gewalttätig wird, wenn ihm eine schwarze Katze begegnet. Die Wahrscheinlichkeit, dass ihm im Lauf eines Jahres mindestens einmal ein Tier dieser Art über den Weg läuft, ist nur noch theoretisch von 1 unterschieden. Also, ab in die Geschlossene.

Doch das ist eine Illusion, nichts Reales. Treten wir in einen Gerichtssaal, in dem ein forensischer Psychiater gutachtet, dann tun sich vor unseren Augen Wunder auf. Wie ein surrealistisches Gemälde ist der Saal nun plötzlich in einen magischen Schein gehüllt. Eine Welt bizarrer Schönheit und tiefer Abgründe tut sich auf.

Doch Ernst beiseite!

Man bedenke: Über das Wetter wissen wir unendlich viel mehr als über das menschliche Gehirn. Dennoch sind seriöse Wettervorhersagen über mehr als ein paar Tage nicht möglich. Es ist kaum vorstellbar, dass die Prognostik beim Menschen angesichts unserer viel weniger fortgeschrittenen Kenntnisse leistungsfähiger als in der Meteorologie sein sollte.

Rudolfs Gutachten beruht daher ausschließlich darauf, was er für plausibel und aufgrund seiner Erfahrung für wahrscheinlich hält. Zwar weiß er dies in eine wissenschaftlich klingende Sprache zu übersetzen und mit allerlei Fachbegriffen und Namedropping zu garnieren. Aber der Kundige erkennt selbstredend, dass Rudolf im Trüben fischt wie alle anderen auch.

All dies ist Rudolf natürlich bewusst, falls er Psychologie studiert und noch nicht alles vergessen haben sollte. Er hofft vermutlich, dass die Mehrheit der anderen dies nicht weiß und dass die Minderheit, die dies weiß, schon die Klappe halten wird, aus Eigeninteresse oder aus Gleichgültigkeit. Er rechnet wohl damit, dass viele gegenüber der Statistik misstrauisch sind und auf das Urteil der Experten vertrauen.

Doch Robyn Dawes1)Dawes, R. (1996). House of Cards. Psychology and Psychotherapy Built on Myth. New York: Free Press und viele andere haben gezeigt, dass die auf „klinischer Erfahrung“ beruhenden Prognosen der Experten weitaus schlechter sind als die mit formalisierten, quantitativen Verfahren gewonnenen. Und die sind schon schlecht genug.

Bisher habe ich stillschweigend vorausgesetzt, dass Merkmale wie „Gefährlichkeit“ relativ stabil seien. Da nicht alle in einer Bezugsgruppe diese Merkmale hätten – so heißt es in den Kreisen der Prognostiker, die diese Auffassung teilen – bestünde die Schwierigkeit allein darin, jene Menschen herauszufischen, die sie besitzen.

Es könnte aber durchaus sein, dass Menschen, die beispielsweise während einer Phase ihres Lebens höchst gefährlich sind, während einer anderen Phase friedlich sind wie ein Lamm. Dies könnte sogar sein, wenn die Gefährlichkeit auf einer starken genetischen Grundlage beruhte. Schließlich ergibt sich das Verhalten eines Menschen immer aus dem Wechselspiel von Anlage und Umwelt.

Es ist beim Stand neurowissenschaftlicher Erkenntnis überhaupt nicht auszuschließen, dass unser Gehirn Schwellenwerte aggressiven Verhaltens aufgrund von Umwelterfahrungen verschiebt. Auch die Reize, die Aggressionen auslösen, können sich ändern. Eventuell werden häufig vorkommende durch seltenere ersetzt. Dass ein Saulus zum Paulus wird, ist gar nicht so selten.

Die Reaktionsbereitschaft unseres Gehirns unterliegt überdies zufälligen Schwankungen. Das heißt: Wenn wir die Uhr zurückdrehen könnten, so wäre gar nicht sicher, dass ein Gewalttäter eine Tat bei einer zweiten Konfrontation mit derselben Situation unter gleichen Bedingungen erneut begehen würde.

Die Prognose individuellen Verhaltens ist eine vertrackte Sache. Es mag gute Gutachten geben, weil sie weniger Rechtschreibfehler enthalten als die schlechten. Es mag gute Gutachten geben, weil ihre Argumentation plausibel erscheint und in einer gründlichen Abwägung der wichtigsten, relevanten Sachverhalte besteht. Es gibt aber keine guten Gutachten, die auf einer soliden wissenschaftlichen Basis beruhen würden, aus der man ihre zentralen Aussagen ableiten könnte.

Im Fall Mollath2)Siehe Wikipedia: Gustl Mollath beispielsweise wurde heftig um die Qualität der Gutachten gestritten. So seien, so hieß es vielfach, die Gutachten schlecht, bei denen und weil der Gutachter nicht mit dem Probanden gesprochen habe. Sie seien nach Aktenlage gefällt worden und damit unzulänglich.

Dieses Argument ist im Licht des bisher Gesagten allerdings zu verwerfen. Selbst wenn ein Gutachter mit einem Probanden gesprochen und ihn getestet hat, weiß er deswegen nicht gut genug, was von dem Menschen zu erwarten ist. Er kann auf dieser Grundlage kein Gutachten ausfertigen, das dem Anspruch wissenschaftlicher Redlichkeit genügt.

Selbstverständlich kann eine persönliche Untersuchung hilfreich, auch notwendig sein. Nur so kann z. B. festgestellt werden, ob ein Mensch an einer neurologischen oder sonstigen Krankheit mit Auswirkung auf das Verhalten und Erleben leidet. Doch sogar ein solcher Befund, so wichtig er für den Betroffenen auch sein mag, würde keine zuverlässige Gefährlichkeitsprognose gestatten.

Manche meinen, menschliches Verhalten sei determiniert. Die Chaostheorie lehre, dass sogar nicht vorhersagbare Vorgänge determiniert sein könnten. Darüber will ich mich nicht streiten. In der Praxis ist es gleichgültig, ob ein Verhalten determiniert oder von Zufällen abhängig ist, wenn man es nicht prognostizieren kann.

Es gibt im Leben Dinge, die man einfach hinnehmen muss. Menschliche Reife zeigt sich darin, dies zu erkennen und zu akzeptieren. Dies gilt auch für Risiken.

Fußnoten   [ + ]

1.Dawes, R. (1996). House of Cards. Psychology and Psychotherapy Built on Myth. New York: Free Press
2.Siehe Wikipedia: Gustl Mollath