Konstruktion und Anwendung psychologischer Testverfahren
In den 50er Jahren sorgte die sogenannte „Vicary-Studie“ für Aufsehen. Es war bekannt geworden, dass unwissenden Kinobesuchern während des Hauptfilms unterschwellige Botschaften präsentiert worden waren. Durch das 1/3000 Sekunde kurze Einblenden visueller Reize wie der Sätze „Iss Popcorn“ und „Trink Cola-Cola“ wollten die Betreiber offenbar den Absatz steigern. Die Verkaufzahlen belegten angeblich, dass ihnen das durch die vom Publikum nicht bewusst wahrgenommene Beeinflussung gelang.
Die Veröffentlichung der Studie sorgte für Aufruhr. Die Menschen befürchteten, durch psychologische Tricks auch in anderen Bereichen manipuliert zu werden. Wie stark man innerhalb von Experimenten das Verhalten der Probanden tatsächlich formen kann, belegte einige Jahre später das heute berühmt-berüchtigte Milgram-Experiment.
Es verdeutlichte auf erschreckende Weise die Beeinflussbarkeit der Menschen durch Autoritätspersonen. Die Versuchspersonen wurden angehalten, das Lernverhalten vermeintlich anderer Versuchsteilnehmer durch Bestrafung zu verbessern. Bei einer falschen Antwort sollten sie einem Lernenden einen Elektro-Schock per Druck auf eine Taste verabreichen. Der Versuch war so angelegt, dass man die Probanden dazu bringen wollte, die Schockstärke sukzessiv zu steigern.
Natürlich verabreichten sie keine wirklichen Schocks. Bei dem vermeintlichen Lernenden handelte es sich um einen Komplizen des Versuchsleiters, der absichtlich hin und wieder falsche Antworten gab. Die Wirkung des Schocks schauspielerten die Komplizen, indem sie Schreie von sich gaben und wie unter Schmerzen stöhnten. Das konnten die Versuchspersonen hören, doch sehen konnten sie die Schauspieler nicht.
Das Schockierende an dem Versuch war: Auf die wiederholte Aufforderung des Versuchsleiters verabreichten die Probanden ihren Schülern Schocks, die in Realiter tödlich wären. Sie hätten ihre Schüler auf Befehl hingerichtet.
Die Studie verdeutlicht die potenziellen Gefahren psychologischer Test sowie deren ethische Grenzen. Ein Versuchsaufbau vergleichbar dem Milgram-Experiment wäre heute undenkbar. Trotzdem fürchten viele Menschen, durch psychologische Verfahren beeinflusst oder psychisch und physisch verletzt zu werden.
Diese Angst ist unbegründet, denn es existieren strenge Auflagen für die Verwendung diagnostischer Verfahren. Testbatterien und Manuals sind zum Beispiel nur Diplom-Psychologen, Psychiatern oder Psychotherapeuten zugänglich. Wer keine einschlägige Ausbildung vorweisen kann, ist nicht berechtigt, die Tests zu erwerben oder gar anzuwenden. Selbst Psychologie-Studenten dürfen diagnostische Fragebögen in der Regel erst nach Erreichen des Vordiploms und dann nur zu Übungszwecken ausleihen.
Grundsätzlich existieren drei Verfahrenseinheiten, mit deren Hilfe Kognitionen, Emotionen oder Verhaltensweisen von Menschen erhoben werden können: Befragung, Beobachtung und die Anwendung psychophysiologischer Methoden.
Verwendung finden heutzutage verstärkt schriftliche Befragungen. In begrenztem Umfang werden auch psychophysiologischen Verfahren genutzt. Sie dienen in erster Linie der Erfassung affektiver Reaktionen. Häufig wird die elektrodermale Aktiviät (EDA) gemessen, also die Hautleitfähigkeit. Manchmal spricht man im Zusammenhang mit dem Verfahren auch von der Messung der galvanischen Hautreaktion (GHR). Gemessen wird die Reaktion der kleinen Hautschweißdrüsen der palmaren Fingerkuppen, der Handinnenfläche, seltener auch der Fußsohle. Bei durch emotionale Stimuli hervorgerufener Sympathikus-Erregung ändern sie ihre Aktivität.
Populär wurde das Messen der EDA im Zusammenhang mit Lügendetektoren. Noch in den 80er Jahren erfreuten sich die sogenannten Polygrafen großer Beliebtheit. Erst als die American Psychological Associaton ihre Ungenauigkeit belegte, wurden ihre Verwendung weitgehend eingeschränkt. Heutzutage gelten Lügendetektoren als antiquiert. In der BRD ist ihre Verwendung grundsätzlich nicht zulässig.
Zur Erhebung der emotionalen Komponente, zum Beispiel von Einstellungen, werden im Wesentlichen schriftliche Tests eingesetzt. Sie dienen nicht nur zu Erhebungen im Bereich der klinischen Psychologie, sondern werden auch im Rahmen der Personalauswahl und der Marktforschung genutzt. Mit Fragebögen zur Einstellung gegenüber bestimmten Produkteigenschaften können zum Beispiel Hinweise für die Produktgestaltung gewonnen werden. Die Konsumenten werden dazu befragt, wie wichtig ihnen das Vorhandensein einer bestimmten Eigenschaft, zum Beispiel von Sicherheit, bei einem bestimmten Produkt ist und für wie wahrscheinlich sie es halten, dass das Produkt diese Eigenschaft besitzt. Die Befragten können ihre Antwort auf einer Skala angeben. Eine Fragenpaar könnte zum Beispiel lauten: „Wie wichtig ist Ihnen Sicherheit bei PKW ?“, Wie sicher ist das Auto
xy ?“.
Bis derartige Fragebögen eingesetzt werden können, ist es allerdings ein langer Weg. Denn bei der Testkonstruktion sind zahlreiche Punkte zu beachten. Die Anforderungen an die Verfahren sind zudem sehr hoch. Grundsätzlich müssen Tests geeicht sein. Außerdem müssen sie realiabel und valide sein.
Ein Test gilt dann als geeicht, beziehungsweise standardisiert, wenn er bereits von einer großen Anzahl anderer Personen ausgefüllt worden ist. Die Testergebnisse einer Person müssen nämlich mit denen anderer Testteilnehmer in Bezug gesetzt werden können, um Aussagekraft zu erhalten. Fehlt eine geeignete Eichstichprobe, sagen die Ergebnisse nichts aus. Erreicht eine Person auf einer Skala „Räumliche Orientierung“ zum Beispiel einen Durchschnittswert von drei Punkten, so ist dieses Ergebnis nutzlos, solange nicht verglichen werden kann, wie andere Personen durchschnittlich abschneiden.
Das Ermitteln einer Bezugsstrichprobe ist ein kompliziertes Unterfangen, weil die Stichprobe repräsentativ sein muss. Sie muss die Gesamtpopulation widerspiegeln. Demografische Faktoren wie Alter und Bildung müssen bei ihrer Auswahl deswegen akribisch berücksichtigt werden.
Neben der Standardisierung des Tests muss eine hohe Reliabilität gegeben sein. Ein psychologischer Test ist dann reliabel, wenn eine Person unter vergleichbaren Bedingungen die gleichen Ergebnisse erzielt. In diesem Zusammenhang unterscheidet man zwischen der Retest- und der Interrater-Reliabilität. In der Regel werden Tests in der Entwicklungsphase zweimal an den selben Personen durchgeführt. Werden für die Einzelnen vergleichbare Ergebnisse erzielt, ist die Retest-Reliabilität hoch. Die Reliabilität ist auch von der Vergleichbarkeit der Auswertungen abhängig. Gelangen verschiedene Auswerter unabhängig voneinander zu denselben Punktwerten, ist eine hohe Interrater-Reliabilität gegeben.
Eine hohe Reliabilität ist aber dann sinnlos, wenn der neue Test nicht misst, was er messen soll. Es muss gewährleistet sein, dass zum Beispiel ein Einstellungstest auch tatsächlich Einstellungen erhebt. Ein Depressionsinventar sollte die Depressivität messen und nicht die Traurigkeit oder Suizidalität einer Person.
Erst wenn die Kriterien Standardisierung, Reliabilität und Validität erfüllt sind, ist die Anwendung von Testverfahren sinnvoll. In der Psychologie wird daher ein sehr großer Wert auf diese Kriterien gelegt. Im Verlauf des Studiums müssen angehende Diplom-Psychologen Prüfungen in den Bereichen Statistik, Diagnostik und Evaluation absolvieren.