die dimensionale struktur von autoritarismus DIE DIMENSIONALE STRUKTUR VON AUTORITARISMUS eingereicht als Dissertation zur Erlangung des akademischen Grades »doctor philosophiae« (Dr.phil.) vorgelegt dem Rat der Fakultät für Sozial- und Verhaltenswissenschaften der Friedrich-Schiller-Universität Jena von Friedrich Funke Diplompsychologe Geboren am 03. Oktober 1968 in Jena . Gutachter: Prof. Dr. Wolfgang Frindte Prof. Dr. Rolf Steyer Tag des Kolloquiums: 3. April 2003 IMPRESSUM © Friedrich Funke 2002 Friedrich-Schiller-Universität Jena Gesetzt aus der Adobe Garamond 11.5 über 19 Punkt mit Minuskeln und Ligaturen aus der Garamond Expert »when you make your peace with authority, you become authority.« james douglas »jim« morrison (the doors) Dankende Vor-Worte »Identifizieren Sie sich nicht mit Ihrer Arbeit ... vergewissern Sie sich, daß der Schwerpunkt Ihres Lebens irgendwoanders liegt.« (Paul Feyerabend) Liebe Jacqueline, meine große Sophie und mein kleiner Paul, ich danke Euch, die Ihr mich verzaubert habt aus einem Kind, das immer erwachsen sein wollte, in einen Mann, der das Kind in sich am Leben halten darf. Euch habe ich Nerven gekostet – Ihr habt mich wieder. Mein Lehrer Wolfgang Frindte hat mein Denken vom positivistischen Empirismus befreit und ließ mir die Freiheit, mir meine Welt zu konstruieren. Rolf Steyer hat mir das Werkzeug an die Hand gegeben, diese Gedanken wieder einzufangen und in wohldefinierte mathematische Formen zu gießen. Die Bekanntschaft beider gibt mir das Vertrauen, daß die unversöhnlichen Widersacher konstruktivistische Erkenntnistheorie und quantitative Methodik bei verständigem Gebrauch ihre Kräfte vereinen können. Viele meiner Kollegen und Freunde waren unverzichtbar mit ihrem Rat und ihrer Geduld, meine naive »Intuition« – die ich manchmal besser hätte beiseite lassen sollen – zu tolerieren und mich langsam meinen Weg zur mathematischen Klarsicht finden zu lassen: Sindy Krambeer, Katrin Kraus, Ulf Kröhne, Christof Nachtigall, Olivia Martone, Marc Müller, Mira Müller, Andreas Wolf, Silke Zachariae … Ich bin vielen Kolleginnen und Kollegen dankbar für ihre wohldosierte Mischung aus gelassener Geduld und drängender Ungeduld, mit der sie der Fertigstellung dieses Aufsatzes entgegengesehen haben; nur einige seien genannt: John Duckitt, Peter Noack, Thomas Pettigrew, Thomas Petzel, Bernd Six, Jost Stellmacher, Ulrich Wagner, Sven Waldzus … Meinen Eltern habe ich sicher schlaflose Nächte bereitet, in denen sie über mißratene Karrieren nachgedacht haben. Dieses Problem kann ich nun lindern. Ich danke schließlich all denen, die mit ihren nicht autoritären Antworten die Varianz in meinen Stichproben klein gehalten haben; dies hat mir freilich »schöne« (besser: geschönte) Ergebnisse vereitelt, aber darin liegt ja meine geheime Hoffnung: diejenigen nicht en masse zu finden, die mit ihrem Autoritarismus anfällig für Rattenfänger sind. Friedrich Funke ______________________________________________________________ Die dimensionale Struktur von Autoritarismus Inhalt 1. EINLEITUNG ____________________________________________________________ 17 1.1. Der Inhalt in fünf Sätzen 17 1.2. Selbstgesetzte Grenzen der Arbeit 18 2. AUTORITARISMUS ALS PSYCHOLOGISCHES PROBLEM______________________________ 20 2.1. Definitorische Abgrenzung und theoretische Begriffsebene 20 2.1.1. Umgangssprache 20 2.1.2. Soziologie und Politologie 21 2.1.3. Psychologie 22 2.2. Forschungstraditionen 24 2.2.1. Philosophische Wurzeln 27 2.2.2. Vor der Frankfurter Schule 27 2.2.3. Von Frankfurt nach Berkeley 31 2.2.4. Kritische Rezeption der Berkeley-Schule 35 2.2.4.1. Methodische Kritik 35 2.2.4.2. Inhaltliche Kritik und alternative Konzepte 37 2.2.5. Revival der Autoritarismusforschung in 1980er Jahren 40 2.3. Gegenwärtige Forschungslinien und Defizite 41 2.3.1. Reduktionismus auf Psychologisches: Vernachlässigung des gesellschaftlichen Kontexts 41 2.3.2. Reduktionismus auf Individuum: Vernachlässigung der Intergruppenbeziehungen 42 2.3.3. Theoriearmut 44 2.3.4. Operationalisierungsproblem 47 2.4. Zusammenfassung 48 · 7 Friedrich Funke ______________________________________________________________ Die dimensionale Struktur von Autoritarismus 3. PROBLEMBESCHREIBUNG UND FORSCHUNGSFRAGEN _____________________________ 50 3.1. Ein Schritt vorwärts, zwei Schritte zurück oder warum man Anlauf nehmen muß, wenn man weiter springen will...50 3.2. Die Dimensionsfrage bei der Berkeley Gruppe 52 3.2.1. Dimension, Facette oder Komponente – eine Vorbemerkung 52 3.2.2. Die theoretischen a priori Cluster der F-Skala 53 3.2.3. Typen und Syndrome 55 3.2.3.1. Typen unter den Vorurteilsvollen (High-Scorern) 56 3.2.3.2. Typen unter den Vorurteilsfreien (Low-Scorern) 60 3.2.4. Fazit 62 3.3. Die Dimensionsfrage in der kritischen Rezeption 64 3.4. Die Dimensionsfrage bei Altemeyer 66 3.4.1. Beispiele für Submissivität 67 3.4.2. Beispiele für Aggressivität 68 3.4.3. Beispiele für Konventionalismus 68 3.5. Die Dimensionsfrage bei aktuellen Ansätzen 69 3.6. Zusammenfassung der Forschungsfragen 74 · 8 Friedrich Funke ______________________________________________________________ Die dimensionale Struktur von Autoritarismus 4. HERLEITUNG DES METHODISCHEN VORGEHENS_________________________________ 76 4.1. Dekomposition 77 4.1.1. Verwendete Extraktionsverfahren 77 4.1.2. Verwendete Rotationsverfahren 80 4.1.3. Weitere struktursuchende Verfahren 82 4.1.3.1. Clusteranalysen 82 4.1.3.2. Multidimensionale Skalierung 83 4.1.4. Zusammenfassung zur Dekomposition 83 4.2. Rekomposition 85 4.2.1. Einführung theoretisch begründeter Modelle 85 4.2.2. Erkenntnisphilosophische Bemerkungen über die Natur des Zusammenhangs zwischen Konstrukten und Maßen 85 4.2.3. Konkrete mathematische Modelle zur Beschreibung des Zusammenhangs zwischen Konstrukten und Maßen 87 4.2.3.1. Direkt reflektives Modell 88 4.2.3.2. Direkt formatives Modell 89 4.2.3.3. Indirekt reflektives Modell 89 4.2.3.4. Indirekt formatives Modell 90 4.2.3.5. Irriges Modell 90 4.2.3.6. Nichtanalysiertes Modell 91 4.2.3.7. Zusammenfassung und Konsequenzen 91 4.2.4. Formalisierung der derzeitigen Praxis 92 4.2.5. Inhaltsunabhängige Verbesserungen 94 4.2.5.1. Einführung einer Gewichtung der Items – Die Mikroebene des Meßmodells 94 4.2.5.2. Berücksichtigung der Kodierrichtung der Items 97 4.2.6. Inhaltsgeleitete Verbesserungen 101 4.3. Synthese der a priori Modifikationen 104 4.4. Weitere Elaboration des Meßmodells 109 4.4.1. Faktor zweiter Ordnung 109 4.4.2. Generalfaktor 110 4.4.3. Alternative Ansätze zur Modellierung der Kodierrichtung der Items 111 4.4.3.1. Kongenerische Methodenfaktoren 112 4.4.3.2. Korrelierte Methodenfaktoren 112 4.4.3.3. Korrelierte Meßfehlervarianzen – CTCU 112 4.4.3.4. Sechs Faktoren 113 4.5. Exkurs: Ein bislang ignoriertes Problem 115 4.5.1. Inhaltliche Evaluation der semantischen Struktur der Items 115 4.5.1.1. Ansatz von Eigenberger 115 4.5.1.2. Ansatz von Turner 117 4.5.2. Quantifizierender Ansatz zur Evaluation der Items 118 4.5.2.1. Auswahl von 1 aus 3 119 4.5.2.2. Auswahl von 1 aus 6 120 4.5.2.3. Unabhängiges Rating 121 4.5.2.4. Fazit der quantifizierenden Evaluation der Items 131 4.6. Zusammenfassung zum methodischen Vorgehen 131 · 9 Friedrich Funke ______________________________________________________________ Die dimensionale Struktur von Autoritarismus 5. DIE EMPIRISCHE BASIS I: SKALENADAPTATION___________________________________134 5.1. Vorgehen bei der Adaptation 134 5.1.1. Übersetzung 134 5.1.2. Antwortformat 135 5.1.3. Instruktion 136 5.1.4. Sprachniveau 137 5.2. Items und Trennschärfe 137 5.2.1. Right-Wing-Authoritarianism Scale RWA96 137 5.2.2. Right-Wing-Authoritarianism Scale RWA98 138 5.2.3. Reduktion der Skala auf reine Items – die RWA³D 138 5.3. Interne Konsistenz im Vergleich 139 5.4. Zusammenfassung 140 · 10 Friedrich Funke ______________________________________________________________ Die dimensionale Struktur von Autoritarismus 6. DIE EMPIRISCHE BASIS II: ERHEBUNG UND STICHPROBEN _________________________141 6.1. Studie I: RWAnet zur Bundestagswahl 1998 141 6.1.1. Erhebungsmodus und Erhebungszusammenhang 141 6.1.2. Hauptfragestellungen und Instrumente 142 6.1.3. Stichprobe 146 6.2. Studie II: KosovoNet I zum Kosovokonflikt 147 6.2.1. Erhebungsmodus und Erhebungszusammenhang 147 6.2.2. Hauptfragestellungen und Instrumente 150 6.2.3. Stichprobe 153 6.3. Studie III: KosovoNet II zum Tschetschenienkonflikt 154 6.3.1. Erhebungsmodus und Erhebungszusammenhang 154 6.3.2. Hauptfragestellungen und Instrumente 154 6.3.3. Stichprobe 156 6.4. Studie IV: NEO I zu Politik und Persönlichkeit 156 6.4.1. Erhebungsmodus und Erhebungszusammenhang 156 6.4.2. Hauptfragestellungen und Instrumente 156 6.4.3. Stichprobe 157 6.5. Studie V: NEO II zu Politik und Persönlichkeit 158 6.5.1. Erhebungsmodus und Erhebungszusammenhang 158 6.5.2. Hauptfragestellungen und Instrumente 159 6.5.3. Stichprobe 162 6.6. Studie VI: RWAnet98/Zukunft 162 6.6.1. Erhebungsmodus und Erhebungszusammenhang 162 6.6.2. Hauptfragestellungen und Instrumente 163 6.6.3. Stichprobe 164 6.7. Studie VII: Strafvollzug 164 6.7.1. Erhebungsmodus und Erhebungszusammenhang 164 6.7.2. Hauptfragestellungen und Instrumente 164 6.7.3. Stichprobe 165 6.8. Studie VIII: Terror und Politische Kultur 165 6.8.1. Erhebungsmodus und Erhebungszusammenhang 165 6.8.2. Hauptfragestellungen und Instrumente 166 6.8.3. Stichprobe 166 6.9. Studie IX: Bundestagswahl 2002 166 6.10. Zusammenfassung der ersten fünf Studien mit der RWA³D 167 · 11 Friedrich Funke ______________________________________________________________ Die dimensionale Struktur von Autoritarismus 7. EMPIRISCHES I – DEKOMPOSITION __________________________________________ 169 7.1. Sinn und Zweck der Dekomposition 169 7.2. Konventionen der Darstellung der Dekomposition 170 7.3. Dekomposition der RWA96 170 7.3.1. Globale Hauptkomponentenanalysen 170 7.3.1.1. Extraktion nach Kaiserkriterium 171 7.3.1.2. Extraktion dreier Faktoren 172 7.3.1.3. Extraktion zweier Faktoren 174 7.3.2. Getrennte Hauptkomponentenanalysen 174 7.3.3. Weitere struktursuchende Verfahren 176 7.4. Dekomposition der RWA98 177 7.4.1. Globale Hauptkomponentenanalysen 177 7.4.1.1. Extraktion nach Kaiserkriterium 177 7.4.1.2. Extraktion dreier Faktoren 177 7.4.1.3. Extraktion zweier Faktoren 178 7.4.2. Getrennte Hauptkomponentenanalysen 179 7.4.3. Weitere struktursuchende Verfahren 180 7.5. Dekomposition der RWA³D 181 7.5.1. Globale Hauptkomponentenanalysen 181 7.5.2. Getrennte Hauptkomponentenanalysen 182 7.5.3. Weitere struktursuchende Verfahren 184 7.6. Zusammenfassung – ist die Dekomposition möglich? 187 · 12 Friedrich Funke ______________________________________________________________ Die dimensionale Struktur von Autoritarismus 8. EMPIRISCHES II – REKOMPOSITION ___________________________________________189 8.1. Sinn und Zweck der Rekomposition 189 8.2. Konventionen der Darstellung der Rekomposition 190 8.2.1. Absolute Fit-Indizes 191 8.2.2. Inkrementelle Fit-Indizes 193 8.2.3. Sparsamkeitsindizes 194 8.2.4. Schlußfolgerung für die Darstellung 194 8.3. Modellvergleich der a priori Meßmodelle für die RWA³D 198 8.3.1. Anpassungsgüte der a priori Modelle 200 8.3.1.1. Einfaktormodell ohne Methodenfaktor (parallel) 201 8.3.1.2. Einfaktormodell ohne Methodenfaktor (.-äquivalent) 202 8.3.1.3. Einfaktormodell ohne Methodenfaktor (.-kongenerisch) 203 8.3.1.4. Einfaktormodell mit Methodenfaktor (parallel) 204 8.3.1.5. Einfaktormodell mit Methodenfaktor (.-äquivalent) 205 8.3.1.6. Einfaktormodell mit Methodenfaktor (.-kongenerisch) 206 8.3.1.7. Dreifaktormodell ohne Methodenfaktor (parallel) 207 8.3.1.8. Dreifaktormodell ohne Methodenfaktor (.-äquivalent) 208 8.3.1.9. Dreifaktormodell ohne Methodenfaktor (.-kongenerisch) 209 8.3.1.10. Dreifaktormodell mit Methodenfaktor (parallel) 210 8.3.1.11. Dreifaktormodell mit Methodenfaktor (.-äquivalent) 211 8.3.1.12. Dreifaktormodell mit Methodenfaktor (.-kongenerisch) 212 8.3.2. Zusammenfassende Würdigung der Modellanpassung 213 8.3.2.1. Globale Anpassungsgüte 213 8.3.2.2. Evaluation der Ladungsmatrizen 218 8.3.2.3. Interkorrelation der latenten Konstrukte 218 8.3.2.4. Varianz der »Methodenfaktoren« 219 8.3.2.5. Zusätzliche Absicherung durch Bootstrapping 220 8.4. Feinabstimmung des Meßmodells 222 8.4.1. Modifikationsindizes 222 8.4.2. Polychorische Korrelationsmatrizen 224 8.5. Alternative Meßmodelle 225 8.5.1. Faktor zweiter Ordnung 225 8.5.2. Generalfaktor 230 8.5.3. Alternative Ansätze zur Modellierung der Kodierrichtung der Items 231 8.5.3.1. Methodenfaktor auf den positiv formulierten Items 232 8.5.3.2. Kongenerischer Methodenfaktor 232 8.5.3.3. Korrelierte Methodenfaktoren 233 8.5.3.4. Korrelierte Meßfehlervarianzen – CTCU 233 8.5.3.5. Kodierrichtungsspezifische Konstrukte 234 8.6. Meßmodelle für die RWA96/98 237 8.7. Analyse auf Itemebene oder Aggregatebene? 238 8.7.1. Itemparcels 239 8.7.2. Single Indicators 241 8.7.3. Tilgen problematischer Items 242 8.7.4. Beschränkung auf in Merkmalsrichtung formulierte Items 245 8.8. Zusammenfassung zur Rekomposition 246 · 13 Friedrich Funke ______________________________________________________________ Die dimensionale Struktur von Autoritarismus 9. EXEMPLARISCHE EXTERNE VALIDIERUNG _____________________________________ 247 9.1. Sinn und Bedeutung des Validierens 247 9.2. Strategie 248 9.2.1. Konstruktebene 248 9.2.2. Personenebene 249 9.2.3. Person-Umwelt-Interaktion 249 9.3. Beispiel I: Autoritarismus und Fremdenfeindlichkeit 251 9.4. Beispiel II: Autoritarismus und Toleranz gegenüber politischen Gegnern 254 9.5. Beispiel III: Autoritarismus und Politisches Selbstverständnis 259 9.5.1. RWA und Links-Rechts-Orientierung 259 9.5.2. Parteipräferenz und Autoritarismus 266 9.6. Beispiel IV: Autoritarismus und Punitivität 271 9.6.1. Hypothetische Verhängung von Haftstrafen 271 9.6.2. Nur Bestrafung oder auch Wiedereingliederung? 276 9.7. Beispiel V: Befürwortung von »Friedenseinsätzen« 277 9.8. Beispiel VI: Autoritarismus und »Big Five« 281 9.8.1. Theoretische Annahmen 281 9.8.1.1. Neurotizismus 282 9.8.1.2. Extraversion 282 9.8.1.3. Offenheit für neue Erfahrungen 283 9.8.1.4. Verträglichkeit 284 9.8.1.5. Gewissenhaftigkeit 285 9.8.2. Exploratorische Faktoranalysen auf Itemebene 285 9.8.3. Exploratorische Faktoranalysen auf Skalenebene 287 9.8.4. Latente Modellierung der attenuationskorrigierten Korrelationen 288 9.8.5. Zusammenfassung: Big Five und Little Three 290 9.9. Beispiel VII: Autoritarismus und Geschlecht 293 9.9.1. Mittelwertsunterschiede auf Skalenebene 293 9.9.2. Mittelwertsunterschiede auf Itemebene 295 9.10. Beispiel VIII: »Typen« von Autoritären 298 9.11. Einige Lehren aus den Beispielen 306 · 14 Friedrich Funke ______________________________________________________________ Die dimensionale Struktur von Autoritarismus 10. DISKUSSION____________________________________________________________ 307 10.1. Ausblick auf die Diskussion 307 10.2. Ist die Dekomposition geglückt? 308 10.3. Ist die Rekomposition geglückt? 308 10.4. Bedarf es einer neuen Skala? 309 10.5. Einige theoretische Konsequenzen 310 10.5.1. Dialektik von Aggression und Submission 310 10.5.1.1. Notwendige definitorische Abgrenzung von Aggression und Aggressivität 310 10.5.1.2. Kurzfristiger und langfristiger Zusammenhang 311 10.5.1.3. Kombination von Submissivität und Aggressivität in einem Item 312 10.5.1.4. Zwei Paradoxa – aggressive Unterordnung und Unterwerfung unter Aggressive 313 10.5.2. Dialektik von Submission und Konventionalismus 314 10.5.3. Dialektik von Aggression und Konventionalismus 315 10.5.4. Dialektik von Autoritarismus, Sozialer Dominanzorientierung und Diskriminierung 315 10.5.5. Dialektik Situation – Person 318 10.6. Offene Enden 319 10.6.1. Weitere Forschungsperspektiven aufgrund der Ergebnisse 319 10.6.2. Weitere Forschungsperspektiven jenseits der Ergebnisse 319 11. METHODENKRITIK _______________________________________________________323 11.1. Skalenqualität 323 11.2. Stichprobenproblematik 324 11.3. Politischer Anspruch und szientistische Ohnmacht 327 · 15 Friedrich Funke ______________________________________________________________ Die dimensionale Struktur von Autoritarismus 12. ANHANG ______________________________________________________________ 329 12.1. Dokumentation der Skalen 329 12.1.1. RWA96 330 12.1.1.1. Itemtexte und Trennschärfe 330 12.1.1.2. Ladungsmatrizen 332 12.1.2. RWA98 338 12.1.2.1. Itemtexte und Trennschärfe 338 12.1.2.2. Ladungsmatrizen 340 12.1.3. RWA82/86 345 12.1.4. RWA³D 346 12.1.4.1. Itemtext und Trennschärfen 346 12.1.4.2. Zentrale Tendenz – erstes Moment 347 12.1.4.3. Varianz – zweites Moment 351 12.1.4.4. Verteilungsform – drittes und viertes Moment 352 12.1.4.5. Interne Konsistenz 355 12.1.4.6. Verteilungsform der aggregierten Werte 356 12.1.4.7. Kovarianzmatrizen 357 12.1.4.8. Korrelation von Itemblöcken 358 12.1.4.9. Stabilität über die Zeit 359 12.1.4.10.Ladungsmatrizen 362 12.1.4.11. Bootstrap: Meßmodelle mit Methodenfaktor (t-kongenerisch) 363 12.1.4.12.Bootstrap: Meßmodelle mit Methodenfaktor (t-äquivalent) 364 12.1.4.13. Bootstrap: Meßmodelle mit Methodenfaktor (parallel) 365 12.1.4.14.Bootstrap: Meßmodelle ohne Methodenfaktor (t-kongenerisch) 366 12.1.4.15. Bootstrap: Meßmodelle ohne Methodenfaktor (t-äquivalent) 367 12.1.4.16.Bootstrap: Meßmodelle ohne Methodenfaktor (parallel) 368 12.2. Behandlung von Kovariaten 369 12.3. Beschreibung des CD-Inhalts 374 12.4. Tabellenverzeichnis 375 12.5. Abbildungsverzeichnis 378 12.6. Literatur 380 12.7. Register Fehler! Textmarke nicht definiert. 12.8. Ethikerklärung 411 12.9. Selbständigkeitserklärung 412 · 16 1. Einleitung Du. Mann an der Maschine und Mann in der Werkstatt. Wenn sie dir morgen befehlen, du sollst keine Wasserrohre und keine Kochtöpfe mehr machen – sondern Stahlhelme und Maschinengewehre, dann gibt es nur eins: Sag NEIN! Du. Forscher im Laboratorium. Wenn sie dir morgen befehlen, du sollst einen neuen Tod erfinden gegen das alte Leben, dann gibt es nur eins: Sag NEIN! Du. Arzt am Krankenbett. Wenn sie dir morgen befehlen, du sollst die Männer kriegstauglich schreiben, dann gibt es nur eins: Sag NEIN! (Wolfgang Borchert, 1937) 1.1. Der Inhalt in fünf Sätzen In dieser Arbeit geht die Rede über Ja-Sager: Mit »Autoritarismus« gibt man der Neigung des Menschen einen Namen, sich schon bei geringem situationalen Druck (vermeintlich) legitimierten Autoritäten zu unterwerfen, »Abweichler« drakonisch zu bestrafen und starr an festgefahrenen Normen festzuhalten, ohne sie kritisch infrage zu stellen. Den Forschungsansätzen zur Untersuchung dieses Phänomens ist gemein, daß sie einerseits als mehrdimensional beschrieben, dessenungeachtet jedoch in der Regel eindimensional erhoben werden. Der vorliegende Aufsatz begründet inhaltlich den Sinn einer mehrdimensionalen Messung und entwickelt ein Prozedere zur Dekomposition sowie theoretisch fundierten Rekomposition der Zusammenhangsstruktur von Autoritarismusskalen. Auf der Basis mehrerer Studien werden alternative Meßmodelle in vielfältigen empirischen Zusammenhängen angewandt. Friedrich Funke ____________________________________________________________________________________________ Einleitung 1.2. Selbstgesetzte Grenzen der Arbeit Die zentralen Fragen der Autoritarismusforschung haben wissenschaftshistorisch und nicht zuletzt auch biographisch einen ausdrücklich gesellschaftspolitischen Bezug. Dies stellt diese Forschungstradition in deutlichen Gegensatz zu vielen anderen Forschungsgebieten der Psychologie in ihrem Selbstverständnis als wertfreie Wissenschaft (vgl. Gergen & Leach, 2001). Die nachstehenden Fragen sollen die Suchrichtungen der Autoritarismusforschung zusammenfassen: 1. Welche Faktoren Genese führen zur Herausbildung autoritärer Einstellungen? 2. Womit gehen autoritäre Einstellungen einher? Assoziation 3. Welcher Gestalt ist der Zusammenhang der Facetten Struktur autoritärer Einstellungen? 4. Wie läßt sich die Verhaltenswirksamkeit autoritärer Einstellungen Prädiktion und Prävention in demokratisch verfaßten Gesellschaften kontrollieren? Die erste und die letzte Frage stellen gewissermaßen die »Beweg-Gründe« dar, die die Mühen der Beantwortung der Fragen 2 und 3 rechtfertigen. Gleichwohl ist eine hinreichende Kenntnis der Antworten auf diese nur scheinbar nachgeordneten »technischen« Fragen die unerläßliche Bedingung, um die eigentlich wichtigen Probleme zu klären. Insofern sei hier gerechtfertigt, daß in der vorliegenden Arbeit eine Beschränkung auf die Struktur autoritärer Einstellungen erfolgt, was gleichzeitig ein zeitweiliges Ausblenden der Genese und der Intervention impliziert. Mitnichten soll das als Zeichen von Ignoranz mißverstanden werden. Vielmehr geht es um das Schärfen des Blickes auf die Mittel, mit denen wir unsere Zwecke erreichen. 1 Eine letzte Vorbemerkung: »Orthographie und Interpunktion waren immer das einzige, was ich einigermassen beherrschte. Wenn diese beiden Tugenden plötzlich nichts mehr gelten, stehe ich vor dem Nichts. Ich kann ja nicht mal ordentlich skilaufen. […] sobald von mir verlangt wird, ›Spaghetti‹ ohne H zu schreiben, werde ich immer gnadenlos ›Spadschetti‹ bestellen.« Harry Rowohlt spricht mir hier aus dem Herzen und stärkt mir ungefragt den Rücken in meinem Vorhaben, diese Arbeit den Regeln der deutschen Rechtschreibung gemäß zu schreiben und die »neue deutsche Rechtschreibung« geflissent- Fortsetzung auf Folgeseite … · 18 Friedrich Funke ____________________________________________________________________________________________ Einleitung Fortsetzung der Fußnote: lich zu ignorieren. Bei dem von mir gewählten altmodischen Thema empfinde ich dies als angemessen und passend; es sei mir nachgesehen. Ebenfalls voranschicken möchte ich die Versicherung, daß ich bei der Beschränkung auf die männliche Form – zum Beispiel bei der Beschreibung »des Autoritären« – die weibliche immer mit im Sinn habe. Sollte ich zuweilen auf eine der beiden Formen verzichten, so geschieht dies lediglich aus Gründen der besseren Lesbarkeit. Auch das ist jedoch kein Dogma, da das explizite Benutzen beider Formen dem mißverständlichen Bild entgegenarbeitet, es handelte sich um ein vorwiegend »männliches« Problem. Eine dritte Vorbemerkung bezieht sich schließlich auf den Stil: ich leiste mir den Luxus, neben den recht technischen Passagen bisweilen in meinen Stil zu flüchten, der wohl nicht allzeit frei von manieristischen Albernheiten ist, wie diese Fußnote belegen mag. Ich nehme mir das Recht dennoch und setze mich mutwillig der Gefahr aus, daß meine Sprache unwissenschaftlich erscheint. Meiner Wissenschaftsauffassung zufolge fordert »Wissenschaftlichkeit« nicht Trockenheit und Nüchternheit bis zur Unkenntlichkeit und Verwechselbarkeit des Menschen hinter dem Text. Sie soll im Gegenteil mit Leben erfüllt sein. Ich möchte daher trotzig auf meiner Art beharren; auch daraus schöpfe ich meine Kraft für diese Arbeit. · 19 2. Autoritarismus als Psychologisches Problem »Das autoritäre Einstellungssyndrom soll Personen zur Übernahme faschistischer Ideologien prädestinieren. Diese Auffassung tendiert zum Psychologismus. […] Für die sozialistische Gesellschaft ist dieser Typ seinem Wesen nach irrelevant und gilt als Fehlform der Führung.« (Harry Schröder, Autorenkollektiv, 1981) 2.1. Definitorische Abgrenzung und theoretische Begriffsebene Die folgenden Ausführungen deuten das mit »Autoritarismus« bzw. »autoritär« in verschiedenen Sprachebenen Gemeinte. Diese Betrachtungen erhellen die Diskrepanz zwischen Alltagsgebrauch und Wissenschaftssprache. Abschnitt 2.1.3 (S.22ff.) entscheidet die Frage nach dem konzeptuellen Status des Konstrukts. 2.1.1. Umgangssprache Der Begriff »Autoritarismus« hat in die deutsche Alltagssprache kaum Eingang gefunden. In den beiden maßgeblichen Etymologischen Wörterbüchern der deutschen Sprache (Kluge bzw. Wahrig) fehlen Einträge für dieses Substantiv. Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem Dies gilt jedoch nicht für das zugehörige Adjektiv »autoritär« und vor allem dessen (vermeintliches) Antonym »antiautoritär«. Seit den 1920er Jahren, spätestens jedoch seit der Studentenbewegung der 1960er Jahre wird letzteres vor allem im Zusammenhang mit einem laissez faire Erziehungsstil gebraucht und gehört als Schlagwort zum Gemeingut. »Autoritär« als Attribut für Personen bezeichnet meist Leiter oder Lehrer, die einen direktiven, selbstherrlichen und despotischen Stil an den Tag legen.2 Eine zweite Bedeutung von »autoritär« besteht im Attribut für Regime und Gesellschaften. Umgangssprachlich wird hier nicht unterschieden zwischen autoritären und totalitären Herrschaftsformen; beide Begriffe werden fälschlicherweise gleichsam synonym gebraucht. Während des ersten »Nachwendejahrzehnts« wurde in der bundesdeutschen Öffentlichkeit in erster Linie die DDR mit »autoritären Gesellschaften« assoziiert; lateinamerikanische oder asiatische Staaten spielten im nichtwissenschaftlichen Diskurs eine eher untergeordnete Rolle (vgl. hingegen 2.1.2). Die Gemeinsamkeit in der Bedeutung von »autoritär« über die genannten Geltungsbereiche hinweg scheint die Betonung der autoritär-aggressiven Komponente zu sein, die »von oben nach unten« gerichtet ist. Während das Substantiv »Autorität« ausdrücklich positiv besetzt ist, haftet dem alltagssprachlichen Gebrauch von »autoritär« eine pejorative Wertung an3. Autorität legitimiert in sozial erwünschter Weise Macht, das zugehörige Adjektiv hingegen beschreibt paradoxerweise gerade illegitime Herrschaft.4 2.1.2. Soziologie und Politologie In den Politik- und Sozialwissenschaften ist »autoritär« ein zentraler Begriff, der Gesellschaftsformen mit unzureichend begrenzter Herrschaft beschreibt. In autoritären Regimes ist die Exekutive monopolisiert und nur sehr defizitär durch demokratische Strukturen kontrolliert. Häufig entstehen derartige Regierungsformen als 2 Weit vorgreifend sei hier bemerkt, daß besonders die autoritär aggressive Facette oder Subdimension in diesem Begriff ihren Niederschlag findet. 3 Interessanterweise gilt derzeit sinngemäßes auch für »antiautoritär«. 4 Ein ähnliches Spannungsfeld besteht zwischen dem psychisch funktionalen autoritären Verhalten und der gesellschaftlichen Unerwünschtheit dieses Gebarens. · 21 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem Deformationen oder Verfallsformen parlamentarischer Demokratien (z.B. südeuropäische Militärdiktaturen der 1960er und 1970er Jahre, späte Weimarer Republik, Lateinamerika). Die definitorische Abgrenzung zu »totalitär« ist essentiell, jedoch für das hier behandelte Thema ohne Belang. 2.1.3. Psychologie »Autoritär« im hier gemeinten Sinne ist als Attribut für Persönlichkeiten ein Begriff, der heutzutage in erster Linie in der Psychologie beheimatet ist. Historisch betrachtet kommt die Forschungstradition aus der kritischen Soziologie und findet sich heute im Grenzbereich zwischen Sozialpsychologie und Persönlichkeitspsychologie, ohne jedoch in einer der Subdisziplinen wirklich heimisch zu sein.5 Weitgehend unabhängig von den verschiedenen theoretischen Ansätzen der Autoritarismusforschung besteht definitorischer Konsens darüber, das Wesen von Autoritarismus als Einstellungssyndrom zu fassen, das »Personen zur Übernahme faschistischer Ideologien prädestiniert«6. In den verschiedenen definitorischen Ansätzen liegt die Betonung beim »artbildenden Unterschied« – der differentia specifica im Sinne der aristotelischen Definitionslehre – meist auf dem autokratischen Führungsstil, seltener auf der freiwilligen Unterwerfung unter nicht legitimierte Herrschaft. Beachtenswert ist jedoch die jeweilige Festlegung der »nächsthöheren Gattung« (genus proximum). Häufig ist hier von »Einstellungssyndrom« die Rede; hierbei handelt es sich jedoch um keinen in der Psychologie eindeutig verwendeten Begriff. Es besteht keine Einigkeit darüber, ob Einstellungen konzeptuell näher an Meinungen (opinions) oder 5 Autoritarismusforschung ist (zumindest in Deutschland) ein Musterbeispiel für kombinatorische bzw. integrative Bestrebungen, die jeweiligen Vorteile der (allgemeinpsychologischen) Sozialpsychologie mit der (differentialpsychologischen) Persönlichkeitspsychologie zu einer differentiellen Sozialpsychologie zu vereinen. Imperialistische oder inkorporative Tendenzen (Jones, 1998, S.6) kann man keiner der beiden Subdisziplinen unterstellen, am ehesten noch separatistische. Meiner subjektiven Beobachtung zufolge verstehen sich die meisten Kolleginnen und Kollegen, die sich mit Autoritarismusforschung beschäftigen, als Sozialpsychologen. Gleichzeitig erscheint mir aus Sicht des sozialpsychologischen Mainstream die Autoritarismusforschung wegen ihrer differentialpsychologischen Sichtweise eher beargwöhnt zu werden. 6 Hier wird auf den Stichworteintrag zur »autoritär« von Harry Schröder aus dem (DDR-)Wörterbuch der Psychologie Bezug genommen (Autorenkollektiv, 1981, S.64). · 22 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem aber an Persönlichkeitseigenschaften (traits) liegen. Neben dem durch diese Extrema bestimmten Kontinuum gibt es auch definitorische Lesarten von Autoritarismus als Ideologie, normative Überzeugung, Vorurteil oder Wertvorstellung7. Die bewußte Entscheidung für diese oder jene Gattungsebene ist nur scheinbar akademisch und unwesentlich. All diese Begriffe implizieren eine mehr oder weniger große Distanz zum konkreten Einstellungsobjekt und damit auch zu potentiellem Verhalten. Neben der Verhaltensrelevanz wird auch die Veränderbarkeit durch den Bedeutungshof des Gattungsbegriffs impliziert. Persönlichkeitseigenschaften oder gar gesellschaftlich konstruierte Ideologiesysteme entziehen sich weitgehend der kurz- oder mittelfristigen Veränderbarkeit durch Interventionen, während konkrete Einstellungen und Meinungen eher wandelbar sind. Der vorliegende Aufsatz bezieht sich ausdrücklich auf Bob Altemeyers (1981, 1988, 1996) operationale Definition von Autoritarismus (vgl. 3.4 S.66). Altemeyer mißt der Begriffsebene ganz augenscheinlich geringeren Wert bei: Right-wing authoritarianism8 is an ›individual‹ factor, a personality variable, a ›trait‹ if you like, developed on the premise that some persons need very little situational pres- sure to (say) submit to authority, while others often require significantly more. Con- ceived as a set of covarying attitudes (that is, attitudes that tend to go together), it is operationally defined as the score on an attitude scale that I named (in a burst of crea- tivity) the RWA Scale. (Altemeyer, 1988 S.3) Da Altemeyer sich hier nicht festlegt, ich dies aber für belangreich halte, fasse ich Autoritarismus in Anlehnung an Six (1996) als generalisierte Einstellung auf. Die Besonderheit gegenüber spezifischen Einstellungen liegt darin, daß es sich bei den Einstellungsobjekten um soziale Sachverhaltsklassen handelt, die sich zu ideologischen Konzepten zusammenfassen lassen. Diese deutliche Abgrenzung gegenüber spezifischen Einstellungen halte ich für erheblich und unerläßlich, da sonst Erklärungszusammenhänge zirkulär würden: Wenn Autoritarismus eine Einstellung ist, 7 Beispiele für Autoritarismus und Ideologie: Durrheim, 1997; Eysenck & Wilson, 1978; García & Griffitt, 1978; Kent, 1965; Ray, 1989; Tetlock, 1983. Autoritarismus und Werte: Boehnke, Frindte, Reddy & Singhal, 1993; Munning, 1975; Suziedelis & Lorr, 1973. Autoritarismus und soziale Normen: Cialdini & Trost, 1998; Duckitt, 1988; Kagitçibasi, 1967. 8 Kursiv im Original · 23 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem dann kann er keine anderen Einstellungen »erklären«, da er theoretisch nicht vorgeordnet wäre. Zugleich ist Autoritarismus in meiner Lesart nicht so »persönlichkeitsnah « wie ein Trait. 2.2. Forschungstraditionen Von 1950 bis 1989 verzeichneten die Psychological Abstracts 2341 Publikationen über Autoritarismus und Dogmatismus (Meloen, 1991). Mit ähnlichen Verweisen beginnt eine ganze Reihe von Überblicksarbeiten zur Autoritarismusforschung. In der Tat ist die Anzahl der Veröffentlichungen zum Autoritarismus sehr hoch. Seit Mitte der 1960er Jahre werden pro Jahr zwischen 200 und 500 Artikel publiziert, die sich zumindest im weiteren Sinne auf Forschung zum Autoritarismus be- ziehen.9 Veröffentlichungstrend zum Autoritarismus 0 200 500 lPsycInfo: indizierte Veröffentlichungen pro Jahr 10000 20000 30000 40000 50000 60000 Artikel zum Suchbegriff {authoritarian* or authority} 100 300 400 Blasengröße symboisiert den prozentualen Anteil 0 5 0 5 0 5 0 5 0 5 0 5 0 5 0 5 3 4 2 3 5 6 7 8 9 2 4 5 6 7 8 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Publikationsjahr Abbildung 1: Veröffentlichungstrend zum Autoritarismus (absolute Zahlen) Um jedoch den Veröffentlichungstrend wissenschaftshistorisch interpretieren zu können, ist es unerläßlich, die Zahl der Publikationen an den Gesamtveröffentlichungen zu gewichten: Die Gesamtzahl der (in PsycInfo indizierten) Publikationen hat vor allem seit Mitte der 1960er Jahre stetig zugenommen und sich seit den Einziger Tiefpunkt war 1979 mit »nur« 100 Publikationen. · 24 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem 1990er Jahren auf ca. 60,000 eingepegelt. Der relative Anteil der Arbeiten zum Autoritarismus bewegt sich dabei zwischen 5‰ und 13‰ (vgl. untere Linie in Abbildung 1 S.24). Veröffentlichungstrend zum Autoritarismus i20000 50000 li} 0 100 200 300 400 500 0 1 2 3 PsycInfo: indzierte Veröffentlichungen pro Jahr 10000 30000 40000 60000 Artike zum Suchbegriff {authortarian* or authorityprozentualer Anteil an Gesamtveröffentlichungen 0 0 0 0 5 0 5 0 5 5 5 0 5 5 0 5 2 3 5 6 8 9 4 6 7 8 9 2 3 4 5 7 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Publikationsjahr Abbildung 2: Veröffentlichungstrend zum Autoritarismus (relative Zahlen) Die Zunahme von Veröffentlichungen läßt sich nun gut in einen zeitlichen Rahmen stellen. Nach dem zweiten Weltkrieg und namentlich nach der Veröffentlichung der »Authoritarian Personality« gab es einen ersten deutlichen Anstieg auf das Maximum von 1.3% im Jahre 1957. Weitere Anstiege gab es jeweils nach maßgeblichen Sammelbänden oder »Klassikern« der Autoritarismusforschung: 1. nach 1967 »Dimensions of Authoritarianism« von John Kirscht und Ronald Dillehay, 2. nach 1981 »Understanding Right Wing Authoritarianism« von Bob Altemeyer und schließlich 3. Mitte der 1990er Jahre, wobei die politische Wende in Europa eine plausible Begründung hierfür darstellt. Schließt man in die Recherche zusätzlich »Dogmatismus«, »Extremismus« und »politisch« mit ein, dann lassen sich noch deutlichere Rückschlüsse auf die politi- · 25 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem schen Hintergründe, aber auch auf Wandlungen in Begriffen ziehen. Die Graphen verlaufen weitestgehend parallel; lediglich zwei Besonderheiten seien hervorgehoben: In den ersten Nachkriegsjahren gab es einen Höhepunkt politisch-psycho- logischer Forschung, der jedoch erst nach der Veröffentlichung der »Authoritarian Personality« mit einem Anstieg der Arbeiten zum Autoritarismus einherging. Die Studie der Berkeley-Gruppe 10 war gewissermaßen begriffsstiftend für den Mainstream. Die zweite Abweichung vom parallelen Verlauf zeigt sich seit Mitte der 1990er Jahre. Zwar steigt auch hier die Anzahl von Arbeiten zum Autoritarismus an, noch deutlicher jedoch ist der Anstieg bei den begrifflich weiter gefaßten polit-psychologischen Veröffentlichungen.11 Die zeitliche Einordnung des Veröffentlichungstrends soll nicht implizieren, daß Autoritarismusforschung in Abhängigkeit vom gesellschaftlichen Bedarf zu- bzw. abnahm. Wollte man direkte Parallelen zu politischen Umständen ziehen, dann fände man unter Umständen gerade gegenläufige Trends. In den USA zogen sich die Autoritarismusforscher während der Reagan- und Bush-Administration frustriert zurück und überließen das Feld in erster Linie Kanadiern (Altemeyer, 1981; 1988; 1996), Holländern (Meloen, Hagendoorn, Raaijmakers & Visser, 1988; Meloen & Middendorp, 1991; Meloen, 1994; Meloen, Van der Linden & de Witte, 1996; Eisinga, Felling & Peters, 1990), Südafrikanern (Duckitt, 1989), Australiern (Ray, 1983b; 1984c; Billig, 1977) und Deutschen (Oesterreich, 1974a; 1993; 1996; Lederer, 1982; 1995; Freyhold, 1971; Freyhold, 1985). Besser sind die Schwankungen unter Umständen durch wissenschafts- und veröffentlichungspolitische Umstände zu erklären. In aller Regel folgen die Anstiege in der Veröffentlichungsmenge maßgeblichen Publikationen, die ihrerseits weitere Studien initiiert und katalysiert haben. 10 Der Soziologe John Levi Martin, ein Schüler von Herbert Hyman (Hyman & Sheatsley, 1954; Hyman, 1959) führte in einem kritischen Aufsatz anläßlich des 50. Jubiläums der TAP die Abkürzung »AFLS« für die Autoren Adorno, Frenkel, Levinson und Sanford ein, um der Tatsache Rechnung zu tragen, daß die Reihung der Autoren lediglich eine alphabetische ist (Martin, 2001). Die Sprachregelung »Adorno et al.« – so die unausgesprochene Botschaft – suggeriert fälschlicherweise die Leitung der Gruppe durch The- odor W(iesenthal) Adorno, was jedoch mitnichten der Fall war (vgl. auch Sanford, 1986; Samelson, 1986; 1993; Six, 1997; Six, Wolfradt & Zick, 2001). 11 Eine einleuchtende, jedoch nicht validierte Vermutung wäre hier die wachsende Zuwendung der politischen Psychologie zu Fragen der Politikberatung. · 26 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem Es kann und soll an dieser Stelle kein umfassender und erschöpfender historischer Abriß der Autoritarismusforschung geboten werden. Er wäre ob seines Umfanges in doppeltem Sinne erschöpfend. Dennoch soll eine kurze Einführung verdeutlichen, auf welche Forschungstraditionen sich diese Arbeit bezieht. Zudem halte ich für ausdrücklich unterstreichenswert, daß es die »klassischen« Arbeiten nicht verdient haben, nur in der Sekundärliteratur zitiert zu werden. Vieles ist hier schon angedacht und auch zuende gedacht. Einiges davon ist zu unrecht in Vergessenheit geraten. Besonders lesenswerte Aufsätze über die frühen Arbeiten zum Autoritarismus finden sich bei Franz Samelson (1993) und in deutscher Sprache bei Detlef Oesterreich (1996). 2.2.1. Philosophische Wurzeln Löst man sich vom konkreten Begriff des Autoritarismus und verallgemeinert das mit dem Begriff Gemeinte auf die Frage nach der Verantwortung der oder des Einzelnen für ihr oder sein Tun, dann handelt es sich um eine zentrale und alte Frage der Philosophie. Zweifellos hatte diese Fragestellung einen Höhepunkt in der Aufklärung und ist besonders mit den Namen Immanuel Kant und Gotthold Ephraim Lessing verbunden. Wird unser Wille durch Gesetze, die in uns selbst liegen (Autonomie) oder aber durch etwas außerhalb unserer Vernunft Liegendes (Heteronomie) bestimmt (Kant, 1784 [1784]). Genau in diesem Spannungsfeld findet sich das Phänomen Autoritarismus. 2.2.2. Vor der Frankfurter Schule Schon bevor der Begriff »Autoritarismus« geprägt wurde und sich schulenbildend in der wissenschaftlichen Literatur durchgesetzt hatte, gab es eine Reihe von Studien, die sich differentialpsychologisch mit politischen Einstellungen und Verhalten auseinandersetzten. Hier sollen nur einige Beispiele zur Illustration angeführt werden. Moore (Moore, 1925) fand in experimentellen Studien die Überlegenheit von Radikalen12 gegenüber Konservativen bei Kreativitäts- und Assoziationstests. Vetter (1930a; 1930b) bezog persönlichkeitspsychologische Maße (Laird C Test, Wood12 Mit »Radicals« sind in der amerikanischen Literatur meist Linksradikale gemeint. · 27 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem worth P.D. Sheet, Kent-Rosanoff Scores, Intelligenztests) auf politische Einstellungen und Parteipräferenzen. Etwa zur gleichen Zeit führte Howells Experimente mit 51 extrem Radikalen und 50 extrem Konservativen durch, bei denen er eine ganze Reihe von signifikanten Unterschieden findet (Howells, 1928; 1933). Wenn auch nicht alle Befunde repliziert werden konnten, so mögen diese Studien dennoch als Beispiel für die frühe Idee dienen, daß sich Rechte und Linke hinsichtlich ihrer Persönlichkeitsstruktur unterscheiden. In den späteren Berkeley-Studien spielten projektive Tests eine zentrale Rolle (vgl. Daniel J. Levinsons Kapitel XV in Adorno, Frenkel-Brunswik, Levinson & Sanford, 1950; Dorris, Levinson & Hanfmann, 1954). Die Autoren konnten sich hier auf eine Reihe von Vorarbeiten aus den 1940er Jahren stützen (McGranahan, 1946; Reichard, 1948). Das erste bekannte (amerikanische) Fragebogeninstrument zur Erfassung von Autoritarismus wird dem 1997 verstorbenen Ross Stagner zugeschrieben (vgl. Christie, 1991). Wie jedoch schon die Titel seiner zwei Aufsätze zu diesem Thema nahelegen, handelte es sich hier mehr um die Erfassung faschistoider Einstellungen (Stagner, 1936a; 1936b).13 Die Items basierten auf einer Inhaltsanalyse nationalsozialistischer und italofaschistischer Propagandamaterialien. Dementsprechend schmal war die theoretische Basis, auf der diese Skala gegründet war. Sinngemäßes gilt für die Political and Economic Progressivism Scale (P.E.P.) von (Newcomb, 1943). Hier handelte es sich um ein außergewöhnlich reliables (.91-.94) Meßinstrument zur Erfassung von Einstellungen zur Politik des New Deal der 30er Jahre des 20. Jahrhunderts. Newcomb untersuchte damit in einem Vierjahreslängsschnitt von 1935 bis 1938 die vollen Jahrgänge des Bennington College. Während Stagners und Newcombs Skalen noch sehr »politisch« und damit sehr anfällig gegenüber sozialer Erwünschtheit und tagespolitischen Stimmungen waren, wandelte sich bei Edwards (1941) der Ansatz von einem soziopolitischen zu einem differentialpsychologischen. Edwards konnte sich dabei auch auf Arbeiten von Gundlach (1937) sowie Katz und Kantril (1940) stützen. Die Items wurden in seiner Unlabeled Fascist Attitude Scale subtiler. Zwar entstanden damit große psychometrische Probleme (vor allem sehr geringe Reliabilität), letztlich war aber das 13 »Fascist attitudes: Their determining conditions.« und »Fascist attitudes: An exploratory study.« · 28 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem Hinbewegen zu subtileren Frageformen ein erster Schritt auf eben jenem Pfad, den später die Berkeley-Gruppe und ihre Nachfolger zum Königsweg, zur via regia ausbauten. Im deutschen Sprachraum keimte die Autoritarismusforschung im Spannungsfeld zwischen Marxismus und Freudianscher Psychoanalyse. Bereits Ende der 1920er Jahre theoretisierte Wilhelm Reich über die psychodynamischen Hintergründe, die den Sturz des kapitalistischen Systems verhindern. Als strukturelle Quelle der sexuellen Repression durch die Gesellschaft und »Fabrik bourgeoiser Ideologie« identifizierte er die bürgerliche Familie (Reich, 1933), die zur Herausbildung einer Feldwebelnatur führt, die sich nach oben duckt und nach unten herrscht. In sehr ähnlicher Weise argumentiert Otto Fenichel (1931). Tragischerweise waren Reichs vorausschauende Erkenntnisse gerade durch ihre Richtigkeit zu geringem Einfluß verurteilt: seine Arbeiten zur Massenpsychologie des Faschismus wurden sofort nach der nationalsozialistischen Machtergreifung verboten, so daß sie keine Wirkung entfalten konnten. Seine späteren Überarbeitungen hatten durch die Streichung des marxistischen Vokabulars an Bissigkeit und Deutlichkeit verloren, Reich selbst hatte sich als Wissenschaftler durch seine Arbeiten zur Orgontheorie (Reich, 1948; 1973) diskreditiert. Ebenfalls beheimatet zwischen Marxismus und Psychoanalyse war Erich Fromm, der sich vom Jüdischen Lehrhaus in Frankfurt (Main) immer mehr ins »Café Marx« (Institut für Sozialforschung, vgl. Lowenthal, 1980) bewegte. Fromm entwickelte in der ersten Hälfte der 1930er Jahre sein Konzept des autoritärmasochistischen Charakters. Die empirischen Arbeiten zu diesem Thema (Fromm, 1936; Horkheimer, Fromm & Marcuse, 1936)14 hatten wahrscheinlich ursprünglich andere Beweggründe, lassen sich aber in der Rückschau durchaus als erste Arbeiten zum autoritären Charakter bzw. dessen Widerpart lesen.15 Ungeachtet der Diskussion über den empirischen Wert der Studien über Autorität und Familie bleibt unberührt, daß die theoretischen Arbeiten Fromms (1936; 1941; 1966) Wertvolles 14 Samelson (1993) verweist hier auf die bemerkenswerte Doppeldeutigkeit des Wortes »Erhebung [der Arbeiterklasse]«, das in der Übersetzung ins Englische zunächst zu »survey« wurde, später jedoch zu »revolt». 15 Franz Samelson (1993) zweifelt letzteres an, ich kann dies nur ohne Anmaßen eines eigenen Urteils wiedergeben. · 29 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem über die Phänomenologie des Autoritären zusammengetragen haben (vgl. auch Lee, 1963; Paluchowski, 1985; Bacciagaluppi, 1997; Billiet & McClendon, 2000). Der Typus des Autoritären16 wurde auch aus völlig anderer ideologischer Richtung phänomenologisch beschrieben: Der führende nationalsozialistische Psychologe Erich Jaensch (1938a) charakterisierte die autoritäre Persönlichkeit als erwünschten Idealtypus der nationalsozialistischen Bewegung (vgl. auch Jaensch, 1938b; 1938c).17 Dies ist nur scheinbar paradox; schließlich belegt Jaensch mit seiner Typologie gleichsam als Kronzeuge, wie die optimal an den Nationalsozialismus angepaßte Persönlichkeit aussehen sollte. Mit der rassistischen Interpretation seiner Erkenntnisse hat sich Jaensch aus nachvollziehbaren Gründen außerhalb des wissenschaftlichen Nachkriegsdiskurses gestellt. Die theoretischen Ansätze und experimentellen Belege zu Besonderheiten im kognitiven System decken sich aber weitgehend mit den Ansichten, die Milton Rokeach zwanzig Jahre später in seinem Dogmatismuskonzept formulierte (Rokeach, 1956; 1960; Roberts & Rokeach, 1956; Plant, 1960, vgl. auch Oesterreich, 1996, S. 39ff.). Der nationalsozialistische Idealtypus wäre in Rokeachs Begrifflichkeit mit closed-mindedness beschrieben worden. Eine Reihe von Arbeiten befaßten sich in den 1940er Jahren ausdrücklich mit dem Problem, das später für die Forscherinnen und Forscher der Berkeley-Gruppe maßgebend war: welche psychischen Charakteristika lassen sich bei Antisemiten und Nationalsozialisten (bzw. ihren Anhängern) finden. Daß diese Arbeiten nicht in den Kanon der Autoritarismusforschung eingegangen sind, zumindest jedoch nicht so einflußreich wie der spätere Klassiker wurden, bedeutet keinesfalls, daß die tap die erste und einzige Studie dieser Zeit in diesem Feld war: Otto Fenichel veröffentlichte 1940 seine Psychoanalyse des Antisemitismus. Zwei der späteren Autoren der tap, Levinson und Sanford, publizierten 1944 die Itemanalyse ihrer sehr reliablen Antisemitismus-Skala. Die Antisemitismusskala von Gough (1951) wurde zwar erst später veröffentlicht, ist aber bereits vor der tap als Manuskript eingereicht worden. Erikson (1942) und Chisholm (1946) theoretisierten aus psychiatrischer Sicht über Hitlers jugendliche Anhänger und über mögli16 Die Wortwahl ist mit Bedacht getroffen, da für die Forschung der 1920er/1930er Jahre sowohl typisierende Persönlichkeitstheorien als auch männerzentrierte Ansätze vorherrschend waren. 17 Jaensch war nach dem 15. Kongreß der Deutschen Gesellschaft für Psychologie 1936 in Jena deren Vorsitzender. · 30 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem che Nachkriegsentwicklungen der deutschen Gesellschaft; Maslow beschrieb bereits 1943 die »autoritäre Charakterstruktur«. Simmel (1946) schrieb eine Monographie über Antisemitismus als gesellschaftliche Krankheit, Sartre (1946) zeichnete im selben Jahr das »Portrait of the Antisemite«. Nancy Morse und Floyd Allport (1949) untersuchten mögliche Ursachen für Antisemitismus und beschrieben verschiedene Typen.18 Diese Beispiele sollen illustrieren, daß die tap besser als Wendepunkt denn als Ausgangspunkt der Forschung zum Autoritarismus und verwandten Konstrukten beschrieben wäre. Die Berkeley-Forscherinnen und -forscher konnten bereits auf Vorarbeiten der Kollegen aufbauen. 2.2.3. Von Frankfurt nach Berkeley Nach dem Bruch Fromms mit Horkheimer 1939 begannen die Forscher des Frankfurter Instituts für Sozialforschung mit der Planung eines Forschungsprojekts zum Antisemitismus. Es ist bemerkenswert, daß ungeachtet der Gründungsintention des Instituts Antisemitismus als soziologisches Problem bis zu diesem Zeitpunkt keine große Rolle in der Forschung zu spielen schien. Man mag dies plausibel damit erklären, daß Klassengegensätze die zentrale marxistische Kategorie des historischen Materialismus sind, was per definitionem wenig Raum für rassentheoretische Erklärungen läßt. Zugleich scheinen mir die assimilatorischen Tendenzen vieler deutsch-jüdischer Intellektueller in der Weimarer Zeit die Beschäftigung mit Antisemitismus verhindert zu haben.19 Auslöser und biographischer Ausgangspunkt der Forschungsarbeiten zur Autoritären Persönlichkeit waren die Erfahrungen der »Frankfurter« Emigranten mit dem Nationalsozialismus in Deutschland. Ursprünglich ging es darum, die psychologischen Hintergründe von Antisemitismus zu untersuchen. Dieser spezielle Fokus wurde relativ schnell auf die allgemeinere Frage erweitert, was Massen von Menschen dazu treibt, sich unmenschlichen Zielen unterzuordnen: 18 Diskriminierung/Ausgrenzung, sprachliche Abwertung und aversive Gefühle gegenüber Juden. 19 Als prominenter Zeuge sei hier der Romanist Viktor Klemperer genannt (Klemperer, 1957; 1989; 1995); vgl. auch Arbeiten zum Jüdischen Selbsthaß von Lessing (1930) oder Kurt Lewin (1941). · 31 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem The research to be reported in this volume was guided by the following major hy- pothesis: that the political, economic, and social convictions of an individual often form a broad and coherent pattern, as if bound together by a ›mentality‹ or ›spirit,‹20 and that this pattern is an expression of deep-lying trends in his personality. (Adorno et al., 1950, S.1) Diese Konzentration auf die Persönlichkeitsstruktur rechtfertigt die Entscheidung zugunsten einer psychologischen Herangehensweise, obwohl die Forscherinnen und Forscher des emigrierten Frankfurter Instituts für Sozialforschung eher einen soziologischen oder sozialhistorischen Hintergrund hatten. Der soziologische Mechanismus der Psychogenese von Autoritarismus wurde von den Autoren in den patriarchalischen Sozialisationspraktiken des Mittelstandes der Weimarer Zeit gesehen. Else Frenkel-Brunswik (1950, S.384ff.) konkretisiert in Kapitel X der tap die Familienverhältnisse und Erziehungsmuster, die für das Entstehen autoritärer Persönlichkeiten verantwortlich gemacht werden. Charakteristisch sind eine kühl dominierende Vaterfigur, emotionale Kälte und strikte Disziplinierung21, Bagatellisierung innerer Prozesse und Gefühle sowie hermetische Familiengrenzen. Dieses Familienklima führt(e) bei den Kindern zu starken, aber verständlicherweise unausgelebten Haßgefühlen gegenüber dem Vater im Speziellen und den Eltern im Allgemeinen. Der »angestaute« Haß wird entsprechend der psychoanalytischen Theorie verschoben auf Schwächere und vor allem auf soziale Randgruppen und Abweichler. Folgerichtig werden die antisemitischen und fremdenfeindlichen Orientierungen Erwachsener als fortgesetztes Muster einer unkritischen Unterordnung unter (aggressive) Autoritäten interpretiert. Diese Auffassungen über die Psychogenese der Autoritären Persönlichkeit ist in der tap nicht originell; sie wurden in wesentlichen Zügen bereits in den 1930er Jahren von den Frankfurtern entwickelt (Horkheimer et al., 1936, aber auch Fromm, 1936; 1941). Die Weiterentwicklung der tap ist weniger in der Theorie zu sehen als vielmehr im Operationalisierungsversuch (vor allem durch die Fascism-F-Scale, Kapitel VII, S.224ff.), in der umfassenden empirischen Illustration anhand von Inter20 Typographischer Fehler wie im Original. 21 vgl. viel später Baumrind (1968). · 32 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem views (Kapitel IX-XIII, XVI-XVIII) sowie im Ableiten verschiedener Typen von Autoritären (Kapitel XIX, S.744ff.). Im Ergebnis der Interviews sowie der Inhaltsanalyse nationalsozialistischer Dokumente leitete die Berkeley-Gruppe neun Konstrukte ab, die das Syndrom der Autoritären Persönlichkeit formen (Adorno et al., 1950, S.228, hier Tabelle 1, S.34). Im Verlauf der Studie wird deutlich, daß den Autoren die komplexe Struktur dieser analytisch unterschiedenen Konstrukte durchaus bewußt war. Es wurde weder behauptet, daß diese Subdimensionen eine erschöpfende Beschreibung und damit hinreichend wären, noch daß sie alle in gleicher Weise notwendig seien. Die widersprüchlichen Ausführungen in der tap wurden vom Autor des entsprechenden Kapitels VII später konkretisiert und klargestellt (Sanford, 1973; Farsides, 1993). · 33 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem Konstrukt Definition Konventionalismus Autoritäre Unterwürfigkeit Autoritäre Aggression Anti-Intrazeption Aberglaube und Stereotypie Machtdenken und »Kraftmeierei«22 Destruktivität und Zynismus Projektivität Sexualität Starre Bindung an die konventionellen Werte des Mittelstandes Unkritische Unterwerfung unter idealisierte Autoritäten der Eigengruppe Tendenz, nach Menschen Ausschau zu halten, die konventionelle Werte mißachten, um sie verurteilen, ablehnen und bestrafen zu können Abwehr des Subjektiven, des Phantasievollen, Sensiblen Glaube an die mystische Bestimmung des eigenen Schicksals; die Disposition, in rigiden Kategorien zu denken Denken in Dimensionen wie Herrschaft – Unterwerfung, stark – schwach, Führer – Gefolgschaft; Identifizierung mit Machtgestalten; Überbetonung der konventionalisierten Attribute des Ich; übertriebene Zurschaustellung von Stärke und Robustheit Allgemeine Feindseligkeit, Diffamierung des Menschlichen Disposition, an wüste und gefährliche Vorgänge in der Welt zu glauben; die Projektion unbewußter Triebimpulse auf die Außenwelt Übertriebene Beschäftigung mit sexuellen »Vorgängen« Tabelle 1: Das Syndrom der Autoritären Persönlichkeit Detlef Oesterreich (1996, S.46ff.) kommentiert die einzelnen Dimensionen, verweist auf die Analyseebenen, auf denen sie angesiedelt sind und erklärt ihren psychodynamischen Zusammenhang. Letztlich bleibt jedoch anzumerken, daß es sich bei der Aufzählung der Subdimensionen am ehesten um eine operationale Definition von Autoritarismus handelt bzw. um eine nachträgliche Beschreibung dieser Operationalisierung durch die F-Skala. Die F-Skala ist wohl auch derjenige Teil der Studie, auf den sie ungerechterweise reduziert wird. Zugleich richtete sich auch die Hauptkritik gegen diese Skala (2.2.4.1). 22 »toughness« im Original. · 34 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem 2.2.4. Kritische Rezeption der Berkeley-Schule Die Rezeption der Studie zur Autoritären Persönlichkeit ist wissenschaftshistorisch nicht zu trennen von der gesellschaftspolitischen Situation in den Vereinigen Staaten während der 1950er und 1960er Jahre. Zwar ging es den Autorinnen und Autoren der tap ursprünglich um eine Beschreibung des zu der Zeit inzwischen besiegten Nationalsozialismus in Deutschland, gleichzeitig sollte aber auch das antisemitische und faschistische Potential unter der US-amerikanischen Bevölkerung eingeschätzt werden. Während der McCarthy-Ära waren die kapitalismuskritischen Ansichten der Berkeley-Gruppe jedoch in höchstem Maße suspekt. Dies führte einerseits – gleichsam in vorauseilendem Gehorsam – zum Psychologismus, der die soziologischen Ursachen für das Entstehen autoritärer Persönlichkeiten ausblendete, und andererseits zu einer politisch-korrekten Lesart der Studie, die Faschismus und Kommunismus im Sinne der populären Totalitarismusthese gleichsetzt (siehe auch 2.2.4.2, S.37). 2.2.4.1. Methodische Kritik Die klassische Studie der Berkeley-Forscher sollte weniger als Ausgangspunkt der Autoritarismusforschung mißverstanden werden, vielmehr als Wendepunkt in dieser Forschungstradition. Sie leitet die Nachkriegspsychologie nach der Zäsur des Zweiten Weltkriegs ein, sie ist ein deutliches und manchmal schmerzhaftes Beispiel für den Übergang von einem soziologischen und kapitalismuskritischen Ansatz zu einem reduzierten psychologischen Fokus. Auf der methodischen Ebene markiert die Studie den Übergang zu einer streng empirischen und – konkreter – zu einer fast ausschließlich quantitativ orientierten psychologischen Forschung. In the marriage of the two methodologies [qualitative klinische Studien und quantita- tive Methoden – Kommentar FF], the quantitative statistical method is all too often cast in the role of the stodgy husband who answers ›Yes, dear‹ to all the bright sugges- tions made by the wife. (S.70f.) (Kirscht & Dillehay, 1967) Die Berkeley-Gruppe war mit ihrer Studie in der tragischen Situation, eine gute Interviewstudie vorgelegt zu haben, aber fortan an der »Zugabe« der eigentlich nachrangigen F-Skala gemessen zu werden. Dadurch gerieten die Interviews weit- · 35 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem gehend in Vergessenheit, gleichzeitig war die F-Skala nach den sich erst später durchsetzenden psychometrischen Gütekriterien überfordert. Der zentrale Kritikpunkt wies auf die Zustimmungstendenz hin, die bei unbalancierten Skalen eine ernsthafte Gefahr darstellt (ausführlich dazu 4.2.5.2, S.97ff.).23 Bereits Brewster Smith hat das Problem der Zustimmungstendenz vorhergesehen (1950, s.a. Eager & Smith, 1952). Die dahingehende Kritik wurde besonders durch den Aufsatz von Hyman und Sheatsley (1954) im ersten großen Übersichts-Band nach der tap (Christie & Jahoda, 1954) zusammengefaßt. John J. Ray spitzte die Kritik zu: »A person with a high F score might be simply a careless responder rather than a genuine fascist.« (Ray, 1983a, S.82).24 Gleichwohl ist auch die Argumentation plausibel, daß »Verzerrungen« durch eine Zustimmungstendenz im konkreten Fall der Erfassung von Autoritarismus mit Inhaltlichem überlagert sind. Michaela von Freyhold (1971, S.243) gibt zu bedenken, daß es gerade für Autoritäre typisch ist, daß sie im Zweifelsfalle zustimmen. Eine der Facetten oder Subdimensionen von Autoritarismus ist definiert als Tendenz, absoluten Aussagen unkritisch zuzustimmen: autoritäre Unterordnung. So wurde in diesem Sinne argumentiert, daß Zustimmung zu Autoritarismusitems sowohl aus logischen als auch psychologischen Gründen nachvollziehbar und folgerichtig ist (Leavitt, Hax & Roche, 1955; Gage et al., 1957; Gage & Chatterjee, 1960). Bei ausschließlich in Merkmalsrichtung kodierten Autoritarismusitems können somit hohe Werte durch Autoritarismus oder/und durch Zustimmungstendenz »herbeigeführt« worden sein. Die Zustimmung zu negativ formulierten Items hingegen wird logisch als geringer Autoritarismus interpretiert, psychologisch 23 »The road to Measurement Hell is paved with protrait items«. (Altemeyer, 1996, S.63) 24 Weitere wichtige Aufsätze aus dieser Zeit zu diesem Thema: Bass, 1955; Chapman & Campbell, 1957; Messick & Jackson, 1957; Gage, Leavitt & Stone, 1957; Jackson & Messick, 1957; Jackson, Messick & Solley, 1957; Messick & Frederikson, 1958; Kerlinger, 1958; Chapman & Bock, 1958; Christie, Havel & Seidenberg, 1958; Gaier & Bass, 1959; Jackson, 1959; Gage & Chatterjee, 1960; Edwards & Walker, 1961; Clayton & Jackson, 1961; Zuckerman & Norton, 1961; Couch & Keniston, 1961; Zuckerman & Eisen, 1962; Adams, 1962. Mit etwas Abstand wurde die Diskussion später wieder aktiviert (Ezekiel, 1970; Eisenman & Platt, 1970; Bentler, Jackson & Messick, 1971; Oesterreich, 1974b; Heaven, 1983). · 36 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem freilich als hoher Autoritarismus, da autoritäre Unterordnung integraler Bestandteil des autoritären Syndroms ist.25 Ein zweiter methodischer Kritikpunkt betraf die Bildungsabhängigkeit der Ergebnisse. Intelligentere Personen weisen in aller Regel geringere Autoritarismuswerte auf (Hyman & Sheatsley, 1954, S.57). Die positive Lesart wäre, Bildung per se eine immunisierende Wirkung zuzuschreiben. Dies wäre jedoch m.E. zu optimistisch, zumal Inhalt (und Form) der Bildung sicher wichtiger sind als die »Verweildauer« in schulischen Einrichtungen. Eine kritische Auslegung der Ergebnisse erscheint mir hier plausibler: intelligentere Personen durchschauen den Fragebogen eher. Somit wird der Bildungsbias zu einem Folgeproblem der Antworttendenz sozial erwünschten Antwortverhaltens. Weitere methodische Kritik betrifft die Analyseebene oder den begrifflichen Status von Autoritarismus. Wiederholt wurde darauf hingewiesen, daß Autoritarismus zwar als Charaktersyndrom oder Persönlichkeitseigenschaft konzipiert ist, aber empirisch mit den Mitteln der Einstellungsmessung erfaßt wird (Hyman & Sheatsley, 1954; Roghmann, 1966; Ray, 1979c; Rao & Mehta, 1979; Oesterreich, 1996; 1998). Die Autoren der tap hatten keine Veranlassung, das Problem in dieser Deutlichkeit zu sehen, da ihnen die psychoanalytische Theorie axiomatisch »bewies «, daß die gemessenen Einstellungen indirekte Manifestationen innerer psychischer Gegebenheiten sind. Da diese Verbindung nicht hinterfragt wurde, konnten nunmehr genau diese psychischen Eigenschaften als kausale Prädiktoren konkreter Einstellungen ins argumentatorische Feld geführt werden. Letztlich wird damit jedoch die Zirkularität solcher Argumentationen verschleiert. 2.2.4.2. Inhaltliche Kritik und alternative Konzepte Die inhaltliche Kritik an der Studie zur Autoritären Persönlichkeit betrifft zum großen Teil den unterstellten Zusammenhang zwischen spezifischen Mustern elterlicher Sozialisation und Erziehungspraktiken auf der einen Seite und der Herausbildung autoritärer Persönlichkeiten auf der anderen. Hier zeigt sich der psychoanalytische Hintergrund der Autoren besonders deutlich, sodaß sie sich hier auch am stärksten der Kritik an dieser Sichtweise aussetzen. 25 Zur Auswirkung der Zustimmungstendenz auf die hier vorgestellten eigenen Studien vergleiche 4.2.5.2., S.97ff.. · 37 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem Es wäre jedoch falsch, den Autoren zu unterstellen, sie hätten einen deterministischen Zusammenhang zwischen Sozialisationspraxis und Persönlichkeitsentwicklung behauptet. Die Sozialisationserfahrungen eröffnen vielmehr eine Reihe potentieller Entwicklungspfade, die zudem durch makrosoziale Bedingungen (Produktionsverhältnisse, Propaganda) oder auch Gruppenzugehörigkeiten beeinflußt werden (Adorno et al., 1950, S.7ff.). Schon während der Studien und erst recht nach der Veröffentlichung sah sich die Berkeley-Gruppe massiven politischen Anfeindungen ausgesetzt. Im aufkommenden Kalten Krieg bestand der Vorwurf in einer Ideologieanfälligkeit, die die strukturellen Ähnlichkeiten von Faschisten und Kommunisten ignoriert. Diese Sichtweise formulierte Edward Shils (1954) in einem kämpferischen Aufsatz in dem kritischen Sammelband von Christie und Jahoda (1954). Diese Debatte wurde sehr erbittert geführt (McGrew, 1969; Hanson, 1969; Kohn, 1972; Wilson, Dennis & Wadsworth, 1976; Eysenck, 1981; Lichter & Rothman, 1982; Rajnarain, 1986), teilweise konnten die Autoren ihre politischen Beweggründe kaum verhehlen (Ray, 1983b; 1984d; 1985a; 1985b).26 Der wichtigste Aufsatz, der die Existenz eines linken Autoritarismus anhand empirischer Evidenz (DiRenzo, 1967a; 1967b; 1971; Hanson, 1968) als Mythos zurückweist, stammt von William Stone (1980; 1983). Bob Altemeyer, der sich durch die Einführung des Begriffs »Right-wing Authoritarianism« ausdrücklich gegen die Existenz eines linken Autoritarismus ausspricht, ihn aber gleichsam »wegdefiniert« hat, versuchte durch die Einführung einer eigenen LWA-Skala linken Autoritarismus empirisch zu erfassen (Altemeyer, 1996, S.216ff., dt. Funke, 1997; Levasseur, 1998;). Die angesprochene Rechts-Links-Debatte war der entscheidende Beweggrund für die Entwicklung alternativer Autoritarismuskonzepte: Hans Eysenck entwickelte ein Zweifaktorenmodell der Persönlichkeit, das er auch auf politische Einstellungen anwandte. Demzufolge lassen sich politische Einstellungen durch die Dimensionen Konservatismus vs Radikalismus sowie Tender-vs Tough-Mindedness beschreiben (Eysenck, 1954; 1972; 1978; 1981; Velicer & Jackson, 1990a; Heaven & 26 Rays Aufsatztitel mögen dies illustrieren: »The psychopathology of the political left«, »Half of all racists are left wing« oder »Half of all authoritarians are left wing«. · 38 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem Connors, 1988). Eysencks ideologisches Engagement ist in diesen Arbeiten jedoch stärker als die empirische Basis und wissenschaftliche Qualität. Milton Rokeach führte Dogmatismus als generelles Alternativkonzept zum rechten Autoritarismus ein (Rokeach & Fruchter, 1956; Rokeach, 1956; 1960). In einem kognitionspsychologischen Ansatz nutzte er die Dimension Open-vs Closed- Mindedness zur Beschreibung von Überzeugungssystemen. Zur Operationalisierung wurde die D-Skala entwickelt (zahlreiche Validierungsstudien vor allem in den 1960er Jahren: Fruchter, Rokeach & Novak, 1958; Plant, 1960; Hellkamp & Marr, 1965; Troldahl & Powell, 1965; Kerlinger & Rokeach, 1966; Rosenman, 1967; Vacchiano, Schiffman & Strauss, 1967; Vacchiano, Strauss & Hochman, 1968; Vacchiano, Strauss & Schiffman, 1968; Lovell, Giddan & Korn, 1967; Di- Renzo, 1967b; Simons, 1968; Warr, Lee & Jöreskog, 1969; Jay, 1969; Dembroski & Johnson, 1969; Hanson, 1968; 1969; 1970b; Ertel, 1972; 1975; Skroblin, 1975). Zusammenfassend kommt Christie (1991, S.562) zu der Empfehlung, die D-Skala nicht als Maß für generellen Autoritarismus und vor allem nicht als Alternative für F-Skala oder RWA-Skala einzusetzen, obgleich das theoretische Konzept sehr interessant ist. Weitere Konstrukte, die als Alternativkonzepte zum Autoritarismus eingeführt oder aber durch Dritte als solche interpretiert wurden, sind z.B. 1. Rigidität (Rubenowitz, 1963), 2. Direktivität (Ray, 1984c; Ray & Lovejoy, 1986; 1988, Übersetzungen bei Ojha & Singh, 1987; Charter, 1997; Nunnally, 1978 und Seoane, Arce & Sabucedo, 1988, kritisch dazu Duckitt, 1983; 1984; Heaven, 1986a; 1986b; Meloen & de Witte, 1998), 3. Machiavellismus (Christie & Geis, 1970; Henning & Six, 1977; Vleeming, 1979; Kline, 1983; Kline & Cooper, 1983; Ray, 1983a; Cloetta, 1983), 4. Konservatismus (Wilson, 1968; Cronbach & Meehl, 1955; Wilson & Pat- terson, 1968; Wilson & Patterson, 1970; Ray, 1979b; Ray, 1985b; Ray, 1988; Sidanius, 1988; Tarr & Lorr, 1991; Heaven & Bucci, 2001), 5. Liberalismus (Kerlinger, 1970; Kerlinger, 1972; Kerlinger, 1980), 6. Individualismus-Kollektivismus (Hofstede, Bond & Luk, 1993; Hui & Triandis, 1986; Triandis, Bontempo, Villareal & Asai, 1988; Triandis, 1987, kritisch dazu Kemmelmeier, Burnstein & Peng, 1999). · 39 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem Zweihundertsechsundsechzig weitere Ismen finden sich in dem Aufsatz »Isms and the structure of social attitudes« (Saucier, 2000). 2.2.5. Revival der Autoritarismusforschung in 1980er Jahren Die Veröffentlichung von Bob Altemeyers erstem Buch »Right-wing Authoritarianism « (1981) gilt als Zäsur und Beginn der modernen Autoritarismusforschung. Altemeyer stützt sich in seiner sparsamen theoretischen Konzeption auf lerntheoretische Erklärungen zur Entstehung von Autoritarismus (Bandura, 1977). Sein weitaus größeres Verdienst liegt in einer Vereinfachung der Operationalisierung: Altemeyer induziert auf der Basis einer unüberschaubaren Vielzahl zweifellos konkurrenzloser Experimente und Fragebogenstudien seine pragmatische Reduktion des Konzepts auf drei (statt neun) Subdimensionen. Altemeyers RWA-Skala gilt weitgehend als bestes Fragebogeninstrument, das derzeit zur Messung dessen zur Verfügung steht, was die Berkeley-Gruppe suchte (Christie, 1991, S.552; Stone, Lederer & Christie, 1993). Aus sozialpsychologischer Sicht ist besonders der Ansatz des Südafrikaners27 John Duckitt (1989; 1990; 1992c; 1998) interessant, der versuchte, die Autoritarismusforschung mit ihrem persönlichkeitspsychologischen Fokus an die Theorie der Sozialen Identität anzubinden (vgl. Tajfel, 1978; Tajfel & Turner, 1979; 2001; Turner, Hogg, Oakes, Reicher & Wetherell, 1987; Turner & Oakes, 1989; Wagner & Zick, 1990).28 Duckitt sucht nach dem Konstrukt, das für die Kovariation der drei Altemeyerschen Autoritarismusdimensionen verantwortlich ist. In seiner theoretischen Konzeption benennt er Gruppenkohäsion als das Gesuchte sowie das Bedürfnis, sich mit einer starken Gruppe zu identifizieren. In Deutschland arbeiten vor allem Jost Stellmacher und Thomas Petzel an der Überprüfung dieses Ansatzes. Der folgende Abschnitt systematisiert die gegenwärtigen Forschungslinien anhand der Defizite und Beschränkungen der bisherigen Autoritarismuskonzeptionen. Ich wähle diese Argumentationsrichtung ausgehend vom Problem und nicht von der Schule; selbstredend sind den meisten aktuellen Ansätzen die Probleme bewußt. 27 Duckitt lebt mittlerweile in Neuseeland. 28 Debatte dazu bei Schiffmann & Wicklund, 1988; 1992; Baars & Scheepers, 1993; Gelfand, Triandis & Chan, 1996). · 40 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem Alle Forschungslinien haben in mehr oder weniger starkem Maße die Lösung eines oder mehrerer Probleme als Ziel. 2.3. Gegenwärtige Forschungslinien und Defizite Der Großteil der gegenwärtigen Forschung zum Autoritarismus beschäftigt sich mit der Suche nach Korrelaten von Autoritarismus. Dies ist Folge und gleichzeitig Ursache des »Revivals« der Autoritarismusforschung als psychologische (Neo)- Faschismustheorie zur Erklärung der neuen Fremdenfeindlichkeit in der BRD (z.B. Lederer & Schmidt, 1995; Rippl & Boehnke, 1995; Hopf, Rieker, Sanden- Marcus & Schmidt, 1995; Oesterreich, 1996; Frindte, Funke & Jacob, 1997; Funke, 1999a; Rippl, Seipel & Kindervater, 2000) und den Beneluxländern (Meloen & Middendorp, 1991; Meloen et al., 1988; 1996; Verkuyten & Hagendoorn, 1998). Lange Jahre blieb es jedoch bei dieser oberflächlichen Forschungsstrategie; konzep- tionelle Fragen wurden selten gestellt und entsprechend seltener einer Antwort zu- geführt. Die Defizite der aktuellen Autoritarismusforschung liegen vor allem auf theoreti- schen Gebiet; Operationalisierungsprobleme sind eher eine Folge dieser Unsicher- heit. Der alte Vorwurf des Reduktionismus auf Psychologisches wird vor allem von Seiten der Soziologie seit Jahrzehnten vorgebracht (2.3.1). Desgleichen begrenzt ist die Beschränkung auf das Individuum und die Vernachlässigung der Intergrup- penbeziehungen, in deren Spannungsfeld sich die Personen befinden (2.3.2). Die Theoriearmut vor allem in Bezug auf die Genese von Autoritarismus ist den meis- ten aktuellen Ansätzen gemein (2.3.3). Vor dem Hintergrund sich fortwährend wandelnder politischer Kulturen wird wohl die Frage der adäquaten Operationali- sierung ein ständig aktuelles und niemals endgültig zu lösendes Problem sein (2.3.3). 2.3.1. Reduktionismus auf Psychologisches: Vernachlässigung des gesellschaftlichen Kontexts Vor den biographischen Hintergründen der Frankfurter Gelehrten ist nachvoll- ziehbar, daß die soziologische Sichtweise nach der Emigration an Einfluß verlor. Es ist durchaus fatal zu nennen, daß hier zwar die besondere Stärke der gesell- schaftskritischen Forscherinnen und Forscher lag, daß dieser Ansatz aber aus wis- · 41 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem senschaftshistorischen und letztlich auch aus politischen Gründen in den USA der Nachkriegszeit nicht sonderlich populär war. Folglich konzentrierte sich die kritische Rezeption zwar auf Kritikwürdiges, ignorierte aber die besonderen – wenn auch vergeudeten – Stärken. Kaum einer der maßgeblichen Autoritarismusforscher hat in der Nachfolge vermocht, an den großen Entwurf anzuknüpfen. Ein konkretes Einbeziehen des lange Zeit ausgeblendeten gesellschaftlichen Kontexts findet sich im Zusammenhang mit makrosozialen Bedrohungssituationen. Hier gibt es empirische Untersuchungen, die autoritäres Verhalten durch Bedrohungsgefühl ausgelöst oder katalysiert sehen. Als Beispiel mögen genügen: Untersuchungen zu 1. Ängstlichkeit und Dogmatismus (Tosi, Fagan & Frumkin, 1968a; 1968b; Hanson & Bush, 1971), 2. ökonomischer Bedrohung (Sales, 1972; Sales, 1973b; 1973a; Jorgenson, 1975; Padgett & Jorgenson, 1982; Rickert, 1998) und 3. allgemeinen politischen Bedrohungen, z.B. Krieg, AIDS, Randgruppen: (McCann & Stewin, 1987; McCann, 1991; 1997; Bit, 1991; Doty, Peterson & Winter, 1991; van de Wetering, 1996; Feldman & Stenner, 1997; Sten- ner, 1998; Lavine et al., 1999). Teilweise mündeten diese Ansätze in ausformulierte Theorien (Oesterreich, 1993); die empirischen Befunde blieben jedoch auch nicht gänzlich unwidersprochen (Duckitt, 1992d). 2.3.2. Reduktionismus auf Individuum: Vernachlässigung der Intergruppenbeziehungen Die Vernachlässigung des gesamtgesellschaftlichen Kontexts mag sich erklären aus der schwindenden Popularität gesellschaftskritischer, namentlich (neo)marxis- tischer Erklärungsansätze seit den 1950er Jahren und vor allem während des letzten Jahrzehnts. Dies rechtfertigt jedoch nicht das Verhaftetbleiben in individualpsychologischem Denken, das Autoritarismus vollständig in die Person verlagert. Genau dies ist aber ein weitgehendes Defizit, das eine dringende Aufgabe der aktuellen Autoritarismusforschung verdeutlicht. · 42 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem Der Profilierungsdrang der psychologischen Subdisziplinen – der teilweise ideologische Züge annahm – hat hier eher dazu geführt, daß Persönlichkeits- und Sozialpsychologie sich gegenseitig Reduktionismus vorwerfen, statt die Potentiale zu integrieren. Seitens der Sozialpsychologie wurden interindividuelle Unterschiede bislang meist als störende Varianzquelle »wegdiskutiert« (so bspw. bei Brown, 1965), die persönlichkeitspsychologisch dominierte Autoritarismusforschung hingegen übersah lange Zeit den Einfluß von Gruppennormen und situativen Einflüssen. In den letzten Jahren sind hier einige bemerkenswerte Ausnahmen zu nennen: John Duckitt versuchte eine Anbindung des Altemeyerschen Ansatzes an die Theorie der Sozialen Identität (vgl. weiter oben Seite 40, auch Stellmacher, Petzel).29 In Europa gibt es integrierende Ansätze vor allem bei Maykel Verkuyten und Louk Hagendoorn (1998). Zur Zeit läuft ein Forschungsprojekt in der Arbeitsgruppe um John Turner, das einen sozialpsychologischen kritischen Quereinstieg in die Autoritarismusforschung zum Ziel hat (Reynolds, Turner, Haslam & Ryan, 2001). Diesem Paradigma folgt auch eine Studie, die der vorliegenden Arbeit zugrunde liegt (vgl. S.155). All diesen Ansätzen ist die Idee gemein, die Wahrscheinlichkeit vorurteilsvollen Handelns aus der Interaktion zwischen dispositionalen und situativen Umständen vorherzusagen. Dabei heißt »situativ« hier nicht etwa Bedrohung durch tatsächliche oder auch nur konstruierte Gefahren, auch nicht das Ausgesetztsein gegenüber einem starken Machtgefälle (Befehlszwang, vgl. auch Milgram, 1963; 1965; Ancona & Pareyson, 1970; Blass, 1991; 1995). Vielmehr geht es um die relative Bedeutung von Dispositionen (Autoritarismus) in Abhängigkeit von der salienten Ebene der Selbstkategorisierung (vgl. Self-Categorization Theory, Turner et al., 1987; Turner & Oakes, 1989). Mutmaßlich ist es bedeutsam für die Vorhersagekraft von Autoritarismus für Vorurteile und Diskriminierung, ob sich Personen in der Untersuchungssituation als isolierte Individuen oder aber als Teil eines größeren sozialen Ganzen ansehen.30 29 John Duckitt kommt das Verdienst des Pioniers zu; allein die Forschung verlor sich tragischerweise im letzten Jahrzehnt zeitweise im neuseeländischen Sand. 30 Verkuyten und Hagendoorn (1998) manipulierten experimentell die Salienz der persönlichen vs nationalen Identität der Befragten als Holländer. Vorurteile konnten bei salienter (also aktuell vorherrschender) Fortsetzung auf Folgeseite … · 43 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem Diese Forschungsrichtung halte ich für vielversprechend, sofern sie als Chance zur Integration eines sehr alten politpsychologischen Themas mit der zur Zeit einflußreichsten sozialpsychologischen Metatheorie begriffen und ausgestaltet wird. Imperialistische oder separatistische Motive würden hier hingegen abermals lähmend und zerstörerisch wirken. 2.3.3. Theoriearmut Neben den methodischen Einwänden gegen die klassischen Arbeiten zur Autoritarismusforschung geriet schnell auch die theoretische Basis in den Fokus der Kritik. Diese bezog sich auf die starke Ideologieanfälligkeit, aber auch auf den Zusammenhang zwischen spezifischen Sozialisationspraktiken und der Ausbildung autoritärer Orientierungen.31 Dieser Zusammenhang wird aus der Psychoanalyse abgeleitet und ist daher eher postuliert als nachgewiesen. Aber auch ohne die Fundamentalkritik an der Psychoanalyse lassen sich leicht Unschlüssigkeiten in der theoretischen Begründung zeigen. Gegen ein rein psychodynamisches Erklärungsmodell sprechen die inzwischen zahlreichen Befunde zum Zusammenhang von Bedrohungssituationen und Autoritarismus (Feldman & Stenner, 1997; Doty et al., 1991; Duckitt, 1992d, vgl. weiter oben Seite 42). Es wäre hingegen ein fatales Mißverständnis, würde mit dieser überzeugenden empirischen Evidenz die Sozialisationsbedingtheit vollkommen infrage gestellt. Vielmehr liegt hier ein Hauptdefizit der aktuellen Autoritarismusforschung: auch die Kritiker der tap, namentlich Altemeyer, haben wenig zur Sozialisationstheorie und Psychogenese autoritärer Einstellungen ausgesagt. Dieses Forschungsdefizit ist erkannt und wird seit den 1990er Jahren zu mildern versucht. In Deutschland verfolgt vor allem Christel Hopf mit qualitativer Methodik einen mikrosoziologischen Ansatz (Hopf, 1993, zusammenfassend 2000), um den Zusammenhang zwischen Bindungserfahrungen und Autoritarismus aufzuklä- Fortsetzung der Fußnote: persönlicher Identität durch Autoritarismus vorhergesagt werden, nicht jedoch bei salienter nationaler Identität. Dasselbe Muster konnte in Australien gezeigt werden (Reynolds et al., 2001). Vgl. auch S.155 . 31 Ersteres halte ich für das geringere Problem, da es sich hier um einen Kritikpunkt handelt, der guten Gewissens eingeräumt werden kann, da es sich bei der Debatte um die Ideologielastigkeit gerade um eine ideologische Debatte handelt. Dieser konnten und können sich die klassischen Autoritarismusforscher und viele ihrer Nachfolger getrost stellen. · 44 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem ren. Hier bezieht sie sich auf die Attachment-Forschung und moderne Psychoanalyse (vgl. auch van Ijzendoorn, 1989; 1997; Kracke, Noack, Hofer & Klein- Allermann, 1993; Hefler, Boehnke & Butz, 1999; Milburn & Conrad, 2000). Die theoretischen Probleme werden umso deutlicher, sobald unterschiedliche soziokulturelle Rahmenbedingungen in betracht gezogen werden. Dies gilt sowohl für kulturellen Wandel über die Zeit als auch für interkulturelle Unterschiede. Erstere entziehen sich weitestgehend der empirischen Überprüfbarkeit, gleichwohl sollte man den Blick dafür offenhalten, daß z.B. durch eine veränderte Vaterrolle in westlichen Gesellschaften die Sozialisationsinstanzen andere sind als sie es etwa in den 1950er Jahren waren. Gleichzeitig wäre die Annahme plausibel, daß der Wertewandel in den letzten Jahrzehnten bestimmte ehemalige Tugenden diskreditiert hat, die auch im Zusammenhang mit Autoritarismus von belang sind: So ist Unterwürfigkeit sicher nicht mehr so populär, wohl aber ist Aggressivität unter dem Deckmantel der Erfolgsorientierung durchaus sozial angesehen.32 Autoritäre Unterwürfigkeit könnte heutzutage jedoch seltener gegenüber machtvollen Personen anzutreffen sein und sich stattdessen zunehmend gegenüber einflußreichen massenmedialen Sinndeutungen äußern. Hier wäre Forschungen zur political correctness indiziert.33 Der zweite Aspekt der genannten Kulturabhängigkeit von Autoritarismus betrifft die interkulturellen Unterschiede. Dieser Gedanke wurde bereits früh aufgeworfen (Siegman, 1961) und führte zu einer Reihe von Studien, die in anderen Kulturen als Nordamerika durchgeführt wurden. Einige ausgewählte Beispiele seien in Tabelle 3 (S.63) angeführt.34 32 Man denke an Formulierungen wie »Der hat Biß« oder »Die ist richtig tough.«. 33 In gewisser Weise ordnen sich meine Studien zum Humanbellizismus hier ein (vgl. 6.2, 6.3, 6.8). 34 Eine Integration und Systematisierung dieser empirischen Evidenz im Sinne einer Metaanalyse steht noch aus. Um nur eine mögliche Lehre zu nennen, so weist einiges darauf hin, daß Autoritarismus dann besonders mit Vorurteilen korreliert, wenn autoritäre Überzeugungssysteme im Überbau der Gesell- schaft nicht (!) dominieren. Vereinfacht gesagt: wenn die Gesellschaft schon die autoritären Schablonen anbietet, bleibt wenig Raum für interindividuelle Unterschiede bzw. für deren Verhaltensrelevanz. Sys- tematische Untersuchungen in verschiedenen Kulturen könnten hier in der Zukunft Aufklärung bringen. · 45 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem Quelle Herkunft der Stichprobe Pirojnikoff, Hadar & Hadar, 1971 Kibbutzniks, non-Kibbutzniks, US-amerikanische Juden und Nicht-Juden Thomas, 1975 Tahiti, Cook-Inseln, Samoa, Tonga, Fiji, Fiji-Indien und Neue Hebriden Shaver, Hofmann & Richards, 1971; USA, BRD Hogan, 1977; 1980; Lederer, 1982 Ray, 1979a Australien, England, Schottland Ray, 1980 Los Angeles, Sydney, London, Glasgow und Johannesburg Ray, 1983c Kalifornien, Australien, England, Schottland, Philippinen und Südafrika (»Weiße«) Stones, 1981 Simbabwe, Südafrika (»Weiße«) Miller, Slomczynski & Schoenberg, 1981 USA, Polen Rigby, 1984; Rigby, Metzer & Ray, 1986 England, Australien Bhushan, 1985 Indien Heaven, 1986a Australien, Südafrika (»Weiße«) Pedersen & Ray, 1990 Nassau County, BRD, Südafrika (»Weiße«) McFarland, Ageyev & Abalakina-Paap, 1992 USA, Rußland Stephan, Ageyev, Coates-Shrider & USA, Rußland, Irak Stephan, 1994 Lederer, 1991 BRD, Rußland Rippl & Boehnke, 1995; Ost-/Westdeutschland Frindte, Funke & Waldzus, 1996 Rubinstein, 1996 Israel, Palästina Taylor & Oskay, 1995 USA, Türkei Rudy & Grusec, 2001 Anglo- und ägyptische Kanadier Meloen, 2000 133 reanalysierte Länderdatensätze aus Studien von Hofstede (1980) und Todd (1985) Feldman & Watts, 2000 Japan Tabelle 2: Einige kulturvergleichende Studien zum Autoritarismus · 46 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem Methodisch hochwertige kulturvergleichende Studien sind dabei in der Minderzahl und dringend nötig. Wenn die differentielle Sichtweise über triviale und irreführende Mittelwertsvergleiche hinausgeht, so liegt hier ein mächtiges Potential, um Neues über die Sozio- und Psychodynamik der Transmission autoritärer Einstellungen zu erfahren. 2.3.4. Operationalisierungsproblem Es gehört zu den paradoxen Ergebnissen jahrzehntelanger Autoritarismusforschung, daß die Studien zwar kumulieren, jedoch aufgrund der starken Datenbindung selten zur theoretisch begründeten Hypothesenprüfung und Reformulierung der Konzeptionen beitragen. Soweit es explizite Verweise auf den theoretischen Hintergrund der Studien gibt, bleiben die Ansätze meist innerhalb des Paradigmas und verzichten dadurch auf eine Wertung der konkurrierenden Ansätze. Dabei soll hier nicht behauptet werden, daß eine endgültige Entscheidung zugunsten des einen (z.B. psychoanalytischen) Ansatzes gegenüber anderen (z.B. lerntheoretischen oder gruppenorientierten) Herangehensweisen zwingend notwendig wäre. Das Verhaftetbleiben in jeweils einer der Schulen verstellt jedoch auch den Blick auf Integrationswürdiges. Wesentlicher Erkenntnisgewinn scheint mir nur jenseits des Schulenzwanges möglich. Die konkurrierenden Ansätze sind ohne versöhnlerische Gleichmacherei auf Gemeinsames zu prüfen, die Methodik muß sowohl quantitative als auch qualitative Ansätze fruchtbringend nutzen. Eine feinauflösende quantitative Meßweise, wie sie in dieser Arbeit vorgeschlagen wird, kann dabei einen sinnvollen Beitrag leisten, die komplexeren qualitativen Ansätze jedoch nicht ersetzen. Indiziert ist eine klare theoretische und empirische Aussage über den Status von Autoritarismus als unabhängige oder aber abhängige Variable, da häufig Autoritarismus mit Skalen erfaßt wird, deren Inhalte tautologisch mit den abhängigen Konstrukten auf einer konzeptionellen Ebene stehen. Hier können Designs hilfreich sein, die mehrere Messungen über verschiedene Zeitpunkte und über verschiedene Meßinstrumente und Beurteiler hinweg integrieren (Steyer, Eid & Schwenkmezger, 1997; Steyer, Partchev & Shanahan, 2000). Längsschnittliche Studien mögen das Problem der retrospektiven Befragung mindern, das sich bei Autoritären z.B. in einer Elternidealisierung fatal auswirkt. · 47 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem 2.4. Zusammenfassung Das Kapitel zeichnet sowohl zeitlich aufeinanderfolgende als auch parallel verlaufende Theorieentwicklungen und Forschungstraditionen nach (2.2). Es zeigt sich, daß die gelehrte Suche nach den Gründen und Begründungen der freiwilligen Unterwerfung unter illegitime Herrschaft schon lange vor der Stiftung des Begriffs »Autoritarismus« begann und dabei in ganz verschiedenen Wissenschaftsdisziplinen beheimatet gewesen ist. Gleichzeitig wurde und wird zuweilen auch Ähnliches untersucht, ohne ausdrücklich diesen Begriff »Autoritarismus« zu gebrauchen. Die Weiterentwicklung der Forschungsansätze war ab ovo von Kritik begleitet, die sich sowohl auf den Inhalt als auch die methodische Form der Forschung konzentrierte. Einige Defizite bestehen ungeachtet dessen bis heute fort: Besonders fatal ist der psychologische Reduktionismus, wodurch sich die Autoritarismusforschung eines großen Teils ihrer gesellschaftskritischen Kraft beraubte (2.3.1, S.41 ff.). Der Südafrikaner Don Foster (1999) wirft pointiert der gesamten Mainstream-Psychologie ihr Unpolitischsein vor und führt die Autoritarismusforschung als prototypische Kronzeugin an: The tale of authoritarianism is wellnigh a prototype of the wider victory of reductionism and value-free empiricism in the mainstream psychology of prejudice. (Foster, 1999, S.339) Auch innerhalb der Psychologie läßt sich ein Reduktionismus beobachten, namentlich die Beschränkung auf das Individuum und die Vernachlässigung der Intergruppenbeziehungen (2.3.2, S.42ff.). Einige moderne Ansätze versuchen dieses Manko durch Anbindung an die Selbstkategorisierungstheorie auszugleichen (Verkuyten & Hagendoorn, 1998; Reynolds et al., 2001, Petzel 2002; Stellmacher, 2002).35 35 Angesichts all dieser Reduktionismen muß eingeräumt werden, daß diese Aufzählung ebenfalls ein analytischer Reduktionismus ist, der die Problem durch Pointierung verdeutlicht. Die meisten Ansätze kennen die Gefahren der isolierten Betrachtung – wenn sie nicht völlig naiv herangehen. Der Wissenschaftsbetrieb, in dem der Artikel zur fast einzigen Kommunikationsform geworden ist, begünstigt diese hochspezialisierten Ansätze und läuft einer ganzheitlichen Sicht eher zuwider. · 48 Friedrich Funke _______________________________________________________________ Autoritarismus als Psychologisches Problem Weitere Erkenntnis dürfte die interdisziplinäre Reintegration soziologischer, sozial- und persönlichkeitspsychologischer Ansätze voraussetzen, sowohl hinsichtlich der Theoriekonzeption als auch hinsichtlich der Methode. · 49 3. Problembeschreibung und Forschungsfragen »Eine Revolution ist gewiss die autoritärste Sache, die es gibt, ein Akt, durch den ein Teil der Bevölkerung seinen Willen dem anderen Teil durch Flinten, Bajonette und Kanonen, alles das sehr autoritäre Mittel, aufzwingt.« (Friedrich Engels, zit. nach Marcuse 1936, S.211) 3.1. Ein Schritt vorwärts, zwei Schritte zurück oder warum man Anlauf nehmen muß, wenn man weiter springen will... Die zentrale These der vorliegenden Arbeit geht davon aus, daß es sich bei Autoritarismus um ein mehrdimensionales Konstrukt handelt, welches jedoch in aller Regel mit eindimensionalen Erhebungsinstrumenten erfaßt wird, die dieser komplexen Struktur nicht Rechnung tragen. Eine radikale Konsequenz aus dieser Bestandsaufnahme wäre die Forderung nach einem mehrdimensionalen und bereichsspezifischen Meßinstrument, das sowohl differenzierte Aussagen über die einzelnen Facetten als auch die situationsabhängigen »Auslösungsbedingungen« (sog. trigger) ermöglicht. Allein, dies würde das Konstruieren, Validieren und schließlich das Etablieren einer völlig neuen Skala bedeuten. Selbst wenn dies mittelfristig für den deutschen Sprachraum gelänge, so müßte zeitgleich zumindest auch eine englische Version etabliert werden. Dies ist im Rahmen dieser Qualifikationsarbeit nicht realistisch Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen und nicht vorgesehen.36 Das Problem liegt dabei nicht im Arbeitsaufwand, der gewiß zu rechtfertigen wäre, wie diese Arbeit zu zeigen versucht. Daß hier mit Bedacht keine völlig neue Skala eingeführt wird, hat vielmehr mit einer nüchternen Einschätzung der wissenschaftspolitischen Wirklichkeit zu tun: Selbst ein Instrument, das alle Gütekriterien zufriedenstellend erfüllen würde, bliebe wirkungs- und damit wertlos, solange es nicht binnen kurzer Zeit in zahlreichen Studien verschiedener Autoren Verbreitung findet. Der wissenschaftliche Wert eines Erhebungsinstruments im Speziellen und letztlich auch einer Methode im Allgemeinen hängt in wesentlichem Maße auch von seiner Praktikabilität und auch seiner »Kommunizierbarkeit« ab. Diese wäre jedoch ohne klare Bezugnahme auf (mehr oder auch weniger!) Bewährtes und Bekanntes nicht gegeben. Die hier daher absichtsvoll gewählte Strategie nutzt zur – durchaus angestrebten – Innovation scheinbar widersinnig einen konservativen Ansatz: es wird zunächst trotz der hier gezeigten bzw. unterstellten Mängel auf die etablierte RWA-Skala in ihrer originalen oder leicht modifizierten Form vertraut. Bei ihr handelt es sich um das Standardinstrument der modernen (quantitativen) Autoritarismusforschung (vgl. auch Christie, 1991); sie hat somit implizit den Charakter einer operationalen Definition von Autoritarismus. Jegliches wesentliche Abweichen würde Verschiebungen im Bedeutungsgehalt des Konstrukts nach sich ziehen, die zwar sinnvoll sein mögen, aber der extensiven Erklärung und Rechtfertigung bedürfen. Erst das Anlehnen an Bekanntes und Bewährtes schafft die sichere Basis für weitere wohldefinierte Schritte. Im konkreten Falle besteht die Neuerung in einem modifizierten Meßmodell, einer veränderten Auswertungsvorschrift. Auf diese Weise entfällt die Notwendigkeit definitorischer Reformulierungen, die u. U. oder sogar sehr wahrscheinlich nicht konsensfähig wären. Vielmehr steht ohne Zeitverzug die Möglichkeit offen, auch bisherige traditionelle Studien zu reanalysieren und damit ein höheres oder zumindest weiteres Differenzierungsniveau zu erreichen, das im ursprünglichen Design der Untersuchung nicht vorgesehen war. Erweist sich das 36 Zum Zeitpunkt der Drucklegung ermutigten mich Sam McFarland, Jim Sidanius und John Duckitt, die Skala schnell zu übersetzen und ihnen zur Verfügung zu stellen. · 51 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen dadurch Gelernte als vielverheißend, so lohnt wohl auch eine aufwendige Neukon- struktion37. In diesem Sinne plädiert der hier vorgestellte Ansatz bildhaft für ein verlangsamtes Gehen, ein Besinnen und Innehalten, um dann für den Sprung Anlauf zu neh- men. Dies dürfte erfolgversprechender sein als ein hastiges Verlassen von sicherem Boden auf eine möglicherweise fruchtbare, aber menschenleere Insel38. 3.2. Die Dimensionsfrage bei der Berkeley Gruppe 3.2.1. Dimension, Facette oder Komponente – eine Vorbemerkung Den meisten Ansätzen der Autoritarismusforschung ist gemein, daß sie ausdrück- lich oder zumindest implizit eine mehrdimensionale Struktur oder ein Syndrom unterstellen. Die Bezeichnung der einzelnen Elemente des interessierenden Gan- zen ist zuweilen beliebig, in manchen Fällen jedoch bergen die gewählten Begriffe auch Bedeutungen, die über bloße austauschbare Synonyme hinausgehen. In der Beschreibung der Konstruktion der F-Scale wählt Nevitt Sanford39 die Beg- riffe »central personality trends« (S. 225) oder einfach nur »variables« (S.228).40 In einer der einflußreichsten frühen kritischen Überblicksarbeiten zum Autorita- rismus verwenden die Autoren die Bezeichnung »composite of subparts« oder »clo- sely cohering parts of one syndrome« (Kirscht & Dillehay, 1967, S.6) zum Be- zeichnen des Ganzen. In engem sprachlichen Bezug auf die Autorengruppe der tap wird auch von »hypothetical clusters« gesprochen. In einer aktuellen Kritik (Martin, 2001) verwendet ein Schüler des frühen Rezen- senten Herbert Hyman (1959; Hyman & Sheatsley, 1954) den Ausdruck »key fac- tors«, ohne damit Faktor oder Hauptkomponente im Sinne der Faktoranalyse zu meinen. In der deutschsprachigen Literatur erfolgt im Sprachgebrauch weitestge- hend eine Anlehnung an das Original; Detlef Oesterreich spricht von den »be- rühmten neun Autoritarismusunterkonzepte[n]« (1996, S.46). 37 Dieser muß jedoch eine definitorische Neubestimmung vorausgehen. 38 »Ein Schritt vorwärts, zwei zurück« also anders als im Leninschen Sinne (Lenin, 1904, »... ......, ... .... .....«). Die Reihenfolge ist hier umgekehrt: das vorläufige Zurückgehen erlaubt erst den zukünf- tigen Schritt nach vorn. 39 R. Nevitt Sanford war federführender Autor dieses Kapitels der tap über die Entwicklung der F-Skala. 40 »Charakterzüge« und »Variablen« in der Originalübersetzung von Milli Weinbrenner (S.44). · 52 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen In meiner Argumentation betone ich den Sinn einer feinen Unterscheidung und des möglichst konsistenten Gebrauchs der Begriffe »Dimension« und »Facette«. »Dimension« symbolisiert hier die diskriminante Validität der einzelnen Konstrukte, die eine gewisse Autonomie aufweisen, die man faktoranalytisch abbilden kann. Dem Gebrauch von »Facette« liegt hingegen der Gedanke eines Gemeinsamen zugrunde, das durch eigentümliche Spezifika näher qualifiziert wird.41 3.2.2. Die theoretischen a priori Cluster der F-Skala Wie bereits an anderer Stelle ausgeführt, sahen die Autoren der tap Autoritarismus als Syndrom an, dessen einzelne Komponenten »eine mehr oder weniger überdauernde Struktur in der Person [formen], die sie für antidemokratische Propaganda empfänglich werden lassen.« (übersetzt nach Sanford et al., S.228). Dies impliziere jedoch ausdrücklich nicht, daß alle Merkmale des Persönlichkeitsmusters in der F- Skala erfaßt würden. Die Autoren bedauerten, daß keine zweite F-Skala konstruiert werden konnte, die weitere Persönlichkeitsmerkmale erfaßte. Es war ausdrückliches und verständliches Interesse und Ziel, durch die Items die maximale Breite und Reichhaltigkeit des zu beschreibenden Persönlichkeitsmusters zu erfassen, nicht jedoch psychometrische Reinheit und Eindimensionalität. Dennoch sind im Kapitel VII der tap die Items explizit bestimmten Subdimensionen zugeordnet worden, wenn auch nicht immer allein einer der Variablen. Es wäre jedoch ein Mißverständnis, interpretierte man dieses Vorgehen in der Darstellungsweise fälschlich als Vorgehen bei der Konstruktion. Die gesonderte operationale Definition jedes Charakterzuges anhand illustrativer Beispielitems implizierte mitnichten, daß die Komponenten voneinander unabhängig wären. Dies wird sogar ausdrücklich verneint: 41 Der direkte Bezug zur Facettentheorie wäre hier jedoch zu weitgehend, zumal ein anderer methodischer Ansatz zum Einsatz kommt. · 53 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen Conventionalism, authoritarian submission, and authoritarian aggression all have to do with the moral aspect of life – […]. We should expect that, in general, subjects who score high on one of these variables will score high on the others also, inasmuch as all three can be understood as expression of a particular kind of structure within the per- sonality. (Adorno et al., 1950, S.233). Auch im eher empirischen Teil, der die Itemanalyse der F-Skala beschreibt, wird deutlich unterstrichen, daß die Items zwar zu »Clustern« zusammengefaßt wurden, daß es sich dabei jedoch nicht um Cluster im statistischen Sinne handele, sondern vielmehr um a priori Hilfsmittel für die Diskussion (S.262). An verschiedenen Stellen weisen die Ausführungen implizit auf das Verständnis der Autorengruppe vom Wesen des Zusammenhängens der einzelnen Variablen hin. Concern with overt sexuality is represented in the F scale by four items, two of which have appeared in connection with authoritarian aggression and one other as an expres- sion of projectivity. This is an example of the close interaction of all the present vari- ables; since, taken together they constitute a totality, it follows that a single question may pertain to two or more aspects of the whole. (Adorno et al., 1950, S.240). Die Autorengruppe war sich offenbar durchaus dessen bewußt – ohne dies zu beklagen –, daß viele der Items mehrere Konstrukte operationalisieren, wie die Bemerkungen über die Items zur Sexualität belegen. Zumindest für die drei zuerst eingeführten zentralen Facetten vermuteten oder unterstellten die Autoren ein gemeinsames Auftreten, mithin eine sehr hohe Korrelation42. 42 Kommentar im Arbeitsjournal beim Lesen der tap: »Ich weiß noch nicht, was ich damit anfangen soll, aber ich hab eine seltsame Ahnung. Autoritarismus meinte eigentlich nur Submission und Aggression. Alles andere ist Teil der antidemokratischen Persönlichkeit oder der »Fascist Personality«, wie die Studie ursprünglich heißen sollte. Belege für diese Ahnung sehe ich in den folgenden Zitaten, die dem Abschnitt des Kapitels VII tap entnommen sind, der unmittelbar die Vorstellung der drei Facetten Konventionalismus, autoritäre Submission und autoritäre Aggression zum Thema hatte: »[…] ego weakness would seem to be a concomitant of conventionalism and authoritarianism.« und weiter unten »Although conventionalism and authoritarianism might thus be regarded as signs of ego weakness, it seemed worthwhile to seek other, more direct, means for estimating this trend in personal- ity, and to correlate this trend with the others.« (S. 234, Hervorhebungen nicht im Original). Fortsetzung auf Folgeseite … · 54 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen Wenn mehrere Dimensionen sehr hoch bis perfekt miteinander korrelieren, dann gibt es keinen Spielraum für Gruppen von Menschen, die hohe Werte haben auf einer der Dimensionen und gleichzeitig niedrige Werte auf anderen. Gleichzeitig impliziert dies, daß verschiedene Subtypen von Autoritären oder Autoritarismen an dieser Stelle im Konzept nicht vorgesehen sind. 3.2.3. Typen und Syndrome An anderer Stelle wird diese Sichtweise wieder relativiert. Adorno vertieft im Kapitel XIX »Typen und Syndrome« die Phänomenologie des/der Autoritären. Dabei ist ihm die auch schon damals aktuelle Kritik an Typologien wohlbekannt und zusagend. Er folgt dabei der Argumentation Anne Anastasis (1937), die den Widerspruch zwischen normalverteilten Persönlichkeitsvariablen einerseits und klar trennbaren Kategorien andererseits illustriert. Kategorien oder Typen, so Anastasi, unterstellen hingegen multimodale Verteilungen der Traits. Adornos Ablehnung gegenüber Typologien folgt aber vor allem aus den Erfahrungen in Nazi-Deutschland, wo die Etikettierung von Menschen zu Entscheidungen über deren Leben oder Sterben führte. Fortsetzung der Fußnote: Möglicherweise ist es spitzfindig, aber warum sollte man einen Satz bilden mit einer Aufzählung »A und B können als Zeichen von C angesehen werden«, wenn A nicht als von B distinkt verstanden wird, sondern als Teil von B. Dieser Verdacht verstärkt sich noch, wenn man die Struktur des gesamten Kapitels analysiert. Beide genannten Sätze finden sich in einem Abschnitt, der als Zwischenfazit die Vorstellung der ersten drei (sic!) Facetten abschließt und die Definition der anderen 6 Facetten einleitet. Dies führt bei mir zu dem Eindruck, daß zumindest im Moment des Schreibens »Autoritarismus« als Sammelbegriff für und nur für die beiden Facetten autoritäre Aggression und autoritäre Submission gemeint gewesen war. Dies würde verständlich, wenn man bedenkt, daß die Studie zunächst nicht »The Authoritarian Personality« heißen sollte, sondern »The Fascist Character« und später »The antidemocratic Personality« (Samelson, 1993). « · 55 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen Zugleich rehabilitiert Adorno typologische Überlegungen mit einem auch heute noch zeitgemäßen Argument: The reason for the persistent plausibility of the typological approach, however, is not a static biological one, but just the opposite: dynamic and social. […] The construction of psychological types does not merely imply an arbitrary, compulsive attempt to bring some ›order‹ in the confusing diversity of human personality. It represents a means of ›conceptualizing‹ this diversity, according to its own structure, of achieving closer un- derstanding. (Adorno et al., 1950, S. 747 f.) Die Typologisierung will Adorno sonach nicht auf der Personenebene verstanden wissen, sondern auf der Konstruktebene. Er hält es für sinnvoll, bestimmte Aspekte des Syndroms aus analytischen Gründen zu Subsyndromen zusammenzufassen. Diese Subsyndrome stellen jedoch nicht das Gesamtbild des Autoritären infrage: Es existiere so etwas wie der potentiell faschistische Charakter, der für sich genommen eine »strukturelle Einheit« sei (S.751). In anderen Worten, so Adorno, gehen die Facetten des Gesamtsyndroms i.a.R. zusammen. Hence, the ›subsyndromes‹ which we outline here are not intended to isolate any of these traits. They are all to be understood within the general frame of reference of the high scorer. (Adorno et al., 1950, S.751) Die nachfolgenden Abschnitte 3.2.3.1 und 3.2.3.2 (S.60 f.) fassen die ursprünglichen Überlegungen zur Typologisierung zusammen. 3.2.3.1. Typen unter den Vorurteilsvollen (High-Scorern) Die Typen basieren auf theoretischen Vorarbeiten zum Antisemitismus (Institute of Social Research, 1941), die infolge der Interviewergebnisse modifiziert und um Typen von »Lowscorern« erweitert wurden. Die Autoren betrachteten die Typen durchaus mit Abstand als Provisorium und als »Zwischenstufe zwischen Theorie und empirischem Material« (Adorno et al., 1950, S. 752; dt. Adorno, 1999, S.314). Dies hat sie jedoch mitnichten gehindert, die Typen in aller Ausführlichkeit zu beschreiben. Unter den Vorurteilsvollen fanden sie folgende Muster: das »Oberflächenressentiment « äußert sich durch starke Vorurteile in vielen sozialen Bereichen, die jedoch eher in sehr rationalisierter Form auftreten und einen geringen libidinösen Bezug erkennen lassen. Die Vorurteile werden durch die Betreffenden teilweise · 56 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen gar explizit den eigenen Erfahrungen gegenübergestellt. Offensichtliche Diskrepanzen werden nicht als unlösbarer Widerspruch empfunden, sondern mit rationalen oder pseudorationalen Rechtfertigungen »wegargumentiert«.43 Zu diesem analytischen Typus gehört »der unzufriedene, mürrische Familienvater, der froh ist, wenn er andere für das eigene wirtschaftliche Versagen verantwortlich machen kann« und »wohl auch die antisemitischen Neger in Harlem, die überhöhte Mieten an jüdische Geldeintreiber zahlen müssen« (Adorno et al., 1950, S.754, Adorno, 1999, S. 316). Dieser Typus wurde eher soziologisch als psychologisch begründet; der kritisch-marxistische Duktus der 1930er Jahre wird hier noch einmal besonders deutlich, während sich die Autoren andernorts wohl nicht gänzlich zu unrecht dem Vorwurf des Psychologisierens aussetzen: […] these people are spread over all those sectors of economic life where one has to feel the pinch of the process of concentration without seeing through its mechanism, while at the same time still maintaining one’s economic function. (Adorno et al., S. 754). Das »konventionelle Syndrom« ist im Gegensatz zum Oberflächenressentiment dadurch gekennzeichnet, daß die Vorurteile nicht in rationalisierter Form in das eigene Überzeugungssystem integriert, sondern im eigentlichen Wortsinn von »Vor-Urteil« ungeprüft übernommen werden. Die psychoökonomische Funktion besteht wohl am ehesten in einer Erleichterung der Identifikation mit der eigenen Gruppe bzw. mit der sozialen Gruppe, der man gern angehören möchte. Die typischen Vertreter des konventionellen Syndroms sind nicht sonderlich »böswillig«, sie repräsentieren vielmehr die Konvention ihrer Gruppe. Die psychologische Begründung in der tap nimmt in bemerkenswerter Weise die Argumentation (und Begrifflichkeit) der Theorie Sozialer Identität vorweg (ingroup-outgroup, outgoup-Homogenisierung, Gruppenkohäsion, Kontakthypothese): 43 Altemeyer (1996) hat zu diesem kognitiven Aspekt eine Reihe von Experimenten durchgeführt und sie vielerorts unter den Begriffen »double standards« oder »compartmentalization« diskutiert (ausführlich in Altemeyer, 1996, Kapitel 5, S. 114). · 57 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen The specific color of his antiminority attitude is provided by his special emphasis upon the ingroup-outgroup dichotomy: he does not have, or does not like to have, ›contacts‹ with the outgroup, and at the same time he projects upon them his own ingroup pat- tern and emphasizes their ›clannishness‹. (Adorno et al., 1950, S. 757) Weiter unten wird die besondere Diskriminierung von »Negern« damit begründet, daß hier die Trennungslinie zwischen Eigen- und Fremdgruppe besonders drastisch ist. Als dritter Typ unter den Vorurteilsbehafteten wird das »autoritäre Syndrom« eingeführt. Zwar wird unterstrichen, daß dieser Typ dem Gesamtbild der in der Studie beschriebenen Charakterstruktur am nächsten kommt, dennoch wird hier eines besonders deutlich: bei der reduzierenden Rezeption der Studie handelt es sich offenbar um ein Mißverständnis, das autoritäre Syndrom ist, wie hier expressis verbis gesagt, nur ein Teil des Ganzen, obgleich das zentrale.44 Die Autoren der tap nehmen bei der Beschreibung der Psychogenese Bezug auf Vorarbeiten früherer Kollegen, namentlich Max Horkheimer (1936) und Erich Fromm (1936; 1941, vgl. auch Lee, 1963; Baars & Scheepers, 1993; Bacciagaluppi, 1997). Die von Fromm beschriebene sadomasochistische Triebstruktur im Ergebnis einer unvollständigen Lösung des Oedipus-Komplexes wird hier sowohl als Bedingung als auch als Ergebnis der übersteigerten Anpassung an die gesellschaftlichen Zwänge angesehen: Die Liebe zur Mutter ist mit einem Tabu belegt, was zum Haß gegen den allmächtigen Vater führt. Diese Aggressivität kann jedoch nicht ausgelebt werden und wird zu einem Teil absorbiert und zu Masochismus gewandelt, zum anderen Teil als Sadismus gegen »outgroups«, insbesondere gegen Juden übersteigert. Der Vater hingegen bleibt – wider besseres Wissen – idealisiert. Der marxistischen Gesellschaftsanalyse folgend erwartete die Berkeley-Gruppe ein besonders häufiges Auftreten dieses autoritären Syndroms im unteren Mittelstand, insbesondere in Schichten mit einer starken Aufstiegsorientierung, denen die Aufwärtsmobilität jedoch verwehrt ist. 44 Wiederum sehe ich hier einen Hinweis darauf, daß Autoritarismus lediglich als ein Typ oder ein Bestandteil der antidemokratischen Persönlichkeit von den Autoren aufgefaßt wurde. Ironischerweise wurde erst in der wissenschaftlichen Rezeption dieses – zugegebenermaßen prototypische Bild – zum Sammelbegriff für etwas, dessen Bestandteil es bei seiner Schöpfung lediglich war. · 58 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen Auch bei diesem Typus sei auf die Vorwegnahme von späteren Forschungsfeldern hingewiesen: It is the equivalent of the ›no pity-for-the-poor‹ ideology […]. Even where social con- ditions have to be recognized as the reason for the depressed situation of a group, a twist is applied in order to transform this situation into some kind of well-deserved punishment. (Adorno et al., 1950, S. 757) Der hier angesprochene Effekt wurde später in der Forschung zum Gerechte-Welt- Glauben thematisiert (Abwertung von Opfern, Vergewaltigungsmythos, Rubin & Peplau, 1975; Zuckerman & Gerbasi, 1977; Zuckerman, Gerbasi & Marion, 1977; Connors & Heaven, 1987; Dalbert, 1992; 1996; Dalbert & Katona-Sallay, 1996; Szmajke, 1991; Lambert, Burroughs & Chasteen, 1998; Lambert, Burroughs & Nguyen, 1999; Ma & Smith, 1985; Montada & Lerner, 1998; Staub, 1989; Weir & Wrightsman, 1990).45 Unter bestimmten (nicht näher bezeichneten) Bedingungen wird der Oedipus- Komplex jedoch nicht sadomasochistisch aufgelöst, sondern resultiert im Auflehnen gegen die väterliche Autorität. In Anlehnung an eigene (Institute of Social Research, 1941) und fremde (Lindner, 1944) Vorarbeiten und Typologien stellt dieser als »Rebell« und »Psychopath« bezeichnete Charakter den Prototypen des SA- Folterknechts dar. Als historisches Beispiel wird Ernst Röhm46 angeführt. Es wäre für weite Teile der »Authoritarian Personality« ein ungerechtes Urteil, unterstellte man den Autoren, daß sie Autoritäre pathologisieren. Vielmehr unterstreichen sie meist die »Durchschnittlichkeit«. Dem Vorwurf des Pathologisierens setzen sie sich jedoch bei der Beschreibung des fünften Typs, des »Spinners« (»crank«), am ehesten aus. Die »Spinner« werden fast psychotisch, paranoid dargestellt. Was sie vor akuter Geisteskrankheit rettet, sei die Kollektivierung, mit der sie ihre eigenen extremen Projektionen sozial bestätigen. In dieser Gruppe seien Verschwörungstheorien (»Protokolle der Weisen von Zion«) populär und selbst45 Dies »erklärt« auch den in den angesprochenen Studien häufig berichteten Zusammenhang zwischen dem Glauben an eine gerechte Welt und Autoritarismus – bzw. erklärt ihn eben wegen des tautologischen Zirkels nicht. 46 Stabschef der SA, 1934 ermordet. · 59 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen wertstützend. 47 Als Beispiele werden fanatische Anhänger religiöser Sekten genannt. Als potentiell gefährlichstes Syndrom schließlich wird der »manipulative Typus« eingeführt. Deren Ziel sei »eher die Konstruktion von Gaskammern als das Pogrom. […] Ihr Antisemitismus ist verdinglicht, ein Exportartikel: er muß ›funktionieren‹. « (Adorno, 1999, S.335; im Original Adorno et al. 1950, S.768).48 In der Beschreibung der Psychodynamik lehnen sich die Autoren an den Freudschen Begriff des analen Charakters an. Wiederum wird hier ausdrücklich zumindest metaphorisch zur Psychopathologie Bezug genommen – das Syndrom des »Manipulativen« hätte etwas Schizophrenes (Adorno, 1999, S.335). Die Beschreibung erinnert mit dem Hinweis auf das emotionslose technokratische Manipulieren an Machiavellismus (vgl. S.39, s.a. Machiavelli, 1513; Exline & Eldridge, 1963; Klein, 1969; Christie & Geis, 1970; Greenblatt, 1975; Kline, 1983; Ray, 1985c; Corzine, 1997).49 3.2.3.2. Typen unter den Vorurteilsfreien (Low-Scorern) Die Berkeley-Gruppe versuchte auch die Systematisierung derjenigen Personen, die auf den Skalen niedrige Werte erzielten.50 Die Autorinnen und Autoren legten hier jedoch besonderen Wert auf die Feststellung, daß die Syndrome hier noch weniger typisiert sind, als es bei den Vorurteilsvollen der Fall ist. 47 Aktuelle Studien zu Autoritarismus und Verschwörungstheorien bei Abalakina-Paap, Stephan, Craig & Gregory, 1999. 48 Das technisierende »Funktionieren« erinnert an die Ausführungen des Philologen Victor Klemperer (1957) über die Sprache des Dritten Reiches, aber auch an den offiziellen Sprachgebrauch in der DDR. 49 In der soziologischen Abschätzung des Potentials dieses Typs in den USA legen die Autoren einen Optimismus an den Tag, den ich schwer nachvollziehen kann: »The ingroup-outgroup relationship becomes the principle according to which the whole world is abstractly organized. Naturally this syndrome can be found in this country only in a rudimentary state.« (Adorno et al., 1950, S. 768). Möglicherweise ist diese Aussage sowohl zeitgeschichtlich als auch biographisch gerechtfertigt. Zur Zeit hingegen (Oktober 2001, also nach den Terroranschlägen vom 11. September) scheint mir die Einteilung der Welt in die »Guten« und die »Bösen« das entscheidende Ordnungsprinzip US-amerikanischer Politik zu sein, so nachvollziehbar das auch sein mag (vgl. a. George W. Bushs Rede zur Lage der Nation/State of the Union Address http://www.whitehouse.gov/news/releases/2002/01/20020129-11.html). 50 Die Übersetzung »Vorurteilsfreie« erscheint mir als ein etwas unglücklich gewähltes Antonym; im Original macht es die pragmatische Wortwahl (lowscorer vs highscorer) einfacher, gewiß aber auch schwer übersetzbar. · 60 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen Der erstgenannte und auch für die weitere Forschung wichtigste Subtyp ist der des »starren Vorurteilsfreien« (»rigid lowscorer«). Diese Charakterstruktur ist gekennzeichnet durch stark stereotypisiertes Denken, lediglich das Vorzeichen der ideologischen Ausrichtung scheint umgekehrt. Insofern erscheinen die Vertreter dieses Typs die Gegenparts zum Subtyp »Oberflächenressentiment« zu bilden. In der späteren Debatte zum »linken Autoritarismus«51 spielte daher genau dieser Typ eine besondere Rolle, da seine ideologische Ausrichtung scheinbar nicht ohne eine gewisse Beliebigkeit und Austauschbarkeit sei: The accidentalness in their total outlook makes them liable to change fronts in critical situations, as was the case with certain kinds of radicals under the Nazi regime. (Adorno et al., 1950, S. 772) Ein weiterer Typ ist der »protestierende Vorurteilsfreie«52, bei dem der Oedipus- Komplex derart gelöst wurde, daß sich die Betreffenden in radikaler Weise der väterlichen Autorität widersetzen. Dieser Widerstand ist jedoch nur scheinbar auf Autonomie im Denken zurückzuführen, vielmehr wird es als übermäßig starkes Über-Ich interpretiert, das sie zu zwanghaft Guten werden läßt. Gerade aus heutiger Sicht erscheint dieser Typ sehr interessant, beschreibt er doch das weitverbreitete politisch korrekte, moralisierende »Gutmenschentum«. Diese phänomenologische Verwandtschaft zeigt sich sogar auf sprachlicher Ebene: »Her social attitude is a combination of conformist ›correctness‹, […].« (Adorno et al., 1950, S. 775). In der Beschreibung des »impulsiven Vorurteilsfreien« lehnen sich die Berkeley- Forscher an eigene Vorarbeiten an (Frenkel-Brunswik & Sanford, 1945) und beschreiben ihn als Gegentyp zum psychopathischen Vorurteilsvollen, der mit allen sympathisiert, die »anders« sind. Über-Ich und Ich sind sehr gering ausgeprägt, das dominierende Es ist aber weitestgehend frei von destruktiven Elementen, zumindest gegen andere. Zu Verbreitung führen die Autoren an, dieses Syndrom erstre51 Vergleiche zum Thema des linken Autoritarismus z.B. : Shils, 1954; Mackinnon & Centers, 1956; Barker, 1963; Lipset, 1959; Kirtley, 1968; McGrew, 1969; Hanson, 1969; Gold, Friedman & Christie, 1971; Kohn, 1972; Wilson et al., 1976; Stone, 1980; 1983; Eysenck, 1981; Lichter & Rothman, 1982; Ray, 1983b; 1984d; 1985a; 1985b; Evans, Heath & Lalljee, 1996; Hopf & Hopf, 1997; Heaven & Connors, 1988; Frindte, Funke & Jacob, 1999. 52 Die Autoren weisen darauf hin, daß dieser Begriff von J.F. Brown vorgeschlagen wurde (Adorno et al, 1950, S. 774, Fußnote 5). · 61 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen cke sich »[…] über die ›Süchtigen‹ jeder Art und bestimmte asoziale Charaktere wie Prostituierte und nichtgewalttätige Kriminelle bis zu gewissen Psychopathen.« (dt. Adorno, 1999, S.348, vgl. Original Adorno et al. 1950, S. 777). Paradigmatisch wird das Fallbeispiel einer »genuinen Lesbierin« genannt. Die niedrigen Punktzahlen dreier Prostituierter aus dem Raum Los Angeles werden durch ihren »Umgang mit zahllosen Menschen verschiedenster Art« erklärt, eine Argumentationslinie mithin, wie sie später in den Forschungen zur Kontakthypothese wiederkehrte (Allport, 1954; Basu & Ames, 1970; Amir & Garti, 1977; Spangenberg & Nel, 1983; Downing & Monaco, 1986; Foster & Louw-Potgieter, 1991; Pettigrew, 1997; 1998; 2000). Der sogenannte »easy-going lowscorer« wird als Gegentypus zum manipulativen Vorurteilsvollen gezeichnet. Die »ungezwungenen Vorurteilsfreien« leben nach dem Grundsatz »leben und leben lassen«, der ihnen eine innere Ruhe und Sicherheit gibt, die sie alle Eigengruppe/Fremdgruppe-Unterscheidungen demonstrativ ignorieren läßt. Von ihnen erwarten die Autorinnen und Autoren der tap unter keinen Umständen eine Anpassung an politischen oder psychologischen Faschismus (Adorno et al., 1950, S.774). Während letztgenannter Typ eher unpolitisch und politischen Themen gegenüber fast ignorant ist, ist der der »genuine Liberale« stark mit Benachteiligten identifiziert, ohne jedoch ein neurotisch überkompensierender Philosemit zu sein. Sein oder ihr stark entwickeltes Ich läßt ihn oder sie bewußt autonom und antitotalitär sein. Diesem Typus scheinen die besonderen Sympathien der Autoren zu gelten.53 3.2.4. Fazit Die impliziten Rückgriffe bei der Beschreibung der Vorurteilsfreien auf die Typen unter den Vorurteilsvollen sind in Tabelle 3 zusammengefaßt. 53 Auch einer der Interviewer schien sehr beeindruckt gewesen zu sein, was man seiner verliebten Beschreibung von Fall 515 anmerkt: »She is a handsome brunette with dark, flashing eyes, who exudes temperament and vitality. She has none of the pretty-pretty feminity […].[…] in build she is athletic. One senses in her a very passionate nature and so strong a desire to give intensely of herself in all her relationships, that she must experience difficulty in restraining herself within the bounds of conventionality.« (Adorno et al., 1950, S. 782). · 62 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen Typen unter den Lowscorern Typen unter den Highscorern Der impulsive Vorurteilsfreie Der Psychopath Der ungezwungene Vorurteilsfreie Der manipulative Typus Der protestierende Vorurteilsfreie Autoritäres Syndrom Der starre Vorurteilsfreie Oberflächenressentiment Der genuine Liberale (keine Entsprechung) (keine Entsprechung) Konventionelles Syndrom (keine Entsprechung) Der Spinner Tabelle 3: Typen und Gegentypen in der tap Die Typologisierungsversuche durch die Berkeley-Gruppe brechen recht abrupt ab, ohne systematisiert oder zusammengefaßt zu werden. In einer wohlwollenden Lesart würde ich dies jedoch nicht kritisieren; vielmehr neige ich dazu, es als Zeichen dafür interpretieren, daß sie keine strenge Typologie aufstellen, sondern lediglich ihre Kasuistiken auf ein etwas höheres Abstraktionsniveau heben wollten. Für die Argumentation in der hier vorliegenden Arbeit ist es erwähnenswert, daß die Autorinnen und Autoren der tap die Typologie nicht entlang der neun Subdimensionen bildeten. Damit sind diese Typen nur impliziter Natur: Die Rekonstruktion der Dimensionen des Merkmalsraumes gelingt nicht ausgehend von den identifizierten und beschriebenen Typen. Diese theoretische Herleitbarkeit (vgl. Substruktion bei Lazarsfeld, 1937) der zugrundeliegenden Dimensionen wäre jedoch für eine wohldefinierte Typologie essentiell. Die Autorinnen und Autoren konzentrierten sich vielmehr auf die psychoanalytische Interpretation der zugrundeliegenden Psychodynamik. Mit anderen Worten bleibt als Fazit festzuhalten, daß in der tap die »Autoritäre Persönlichkeit« mitnichten als monolithisches Syndrom dargestellt wird. Dies ist ein unberechtigter Vorwurf der kritischen Rezeption. Es werden aus dem Interviewmaterial sehr viele Typen abstrahiert. Gleichzeitig muß festgestellt werden, daß die Typen nicht aus dem a priori umschriebenen Merkmalsraum der neun Subdimensionen deduziert wurden. Dieses Defizit rechtfertigt die Überlegungen in der hier vorgelegten Arbeit. · 63 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen 3.3. Die Dimensionsfrage in der kritischen Rezeption In der kritischen Rezeption der tap wird bis heute der Dimensionsfrage keine theoretische Aufmerksamkeit geschenkt. Zuweilen finden sich Aussagen zur Dimensionalität verschiedener Autoritarismusskalen als Nebenprodukt empirischer Studien. Robert Krug fand auf der Basis von Faktoranalysen, daß die F-Skala mehrdimensional sei (Krug & Moyer, 1961; Krug, 1961). Er schloß daraus, daß der globale Skalenwert den Blick auf Zusammenhänge verwehrt, die hätten sichtbar sein können, wäre die Analyse auf Basis von Subskalen oder Subsets von Items erfolgt (Kirscht & Dillehay, 1967, S.31). Dies ist exakt die Argumentation, die ich an anderer Stelle vertrete (Umfeld von Gleichung [3.2], ausführlich in Funke, 1999a). Weitere faktor- und clusteranalytische Studien zur Dimensionalität verwerfen die Möglichkeit, die komplexe inhaltliche Zusammenhangsstruktur in eine statistische Entsprechung abzubilden (Aumack, 1956; Kerlinger & Rokeach, 1966; Kerlinger, 1980; Lever, Schlemmer & Wagner, 1968). Richard Christie stellt ebenfalls die Mehrdimensionalität fest – besser gesagt verwirft er die eindimensionale Struktur – ohne jedoch daraus die Konsequenz zu ziehen, daß tatsächlich distinkte Konstrukte nachweisbar seien: These results clearly indicate that the F-scale is not measuring an unidimensional attribute. But since the items intercorrelate it is apparent that they are tapping something in common (or things in common). Do the empirical results indicate that the hypothetical clusters which were a factor in item selection exist in reality? The answer appears to be in the negative. (Christie, 1954, S.133) Bereits drei Jahre vorher und somit unmittelbar nach Veröffentlichung der tap überprüfte Christie mit John García die Zusammenhangsstruktur der Items der F- und E-Skalen m. H. von Clusteranalysen über die (tetrachorischen) Korrelationen (Christie & García, 1951). In keiner der genannten Arbeiten finden sich die neun Subdimensionen oder eine Untermenge davon: · 64 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen It appears that there is by no means a one to one correspondence between items in the hypothetical cluster of authoritarian submission and those determined empirically. (Christie, 1954, S.137) Das extensive Zitieren der nächsten Passage halte ich trotz der Länge für sinnvoll, da hier mehrere für die Arbeit zentrale Punkte angesprochen werden. Christie scheint hier zu ahnen, daß eine Isolation der Subdimensionen und eine getrennte Operationalisierung durch Subskalen sinnvoll sein könnte, wenngleich er auf ein zentrales Problem bei der Umsetzung dieses Vorhabens hinweist – die Eindimensionalität der Frageformulierung muß erreicht werden, ohne die Validität und die optimale Itemschwierigkeit zu gefährden: There is no question that the F scale does not tap a unidimensional component of ›fas- cism‹, ›authoritarianism‹ or whatever. […] It may be that it includes a number of dis- crete attributes, each of which is capable of isolation and measurement upon unidi- mensional scales. If this possibility is correct, a great deal of testing upon a variety of samples with progressively more refined subscales will be necessary before such clarifi- cation ensues. […] Any such attempt at isolation of ›pure‹ dimensions faces serious problems. If the referents of the items are unequivocally specified (as would presuma- bly be necessary to obtain unidimensionality) it may be that the items would lose much of their present ability to capture agreement from those who accept the looser formulations. (Christie, 1954, S.139) Christies zwei Schlußfolgerungen sind daher eher pessimistisch, wenn er schreibt: […] (1) it captures something common to fascistic philosophy but it is impossible to specify with any precision exactly what it captures, and (2) although there is evidence that the hypothesized dimensions have some validity the individual items are not re- lated to these in a clearcut way. (Christie, 1954, S.140) Bei allen Versuchen, von der statistischen Zusammenhangsstruktur auf komplexe psychische Prozesse zu schließen, wäre es jedoch naiv, von einer 1:1 Abbildung auszugehen. Dieses Problem wurde schon von Zeitgenossen der Berkeley-Gruppe erkannt und kritisiert; Solomon Asch (1952) bezweifelte generell die Möglichkeit des Schließens von Fragebogendaten auf psychische Prozesse. Hinzu kommt, daß die Methodenkorrelation zwischen verschiedenen Fragebögen zuweilen größer ist als · 65 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen die Korrelationen mit Verhalten über verschiedene Situationen hinweg (Titus & Hollander, 1957). Es ist aus heutiger Sicht unklar (und letztlich auch zweitrangig), ob die Idee einer isolierten Operationalisierung der Subdimensionen aus technischen Gründen nicht gelungen ist oder aber ob dieses Ziel aus theoretischen Gründen geringgeschätzt und daher nicht in Angriff genommen wurde. 3.4. Die Dimensionsfrage bei Altemeyer Robert Altemeyer (1996) definiert sein Konstrukt des RWA bereits im ersten Satz als gemeinsames Auftreten dreier Einstellungscluster: By ›right-wing authoritarianism‹ I mean the covariation of three attitudinal clusters in a person: – Authoritarian submission – a high degree of submission to the authorities who are perceived to be established and legitimate in the society in which one lives. – Authoritarian aggression – a general aggressiveness, directed against various per- sons, that is perceived to be sanctioned by established authorities. – Conventionalism – a high degree of adherence to the social conventions that are perceived to be endorsed by society and its established authorities. Zugleich beschreibt er die von ihm entwickelte Skala jedoch als eindimensional: I have a definite hypothesis about the factor structure of the RWA Scale, namely, that it is essentially unidimensional. (Altemeyer, 1996, S. 53) Diese kontraintuitive Behauptung gründet er auf das Argument, daß die Skala die »Verquickung« der Facetten in den einzelnen Items regelrecht als Konstruktions- prinzip hatte: 54 54 Dieses Merkmal von Itemstämmen wird als »double barreled« bezeichnet und ist höchst unerwünscht, da kein Kriterium dafür existiert, ob die oder der Befragte sich zum einen oder anderen Teil oder aber zu deren Konjunktion geäußert hat. DeVellis (1991, S. 59) führt als Beispiel das folgende Item an: »I sup- port civil rights because discrimination is a crime against God«. Eine Ablehnung könnte hier beispiels- weise bedeuten, daß die oder der Befragte gegen Bürgerrechte eingestellt sind. Es ist jedoch auch denkbar, daß sie oder er lediglich die Begründung ablehnt. (vgl. auch Robinson et al. 1991, S. 6; Hanson, 1969; 1970a; Barker, 1963). · 66 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen I strove to keep equal the number of statements that seemingly tapped authoritarian submission, authoritarian aggression, and conventionalism – which was pretty easy to do since most items tap at least two of these. (Altemeyer, 1996, S. 51) All of the items tap at least two, and some (such as number 5) tap all three. 55 It would therefore be nigh impossible to find, say, an authoritarian submission factor in such a tangle. (But the ›tangle‹ is consistent with the definition of right-wing authoritarianism as the covariation of the three.) (Altemeyer, 1996, S. 320, Fußnote 6 von S.53) Bereits in seiner ersten Monographie, mit der er seinen Begriff des Right-Wing Authoritarianism einführte, zeigt sich, wie Altemeyer seine Theorie aus der Empirie ableitet (Altemeyer, 1981). Die Skala entsprang nicht der möglichst angemessenen Operationalisierung eines wohldefinierten Theoriegebäudes, vielmehr wurde die »Theorie« durch extensive Itemanalysen induziert. Insofern erklärt sich die operationale Definition als Kovariation der drei Einstellungscluster. 3.4.1. Beispiele für Submissivität Altemeyers vehemente Verteidigung der theoretischen und psychometrischen Eindimensionalität seiner Skala steht in sonderbarem Gegensatz zur impliziten Trennung der Subdimensionen in seinen zahllosen Validierungsstudien. So schreibt er den Zusammenhang zwischen RWA und dem Tolerieren von Regierungsungerechtigkeit namentlich der autoritären Unterordnung zu (Altemeyer, 1981, S.189 ff., 224ff.). Autoritäre Unterordnung war ebenfalls Gegenstand verschiedener Experimente nach dem Gehorsamkeitsparadigma von Stanley Milgram (1963; 1965; Blass, 1991; 1995). Altemeyer fand, daß Autoritäre die bestrafenden Versuchsleiter häufig in Schutz nehmen, und interpretiert dies wiederum als Zeichen ihrer autoritären Submissivität (Altemeyer, 1996 21ff.). 55 Übersetzung von Item Nummer 5: »Es ist höchste Zeit, daß eine machtvolle Führung das radikale Neumodische und Sündhafte in unserem Land zerstört.« · 67 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen 3.4.2. Beispiele für Aggressivität Eine Reihe von Studien befassen sich mit dem Zusammenhang von RWA und Bestrafungstendenz (Punitivität). Autoritäre schätzen Straftaten als schwerer ein, vergeben härtere Strafen und verachten Täter mehr als dies Niedrigautoritäre tun (Altemeyer, 1981, S. 232ff.; 1988, S. 181; Wylie & Forest, 1992). Diese Bestrafungstendenz ist jedoch bei Autoritären geringer, wenn die Täter Vertreter der Obrigkeit sind (Altemeyer, 1981, 226ff.; 1988, S.112ff., vgl. auch Funke in dieser Arbeit Abschnitt 6.5.2, S.159ff.). Punitivität ist als Manifestation von autoritärer Aggression zu sehen. Weitere von Altemeyer in diesem Zusammenhang diskutierte Validierungskriterien sind 1. Ablehnung von Minoritäten (Duckitt, 1992a; 1992b; 1992c; Zanna & Olson, 1994), 2. Aggressivität gegenüber Frauen (Walker, Rowe & Quinsey, 1993; Malamuth, 1986; O'Grady & Janda, 1978; Rigby, 1988; Schulz & Schulz, 1999; Schwebel, 1999), 3. Feindschaft gegenüber Schwulen (Altemeyer, 1988, S.167; Berry & Marks, 1969; Smith, 1971; MacDonald, 1974; Larsen, Reed & Hoffman, 1980; Duckitt, 1983; Kelley, 1985; Had- dock & Zanna, 1998; Herek, 1998; Basow & Johnson, 2000) oder – als letztes Beispiel – gegenüber 4. Obdachlosen, Sozialhilfeempfängern, Atheisten (Peterson, Doty & Winter, 1993; Leak & Randall, 1995). Wie bei den Befunden zur autoritären Unterordnung referiert Altemeyer hier die korrelativen Zusammenhänge zwischen der Gesamtskala und verschiedenen Kriterien, interpretiert sie jedoch mit ausdrücklichem Bezug auf nur eine der Subdimensionen: Aggressivität. 3.4.3. Beispiele für Konventionalismus Auch zur dritten der von Altemeyer als zentral angesehenen Dimensionen – Konventionalismus – können eine Vielzahl von Validierungsstudien angeführt werden: Meist beziehen sie sich auf christliche Religiosität (Leak & Randall, 1995; Altemeyer & Hunsberger, 1992; 1993; Danso, Hunsberger & Pratt, 1997; Duck & Huns- · 68 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen berger, 1999; Hunsberger, 1995; 1996), aber auch auf orthodoxes Judentum und Is- lam (Rubinstein, 1995a; 1995b; 1996). Eine weitere Manifestation von Konventionalismus findet sich in traditionellen Geschlechtsrollen (Browning, 1985; Rigby, 1988; Newman, 1989; Walker et al., 1993; Frindte & Funke, 1995; Petersen & Wilkinson, 1990; Peterson, Lawrence & Dawes, 1990; Duncan, Peterson & Winter, 1997; Whitley & Ægisdóttir, 2000 und letztlich auch schon bei Horkheimer et al., 1936), einer übersteigerten Konformität gegenüber Gruppennormen (Altemeyer, 1988, S.310ff., 1996, S.35) sowie in konser- vativen Parteibindungen (Altemeyer, 1981, S.223ff.; Tarr & Lorr, 1991; McCourt, Bouchard, Lykken, Tellegen & Keyes, 1999; Rubinstein, 1996; Feather, 1993; McFarland, Ageyev & Djintcharadze, 1996; McFarland et al., 1992; Frindte et al., 1996; 1997; Funke, Frindte, Jacob & Neumann, 1999; Jacob, Frindte & Funke, 1998, in dieser Arbeit Abschnitte 6.1 und folgende). Bei allen genannten Validierungskriterien wurde der statistische Zusammenhang mit der globalen Skala (RWA) berichtet, in der Diskussion wird aber nur auf je- weils eine der Dimensionen Bezug genommen. Dies ist theoretisch durchaus sinn- voll, es steht aber im Widerspruch zum methodischen Vorgehen. In die Studien gehen die aggregierten Skalenwerte ein, in der Diskussion jedoch wird implizit o- der gar ausdrücklich auf die Subdimensionen zurückgegriffen, ohne daß sie opera- tionalisiert worden wären. 3.5. Die Dimensionsfrage bei aktuellen Ansätzen Der Frage der Dimensionalität von Autoritarismus wird auch in der aktuellen Forschung kaum explizite Beachtung geschenkt. Wohl aber gibt es implizite Hinweise auf die Dimensionalität in den Methodenteilen empirischer Arbeiten. Johann F. Schneider findet bei Hauptkomponentenanalysen, […], daß die erste unrotierte Hauptkomponente bereits 29.4 Prozent der Gesamtvari- anz aufklärt. Mit Ausnahme der bereits erwähnten vier Items […] laden fast alle verbleibenden 26 Items = .40 auf diesem ersten Faktor. (Schneider, 1997a, S.241). Bemerkenswert ist bei diesem Autor jedoch vor allem eine Expertenbefragung, bei der er die Items in inhaltliche, bedeutungsähnliche Gruppen sortieren ließ. Über · 69 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen die so entstandene Proximitätsmatrix wurde eine hierarchische Clusteranalyse gerechnet. Zwar wird eine Fünf-Cluster-Lösung präferiert, der Autor verzichtet aber auf eine Interpretation, da sie keinen Erkenntnisgewinn brächte.56 Auf der höheren Fusionierungstufe von zwei Clustern jedoch zeigt sich ungeachtet der völlig andersartigen Methode der hinlänglich bekannte Befund, daß die contraits den protraits gegenüberstehen: Die am häufigsten zur Bezeichnung der Item-Gruppen angegebenen Merkmale sind: konservativ, traditionell, autoritär und rechts. In den Contrait-Items erkennen die Probanden, liberales Denken, progressive Einstellungen, Toleranz und Modernität. (Schneider, 1997a, S.244; vgl. auch Schneider, 1997b). Dieser Befund verdeutlicht, daß sich das Problem der positiv bzw. negativ formulierten Items keineswegs lediglich als technisches Detail bagatellisieren läßt. Vielmehr birgt die Formulierungsrichtung auch eine Bedeutung, die sich auf die Konstruktvalidität auswirkt. Mit anderen Worten: contraits sind nicht einfach nur entgegen der Merkmalsrichtung formuliert, sie sind in Merkmalsrichtung [sic!] formuliert, jedoch in Richtung eines anderen Merkmals. Im günstigsten Falle ist dies das Gegen-Teil des Konstrukts, dem die Meßintention gilt. Dies ist jedoch eine empirische Frage und keineswegs eine selbstverständliche Gesetzmäßigkeit. Die Marburger Arbeitsgruppe um Ulrich Wagner hat seit Anfang der 1990er Jahre mit verschiedenen Autoritarismus-Skalen Erfahrungen gesammelt (van Dick, Wagner, Adams & Petzel, 1997; Petzel, Wagner, van Dick, Stellmacher & Lenke, 1997; Wagner, van Dick, Petzel, Auernheimer & Sommer, 2000). In verschiedenen Validierungszusammenhängen kamen bereichspezifisch angepaßte RWA- Übersetzungen zum Einsatz oder aber an das Gruppen-Autoritarismus-Konzept von John Duckitt angelehnte Neukonstruktionen, die jedoch auch auf den theoretischen drei Dimensionen fußen (Duckitt, 1989; 1990; Petzel, Wagner, Nicolai & van Dick, 1997; Nicolai, 1995). All diese Skalen sind eindimensional konstruiert. Es wurde auf Balancierung zwischen positiv und negativ formulierten Items Wert gelegt. Zwar wurde als Ziel formuliert, die drei inhaltlichen Dimensionen ausgewogen zu erfassen, eine isolierte Erhebung der Konstrukte erfolgte jedoch nicht. In 56 Leider wird dadurch nicht nachprüfbar, ob mit der Fragestellung der hier vorgelegten Untersuchung nicht doch eine sinnvolle Interpretation der Cluster möglich gewesen wäre. · 70 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen dieser Richtung wurden auch keine angemessenen methodischen Schritte unternommen, da das nicht im Mittelpunkt der Untersuchungen stand. Vielmehr ging es lediglich darum, die Kontentvalidität in ihrer Breite zu wahren. Auch international wird recht selten der Widerspruch zwischen dreidimensionaler theoretischer Struktur und eindimensionaler Erhebung von Autoritarismus thematisiert. Lediglich zwei aktuelle nordamerikanische Arbeiten aus den Jahren 1997 und 2002 nehmen darauf am Rande bezug (Duncan et al., 1997; Smith & Winter, 2002)57. Eine explizit methodische Auseinandersetzung erfolgt m.W. nicht. Lauren Duncan (1997) ging der Frage nach, ob sich autoritäre Männer und Frauen in ihrer Unterstützung traditioneller Geschlechterrollen unterscheiden. Dabei ging sie davon aus, daß im althergebrachten Rollenbild die Beziehungen zwischen Männern und Frauen hegemonischer Natur sind: Frauen haben sich unterzuordnen (oder ordnen sich bereitwillig unter), während Männer ihre dominante Position aggressiv verteidigen (vgl. in diesem Zusammenhang die Theorie der Social Dominance Orientation, z.B. Pratto, Sidanius, Stallworth & Malle, 1994; Sidanius, Pratto & Bobo, 1994a; Sidanius, Pratto & Rabinowitz, 1994b; Pratto, Stallworth & Sidanius, 1997; Wang, 1999; Lippa & Arad, 1999; Whitley, 1999; Sidanius & Pratto, 1999; Whitley & Lee, 2000; Whitley & Ægisdóttir, 2000; Heaven, Greene, Stones & Caputi, 2000; Pratto et al., 2000; Six et al., 2001; Sidanius, Levin, Federico & Pratto, 2001). Diesem Rationale folgend sollten bei Männern konservative Geschlechterrollen vor allem mit der aggressiven Komponente von Autoritarismus assoziiert sein, bei Frauen hingegen mit Submissivität. Dies ist scharfsinnig argumentiert; allein es ist eben nicht selbstverständlich, daß mit der RWA diese Frage beantwortet werden kann. Diese Art wissenschaftlicher Fragestellungen bedarf einer differentiellen Erhebung der drei Subdimensionen, wie sie von der RWA-Skala in ihrer herkömmlichen Form nicht geleistet wird. Duncan entschied sich aus zeitökonomischen Gründen für eine Kürzung der RWA- Skala in ihrer 1988er Form (Duncan, 1997 S.44 oben). Dabei traf sie jedoch vor57 Bei beiden jungen Autorinnen war David Winter von der University of Michigan, Ann Arbor, Co-Autor. Ich erwähne dies, da er als Mitglied der Promotionskommission von Lauren Duncan und akademischer Lehrer von Allison Smith der empirischen Unterscheidbarkeit der drei Dimensionen zumindest anfangs sehr skeptisch gegenüberstand (persönl. Kommunikation, 20. Juli 1999, Amsterdam, 22nd Annual Scientific Meeting of the International Society of Political Psychology). · 71 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen satzlos – wie sich aus heutiger Sicht und vor allem aus der Perspektive der hier besprochenen Fragestellung herausstellte – eine äußerst glückliche Wahl. Ihre in der Publikation nicht dokumentierte Itemauswahl58 beschränkte sich genau wie in der hier vorgelegten Arbeit auf zwölf Items, wobei alle Subdimensionen mit gleicher Anzahl von protraits und contraits vertreten sein sollten.59 Dieses Vorgehen öffnete den Blick für ein geschlechtsspezifisches Zusammenhangsmuster: traditionelle Geschlechterrollen waren in Duncans Operationalisierung bei Männern nur mit der aggressiven Komponente assoziiert (r=.37). Bei Frauen hingegen korrelierte das konservative Männer- und Frauenbild mit allen drei Subdimensionen (Konventionalismus r=.34, Submission r=.50 und Aggression r=.46). Allison Smith und David Winter (2002) untersuchten auf dem Höhepunkt der Clinton-Lewinsky-Affäre die Einstellung von Studierenden gegenüber feministischen Anschauungen. Auch hier wird am Rande einer inhaltlichen Fragestellung das methodische Problem lediglich gestreift, aber dennoch in erstaunlicher Deutlichkeit ausgesprochen: 58 E-mail communication 21.06.2002, lduncan@smith.edu: »[…] The items are from Altemeyer, 1988, pp. 22-23: Submission: 3, 15, 20, 23 / Aggression: 11, 16, 17, 27 / Conventionalism: 4, 22, 24, 26. About the biographical question, I went to Michigan and received my degree in Personality psychology. David Winter was on my dissertation committee. I've never met Allison, though. […] Best, Lauren«. 59 Mithin deckt sich ihre pragmatische Entscheidung mit dem Konstruktionsprinzip der RWA³D. Am Rande sei bemerkt, daß ich leider erst durch den 2002er Aufsatz von Allison Smith auf die Arbeit von Lauren Duncan wieder aufmerksam wurde. Hier hätten sich sicher Kooperationsbeziehungen schon zu Anfang des Forschungsprogramms ergeben können, die der Arbeit möglicherweise einen anderen Verlauf gegeben hätten. · 72 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen Although Altemeyer (1981, 1988, 1996) has shown that these three components tend to covary, and although most items on the RWA scale (1998) tap into more than one component, we attempted to identify a few items primarily involving a single compo- nent in order to investigate this issue further. (S.359) […], to represent the three components we followed the example of previous research- ers (Duncan et al., 1997) and selected items a priori that we felt most directly and purely related to each component. (S.363) Auf diese Weise fiel die Wahl auf je drei RWA-Items. Von den drei Subdimensionen korrelierte vor allem die Konventionalismus-Miniskala mit der Ablehnung feministischer Bewegungen (operationalisiert mit der FWM Scale/Attitudes toward feminism and the women's movement, Fassinger, 1994). Die Eigenentwicklung Clinton-Lewinsky Scale hatte eine Subskala, in der die moralische Verwerflichkeit Bill Clintons operationalisiert und seine Bestrafung verlangt wird. Genau dieses Bestrafungsthema ließ die Autoren vermuten und schließlich auch finden, daß insbesondere die aggressive Komponente von Autoritarismus mit der Clinton Worthy Scale assoziiert ist. Die theoretische Diskussion dieses Befundes geht recht weit, indem behauptet wird, daß Aggressivität diejenige der drei Subdimensionen wäre, die der Persönlichkeit am nächsten käme. Die anderen Dimensionen lägen näher an politischen Wertungen. Vor dem Hintergrund dieser Auffassung, die freilich nicht belegt, sondern vielmehr axiomatisch eingeführt wird, interpretieren Smith und Winter (2002, S.376) die gefundene hohe Korrelation von Aggressivität mit der Clinton Worthy Scale als deutliches Zeugnis für die Vernetztheit von Persönlichkeit und politischen Einstellungen. Die beiden genannten Studien von der Ann Arbor University gehören zu den ganz wenigen Arbeiten, die aus der theoretischen Mehrdimensionalität von RWA die Lehre ziehen, das Konstrukt auch mehrdimensional zu erheben. Das Problem wird dabei nicht ausführlich diskutiert; erst recht erfolgt keine regelgeleitete methodi- · 73 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen sche Untersuchung. Eher beiläufig wird hier jedoch ein erfolgversprechender Weg beschritten.60 3.6. Zusammenfassung der Forschungsfragen Das hier thematisierte zentrale Problem besteht im Widerspruch zwischen mehrdimensionaler Konzeptualisierung und dem eindimensionalen Operationalisieren von Autoritarismus. Unterstellt man die analytische Unterscheidbarkeit der drei Subdimensionen, so läßt sich das Meßproblem wie folgt illustrieren: RWA Summenscore = .(Aggressiveness, Submission,Conventionalism) [3.1] In einem Zahlenbeispiel sei ein Summenscore dreier Items auf einer siebenstufigen Likert-Skala 12. Ein und derselbe Summenscore kann auf verschiedene Weise zu- stande gekommen sein, wie in [3.2] illustriert wird. Bei vorliegendem Summensco- re der RWA-Skala läßt sich nicht eindeutig nachvollziehen, ob der Skalenwert durch gleichstark ausgeprägte Subdimensionen zustande gekommen ist (erste Zei- le), oder aber ob eine oder auch zwei der Dimensionen in ihrem Gewicht domi- nierten (vgl. hierzu ausführlicher Funke, 1999a). 60 Ganz offenbar scheinen einige Kolleginnen und Kollegen das Problem schon erkannt zu haben. In aller Regel wird es jedoch ignoriert oder aber so behandelt, als wäre es schon gelöst: es werden Subskalen gebildet oder implizite Theorien zur Erklärung implausibler Forschungsergebnisse aufgestellt, die mit den Begriffen der Subskalen operieren, ohne dies jedoch problematisiert, geschweige denn methodisch gelöst zu haben. Die dialektische Spannung zwischen dem erkannten Problem und einer Scheinlösung läßt mich vermuten und befürchten, daß mein hier entwickelter Ansatz, sollte er denn wahrgenommen werden, schließlich als trivial angesehen werden wird. Der Schritt vom Aufspüren eines Problems und dem Aufschreiben einer Lösung hin zum Durchsetzen der Idee kann – auch wenn er originell und noch so mühsam war – zuweilen nicht dem Schicksal ausweichen, als Selbstverständlichkeit »geschluckt« zu werden; geschluckt durchaus im doppelten Sinne des mühelosen Aufgehens in der Mehrheitsmeinung einerseits und des Vergehens in der Vergessenheit andererseits. Scheitern und Triumph einer Idee liegen hier wohl dicht beieinander. · 74 Friedrich Funke _______________________________________________________________Problembeschreibung und Forschungsfragen 4S 12 =4A ++ 4»Durchschnittstyp « C oder - =7A ++ 3»ATyp « 2 SC oder [3.2] 1A =++ 5C »SC -Typ« 6S oder =? Folgt man dieser Veranschaulichung, so ist der RWA-Wert ein ungewichteter additiver Index, eine eindeutige Abbildung, jedoch keine eineindeutige. Einschränkend muß hier bemerkt werden, daß diese additive (De)komposition hier aus didaktischen Gründen überhöht ist. Es wäre sicherlich weder empirisch noch theoretisch angemessen, die einzelnen Subdimensionen als orthogonal aufzufassen. Sie werden, selbst wenn sie sich trennen ließen, sehr stark miteinander korrelieren. Hieraus wird deutlich, daß bei korrelierenden Subdimensionen jedes dieser einzelnen Maße mit einem Gewicht kleiner 1.0 in die Addition einginge. Dies mindert das Problem jedoch nicht, vermehrt es gar. Das zentrale Problem bleibt die Konfundierung der theoretischen Subdimensionen in einem einzigen Skalenwert, dessen Disaggregation aufgrund der mangelnden Kenntnis über die »Zusammensetzung « aussichtslos ist. · 75 4. Herleitung des methodischen Vorgehens »Man kann die Wissenschaften fördern, indem man kontrainduktiv vorgeht.« (Feyerabend, 1976, S.33) Der vorliegende Aufsatz verfolgt das Ziel, weitere Erkenntnis über das Konstrukt des Autoritarismus und seine psychologische Relevanz zu gewinnen. Insofern handelt es sich unmißverständlich um eine politisch-psychologische Arbeit. Zugleich soll das formale methodische Vorgehen auch auf analoge Operationalisierungsprobleme der Sozial- und Persönlichkeitspsychologie übertragbar sein61. Diesem Ziel folgt der Vorsatz, ein hohes Abstraktionsniveau in der Problembeschreibung und in der Lösungsstrategie zu erreichen. Daraus folgt, daß das Vorgehen nicht nur vor der empirischen Prüfung formal expliziert werden kann, sondern auch ohne jene ihren eigenständigen Wert behält. Die Strategie des Vorgehens umfaßt die zwei Hauptsäulen Dekomposition und Rekomposition. Zum Dekomponieren wird in erster Linie auf exploratorische Faktoranalysen zurückgegriffen. Nachfolgend werden theoriegeleitet alternative 61 Die »Analogie« besteht hier in der Struktur: Wie lassen sich Daten auswerten, die mehrere Konstrukte abbilden und dabei positiv und negativ formulierte Items beinhalten? Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens Meßmodelle vorgeschlagen, die in konfirmatorischen Faktoranalysen geprüft wer- den können. 4.1. Dekomposition Bob Altemeyer definiert sein Konstrukt des RWA als gemeinsames Auftreten dreier Einstellungscluster. Zugleich beschreibt er die Skala jedoch als eindimensional (vgl. Abschnitt 2.2.5 und ausführlich Abschnitt 3.4 S.66 ff.). Die theoretische Begründung der Eindimensionalität wird gedeckt durch zahlreiche Faktoranalysen, in denen immer eine oder aber zwei hochkorrelierte Komponenten extrahiert werden (Altemeyer, 1981, S. 182ff.; Altemeyer, 1988, S.30, Altemeyer, 1996, S. 53; van Dick et al., 1997; Petzel et al., 1997). Die Zweifaktorlösungen stellen nur auf den ersten Blick die einfaktorielle Struktur der Skala infrage. Vielmehr sind sie ein Ergebnis der Frageformulierung. Alle in Merkmalsrichtung formulierten Items (»protraits«) laden auf einer Komponente hoch, die negativ formulierten »contraits« auf der anderen.62 Seltsamerweise hat diese Erkenntnis nicht zu der Konsequenz geführt, daß positive und negative Items getrennt zu analysieren sind. Die empirischen Dekompositionen im Abschnitt 7.3.2 werden diesem Umstand jedoch Rechnung tragen, wobei vermutet wird, daß allein diese Trennung potentiell eine bessere Interpretierbarkeit von »Mehrfaktorlösungen« ermöglicht. Als hinreichend wird diese Strategie jedoch nicht angesehen. 4.1.1. Verwendete Extraktionsverfahren Mit dem Begriff »Faktoranalyse« ist kein einzelnes Verfahren definiert, vielmehr handelt es sich um einen Sammelbegriff für eine gesamte Klasse »datenreduzieren- der«63 Methoden. Den Hauptschritten der Faktoranalysen (Extraktion und Rota- tionstransformation) entsprechend lassen sich die einzelnen Verfahren unterschei- 62 Altemeyer erwähnt beiläufig, daß die Einfaktorlösungen immer bei guten Testbedingungen und bei Be- fragten erzielt werden, die durch hohe Lesekompetenz oder andere Fähigkeiten »gesegnet« sind (Altemeyer, 1996). Die unausgesprochene Begründung hiefür ist m.E. darin zu finden, daß gebildete Be- fragte weniger durch doppelte Verneinung zu irritieren sind, was bei ihnen den Methodeneffekt eines »falsch angekreuzten« Items minimiert. 63 Das Attribut »komplexitätsreduzierend« wäre m.E. passender. · 77 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens den. Zunächst wird hier auf die hier verwendete Extraktionsmethoden eingegangen. Die mathematischen Hintergründe sind hier nicht von näherem Interesse. Für eine zusammenfassende Darstellung verschiedener Verfahren sowie ihrer mathematischen Vor- und Nachteile sei auf Übersichtsarbeiten verwiesen (z.B. Gorsuch, 1983; 1990; Mulaik, 1986; 1987). Bei der hier diskutierten Dekomposition erfolgt absichtsvoll eine Orientierung nicht am mathematisch optimalen Verfahren, sondern vielmehr an der Forschungspraxis. Diese wiederum wird stark durch die verwendete Statistiksoftware und die darin implementierten Verfahren und Standardeinstellungen geprägt.64 64 Da diese Programmpakete ständiger Überarbeitung unterliegen, möchte ich die Gewähr über die Vollständigkeit der Angaben einschränken. Dies gilt insbesondere für SAS, das wegen seines modularen Aufbaus ständig aktualiisert wird. Möglicherweise ähneln sich die Algorithmen in den verschiedenen Programmen trotz abweichender Bezeichnung (z.B. iterated communalities und iterated principal axis). · 78 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens SPSS 11 SAS 8.2 Statistica 6.0LISREL 8.51Systat 10.0 principal component analysis pca 9 9 9 9 9 maximum likelihood ml(a) 9 9 9 9 9 principal axis factoring paf 9 9 9 9 unweighted least squares uls 9 9 generalized least squares gls 9 9 alpha factoring af 9 9 image factoring if 9 9 Harris component analysis H 9 iterated communalities minres 9 iterated principal axis ipa 9 centroid method 9 communalities / multiple R² 9 Tabelle 4: Ausgewählte Extraktionsverfahren in verbreiteten Statistikpaketen Das populärste exploratorisch-faktoranalytische Verfahren ist die Hauptkomponentenanalyse (principal components analysis – pca). Häufig werden die Begriffe daher synonym verwendet, wobei der Spezialfall (pca) fälschlicherweise eine Alleinvertretung beansprucht.65 Es sei an dieser Stelle lediglich darauf hingewiesen, daß pca-Faktoren bzw. Hauptkomponenten orthogonal sind und sukzessiv maximale Varianz »erklären«. Letzteres hat häufig eine erschwerte Interpretierbarkeit zur Konsequenz, da i.d.R. eine 65 Zur Kontroverse zwischen Hauptkomponenten- und Hauptachsenanalyse siehe Borgatta, Kercher & Stull, 1986; Gorsuch, 1990; Mulaik, 1990; Snook & Gorsuch, 1989; Velicer & Jackson, 1990b. · 79 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens Vielzahl von Variablen auf der ersten Komponente hoch lädt. Um die Interpretierbarkeit zu erhöhen, wurde eine Reihe von Rotationsverfahren entwickelt. 4.1.2. Verwendete Rotationsverfahren Rotationsverfahren lassen sich sinnvoll in graphische, analytische und Kriteriumsrotationen unterscheiden. Bei niedrigdimensionalen Faktorlösungen kann man versuchen, auf graphischem Wege eine Einfachstruktur (Thurstone, 1947) zu erreichen. Durch die computergestützte Auswertung sind jedoch exaktere analytische Verfahren möglich, bei denen jeweils bestimmte Kriterien maximiert werden. Kriteriumsrotationen schließlich dienen dem Ziel, die Faktorstrukturen verschiedener Teilstichproben zu vergleichen (vgl. auch Procrustes-Rotation, z.B. Mulaik, 1969). Das populärste Rotationsverfahren varimax (Kaiser, 1958) maximiert die Varianz der quadrierten Ladungen pro Faktor, mit anderen Worten minimiert es die Anzahl der Variablen, die hohe Werte auf einem Faktor haben. Dies erleichtert die Interpretation der Faktoren. Umgekehrtes Ziel ist das Rationale der quartimax- Rotation, bei der die zur Erklärung einer Variablen nötige Anzahl der Faktoren minimiert wird. Folglich erleichtert dies die Interpretation der Variablen. Problematisch hierbei ist jedoch das häufige Auftreten eines Generalfaktors. Die equa- max-Rotation integriert als Kompromiß beider Verfahren die beiden vorgenannten Ziele (Landahl, 1938; Saunders, 1962). · 80 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens SPSS 11 SAS 8.2 66Statistica 6.0LISREL 8.51Systat 10.0 varimax orthogonal 9 9 9 9 9 quartimax orthogonal 9 9 9 9 equamax orthogonal 9 9 9 9 orthomax orthogonal 9 9 parsimax orthogonal 9 biquartimax orthogonal 9 orthoblique harris-kaiser orth./obl. 9 crawford-ferguson familie orth./obl. 9 direct oblimin oblique 9 ..67 9 direct quartimin oblique ..68 promax oblique 9 9 9 procrustes oblique 9 covarimin oblique 9 Tabelle 5: Ausgewählte Rotationsverfahren in verbreiteten Statistikpaketen Allen bisher genannten Verfahren ist die Orthogonalität der Faktoren gemein. Diese Unkorreliertheit wird bei den sogenannten obliquen Rotationen aufgegeben. Damit verbessert sich häufig die Interpretierbarkeit der Faktoren, gleichzeitig tra66 In SAS gibt es mittlerweise auch oblique Varianten von Rotationsverfahren, die üblicherweise als orthogonal bekannt sind (z.B. VARIMAX oblique: OBVARIMAX ). Siehe auch http://www.sas.com/rnd/app/da/new/801ce/stat/chap2/sect3.htm 67 OBLIMIN gehörte lange Jahre nicht zum Umfang von SAS. Erst in der aktuellen Version 8.2 wurde diese Rotation implementiert. 68 OBLIMIN mit d=0. · 81 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens gen diese aber redundante Information und sind aufgrund der größeren Flexibilität69 stichprobenabhängiger und daher schwerer zu replizieren. Die meistverbreiteten Verfahren sind oblimin (Jennrich & Sampson, 1966) und promax (Hendrickson & White, 1964). 4.1.3. Weitere struktursuchende Verfahren Bestimmte voraussetzungsarme exploratorische Verfahren können durchaus geeignet sein, Strukturen zwischen den Items zu erkennen. Besonders zweckdienlich erscheinen hier Verfahren, die Proximitätsmatrizen auswerten können. Die Ähnlichkeits- bzw. Distanzmaße können dabei ganz verschiedener Natur sein, was diese Verfahren sehr flexibel werden läßt. Für die hier bestehende Fragestellung bieten sich hierarchische Clusteranalysen sowie Multidimensionale Skalierungsverfahren an. 4.1.3.1. Clusteranalysen Bei hierarchisch agglomerativen Clusteranalysen wird von der feinstmöglichen Partitionierung ausgehend schrittweise die Zahl der Cluster verringert, die dabei an Mächtigkeit zunehmen. Die Zuordnung zu diesem oder jenem Cluster ist irreversibel und kann nach verschiedenen Kriterien vorgenommen werden. Für die vorliegende Aufgabe qualifizieren sich mehrere dieser Fusionsalgorithmen. Nicht geeignet ist jedoch die Minimum-Methode (single linkage, nearest neighbour), da es hier zur Kettenbildung (chaining) kommt. Eine solche artifizielle Konfiguration mit einem großen Cluster und vielen kleinen, die im Extremfall nur ein Item enthalten, schließt das Finden der drei zugrundeliegenden Dimensionen schon von vornherein aus. Die anderen gebräuchlichen Verfahren (z.B. average linkage, furthest neighbour, complete linkage, Centroid-Verfahren) resultieren bei der Verwendung des jeweils angemessenen Ähnlichkeitsmaßes meist in homogenen Clustern, so daß potentiell damit die Dimensionsstruktur unter den Items gefunden werden könnte. Monte- Carlo-Simulationen sprechen insbesondere für das sogenannte Ward-Verfahren (Ward, 1963; Breckenridge, 1989). Die Homogenität der Cluster ist hier nicht nur diffuses Ziel und Nebenprodukt, sondern ausdrückliches Kriterium der Fusionie69 Der Winkel zwischen den Achsen kann kleiner 90° sein. · 82 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens rung: Es werden die Items derart zusammengefaßt, daß sich die Fehlerquadratsumme minimal erhöht. Dazu wird die folgende Kriteriumsfunktion minimiert: . C QS Ms := s 2 .. . [4.1] . p xiq .. = ... xiq . - n i M Dieses Verfahren erscheint daher als beste Wahl und kommt in 7.3.3 (S. 176) und 7.4.3 (S.180) sowie 7.5.3 (S. 184) zur Anwendung. 4.1.3.2. Multidimensionale Skalierung . Ähnlich wie bei der Clusteranalyse basieren multidimensionale Skalierungsverfahren auf Ähnlichkeits-bzw. Distanzmatrizen. Auch hier gibt es viele verschiedene Verfahren und entsprechend große Entscheidungsunsicherheit hinsichtlich der Angemessenheit. Die Grundidee der mds besteht darin, die besagte Ähnlichkeitsstruktur der Variablen in einem niedrigdimensionalen Raum graphisch darzustellen. Auf diese Weise können regelhafte Muster entdeckt werden, die Aufschluß über den Zusammenhang der Items geben. Bislang war besonders der alscal-Algorithmus (alternating least squares scaling, Takane, Young & de Leeuw, 1977) populär. Weit umfangreicher und moderner ist proxscal (Busing, Commandeur & Heiser, 1996), das erst seit Programmversion 10.0 integraler Bestandteil von SPSS ist. Aufgrund der größeren Flexibilität kommt dieses Verfahren hier zur Anwendung. 4.1.4. Zusammenfassung zur Dekomposition Es gibt eine Reihe von Gründen, die bei der gegebenen Fragestellung gegen exploratorische Faktorenanalysen sprechen: a) Die Anzahl der zu extrahierenden Faktoren unterliegt (zumeist) einem statistisch willkürlichen Kriterium. Meist kommt das Kaiser-Guttmann Kriterium (Guttman, 1954b; Kaiser & Dickman, 1959) zur Anwendung, demzufolge alle Komponenten zu extrahieren sind, die Eigenwerte . > 1.0 aufweisen. Richtig ist, daß 1.0 eine untere Schranke sein sollte, da sonst die Idee der Datenreduktion ad absurdum geführt würde. Allerdings führt dieses Vorgehen häufig zu einer Überfaktorisierung der Korrelationsmatrix, si M q s . 1 s = s · 83 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens also zu einem Überschätzen der Faktorenanzahl. Zuverlässigere Aussagen über eine sinnvolle Anzahl zu extrahierender Komponenten erlaubt die Inspektion des Eigenwertverlaufs (Cattell & Vogelmann, 1977; Zoski & Jurs, 1996). b) Schwerwiegender noch ist das Problem, daß efas kein a priori Wissen berücksichtigen können. So können theoretisch unsinnige oder unmögliche Pfade nicht ausgeschlossen, die entsprechenden Faktorladungen also nicht auf Null (oder andere feste Werte) gesetzt werden. c) Die (theoretisch begründete) Lockerung der Annahme unkorrelierter Fehler von Indikatoren kann in bestimmten Fällen sehr sinnvoll sein. So ist bspw. die Hypothese durchaus sinnvoll, daß die Meßfehler ein und desselben Instruments über die Zeit invariant bleiben oder zumindest deutlich korrelieren. Auch die verzerrende Wirkung von Antworttendenzen kann über ein Zulassen von Fehlerkorrelationen abgeschätzt werden. Dies Möglichkeit bieten jedoch nur konfirmatorische (cfa) oder restringierte Faktoranalysen (rfa)70. Die Durchführung exploratorischer Faktoranalysen verfolgt hier an dieser Stelle in erster Linie das Ziel, ohne Zuhilfenehmen und Einführen von Vorwissen die Binnenstruktur der Items der RWA-Skala näher zu ergründen. Diesem Vorgehen liegt die nicht als generalisierend mißzuverstehende Überlegung zugrunde, daß eine bestimmte Faktorstruktur die mathematische Repräsentation mehr oder weniger konsensualer impliziter Theorien der Befragten über den inhaltlichen Zusammenhang der Items und damit über die Dimensionalität des Konstrukts sei.71 Der eigentliche Grund für die Verwendung exploratorischer Verfahren ist jedoch das Nachvollziehen der gängigen Forschungspraxis im Umgang mit der RWA- Skala im Besonderen und Einstellungsskalen im Allgemeinen. Es handelt sich lediglich um einen ersten Schritt in der Argumentation.72 70 Zur Unterscheidung von EFA und CFA vgl. auch Jöreskog, 1969 oder Oort, 1992) 71 In diesem Sinne erscheinen mir Exploratorische Faktorenanalysen aus erkenntnistheoretischer Sicht durchaus als angemessene Methode im Rahmen einer sozialkonstruktivistischen Persönlichkeitsforschung. 72 Besser gesagt handelt es sich eher um den »nullten« Schritt, der nicht für die Analyse, sondern vielmehr für die Argumentation und die Begründung der eigentlichen Analyseschritte vonnöten ist. · 84 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens 4.2. Rekomposition 4.2.1. Einführung theoretisch begründeter Modelle In den vorangegangenen Abschnitten wurde dargelegt, welche exploratorischen Wege zur Strukturfindung eingeschlagen werden. Allen dargestellten Ansätzen ist eine gewisse Theoriearmut gemein; alle verzichten auf das Zurückgreifen auf inhaltliches Vorwissen. Im Folgenden wird hingegen gezeigt, daß Vorwissen sinnvoll eingesetzt werden kann, um theoretisch begründete Modelle vor (und unabhängig von) empirischer Prüfung aufzustellen und zu testen. 4.2.2. Erkenntnisphilosophische Bemerkungen über die Natur des Zusammenhangs zwischen Konstrukten und Maßen In aller Regel befassen sich Theorien mit dem Zusammenhang verschiedener Konstrukte untereinander. Gleichzeitig wird dem Verhältnis von Maßen und Konstrukten nur geringe Beachtung geschenkt. Die exakte Beschreibung dieser Beziehung ist jedoch von entscheidender Bedeutung, da sie die Verbindung von nicht beobachtbaren Abstrakta einerseits und meßbaren empirischen Phänomenen andererseits darstellt. Ohne solche explizierten Hilfssätze ist ein sinnvolles Testen von Theorien über Zusammenhänge von Konstrukten mehrdeutig und damit hinfällig (Blalock, 1985a; 1985b; Costner, 1971; 1989). Zunächst seien die beiden Begriffe Konstrukt und Maß definitorisch näher beschrieben: Unter Maß sei ein beobachteter Wert verstanden. Im hier diskutierten konkreten Fall handelt es sich um Selbstberichte (Fragebögen), selbstverständlich sind aber z.B. auch Beobachtungen, Fremdeinschätzungen oder Interviews mögliche Datenquellen. Unabhängig von der Herkunft des Datums handelt es sich bei einem Maß um ein empirisches Relativ oder Analog zu einem Konstrukt. Konstrukte seien Beschreibungsversuche für Phänomene, die sich einer direkten Beobachtung bzw. Beobachtbarkeit entziehen (vgl. Cronbach & Meehl, 1955; Nunnally, 1978 und andere über Konstruktvalidität). Kritisch realistische Sichtweisen unterstellen, daß die Phänomene selbst real sind und unabhängig vom Bewußtsein (der Forscher, der Beforschten und dritter Beobachter) existieren (Cook & Campbell, 1979; Cook, Campbell & Peracchio, 1990; Messick, 1995a; 1995b). · 85 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens Die auch von mir vertretene Sichtweise verlangt dies hingegen ausdrücklich nicht; die Phänomene mögen real sein oder auch nicht, die Konstrukte sind dies jedoch in keinem objektiven Sinne. Sie sind Ergebnis und Elemente eines wissenschaftlichen Diskurses und dienen als sprachliche Surrogate für die interessierenden Phänomene (Edwards & Bagozzi, 2000; Knorr-Cetina, 1997; Gergen, 1985a; 1985b; Stam, Rogers & Gergen, 1987, vgl. auch Zuriff, 1998). Der Zusammenhang zwischen Konstrukten einerseits und Maßen auf der anderen Seite wird meist (zumindest implizit) als kausal bezeichnet. Der Begriff der Kausalität ist dabei jedoch fortwährend sowohl in der Erkenntnistheorie als auch – im engen Sinne – in Statistik und Methodologie Gegenstand heftigster Debatten (vgl. Michotte, 1946; Hume, 1946; Popper, 1959; Suppes, 1970; 1993 für ersteren und Steyer & Schmitt, 1994; Steyer, 1994a; 1994b; Steyer, Gabler & Rucai, 1996; Pearl, 2000; Steyer & Eid, 2001 für letztgenannten Diskurs). Für das hier verfolgte Ziel ist es jedoch hinreichend, auf wenige weitestgehend konsensuale erkenntnisphilosophische Prinzipien hinzuweisen (Asher, 1983; Bollen, 1989; Heise, 1975): 1. Ursache und Wirkung sollten distinkte Entitäten darstellen, da es sich sonst bei ihrem Zusammenhang um einen tautologischen handelte; 2. Es wird eine Assoziation zwischen Ursachen und Wirkung unterstellt, die sich im statistischen Sinne in einer Kovariation niederschlägt. Ausdrück- lich ist diese Assoziation probabilistisch in dem Sinne zu verstehen, daß das Auftreten der Ursache die Auftretenswahrscheinlichkeit der Wirkung erhöht, diese aber mitnichten garantiert. 3. Kausale Interpretierbarkeit verlangt zeitliche Präzedenz der Ursache ge- genüber der Wirkung. Dieses Problem wird in der (psychologischen) For- schung meist mit experimentellen Designs zu lösen versucht. Für den Zu- sammenhang von Konstrukt und Maß ist dies jedoch von geringer Bedeutung. 4. Weit schwieriger und zugleich bedeutsamer ist die Eliminierung rivalisie- render Erklärungsansätze. Hierauf soll daher besonderer Wert gelegt wer- den. Diese erkenntnisphilosophisch formulierten Prinzipien finden ihren konkreten Niederschlag in methodischen Sicht- und Vorgehensweisen. Die Forderung der Distinktheit von Ursache und Wirkung (Punkt 1) ist durch die definitorische Un- · 86 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens terscheidung der Begriffe Maß und Konstrukt erfüllt. Der Zusammenhang zwischen Konstrukten und Maßen (Punkt 2) läßt sich mit Hilfe von Gedankenexperimenten ergründen. Hierbei wird versucht, ausgehend von einer Veränderung in der Ursache (in der Ausprägung des Konstrukts) die Veränderungswahrscheinlichkeit des Maßes vorherzusagen. Strukturgleichungsmodelle bieten eine empirische Möglichkeit, diese Zusammenhänge quantitativ zu beschreiben. Hierbei werden unter Kenntnis der Kovariation mehrerer Maße eines Konstrukts die Zusammenhänge (Faktorladungen) zwischen dem hypothetischen Konstrukt und den einzelnen Maßen geschätzt (Bollen, 1989). Die zeitliche Präzedenz der Ursache (Konstrukt) vor dem Effekt (Maß, Itemantwort), wie sie in Punkt 3 gefordert wird, ist in jedem Falle gegeben, da dies aus der Definition des Maßes als empirisches Analogon zum konzeptuellen Konstrukt folgt. Dies bleibt auch dann noch unberührt, wenn man – wie dies hier ausdrücklich geschehen soll – die Auffassung vertritt, daß durch das Vorlegen eines Fragebogens (also die Messung selbst) erst das Konstrukt (z.B. eine Einstellung) geformt oder zumindest verändert wird. Das Meßergebnis (letztliche Antwort auf ein Item) folgt in jedem Falle dem Konstrukt, selbst wenn dies kurz vorher durch das Vorlegen der Frage gewandelt wurde. Schwieriger und nicht grundsätzlich lösbar ist das im vierten Punkt geforderte Ausschließen rivalisierender Erklärungen für den Zusammenhang. Weder existieren hier definitorische Setzungen, die die Geltung dieses Prinzips kausaler Interpretierbarkeit garantieren, noch gibt es allgemeingültige empirische Prozeduren, die diesen Punkt einer zuverlässigen Prüfung zuführen. Hier gilt es, den Blick zu weiten, das Urteil Außenstehender einzuholen (Interrater-Reliabilität) und den Einfluß der verwendeten Meßmethoden zu kontrollieren (Methodenvarianz, vgl. Steyer, Ferring & Schmitt, 1992b; Steyer, Ferring & Schmitt, 1992a; Eid, 2000; Kenny & Kashy, 1992; Cronbach, 1995). 4.2.3. Konkrete mathematische Modelle zur Beschreibung des Zusammenhangs zwischen Konstrukten und Maßen Welcher Zusammenhang besteht zwischen dem zu Messenden und den tatsächlich erhobenen Daten? Die Frage ist nicht trivial; das Problem läßt sich formalisieren. Die folgende Darstellung bezieht sich formal auf die Begrifflichkeit und Notation · 87 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens von Edwards & Bagozzi (2000), obgleich die Argumentation hier einem anderen Ziel folgt und konkret auf die Erfassung von Autoritarismus bezogen wird. 4.2.3.1. Direkt reflektives Modell Im direkt reflektiven Modell wird die latente Variable als Ursache für diese oder jene Itemantwort angesehen. Die Items sind »Effektindikatoren« (Namboodiri, 1994; Namboodiri, Carter & Blalock 1975; Bollen, 1989, S. 64-65). Formal geschrieben sei jede manifeste Variable xi (jedes Item) das Produkt aus dem direkten Effekt .i und der fraglichen latenten Variable . zuzüglich eines Meßfehlers di: x1 = ..+ d1 1 x2 = ..+ d2 2 [4.2] .. xi = ..+ di i In Matrixform ließen sich diese Gleichungen vereinfachen als: x = ..+ d [4.3] x wobei x der Vektor der Indikatoren einer latenten Variable . ist x1 ... .... . x 2 x = .. [4.4] xi .... ... und wir schreiben können ... . .11 .12 " .1n ... . d1 .. ... .1 . .. . x1 . . . x2 .. .. .21 .2 # n . ... ... . # 2 + .. . . . . d # 2 . . . . = . [4.5] . # .. . .. . .. . xi .. .. .. .m1 .m2 " .mn .. . .. .. .n .. .. di . . Dieses Modell basiert auf den Annahmen der Klassischen Testtheorie (Gulliksen, 1950; Lord & Novick, 1968) und bildet die Grundlage für Reliabilitätsschätzungen und umfassende Verfahrensklassen wie Faktoranalysen. Inhaltlich gesprochen wird diesem Modell zufolge die Varianz jeder Itemantwort durch ein Konstrukt erklärt, das allen Items gemein ist, sowie durch einen Meßfehler, der jedoch itemspezifisch ist. · 88 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens 4.2.3.2. Direkt formatives Modell Diesem Modell zufolge werden die Itemantworten als korrelierte Ursachen für das jeweilige Konstrukt angesehen: .=. .x + . [4.6] ii i Ignoriert man hier den Fehlerterm, so wird die latente Variable . zu einer (gewichteten) linearen Funktion der Maße. Hier wird deutlich, daß dieses Modell der Skalenwertbildung in der psychologischen Forschungspraxis unausgesprochen zugrunde liegt. Bei der meist durchgeführten Aggregation durch Addition der Testwerte bzw. durch Mittelwertsbildung erfolgt zudem nicht einmal eine itemspezifische Gewichtung der einzelnen Variablen, so daß es sich bei .i=1.0 (beim Summenscore) um eine Konstante handelt, die folglich ignoriert werden kann.73,74 4.2.3.3. Indirekt reflektives Modell Beim indirekten reflektiven Modell werden die Maße (fälschlicherweise) als Indikatoren des interessierenden Konstrukts angesehen. Tatsächlich repräsentieren sie hingegen eine (oder mehrere) seiner Folgen. Die Modellgleichungen enthalten mediierende Konstrukte .*, wobei der Stern symbolisieren soll, daß es sich nicht um das eigentlich zu messende Konstrukt handelt: .* j = .. +.* j [4.7] j y = .ij.* j +ei [4.8] i Setzt man nun die rechte Seite von [4.7] in [4.8] ein, so erhält man * y = .ij ( ..+ . )+ ei i jj [4.9] = .ij..+.ij.* j +ei j und erkennt schließlich, daß der interessierende Zusammenhang zwischen den Indikatoren und dem zu messenden Konstrukt durch die Produkte .ij.j repräsentiert 73 Beim Mittelwert entspricht der Pfadkoeffizient dem Reziproke der Indikatorenzahl. 74 Die gewählte Notation mit . anstelle von . ist mit Bedacht gewählt, um den Unterschied zum reflektiven Modell zu verdeutlichen und zu unterstreichen. · 89 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens wird. In der Konsequenz ist der eigentlich interessierende Zusammenhang zwischen den Indikatoren (Itemantworten) und dem zu messenden Konstrukt (z.B. Autoritarismus) immer eine konfundierte Beziehung: die Varianzen der beobachteten yi sind daher nicht allein auf das Konstrukt . und die Fehlervarianzen ei zurückzuführen, sondern werden auch vom Residuum .* des mediierenden Konstrukts .* beeinflußt. Dieses Meßmodell findet seine konkrete Anwendung in Faktoranalysen höherer Ordnung (second order factor analysis, vgl. Rindskopf & Rose, 1988; Marsh & Hocevar, 1988). Auf unseren75 konkreten Fall bezogen schließen wir vom Antwortverhalten bei mehreren konkreten Items auf ebenfalls relativ konkrete Einstellungen (z.B. zur Todesstrafe oder zur »Homoehe«). Der dargestellten Notation zufolge sind dies jedoch erst unsere .*, die wiederum (mit Fehlern .*) durch ein gemeinsames . erklärt werden. Erst dieses . ist der hier interessierende Autoritarismus. 4.2.3.4. Indirekt formatives Modell Das indirekt formative Modell läßt sich in Analogie zu 4.2.3.1 und 4.2.3.3 aus Abschnitt 4.2.3.2 ableiten. Die ausführliche Darstellung erfüllt keinen entscheidenden Zweck für unsere konkrete Fragestellung, sodaß sie entbehrlich wird. 4.2.3.5. Irriges Modell Das sog. spurious model stellt nicht den vom Forschenden intendierten Zusammenhang zwischen Maß(en) und Konstrukt(en) dar; in der Forschungspraxis hingegen dürfte diese Beschreibung der »Wirklichkeit« sehr nahe kommen: wiederum enthält dieses Modell eine mediierende Drittvariable, die die Varianz der Indikatoren erklärt (vgl. Abschnitt 4.2.3.3 Indirekt reflektives Modell). In Abweichung vom indirekt reflektiven Modell wird hier jedoch diese Drittvariable als Ursache für die Varianz der eigentlich interessierenden Variablen . angesehen. xi = ..*j+ di [4.10] ij.=. jj .. * + . [4.11] j 75 »Unser« meint hier nicht den andernorts von mir vermiedenen pluralis majestatis, sondern Autor und Leser gleichermaßen, da beide am gedachten Prozeß des Interpretierens beteiligt sind. · 90 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens Betrachtet man in einem Spezialfall des spurios model die xi als fehlerfreie Maße der , so reduziert sich die Modellgleichung [4.10] auf .*j xi = .* j [4.12] und man erhält durch Einsetzen von [4.12] in [4.11] . =. .jj+ . [4.13] x j und damit nach Anpassen der Indizes das direkt formative Modell [4.6] . =. . x+ . [4.14] ii i . 4.2.3.6. Nichtanalysiertes Modell Als letztes (skeptisches) Modell sei das unanalyzed model sensu Edwards & Bagozzi (2000) vorgestellt: Dieses beschreibt den (leider nicht unwahrscheinlichen) Fall, daß nichtanalysierte Indikatoren xi tatsächlich reflektive Indikatoren eines Konstrukts . * sind, das mit dem eigentlich interessierenden Konstrukt . bestenfalls hoch korreliert ist. Allen Varianten des Modells ist gemein, daß der Forscher nicht erkennt, daß die versehentlich oder absichtsvoll nicht ausgewerteten Variablen Indikatoren des interessierenden Konstrukts sind. 4.2.3.7. Zusammenfassung und Konsequenzen Die ausführliche Darstellung verschiedener mathematischer Modelle zur Beschreibung des Zusammenhangs zwischen beobachtbaren Maßen (Itemantworten) und den eigentlich interessierenden Konstrukten, die sich der Beobachtung entziehen (z.B. Autoritarismus), ist nur scheinbar überflüssig. Vielmehr ermöglicht sie eine differenzierte methodenkritische Sicht auf den Prozeß des Messens und verdeutlicht die erkenntnistheoretischen Probleme. Die mathematische Formalisierung bietet gleichzeitig darüber hinaus Auswege an, die beispielsweise spezifischen Meßfehlern oder situativen Einflüssen den angemessenen Platz zuweisen und dadurch eine klare Dekomposition zulassen, was wiederum – bildlich gesprochen – die Sicht auf die eigentlich interessierenden Konstrukte freigibt. Gelänge es beispielsweise, bestimmten Items der RWA-Skala eine Besonderheit zu unterstellen, die sie von anderen Items oder Itemgruppen der Skala unterscheiden, dann ließe sich hier etwa das indirekt reflektive Modell anwenden. (vgl. Abschnitt · 91 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens 4.2.3.3, Seite 89). Diese Besonderheit könnte sein, daß die genannten Items in speziellem Maße autoritäre Unterwürfigkeit (.1) abbilden, während andere etwa vor allem den Aspekt der autoritären Aggressivität (.2) beschreiben. Allen Items gemein hingegen ist jedoch, daß sie Autoritarismus messen (sollen); die konkreten Itemantworten werden demnach verstanden als die mehr oder minder fehlerbehaftete Folge einer mehr oder minder hohen Ausprägung spezieller Facetten von Autoritarismus (.), die ihrerseits (fehlerbehaftet - sic!) durch generellen oder globalen Autoritarismus hervorgerufen werden. 4.2.4. Formalisierung der derzeitigen Praxis Eine argumentatorische Hauptlinie der Arbeit versucht, die derzeitige Forschungspraxis zu beschreiben und alternative Meßmodelle theoretisch zu begründen und empirisch zu testen. Um eine konsistente Strategie zum Vergleich zu finden, ist es sinnvoll, den üblichen Umgang mit Itemantworten zu explizieren und in die »Sprache« bzw. Notation von Strukturgleichungsmodellen zu übersetzen. In aller Regel werden die Itemantworten der RWA-Skala addiert bzw. es wird – wie in der vorliegenden Arbeit – das arithmetische Mittel als Aggregation gewählt. Die Mittelwertsbildung läßt sich analog zum direkt formativen Modell (vgl. S. 89 in dieser Arbeit, Edwards & Bagozzi, 2000; Heise, 1972) schreiben: Das direkt formative Modell wird repräsentiert durch die folgende Modellgleichung [4.6] . =. . x+ . [4.15] ii i Führt man zwei Zusatzannahmen ein, erhalten wir folgenden Spezialfall des soeben beschriebenen Modells: 1 Wenn . .i = (mit n:=Anzahl der Items) und . = 0, so gilt n 1 . =. xi. [4.16] n i Auf die beschriebene Weise konnte zwar ein Modell gefunden werden, das als Faktorwerte den individuellen Skalenmittelwert liefert. Sobald dieses Problem jedoch gelöst ist, wird ein neues offenbar: Mit dem direkt formativen Modell [4.6] und den eingeführten Zusatzannahmen [4.16] wurde eine Möglichkeit gefunden, die · 92 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens Mittelwertsbildung als übliche Aggregation und Auswertungspraxis in die formale Sprache von Strukturgleichungsmodellen zu übertragen. Dies wurde mit dem Ziel versucht, ein Referenzmodell zu finden, mit dem alle im weiteren vorgestellten alternativen Modelle verglichen werden können. Es lag die Annahme zugrunde, daß es sich angesichts nicht berücksichtigter Fehlervarianzen und ignorierter Gewichtungen bei dem Mittelwertsmodell um einen strengen Spezialfall eines Einfaktormodells handele, das somit in die alternativen Modell geschachtelt76 und mit dem .2- Differenzentest auch statistisch testbar wäre. 11111 11111 11111 0=.1 n 1 n 1 n Abbildung 3: Saturiertes direkt formatives Modell als Analogie zur Mittelwertsbildung Das intendierte Ziel kann jedoch nicht erreicht werden, da aufgrund fehlender Restriktionen über die Kovarianz der Fehler diese korrelieren dürfen, sodaß keine Freiheitsgrade verbleiben. Ein Modell ohne Freiheitsgrade ist jedoch saturiert (gesättigt) und hat daher einen perfekten Fit, was eine Falsifizierbarkeit des Modells ausschließt. Zumindest in dem vorliegenden Fall ist dies nicht zielführend. Aus diesem Grunde bleibt als Aufgabe das Suchen nach einem Modell, das 1. nur ein Konstrukt widerspiegelt, 2. keine Liberalität hinsichtlich der Gewichtung einzelner Variablen sowie 3. keine Liberalität hinsichtlich der Meßfehler vorsieht. Am ehesten entspricht diesen Forderungen ein einfaktorielles Paralleltestmodell. Die Gleichheit der Ladungen erfüllt die Forderung ungewichteten Eingehens aller Indikatoren, die Gleichheit der Fehlervarianzen kommt dem Ignorieren der Fehler am nächsten (Abbildung 4). 76 »nested« · 93 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens d = d = d .= = ..1111111111 11111 Abbildung 4: Einfaktorielles Paralleltestmodell als Referenzmodell Das single trait Paralleltestmodell wird daher als Referenzmodell verwandt, gegen das die modifizierten Alternativmodelle getestet werden können. 4.2.5. Inhaltsunabhängige Verbesserungen »Papa, hast du diese Männchen hier für mich gemalt?« Sophie Funke (Silvester 2000)77 Ziel dieser Arbeit ist es, auf inhaltlicher bzw. theoretischer Basis methodisch verbesserte Meßmodelle abzuleiten. Die ersten sinnvollen Modifikationen lassen sich jedoch auch ohne den inhaltlichen Bezug nach rein formalen Gesichtspunkten begründen. Diese Modifikationen beziehen sich: 1. auf den Zusammenhang zwischen beobachteten Indikatoren (Itemantworten) und den latenten Konstrukten, denen das Hervorrufen dieses oder jenes Antwortverhaltens unterstellt wird (Abschnitt 4.2.5.1). 2. Eine zweite bereits formal und inhaltsfern begründbare Verbesserung ergibt sich aus der Tatsache, daß es sich bei den hier untersuchten Skalen um balancierte Meßinstrumente handelt, die jeweils zur Hälfte aus positiv (protraits) bzw. negativ formulierten Items (contraits) bestehen (Abschnitt 4.2.5.2). 4.2.5.1. Einführung einer Gewichtung der Items – Die Mikroebene des Meßmodells In Abschnitt 4.2.4 (auf S.92ff.) wurde die übliche Praxis der Aggregation von Itemwerten zu Skalenwerten formalisiert (Summenscores bzw. Mittelwerte). Ein zumindest wenig reflektiertes oder gar mit Bedacht ignoriertes Problem dieses Vor77 Sophies Kommentar beim Betrachten skizzierter Pfaddiagramme. · 94 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens gehens ist, daß es sich bei aggregierten Werten um Maße lediglich minderer Qualität handelt: Bei der Mittelwertsbildung über mehrere Items hinweg werden die Zufallsmeßfehler nicht einbezogen (Attenuation); mithin wird der unterschiedlichen Reliabilität der Items nicht Rechnung getragen. Die Qualität des Meßmodells wird nicht hinterfragt oder gar quantifiziert. Vielmehr wird implizit ein perfektes Meßmodell unterstellt.78 Im Folgenden werden auf der Mikroebene drei unterschiedlich strenge Meßmodelle unterschieden. Allen dreien ist die Annahme der klassischen Testtheorie gemein, daß sich die Itemantworten durch den Einfluß der latenten Variable und eines itemsspezifischen Meßfehlers bzw. einer Störvariable »erklären« lassen (Gulliksen, 1950; Lord & Novick, 1968; Judd & McClelland, 1998; Steyer, 1989). Die Unterschiede bestehen in der Strenge der Annahmen über die Gleichheit von Ladungen bzw. Meßfehlern. a) Meßmodell t-kongenerischer Variablen Die qualitative Zuordnung beobachteter Variablen zu einer (oder mehreren) latenten Variablen impliziert lediglich die Unterscheidung zwischen einem nicht näher spezifizierten Zusammenhang .und »keinem« Zusammenhang (.=0). Über die Größe des Zusammenhangs ist jedoch nichts ausgesagt. Daraus folgt, daß keine Einschränkung dahingehend besteht, ob etwa Item y1 in gleichem Maße mit dem latenten Konstrukt zusammenhinge wie Item y2 (. ..) . 11 21 Die Gemeinsamkeit derartig beschriebener Items mit Blick auf ein gemeinsames latentes Konstrukt beschränken sich somit darauf, daß sie mit genau diesem und nicht mit einem anderen betrachteten Konstrukt zusammenhängen. Weder die Ladungen sind restringiert, noch wird eine Gleichheit der Fehlervarianzen unterstellt. Dieses Modell nennt man kongenerisch (Carmines & McIver, 1981; Jöreskog & Sörbom, 1996; Steyer & Eid, 2001). 78 Gleichwohl haben Mittelwerte und Summenscores nicht zu übersehende Vorteile vor allem in der Handhabbarkeit und Kommunizierbarkeit. Es wäre vollkommen wirklichkeitsfremd, eine Ablösung dieser Praxis anzumahnen oder gar zu erwarten, wie wünschenswert dies auch immer sein mag. · 95 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens Als Modellgleichung ergäbe sich aus dem Gesagten daher 1x = 1.. 1+ d 2x = 2.. 2+ d # [4.17] xi = .. + di i , wobei die Indizierung der Ladungen .und der Fehlervarianzen dauf die (zugelassene) Ungleichheit hinweist. Dieses Modell stellt auf der Mikroebene den liberalsten Fall mit den am wenigsten strengen Annahmen dar.79 b) Meßmodell essentiell t-äquivalenter Variablen Es ist jedoch denkbar und aus Sparsamkeitsgründen fraglos wünschenswert, daß 80 die unstandardisierten Ladungen alle als gleich unterstellt werden (. =. =.) . 11 21 Dieser Spezialfall des kongenerischen Meßmodells wird als Meßmodell essentiell t-äquivalenter Variablen bezeichnet. Als Folge der verschiedenen Fehlervarianzen unterscheiden sich die standardisierten Pfadkoeffizienten zwischen manifesten Items und latentem Konstrukt (Allen & Yen, 1979; DeVellis, 1991, S. 22).81 In der Modellgleichung [4.18] kann somit auf den Index für die Ladungen verzichtet werden, um deren Invarianz zu symbolisieren: x1 = .. + d1 x2 = .. + d2 .. [4.18] xi = .. + di Die Fehlervarianzen bleiben hingegen itemspezifisch und tragen daher weiterhin den Index i. 79 Noch liberaler ist das sog. general factor model (Carmines & McIver, 1981; Long, 1983; DeVellis, 1991, S.22) 80 Da die Fehler nicht restringiert sind und voneinander verschieden sein können, sind die standardisierten Ladungen nicht gleich. Dies impliziert ebenfalls, daß Mittelwerte und Varianzen der Items variieren können, was der Realität sehr entgegenkommt. 81 Vgl. auch die Diskussion zum »domain sampling model« (Hudson & Faul, 1998) · 96 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens c) Paralleltestmodell Die strengste hier eingeführte Annahme fordert neben der Gleichheit der Ladungen zusätzlich die Übereinstimmung der Fehlervarianzen. x1 = .. + d x2 = .. + d .. [4.19] xi = .. + d Dies impliziert u.a. die Gleichheit aller paarweisen Korrelationen der Items82, ihrer Mittelwerte und ihrer Varianzen, wobei diese rigorose Annahme zumindest auf Itemebene »realitätsfern« ist. Das Paralleltestmodell hat gleichwohl vor allem dann seine Berechtigung, wenn auf der Basis aggregierter Werte (z.B. Testhälften, Testlets, Itemparcels) gerechnet wird. 4.2.5.2. Berücksichtigung der Kodierrichtung der Items In der Praxis der Skalenkonstruktion hat sich weitestgehend die Überzeugung durchgesetzt, daß sogenannte Antwortverzerrungen (response bias) die Reliabilität und vor allem die Validität von Fragebogenerhebungen erheblich gefährden können (vgl. 2.2.4.1, S.35ff.). Solche Verzerrungen können kurzfristig als situativ induzierte Antworttendenz auftreten (response sets) oder aber relativ überdauernd durch einen persönlichkeitsspezifischen Antwortstil (response style) hervorgerufen werden (Jackson & Messick, 1957; Wiggins, 1973; Angleitner & Wiggins, 1986).83 Gerade letzteres ist kritisch, da hier eine verdeckte Konfundierung des Skaleninhalts mit dem konsistenten Antwortstil möglich ist. Für den konkreten Fall der Erfassung von Autoritarismus mit Selbstberichtsmethoden ist sogar durchaus wahrscheinlich, daß Befragte mit einer starken Tendenz zur Unterordnung unter Autoritäten auch einen Antwortstil aufweisen, der sie allen Items relativ unabhängig vom Inhalt zu82 Alle Korrelationen werden »erklärt« durch den Einfluß der latenten Variable. Die Korrelation zwischen zwei Variablen x1 und x2 ist das Produkt der Pfadkoeffizienten, die diese manifesten Variablen mit der latenten Variable »verbinden«. Aus der Gleichheit aller Pfadkoeffizienten folgt zwingend die Gleichheit aller paarweisen Produkte. 83 Mögliche Ursachen sind hier z.B. der Aufforderungscharakter (demand characteristic) der Situation, Kontexteffekte durch vorhergegangene Items oder aber auch Zeitdruck bei der Erhebung. · 97 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens stimmen läßt: dies entspricht durchaus dem alltagspsychologischen Verständnis der autoritär-unterwürfigen »Ja-Sager« (yeasayers). Die Antwortverzerrung durch Zustimmung (acquiescence)84 wurde bereits relativ früh beschrieben (Lentz, 1930; 1938) und intensiv beforscht (z.B. Couch & Keniston, 1961; Messick & Jackson, 1957; Mahler, 1962; Ayidiya & McClendon, 1990; Paulhus, 1991; Billiet & McClendon, 2000)85. Einigkeit besteht vor allem darin, daß die Einstellungsforschung stärker unter diesem Problem leidet als etwa die Persönlichkeitsforschung (Bentler et al., 1971; Bentler, Jackson & Messick, 1972; Samelson, 1972). Besonders gefährdet erscheinen Skalen mit sehr komplexen Items (Schuman & Presser, 1977; Presser & Schuman, 1980; Schwarz, Groves & Schuman, 1998). Ferner verstärkt sich die Zustimmungstendenz durch Unsicherheit bzw. wird durch diese überhaupt erst ausgelöst (Peabody, 1966). Beide Umstände sind bei der Erfassung von Autoritarismus gegeben: einerseits enthält die RWA-Skala ebenso wie die meisten Varianten und Derivate der F-Skala sehr lange, hochkomplexe Items, andererseits wird Unsicherheit der Befragten in verschiedenen Ansätzen der Autoritarismusforschung als zentrales Konzept diskutiert (Freund, Kruglanski & Shpitzajzen, 1985; Doty et al., 1991; Oesterreich, 1996). Im Ergebnis der Debatte über den Einfluß von Antworttendenzen und –stilen wird eine Konsequenz fast ausnahmslos als sinnvoll angesehen: In aller Regel wird bei der Skalenkonstruktion der Versuch unternommen, etwa die Hälfte der Items 84 Es gibt neben der Zustimmungstendenz auch eine Reihe anderer Verzerrungen wie etwa -die Neigung zu extremen oder aber eher mittleren Antworten (extremity response bias ERB vs central tendency vgl. van der Kloot, Brouwer & Willemsen, 1982; van der Kloot, Kroonenberg & Bakker, 1985), -soziale Erwünschtheit (social desirable responding SDR, faking good, faking bad z.B. Paulhus, 1991; Couch & Keniston, 1961; Edwards & Walker, 1961; Martin, 1964; Pedersen, 1967; Ritter & Dickson, 1985; Rigby, 1987), -devianter Antwortstil (Goldberg & Slovic, 1967; Berg, 1967), -nachlässiges Antworten (careless responding Meehl & Hathaway, 1946; Hathaway & Meehl, 1947) -konsistentes Antworten (Dillehay, Insko & Smith, 1966; Dillehay & Jernigan, 1970) oder auch -das Auslassen von Items (Cronbach, 1946). 85 PsycInfo weist von 1887 bis 2001 über 500 Einträge zum Suchbegriff acquiescence auf. · 98 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens entgegen der Merkmalsrichtung zu formulieren86. Das dahinterliegende Rationale ist offenbar: um einen hohen Wert auf der Gesamtskala zu erlangen genügt es nicht, alle Items zu bejahen. Da die Hälfte der Items umgepolt ist, würde die Auswertungsvorschrift konservativ zu einem mittleren Skalenwert führen. Dies gilt für das yeasaying ebenso wie für das naysaying. Diese Art der balancierten Skalenkonstruktion mag die Verzerrungen schon an sich mildern; darüber hinaus gibt es eine Reihe von Vorschlägen, wie die Antworttendenzen post hoc statistisch kontrolliert werden könnten (Webster, 1958; Paulhus, 1981; 1991; Paulhus, Bruce & Trapnell, 1995; Winkler, Kanouse & Ware, 1982 und die nachfolgende Polemik bei Ray, 1984a; 1984e). Nach der heißen Phase der Debatte über die mehr oder minder großen Gefahren von Antworttendenzen in den 1960er Jahren sind die Lager mittlerweile stark polarisiert. Leonard Rorer (1965) bezeichnete das Problem der Zustimmungstendenz radikal als Mythos. Wie auch immer man dazu stehen mag, das Balancieren von Einstellungsskalen ist ein anerkannter Kompromiß, da das Ergebnis mit und ohne Existenz von Antworttendenzen konservativ ist und mithin wenig Schaden entstehen kann. Die vorangegangenen Überlegungen zu Antworttendenzen vor allem unter Unsicherheit und Bedrohung legen nahe, daß es sowohl theoretisch begründet ist als auch empirisch sinnvoll sein wird, die Besonderheiten der positiven bzw. negativen Items a priori mit in das Meßmodell aufzunehmen. Die Ergebnisse der eigenen hier vorgestellten Studien zeigen deutlich das Problem der Zustimmungstendenz. Die RWA³D-Skala ist sowohl inhaltlich als auch formal balanciert. Von den 12 Items sind jeweils 6 positiv bzw. negativ formuliert (vgl. Abschnitt 5.2.3 S.138 ff.).87 Der Skalenwert der RWA³D korreliert deutlich (r=.28) mit der Differenz aus positiven und negativen Items. Noch höher ist der Zusammenhang mit den positiv formulierten Aussagen (r=.67). 86 Niedrige Itemantworten weisen auf eine hohe Ausprägung des zugrundeliegenden latenten Konstrukts hin. 87 »Negativ formuliert« heißt hier ausdrücklich nicht, daß die Items Satzkonstruktionen mit Verneinungen enthalten. Vielmehr ist es vonnöten, das konzeptionelle »Gegenteil« zu finden und dann positiv zu erfragen. Dies ist äußerst problematisch und bedarf eingehender Diskussion an anderer Stelle, da nicht immer klar ist, was das »Gegenteil« etwa von autoritärer Aggression oder autoritärer Unterwürfigkeit ist. · 99 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens Pearson Correlation global scale difference protraits contraits mean protraits-contraits protraits contraits .512** global scale mean .902** .832** difference protraits-contraits .669** -.295** .284** **. Correlation is significant at the 0.01 level (2-tailed). Tabelle 6: Zustimmungstendenz in den Studien mit der RWA³D Die orthogonale Struktur der Items mit drei zugrundeliegenden inhaltlichen Dimensionen und zwei formalen Gruppen (positiv vs negativ) erinnert an Multitrait- Multimethod-Designs. Strukturell lassen sich die Subdimensionen Autoritäre Aggressivität, Unterordnung und Konventionalismus als »Traits« i.S. des mtmm- Ansatzes verstehen, die positiv bzw. negativ formulierten Items bilden jeweils eine Methode zur Erfassung ein und desselben Traits. Aus diesem Grunde lassen sich in Analogie zum Vorgehen bei der Auswertung von mtmm-Matrizen auch ähnliche Auswertungsstrategien anwenden. Es gibt eine Reihe multivariater statistischer Methoden zur Auswertung von mtmm-Designs und Methodenfaktoren. Konfirmatorische Faktorenanalysen sind dafür in den 1990er Jahren aus gutem Grund zur via regia geworden (Millsap & Everson, 1993; Millsap, 1995; Schmitt & Stults, 1986; Wothke & Browne, 1990; Wothke, 1995; Eid, 2000) . Die Vorteile liegen auf der Hand: Mit Hilfe der CFA gelingt eine getrennte Evaluation der diskriminanten und konvergenten Validität bis auf die Itemebene, eine analytische Aufspaltung der Varianz in Trait-, Methoden- und Fehleranteile sowie eine Schätzung der schrumpfungskorrigierten (disattenuierten) Korrelation zwischen den Traits (Byrne & Goffin, 1993). Anwendungsbeispiele finden sich etwa im Zusammenhang mit Rosenbergs Selbstwertskala (Salgado & Iglesias, 1995; Tomás & Oliver, 1999; Marsh, 1996) oder Maskulinität und Femininität (Marsh, Antill & Cunningham, 1989). Den Vorteilen der ctcm88-Modelle stehen jedoch auch eine Reihe schwerwiegender Nachteile gegenüber. Für eine ausführlich Diskussion wird auf Eid (2000) verwiesen. 88 ctcm=Correlated-Trait-Correlated-Method · 100 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens Neben der Einführung von Methodenfaktoren in ein ctcm-Modell bietet sich eine weitere Modellklasse zur Berücksichtigung der Itemformulierung an: die sogenannten ctcu89-Modelle (Marsh, 1989; Marsh & Bailey, 1991; Marsh & Hocevar, 1988). Bei diesen Modellen wird die Diagonalität der Fehlermatrix aufgegeben und das Kovariieren aller Meßfehler jeweils einer Methode zugelassen. Für den vorliegenden Fall gäbe es daher drei ctcu-Modelle: zugelassene Fehlerkovarianz zwischen allen negativen (1) oder allen positiven Items (2) sowie schließlich die Kombination aus beiden Modellen (3)90. Ein entscheidender Unterschied zwischen ctcm- und ctcu-Modellen liegt in den Annahmen über die Dimensionalität der Methodenfaktoren und deren Zusammenhang untereinander. In ctcm-Modellen lassen sich Hypothesen über die Orthogonalität von Methodenfaktoren prüfen, was bei ctcu-Modellen nicht möglich ist. Letztere hingegen sind liberaler in der Annahme der Dimensionalität des Methodenfaktors. 91 Im vorliegenden Fall wird ein relativ rigides ctcm-Modell mit nur einem Methodenfaktor angepaßt, mit dem der Besonderheit der positiven bzw. negativen Items Rechnung getragen wird. Alle Ladungen von den negativen Items auf den Methodenfaktor wurden auf 1.0 fixiert, womit hier Eindimensionalität getestet wird. Empirisch wird dies wohl nicht das Optimum sein, allein die Definition des Methodenfaktors ist auf diese Weise wesentlich sauberer. Dieses Kriterium soll hier ausdrücklich im Vordergrund stehen. Es geht nicht um eine gute Modellanpassung um jeden Preis, sondern um eine methodisch sparsame und wohldefinierte Begründung adäquater Meßmodelle. Das nachfolgende Suchen von a posteriori verbesserten Modellen bleibt davon unberührt. 4.2.6. Inhaltsgeleitete Verbesserungen Die beiden vorangegangenen Abschnitte haben begründet, welche inhaltsfernen formalen Eigenschaften der Items sich mit Modifikationen des Meßmodells besser beschreiben lassen: aus theoretischer Sicht sollte ein kongenerisches Modell mit 89 ctcu=Correlated-Trait-Correlated-Uniqueness 90 Bei letzterem Modell gibt es häufig Identifikationsprobleme. 91 ctcm-Modelle bilden eindimensionale Methodenfaktoren ab, während ctcu-Modelle auch mehrdimensionale Methodenfaktoren erfassen können. · 101 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens Methodenfaktor die Kovarianzstruktur der Items besser beschreiben als strengere Meßmodelle ohne die Berücksichtigung eines Methodenfaktors. Das zentrale Anliegen dieser Arbeit ist selbstredend das Begründen und Prüfen alternativer Meßmodelle, die die inhaltliche Struktur der Items widerspiegeln. Wie an anderer Stelle ausführlich begründet, wird Autoritarismus als komplexes Konstrukt mit mehreren Facetten oder Subdimensionen verstanden. Die Aufgabe muß daher darin bestehen, ein Meßmodell vorzuschlagen, das sowohl das Gemeinsame der Items widerspiegelt (Autoritarismus) als auch der Besonderheit bestimmter Itemgruppen Rechnung trägt. Abbildung 5 (a) zeigt das Einfaktormodell, (b) symbolisiert durch die zugelassene Kovarianz der Fehlervarianzen das Gemeinsame der Items der Subdimensionen.92 In Analogie zur Begrifflichkeit der Multitrait-Multimethod-Debatte gilt es, die diskriminante Validität der einzelnen Subdimensionen zu zeigen. Die Konvergenz dürfte außer Frage stehen, weil durch die Erhebungspraxis implizit eine perfekte konvergente Validität unterstellt wird. Die hier vorgeschlagene Veränderung des Meßmodells ist augenfällig: dem einen erklärenden Konstrukt »Autoritarismus« werden alternativ drei latente Variablen gegenübergestellt, die jeweils eine der theoretischen Subdimensionen erklären. Der starken Gemeinsamkeit dieser Facetten wird Rechnung getragen, indem die Korrelation dieser Faktoren erlaubt wird. 92 Die RWA³D-Skala hat 12 Items. Zur Veranschaulichung genügen hier 6 Items, die jeweils zwei Items symbolisieren. Eine Aggregation impliziert das indes nicht. · 102 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens In Abwandlung des Modells in Abbildung 5 (b) wird für jede Subdimension ein latenter Faktor eingeführt. Dies ist eine äquivalente Darstellung der spezifischen Struktur mit zugelassenen Kovarianzen zwischen den Meßfehlern, ist jedoch für den hier vorliegenden Fall anschaulicher. _ _ _ c_ p _ c_ n _ _ _ c_ p _ c_ n rw a_ a_ p rw a_ a_ n rw a s_ p rw a s_ n rw arw arw a rw a_ a_p rw a_ a_n rw as_ p rw as_ n rw arw arw a Abbildung 5: Vom Einfaktormodell zum Dreifaktormodell _ _ _ c_ p _ c_ n _ a _ s _ c _ _ _ c_ p _ c_ n _ a _ s _ c .as .sc .ac rw a_ a_ p rw a_ a_ n rw a s_ p rw a s_ n rw arw arw arw arw a1.0 1.0 1.0 rw a_ a_ p rw a_ a_ n rw a s_ p rw a s_ n rw arw arw arw arw a Abbildung 6: Vom Einfaktormodell zum Dreifaktormodell Abbildung 6 verdeutlicht, daß es sich beim Einfaktormodell (a) und Dreifaktormodell (b) um geschachtelte Modelle handelt. Das Einfaktormodell ist ein strenger Spezialfall des Dreifaktormodells insofern, als bei ersterem die Korrelationen zwischen den latenten Konstrukten als 1.0 unterstellt werden. Diese Restriktion wird beim Dreifaktormodell (b) relaxiert. · 103 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens Gleichzeitig muß unterstrichen werden, daß das Dreifaktormodell nicht allzu libe- ral ist. Letztlich ist die kategorische Zuordnung der Items zu einem und nur einem Faktor von einer gewissen Ausschließlichkeit. Sekundärladungen der Items auf an- dere Faktoren sind explizit ausgeschlossen; die Assoziation aller Items wird ledig- lich über die latenten Konstrukte und deren Kovarianz vermittelt. 4.3. Synthese der a priori Modifikationen Die herkömmliche Praxis der Auswertung der RWA (und anderer Skalen zur Ein- stellungsmessung und Persönlichkeitsdiagnostik) besteht in einer Mittelwerts- oder Summenbildung. Beiden Methoden sind drei strenge und nicht explizierte An- nahmen gemein (Tabelle 7 linke Spalte).93 Den genannten impliziten Setzungen der Mittelwertsbildung entspricht am ehes- ten ein Paralleltestmodell (1) ohne Methodenfaktor (2) und lediglich einer zugrun- deliegenden latenten Variablen (3). Dieses Meßmodell soll daher als Referenzmo- dell der herkömmlichen zu kritisierenden Praxis dienen. 93 Die genaue »Übersetzung« der Mittelwerts- bzw. Summenbildung in Strukturgleichungsmodelle gelingt durch das direkt formative Modell (vgl. 4.2.3.2 S.89 ff.), bei dem alle Items fehlerfrei eine latente Variable perfekt »erklären« und dabei kovariieren dürfen. Die latente Variable ist dabei endogen und lediglich eine Linearkombination aus den formativen Indikatoren. Durch die zugelassene Kovariation zwischen den Indikatoren ist das Modell jedoch gesättigt, hat keine Freiheitsgrade und ist damit nicht testbar. Es paßt immer perfekt. · 104 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens Aus dem Gesagten folgen zwingend die drei Modifikationsrichtungen (Tabelle 7 rechte Spalte): Implizite Setzungen Abgeleitete der herkömmlichen Praxis Modifikationsrichtungen 1. Alle Items sind gleichwertige Indikatoren für das zu Messende. Sie gehen somit ungewichtet und meßfehlerfrei ein. Es wird eine Gewichtung der Items eingeführt und der zufällige Meßfehler in das Meßmodell einbezogen. 2. Alle Items messen dasselbe, auch wenn sie beim Auswerten umgepolt werden. Der Kodierrichtung der Items wird durch Einführen eines Methodenfaktors Rechnung getragen. 3. Das Gemeinsame aller Items läßt sich Die Kovarianzstruktur der Items wird mit lediglich einem Faktor beschreiben. durch drei korrelierte Faktoren statt durch lediglich einen erklärt. Tabelle 7: Herkömmliche Mittelwertsbildung und Modifikationslinien In der Modifikationsrichtung der Mikroebene des Meßmodells werden das kongenerische, t-äquivalente und das Paralleltestmodell verglichen (3 Stufen). Alle Modelle werden sowohl ohne als auch mit (einem) Methodenfaktor angepaßt (2 Stufen). Schließlich werden jeweils Dreifaktormodelle gegen das Einfaktormodell getestet (2 Stufen). Entlang dieser abgeleiteten Modifikationslinien lassen sich demnach 12=3×2×2 alternative Meßmodelle gegeneinander vergleichen (vgl. Abbildung 10). Die systematische Ableitung der Modifikationen führt zu einer dreidimensionalen hierarchischen Schachtelungs- oder Nestungsstruktur der zwölf Modelle. Diese ist notwendig, um Modellvergleiche mittels des .²-Differenzentests durchführen zu können. Alle Modelle jeweils einer Modifikationslinie folgen dieser Struktur: Alle t-äquivalenten Meßmodelle sind ceteris paribus Spezialfälle der liberalen kongenerischen Modelle insofern, als sie die Gleichheit der Ladungen fordern. Die Paralleltestmodelle fordern zusätzlich die Gleichheit der Fehlervarianzen und sind somit Spezialfälle sowohl der t-äquivalenten als auch der kongenerischen Modelle.94 94 In Abgrenzung zu den theoretischen Modellen nenne ich die empirisch zu prüfenden nicht t-äquivalent, sondern .-äquivalent. · 105 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens lliill Mikro eb en e des Meßm o des restriktiver eta-ko n g en ersc h e ta-äqu v ae n t paralle Abbildung 7: Nestungsstruktur Mikroebene des Meßmodells Sinngemäßes gilt für die Modifikationslinie, die die Anzahl der Faktoren variiert. Diese Veränderung läßt sich als Festsetzung der Kovarianzen . zwischen den drei latenten Faktoren auf 1.0 schreiben. Somit wird deutlich, daß die Einfaktormodelle – wiederum ceteris paribus – Spezialfälle der hier diskutierten Dreifaktormodelle und daher in diese geschachtelt (nested) sind (Abbildung 8). lliiilllMak ro e b en e d e s Meß m o d es re strk tv er Dre fak to rm o d e Ein fak to rm o d el Abbildung 8: Nestungsstruktur hinsichtlich der Anzahl der Faktoren · 106 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens Schließlich sind die alternativen Modelle auch entlang der dritten Modifikationslinie geschachtelt. Dies ist etwas schwieriger zu erkennen; intuitiv würde man Modelle mit Methodenfaktoren als Spezialfälle von Modellen ohne Methodenfaktoren erwarten. Umgekehrtes ist der Fall: Die Modelle mit Methodenfaktoren sind liberaler, da die Varianz des Methodenfaktors frei geschätzt wird. Die Absenz des Methodenfaktors läßt sich hingegen augenfällig als Methodenfaktor mit der Varianz 0 schreiben. ) (!) (!) (!) oh n e (! Me th o den faktor mitMeth o den fakto r ohn e M eth oden faktor mitM eth odenfaktor Abbildung 9: Nestungsstruktur hinsichtlich der Methodenfaktoren Synthetisiert man die Nestungsstrukturen der verschiedenen Modifikationslinien, so gelangt man zur Systematik aller 12 hier diskutierten alternativen Meßmodelle ( Abbildung 10). Neben den offensichtlichen 20 direkten Nestungsbeziehungen95 gibt es weitere, die sich durch Transitivität erklären. Dabei ist bemerkenswert, daß die Nestung auch über mehrere der hier so genannten Modifikationslinien hinweg gilt96. 95 Pfeile in der Abbildung 96 Hier erweist sich der praktische analytische Nutzen der hier vorgestellten Systematik. Will man bspw. wissen – weil man die Modelle mit dem .²-Differenzentest vergleichen will – ob etwa das .-äquivalente Einfaktormodell ohne Methodenfaktor unter das kongenerische Dreifaktormodell mit Methodenfaktor geschachtelt wäre, so überprüft man, ob sich ein Pfad zwischen den Modellen ziehen läßt. Dies ist im genannten Beispiel der Fall, nicht jedoch bspw. zwischen dem .-äquivalenten Einfaktormodell ohne Methodenfaktor und jedem der vier kongenerischen Modelle. · 107 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens lliiiohne ilohne ivalohne lliiiivall ill ohne l ohne illllMakroeb en e des Meßm o des restrktver eta-ko n gen e rsch M eth oden faktor eta-äquvaent Meth o den fakto r eta-äquen t M eth oden faktor M ikroeb ene des M eßm odes restrktver eta-ko n gen ersch eta-äquent paralleDrefakto rm o deM eth oden fa k tor Ein faktorm odelM eth odenfak tor Drefakto rm o deEinfaktorm ode Abbildung 10: Systematik der alternativen Meßmodelle Zwei Modelle sind von den anderen deutlich verschieden: ausnahmslos alle weiteren elf Modelle sind unter das kongenerische Dreifaktormodell mit Methodenfaktor genestet. Das andere Extrem wird durch das einfaktorielle Paralltestmodell ohne Methodenfaktor gebildet, unter welches nicht eines der elf weiteren Modelle geschachtelt ist. Während ersteres97 das hier vorgeschlagene theoretisch begründbare Optimum darstellt, kommt letzteres98 der herkömmlichen Mittelwerts- oder Summenbildung am nächsten (Abbildung 11)99. 97 Oben links vorn. 98 Unten rechts hinten. 99 Alle Fehler- bzw. Residualterme sind in der Darstellung weggelassen. · 108 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens _ a _ s_ p _ _ c_ p _c_n mf _ c rw a_ a_ p rw a_ a_ n rw arw arw as_ n rw a_ s rw arw arw a Abbildung 11. Theoretisch begründetes optimales Meßmodell So sind die hier vorgeschlagenen und geprüften alternativen Modelle mitnichten willkürlich ausgewählt, sondern befinden sich sämtlich im Spannungsfeld, das durch die beiden Extreme aufgespannt wird. 4.4. Weitere Elaboration des Meßmodells Das nunmehr vorgeschlagene Modell (Abbildung 11) berücksichtigt die Kodierrichtung der Items durch einen Methodenfaktor und trägt zudem der inhaltlichen Struktur Rechnung, indem drei korrelierte (oblique) Faktoren statt nur eines eingeführt wurden. All diese latenten Variablen sind Faktoren erster Ordnung. Es kann jedoch im Interesse einer besseren Interpretierbarkeit sinnvoll sein, weitere alternative Modelle in Betracht zu ziehen. Hierbei geht es ausdrücklich nicht um ein datengetriebenes, fetischistisches und theorieloses Anpassen (overfitting, »post hockery«100). Im Blickpunkt stehen theoriegeleitete Umformulierungen, die teilweise gar mathematisch äquivalent sind. 4.4.1. Faktor zweiter Ordnung Die Korrelation der drei inhaltlichen Faktoren könnte alternativ durch einen zugrundeliegenden Faktor zweiter Ordnung erklärt werden. 100 Vgl. http://bama.ua.edu/cgi-bin/wa?A2=ind0109&L=SEMNET&P=R3075 · 109 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens Das faktoranalytische Modell zweiter Ordnung (Abbildung 12) unterstellt a priori, daß 1. die Zusammenhangsstruktur der Items der RWA³D durch drei korrelierte Faktoren sowie einen Faktor höherer Ordnung zu erklären ist, 2. jedes Item eine von 0 verschiedene Ladung auf einem der Faktoren sowie Null-Ladungen auf den jeweils anderen Faktoren hat, 3. die Fehlervarianzen unkorreliert sind, sowie die Kovariation der drei Fak- toren erster Ordnung vollständig durch ihre Regression auf einen Faktor zweiter Ordnung erklärt wird. _ a _ _ _ s _ c_ p _ c_ n mf _ c rw a_ a_ p rw a_ a_ n rw arw as_ p rw as_ n rw arw arw arw a rw a Abbildung 12: Modell zweiter Ordnung Dieses Modell entspricht weitgehend dem intuitiven Verständnis eines zugrundeliegenden Konstrukts »Autoritarismus«, das sich in drei Unterformen aufspaltet und zugleich deren Gemeinsames symbolisiert. Bei drei Faktoren erster Ordnung stellt das Einführen eines Faktors zweiter Ordnung lediglich eine äquivalente Umformung dar. Das Modell ist gerade identifiziert, so daß der Anpassungstest nicht die Struktur zweiter Ordnung prüfen kann. Dies wäre erst bei vier latenten Konstrukten auf der ersten Ebene möglich. Es läßt sich dann zeigen, daß das Modell mit Faktoren zweiter Ordnung ein Spezialfall des group-factor-model mit mehreren korrelierten Faktoren erster Ordnung ist. 4.4.2. Generalfaktor Ganz Ähnliches wird durch das Generalfaktor- oder Bi-Faktor-Modell beschrieben: Das Gemeinsame der Itemantworten ist auf ein zugrundeliegendes Konstrukt · 110 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens zurückzuführen (»rwa« in der Abbildung 13 oben links). Zusätzlich zu diesem Generalfaktor »Autoritarismus« wird Restvarianz durch drei spezifische Faktoren erklärt (rechts in Abbildung 13). _ a _ _ s_ n _ s _ c_ p _ c_ n mf _ c rw a_ a_ p rw a_ a_ n rw arw as_ p rw arw arw arw arw arw a Abbildung 13: Modell mit Generalfaktor Unter bestimmten Bedingungen sind das vorgenannte Modell zweiter Ordnung (Abbildung 12, S.110) und das Generalfaktormodell äquivalent, wie sich leicht zeigen läßt. Auf den Beweis wird hier verzichtet (weiterführend: Rindskopf & Rose, 1988; Mulaik & Quartetti, 1997; Yung, Thissen & McLeod, 1999). Angesichts der hierarchischen Überführbarkeit der einzelnen Modelle und der Äquivalenz, die bei bestimmten Restriktionen gilt, stellt sich die Frage nach dem Sinn. Diese läßt sich jedoch faßlich mit dem Hinweis beantworten, daß hierdurch die Möglichkeit eröffnet wird, die Modellauswahl nicht nach statistischen, sondern nach theoretisch plausiblen und modellökonomischen Kriterien zu treffen. 4.4.3. Alternative Ansätze zur Modellierung der Kodierrichtung der Items In den bisherigen Modellen wurde der Kodierrichtung der Items dadurch Rechnung getragen, daß ein zusätzlicher Faktor die Gemeinsamkeit der entgegen der Merkmalsrichtung formulierten Items und gleichzeitig deren (gemeinsamen) Unterschied zu den positiv formulierten protraits beschreibt. Dieser Faktor ist mit je- · 111 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens weils gleichen Ladungen mit den Indikatorvariablen assoziiert, was seine wohldefinierte Interpretierbarkeit garantiert. 4.4.3.1. Kongenerische Methodenfaktoren Empirisch mag sich jedoch diese Gleichheitsrestriktion der Ladungen nicht halten lassen. Sehr wahrscheinlich ließe sich durch Liberalisierung der Ladungen die globale Modellanpassung verbessern. Dies geschähe jedoch um den Preis der sauber begründeten Interpretierbarkeit. 4.4.3.2. Korrelierte Methodenfaktoren Die Verwendung zweier Methoden (nämlich positiv und negativ formulierter Items) zur Erfassung eines Konstrukts (in diesem Falle Autoritarismus) hätte in den klassischen Ansätzen zur Multitrait-Multimethod-Auswertung (mtmm) zwei Methodenfaktoren impliziert (4.2.5.2, S. 97ff.). Es liegt jedoch neben weniger offensichtlichen statistischen Problemen zumindest ein inhaltliches auf der Hand: Es ist bei der Interpretation ungeklärt, worin der Unterschied zwischen Trait und Methode besteht. Auf abstrakter, struktureller Ebene ist dies nicht entscheidbar (vgl. auch Eid, 2000). Bei den hier vorliegenden zwei »Methoden« (m=2) und der von Kenny und Kashy (1992) sowie in elaborierter Weise von Eid (2000) vorgeschlagenen Verwendung von m-1 Methodenfaktoren ist die Frage zugelassener oder ausgeschlossener Kovarianz zwischen den Methdodenfaktoren irrelevant, da es nur einen gibt. Bei mehr als zwei Methoden gäbe es hier jedoch weiteren Gestaltungsspielraum. 4.4.3.3. Korrelierte Meßfehlervarianzen – CTCU In der Literatur zur Auswertung von mtmm-Daten mit Hilfe von Strukturgleichungsmodellen wird ein alternativer Ansatz diskutiert, der die bekannten Probleme mit korrelierten Methodenfaktoren überwinden soll. Bei diesem correlated trait/correlated uniqueness Modell (ctcu) mit der Modellgleichung Yij = ..i +eij [4.20] ij gilt neben der Annahme korrelierter Traits .i, daß alle Fehlervarianzen eijmit gleichem Index i untereinander korrelieren dürfen (Kenny & Kashy, 1992; Marsh & Grayson, 1995; Eid, · 112 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens 2000). Diese Modelle konvergieren meist in zulässige Lösungen mit akzeptablem Fit. Da es jedoch keine Methodenfaktoren gibt, lassen sich keine Modellvarianten testen, die die Korrelation der Methodenfaktoren thematisieren (4.4.3.2 Korrelierte Methodenfaktoren). Zudem ist die systematische (Methoden)Varianz nicht von der unspezifischen Meßfehlervarianz zu scheiden, sondern vielmehr mit dieser konfundiert. ctcu-Modelle sind demgemäß zwar meist eine gute Annäherung an die Daten; dies wird jedoch damit erkauft, daß die Modelle inhaltlich schwerer interpretierbar und die mehrdimensionalen »Methodenfaktoren« nicht wohldefiniert sind. 4.4.3.4. Sechs Faktoren Es sind hinsichtlich der Übertragbarkeit des Methodenfaktorkonzepts auf die hier diskutierte konkrete Meßsituation Bedenken angezeigt: 1. Methodenfaktoren werden bei Mehrfachmessungen eingeführt, um den als jeweils über die Zeit gleichbleibend unterstellten Unterschied zwischen Methode A und Methode B abzubilden. Das Rationale hinter der Analo- gieunterstellung besteht darin, daß mit den drei verschiedenen Dimensio- nen drei Mal Autoritarismus gemessen würde (Meßwiederholung) und zwar jeweils mit positiv und negativ formulierten Items (Methoden). Diese Argumentation bricht an der starken Annahme, daß (a) dreimal Selbes gemessen würde und (b) der Unterschied zwischen protraits und contraits gleich bliebe. Beides ist infrage zu stellen. 2. Die Interpretation der Methodenfaktoren wird wesentlich vereinfacht, wenn diese als unkorreliert mit den fokalen Konstrukten angenommen werden. Diese Unabhängigkeit könnte sich jedoch in dem hier vorliegen- den Falle als empirisch nicht haltbar erweisen. Man stelle sich beispielswei- se vor, daß ein Teil der Methodenvarianz dadurch zustande kommt, daß einige negativ formulierte Items aufgrund komplizierter grammatischer Struktur »nicht richtig« verstanden und daher anders beantwortet werden, als die Befragten es eigentlich intendierten. Dieses »Falschverstehen« dürfte mit Intelligenz korrelieren, diese mit dem Bildungsniveau, und dieses sei- nerseits mit Autoritarismus (Evidenz für letzteres z.B. bei Vollebergh, 1994; Schuman, Bobo & Krysan, 1992; Sidanius, 1984; Hesselbart & Schuman, 1976). Im Ergebnis dieser Mediationskette ist es durchaus sinn- · 113 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens voll, eine Korrelation zwischen dem »Methodenfaktor« und Autoritarismus anzunehmen. Die Interpretation des »Methodenfaktors« mit Rückgriff auf das Problem von Antworttendenzen würde ebenfalls eine solche Korrelation erklären, da Zustimmungstendenz der autoritären Unterordnung wesensverwandt ist. Die genannten Probleme legen eine weitere Strategie nahe: Die Kovarianzstruktur zwischen den zwölf Items ließe sich durch sechs (3×2) oblique Faktoren beschreiben, jeweils einen pro Subdimension und pro Kodierrichtung. rwa_c_n rwa_a_n1 rwa_a_n2 rwa_a_n rwa_s_n1 rwa_s_n2 rwa_s_n rwa_c_n1 rwa_c_n2 rwa_a_p1 rwa_a_p2 rwa_a_p rwa_s_p1 rwa_s_p2 rwa_s_p rwa_c_p1 rwa_c_p2 rwa_c_p protraits contraits Abbildung 14: Konzeptuelles Meßmodell mit 6 Konstrukten Dies wäre gewiß ein gut angepaßtes Modell mit wohldefinierten latenten Variablen (z.B. RWA_S_p: »Submissivität«, oder RWA_C_n: »Ablehnung rigider Konventionen «). Aus inhaltlicher Sicht sind diese sechs Dimensionen jedoch in ihrer Interpretierbarkeit eher unhandlich. Der Nutzen durch höhere Auflösung bei der Messung würde mit dem Preis schlechter Kommunizierbarkeit erkauft. · 114 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens 4.5. Exkurs: Ein bislang ignoriertes Problem »You can't see the dust if you don't move the couch.« (Reis & Judd, 2000) Es wurden in den vorangegangenen Abschnitten Meßmodelle theoretisch abgeleitet und systematisiert, als gäbe es eine klare Zuordnung der Items zu theoretischen Subskalen. Dies ist jedoch in der originalen RWA von Altemeyer (und folglich in den Adaptationen RWA96 und RWA98 von Funke) keineswegs der Fall. Selbst wenn die Zuordnung theoretisch möglich wäre, müßte ein empirischer Weg gefunden werden, um diese Entscheidung herbeizuführen. Die folgenden Ausführungen widmen sich diesem Problem. 4.5.1. Inhaltliche Evaluation der semantischen Struktur der Items In der quantitativen Methodik vertraut man darauf, Ähnlichkeiten (etwa zwischen Items) durch Korrelationen zu finden und diese auf höherer Analyseebene (Faktoranalysen) auszuwerten. Qualitativ inhaltsanalytische Ansätze sind aus ideologischen Gründen verpönt, was schwer verständlich und Außenstehenden kaum zu erklären ist. 4.5.1.1. Ansatz von Eigenberger Um so interessanter ist die Arbeit von Marty Eigenberger (1998), in der er die Aussagen der RWA (Altemeyer, 1996) einer philosophisch-analytischen Perspektive unterwirft.101 Jedes Item wird dahingehend untersucht, welche Subdimension(en) in der Proposition angesprochen wird/werden und welcher Art der Zusammenhang zwischen der Beantwortung des Items und der dahinterliegenden Psychodynamik sein mag. Darüber hinaus werden Mehrdeutigkeiten identifiziert und die Folgen für die Beantwortung der Items diskutiert. 101 Leider hat die Arbeit wahrscheinlich nur geringe Verbreitung gefunden. Mir lag sie nur als Mikrofiche von ERIC vor (ED 367 674/TM 021 112). · 115 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens Exemplarisch zitiere ich in gebotener Ausführlichkeit die Evaluation des Items 12 (»Gehorsam und Achtung vor der Autorität sind die wichtigsten Tugenden, die Kinder lernen sollten.«), das bereits in der F-Scale enthalten war (vgl. auch p_s_30 in der RWA96 und rwa6sp in der RWA³D). Eigenberger führt dazu aus: [this item] taps: submission. This is a categorical proposition linking ›all children‹ with the exclusive category of ›most important virtue‹. Logically, this proposition cannot be qualified in a scaled, Likert-type response. The ›most‹ of a class (in this case, ›virtue‹) and the ›all‹ of a class (in this case, all ›children‹) are exclusive categories that do not admit of degrees or par- tiality. One cannot be the ›mostly the most‹ of something, or ›partially the all‹ of something. […] At any rate, agreement is indicative of the importance, in the mind of the authoritarian person, of submission to external controls and of instilling in chil- dren the presumption of the fundamental rightness of external authority over and above self-derived opinions. (Eigenberger, 1998, S.11) Bei diesem Item ist relativ unstrittig, daß damit Unterwürfigkeit/Submission erfaßt wird. Eigenbergers Verdienst besteht jedoch vor allem im sprachanalytischen Charakterisieren von Items, die zwei oder gar drei Subdimensionen erfassen. Diesen Fall findet er bei Item 28 (»Was unser Land wirklich braucht, ist ein starker, entschlossener Kanzler, der das Übel zerschlagen und uns wieder auf unseren rechten Weg bringen wird.«, vgl. auch p_a_21 in der RWA96, rwa8ap102 in der RWA³D). Er führt dazu aus: 102 Ich muß einräumen, daß ich auf der Basis von Gruppendiskussionen und Expertenevaluation das Item explizit der Dimension »Aggression« zugeordnet hatte, da ein deutlicher Bezug zu hart durchgreifenden Führerpersönlichkeiten besteht. In unserer Einschätzung thematisiert dieses Item die Stellvertretergewalt. Eigenberger argumentiert auch auf diese Weise, erinnert aber auch zu recht an den dialektischen Zusammenhang mit Unterordnung (unter diesen Führer) und konventionellem Festhalten am »rechten Weg«. · 116 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens [this item] taps: submission, aggression and conventionalism. This statement carries an appeal for a deindividuating absorption into the will of an- other personality. Agreement with such a proposition, in addition to submissiveness, implies that the respondent knows the ›evil‹ to be crushed and the ›true path‹ that soci- ety must follow. Agreement may indicate a desire to abdicate personal responsibility for obedience to external authority. This is one of the most ›Hitleresque‹ appeals in the survey. […] Since he [the authoritarian – FF.] believes he has no individual ability to realize power and status, the authoritarian may attempt to purchase an association with powerful others by offering a blank check of alliance, which those in authority can cash for some form of aggression currency or ›dirty deeds‹. E.g., ›Cristal Night‹, ›Night of The Long Knives‹, ›Watergate‹; or the more mundane acts of resenting an perhaps attacking, homosexuals, environmental activists and other unconventional types […]. (Eigenberger, 1998, S.22) Eigenbergers Aufsatz ist hilfreich in zweierlei Hinsicht: der konkrete Nutzen besteht in der Möglichkeit, gestützt auf seine Wertungen der Items ein Meßmodell mit Doppelladungen für die double-barrelled items aufzustellen. Dies impliziert das Lesen seines Beitrags als Expertenmeinung, die in Beziehung zu anderen entscheidungsleitenden Quellen gesetzt werden kann. Über diesen konkreten Nutzen hinaus ist Eigenbergers Methode von großem Wert; ihre Anwendung dürfte auch bei anderen Skalen vonnöten sein, gerade weil sie so trivial klingt. 4.5.1.2. Ansatz von Turner In völlig anderem Zusammenhang und mit anderer Zielsetzung hinterfragte John Turner Ende der 1990er Jahre den semantischen Gehalt der Items der RWA-Skala. Zur Qualifizierung seiner Kritik am persönlichkeitspsychologischen Fokus der Autoritarismusforschung wies er darauf hin, daß die Items (zumindest implizit) dichotome Gegenüberstellungen verschiedener sozialer Kategorien beinhalten. 103 Turners Mitarbeiterin Katherine Reynolds verfolgte diesen Gedanken systematisch (Reynolds et al., 2001): 103 Paper presented at the 2nd Jena Workshop on Intergroup Processes, Großkochberg, June 1999. · 117 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens […] a number of items specifically refer to beliefs about the appropriate relationship between younger and older people in society […]. Many of the items also involve comparisons between males and females […]. At least six items in the RWA scale are relevant to national identity and support for nationalistic sentiments […]. Finally seve- ral items focus on religious versus nonreligious beliefs […]. (Reynolds et al., 2001, S. 429f.) Die Beobachtungen und inhaltlichen Systematisierungen, auf die sich die Australier hier stützen, sind durchaus bemerkenswert und richtig. Ihr theoretischer Ansatz zur Integration ihrer Self Categorization Theory (Turner et al., 1987; Turner & Oakes, 1989; Haslam, Oakes & Turner, 1996; Haslam, Oakes, Reynolds & Turner, 1999) mit der persönlichkeitszentrierten Autoritarismusforschung ist vielversprechend, wenngleich nicht Gegenstand dieser Diskussion. So richtig die Beobachtung ist, daß in den Items der RWA Scale verschiedene Gruppen bzw. soziale Kategorien angesprochen sind, so sehr unterliegen die Autorinnen und Autoren der Gefahr, dies in ihrer Kritik überzubewerten. Dieser Umstand ließe sich auch leicht mit der Trivialität erklären, daß der Gegenstandsbereich der RWA in der Sozialen Welt liegt, die selbstverständlich durch verschiedenste soziale Kategorien charakterisiert ist. Hinzu kommt, daß es wesentlich zur Phänomenologie des/der Autoritären gehört, die Welt in »wir« und »die« einzuteilen, sich mit machtvollen Ingroups (»wir«) zu identifizieren sowie »die anderen« (outgroups) abzuwerten. Diese überzogene Kritik verdeutlicht m.E. nicht die Überlegenheit der sozialpsychologischen SCT gegenüber altmodischen personenzentrierten Ansätzen, bietet jedoch – optimistisch gewendet – vielversprechendes Potential zu einer Integration beider Denkschulen, die soweit nicht entfernt sind voneinander. 4.5.2. Quantifizierender Ansatz zur Evaluation der Items Neben der theoretisch-inhaltlichen Analyse der Items wurde von mir ein Weg gesucht, die Zuordnung der Items zu dieser oder jener Subdimension empirisch zu begründen. Gleichzeitig sollte das Urteil quantifiziert werden sowie auf der Entscheidung mehrerer »Experten« beruhen. · 118 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens 4.5.2.1. Auswahl von 1 aus 3 Zunächst wurden dazu etwa 15 Seminarteilnehmer (»Experten«) gebeten, eine eindeutige Zuordnung jedes Items zu ausschließlich einer Dimension vorzunehmen; mithin ging es um die Beantwortung der Frage »Erfaßt dieses Item am ehesten Aggressivität oder Submissivität oder Konventionalismus?«. Erfaßt dieses Item am ehesten 1. Aggressivität oder 2. Submissivität oder 3. Konventionalismus? Um all die Unruhestifter, Kriminellen und Abweichler zur Ordnung zu bringen, wird jede Menge »starker Medizin« nötig sein. Es ist großartig, daß die jungen Leute heutzutage größere Freiheiten haben, »ihr eigenes Ding zu machen« und gegen Dinge zu protestieren, die sie nicht mögen. Was wir in unserem Land wirklich brauchen, ist eine anständige Portion Recht und Ordnung anstatt mehr »Bürgerrechte« autoritäre Aggression autoritäre Unterordnung Konventionalismus »gutes Item« ; . . . . ; . . . . . . ....... ......; Tabelle 8: Expertenevaluation 1 aus 3 Eine notwendige Unterstellung wäre hierbei die Disjunktheit der Mengen A, S und C, also die Überschneidungsfreiheit (AnSnC=Ø) wie in der schematischen Darstellung in Abbildung 15. · 119 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens iA iC iS Aggressvität Konventonalismus Submssivität Abbildung 15: Schematische Darstellung der Expertenevaluation 1 aus 3 Mit anderen Worten impliziert dieses Vorgehen, daß jedes Item (konsensuell) einer und genau einer der Subdimensionen zugeordnet werden könne. Dies ist ebenso wünschenswert wie es jedoch auch unwahrscheinlich ist. 4.5.2.2. Auswahl von 1 aus 6 In einer zweiten Voruntersuchung mußte eine von 6 (bzw. 8) Möglichkeiten gewählt werden. Neben den Prototypen (A, S, C) standen die Mischtypen AS, AC und SC zur Auswahl. Die siebte und achte Alternative stünde für Items zur Auswahl, die zur Erfassung aller drei (ASC) bzw. keiner der Subdimensionen (0) geeignet wären. A AS C SC AC S A AS C SC AC S Abbildung 16: Schematische Darstellung der Expertenevaluation 1 aus 6 Wesentlicher Vorzug dieses Vorgehens ist die eindeutige Zuordnung jedes Items zu einem Typus, der hinreichend »hochauflösende« Informationen enthält, ohne · 120 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens jedoch unübersichtlich zu werden. Dieses Verfahren erbringt hingegen keine Information darüber, wie gut das Item mißt; es erlaubt lediglich Aussagen darüber, was es (nicht) mißt. Mögliche Prototypen wären dann Tabelle 9 zu entnehmen. autoritäre Aggression autoritäre Unterordnung Konventionalismus Reines Aggressivitätsitem 1 0 0 A Reines Submissivitätsitem 0 1 0 S Reines Konventionalismusitem 0 0 1 C zweifacher Mischtyp 1 1 0 AS zweifacher Mischtyp 1 0 1 AC zweifacher Mischtyp 0 1 1 SC dreifacher Mischtyp 1 1 1 ASC Nicht zuordenbar 0 0 0 - Tabelle 9: Prototypische Items der Expertenevaluation 1 aus 6 4.5.2.3. Unabhängiges Rating Schließlich wurde ein Vorgehen gewählt, das zwar aufwendig ist, den Urteilern jedoch die analytische Trennung erleichtert. Jedes der Items sollte dahingehend bewertet werden, wie gut es zur Messung der einzelnen Dimensionen geeignet sei (»Wie gut eignet sich das Item zur Messung von ...«, Skala von 0-4). Die Vorteile dieser Methode sind augenscheinlich. Durch die unabhängige Bewertung können sich die Bewertenden genauer auf das Konstrukt konzentrieren, das gerade im Fokus ist. Auf dieser einzigen Bewertungsdimension legen die Bewertenden nun einen Wert fest, der die »Güte« dieses Items hinsichtlich der Bewertungsdimension beschreibt. Somit war jedes Item durch ein Tripel von Urteilen charakterisiert. · 121 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens In Analogie zu Tabelle 9 illustriert folgende Übersicht das Ideal der Prototypen.104 autoritäre Aggression 4 autoritäre Unterordnung 0 Konventionalismus 0 Zeilensumme 4 0 4 0 4 0 0 4 4 4 4 0 8 4 0 4 8 0 4 4 8 4 4 4 12 0 0 0 0 Reines Aggressivitätsitem Reines Submissivitätsitem Reines Konventionalismusitem zweifacher Mischtyp zweifacher Mischtyp zweifacher Mischtyp dreifacher Mischtyp Nicht zuordenbar Tabelle 10: Prototypische Items der Expertenevaluation 1 aus 6 Wünschenswert wäre für das weitere Vorgehen, einen Index zu bilden, der die theoretisch begründbare Rangfolge der Items homomorph in den Bereich der rationalen Zahlen abbildet. Wie man zeigen kann, leistet die Zeilensumme diese Aufgabe nicht. Zwar läßt sich der Qualität eines Items (genauer gesagt der Prototypen) eindeutig ein Wert zuordnen, umgekehrt jedoch läßt sich von diesem Wert nicht auf die Qualität schließen. Es mußte ein Index gefunden werden, der sein Maximum jeweils genau dann erreicht, wenn eine der Dimensionen sehr hoch bewertet wird, die beiden anderen jedoch sehr niedrig. Daher wurden »aus der Perspektive« jeder Dimension die Abstände zu beiden anderen Dimensionen berechnet [4.21]. 104 Tatsächlich handelt es sich im Stichprobenmittel jedoch um gebrochene Zahlen, deren Wertebereich von 0 bis 4 reicht. · 122 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens distA =(a - s)+(a - c) = 2a - (s +c) distS =(s - a )+(s - c) [4.21] = 2s - (a +c) distC =(c - a)+(c - s) = 2c - (a +s) Es leuchtet unmittelbar ein, daß diese Distanzen ein informatives Maß darstellen; das optimale A-Item [4;0;0] erhält nach der Transformation die Werte [8;-4;-4]. In einem weiteren Schritt lassen sich die Itemqualitäten mit Hilfe von dreieckigen Graphen symbolisieren (Abbildung 17). DistA -8.00 -6.00 -4.00 -2.00 0.00 2.00 4.00 6.00 8.00 DistS DistC C-Typ AC-Mischtyp ungeeignetes Item Abbildung 17: Symbolisierung der Itemqualitäten durch Dreiecke Relativ reine Items führen zu sehr spitzwinkligen Dreiecken, Mischtypen werden durch gleichschenklige Dreiecke symbolisiert. Gleichseitige Dreiecke sind ungeeignet, da diese Items alle drei Dimensionen zu gleichen Teilen enthalten. Aufgrund der bisherigen theoretischen Überlegungen wurden mehrere Experten gebeten, die Items jeweils nach ihrer Fähigkeit zu beurteilen, die einzelnen Dimensionen zu erfassen. Diese Urteile wurden aggregiert und als Grundlage der Dreiecksplots in Abbildung 18 verwendet. Greift man hier auf die originalen Ratings von 0 bis 4 zurück, so kollabieren die Idealtypen zu Linien. · 123 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens rwa1 rwa2 rwa3 rwa4 rwa5 rwa6 rwa7 rwa8 rwa9 rwa10 rwa11 rwa12 rwa13 rwa14 rwa15 rwa16 rwa17 rwa18 rwa19 rwa20 rwa21 rwa22 rwa23 rwa24 rwa25 rwa26 rwa27 rwa28 rwa29 rwa30 rwa31 rwa32 rwa33 rwa34 Ideal A Ideal S Ideal C AS SC AC Abbildung 18: Die inhaltliche Gewichtung der RWA-Items im Expertenurteil Plottet man die Distanzratings der einzelnen Items in einen dreidimensionalen Raum, so lassen sich etwaige Ungleichgewichte oder inhaltliche Akzentuierungen der RWA-Skala erkennen (Abbildung 19 Seite 125 105 , vorgreifend auch schon Tabelle 15, S.129). An dieser Stelle zeigt sich die Überlegenheit der gewählten Distanztransformation: in deren Ergebnis liegen alle Datenpunkte in einer Ebene und sind dadurch bereits durch zwei statt drei Dimensionen vollständig festgelegt. Die Ebene wird durch die Dreipunktegleichung [4.22] unter Einsetzen von [4.21] beschrieben. . dist n .. .. distA1 .. .. dist A - distA1 .. .. dist A - distA1 .. . 23 .. . . dist n = .. distS1 + .1 . dist S2 - distS1 +.2 .... dist S3 - distS1 [4.22] . .. .. . distn .. distC . distC - distC1 .. distC - distC1 . 1 . 23 105 Die markierte hexagonale Fläche zeigt die potentielle Ausdehnung der Punkte. · 124 Friedrich Funke__________________________________________________________________Herleitung des methodischen Vorgehens · 125 Bei der Rotation der Grafik wird deutlich, daß die Punkte eine im Raum liegende plane Fläche bilden. Abbildung 19: Räumliche Konfiguration der Items der RWA-Skala Aufgrund der Expertenevaluation (s. S. 118) über die inhaltlichen Akzentuierungen in den Aussagen der RWA wurden den Items Variablennamen gegeben, die diese Einschätzung widerspiegeln. Eingangs weist ein p bzw. n darauf hin, ob es sich um in Merkmalsrichtung formulierte protraits (p) oder aber negativ formulierte contraits (n) handelt. Diese Unterscheidung ist unstrittig. Bei dem nachfolgenden Etikettieren mit ein bis drei Buchstaben werden die Items den reinen bzw. zwei- und dreifachen Mischtypen zugewiesen. Diese Entschei- dung ist wesentlich subjektiver, wenn auch auf die Einschätzung mehrerer Urteiler gestützt (Tabelle 111). Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens Variable Endfassung RWA96 DistA DistS DistC p_ac_1 Bei bestimmten Verbrechen ist lebenslange Freiheitsstrafe gerechtfertigt. 5.60 -4.00 -1.60 p_asc_2 Bei der Heirat sollten Frauen ihren Ehemännern Gehorsam versprechen. -2.60 1.60 1.00 p_s_3 Unsere Regierung ist im allgemeinen intelligenter, besser informiert und kompetenter als andere - die Menschen können sich wirklich auf sie verlassen. -3.20 3.40 -0.20 n_a_4 Es ist wichtig, die Rechte von Radikalen und Abweichlern in jeder Hinsicht zu wahren. 3.60 -3.60 0.00 p_ac_5 Es ist höchste Zeit, daß eine machtvolle Führung das radikale Neumodische und Sündhafte in unserem Land zerstört. 4.40 -1.60 -2.80 n_c_6 Schwule und Lesben sind genauso unverdorben und moralisch wie jeder andere auch. -3.00 -3.60 6.60 p_asc_7 Unser Land stünde gut da, wenn wir die Traditionen unserer Vorväter ehren, auf die führenden Köpfe hören und uns all der »faulen Äpfel« entledigen würden, die alles verderben. 2.80 -3.20 0.40 n_sc_8 Ungläubige und andere, die gegen die althergebrachten Religionen rebelliert haben, sind zweifelsohne ebenso gut und rechtschaffen wie regelmäßige Kirchgänger. -4.20 1.20 3.00 p_sc_9 Die wahren Schlüssel zum »guten Leben« sind Gehorsam, Disziplin und Tugend. -4.00 2.60 1.40 n_c_10 Viele unserer Regeln hinsichtlich Sittlichkeit und Geschlechtsleben sind Gewohnheitsregeln. Sie sind keinen Hauch besser oder heiliger als die anderer Menschen oder Kulturen. -4.00 -2.80 6.80 p_a_11 Es gibt heutzutage in unserem Land viele radikale unmoralische Menschen, die versuchen, das Land für ihre eigenen gottlosen Zwecke zugrunde zu richten. Die Staatsgewalt sollte sie außer Gefecht setzen. 5.00 -3.40 -1.60 p_sc_12 Man tut immer besser daran, dem Urteil der Zuständigen in Regierung und Kirche zu trauen, als auf die lauten Unruhestifter in unserer Gesellschaft zu hören, die nur Zweifel in den Köpfen der Menschen säen wollen. -6.00 4.20 1.80 n_c_13 FKK-Zeltplätze sind etwas völlig Normales. -3.20 -2.60 5.80 n_c_14 Es gibt nicht »die einzig richtige Art und Weise«, sein Leben zu -3.20 -0.20 3.40 leben. Jeder muß seinen eigenen Weg gestalten. Tabelle 11: Evaluation der Items der RWA96 (Teil 1) · 126 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens p_ac_15 Wenn wir nicht all die Unarten zerschlagen, die an unserer Charakterstärke und unseren traditionellen Überzeugungen nagen, dann wird unser Land eines Tages zugrunde gehen. n_c_16 Homosexuelle und Feministinnen verdienen Anerkennung für ihren Mut, sich den »traditionellen Familienwerten« zu widersetzen. p_a_17 In der heutigen ernsten Situation in unserem Land wären die stärksten Methoden gerechtfertigt, wenn sie nur die Unruhestifter ausschalten und uns wieder auf unseren rechten Weg bringen würden. p_c_18 Manche mögen es altmodisch finden, aber ein ehrenhafter Mann und vor allem eine Dame zeichnet sich noch immer durch eine anständige, korrekte Erscheinung aus. n_c_19 Ein jeder sollte seinen eigenen Lebensstil, religiösen Glauben und sexuelle Vorlieben haben, selbst wenn er sich darin von allen anderen unterscheidet. n_sc_20 Die Zeiten, in denen sich Frauen ihren Männern und gesellschaftlichen Regeln unterzuordnen hatten, gehören strikt der Vergangenheit an. Der »Platz einer Frau« sollte sein, wo immer sie möchte. p_a_21 Was unser Land wirklich braucht, ist ein starker, entschlossener Kanzler, der das Übel zerschlagen und uns wieder auf unseren rechten Weg bringen wird. n_c_22 Man sollte seine eigenen Moralvorstellungen über »Gut und Böse« entwickeln und weniger der Bibel oder anderen alten, traditionellen Glaubenssätzen Beachtung schenken. p_ac_23 Der einzige Weg, unser Land aus der Krise zu führen, besteht darin, zu unseren traditionellen Werten umzukehren, einige entschlossene Führer an die Macht zu setzen und die Unruhestifter zum Schweigen zu bringen, die schädliche Ideen verbreiten. n_c_24 Unser Land braucht freie Denker, die die Courage haben, sich traditionellen Sitten zu widersetzen, selbst wenn dies viele Menschen empört. n_c_25 Vorehelicher Geschlechtsverkehr ist etwas ganz Normales. p_a_26 Im Interesse aller sollte der Staat Zeitschriften zensieren, damit die Menschen gar nicht mit widerwärtigem Schundmaterial in Berührung kämen. n_sc_27 Es ist großartig, daß die jungen Leute heutzutage größere Freiheiten haben, »ihr eigenes Ding zu machen” und gegen Dinge zu protestieren, die sie nicht mögen. 5.00 -7.00 2.00 -4.40 -0.20 4.60 6.40 -3.80 -2.60 -4.00 -3.40 7.40 -4.60 -1.00 5.60 -3.00 0.00 3.00 5.40 -1.80 -3.60 -4.60 -1.60 6.20 1.00 -2.60 1.60 -4.40 -0.80 5.20 -3.40 -2.20 5.60 2.00 1.40 -3.40 -4.40 2.20 2.20 Tabelle 12: Evaluation der Items der RWA96 (Teil 2) · 127 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens p_a_28 Was wir in unserem Land anstelle von mehr »Bürgerrechten« wirklich brauchen, ist eine anständige Portion Recht und 5.80 -2.00 -3.80 Ordnung. n_sc_29 Die Leute, die unsere Regierung herausfordern, die Religion kritisieren und die »normalen Verhaltensregeln« -5.40 1.80 3.60 ignorieren, gehören zu den besten in unserem Land. p_s_30 Gehorsam und Achtung vor der Autorität sind die wichtigsten Tugenden, die Kinder lernen sollten. -0.80 4.60 -3.80 n_c_31 Man sollte sich von eingefahrenen Gleisen losreißen und viele verschiedene neue Ideen und Erfahrungen -3.80 -2.00 5.80 ausprobieren, anstatt an überkommenen Prinzipien festzuhalten. p_asc_32 Wenn unser Staat eines Tages »grünes Licht gibt«, ist es die Pflicht eines jeden patriotischen Bürgers, den Verfall ausmerzen zu helfen, der unser Land von innen her 4.00 -0.20 -3.80 vergiftet. n_c_33 Neue Ideen sind das Herzblut progressiven Wandels. Daher sollten wir Andersdenkenden und Radikalen -3.20 -0.20 3.40 mit offenen Armen und offenen Ohren gegenüberstehen. p_ac_34 Die Fakten über Kriminalität, sexuelle Sittenlosigkeit und die jüngsten öffentlichen Unruhen zeigen alle, daß wir härter gegen abweichende Gruppen und Unruhestifter 4.60 -5.60 1.00 durchgreifen müssen, wenn wir unsere moralischen Normen sichern und Recht und Ordnung bewahren wollen. Tabelle 13: Evaluation der Items der RWA96 (Teil 3) Nunmehr wird es möglich, die inhaltliche Balancierung der RWA-Skala zu untersuchen. Läßt man die ersten vier Items der RWA-Skala gemäß der Vorschrift106 von Altemeyer außer acht, so sind es je 15 protraits bzw. contraits. Im günstigsten Falle sollten daher 2×5 Items jede der Dimensionen erfassen (Tabelle 14). Durch die große Zahl von Mischtypen ist dies jedoch von vornherein ausgeschlossen (Tabelle 15). 106 Die ersten vier Items der RWA96 sind sogenannte »tablesetters« – Aufwärmitems – und sollen nicht in die Analyse eingehen. Bei der RWA98 sind es die ersten beiden Items. · 128 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens protraits contraits protraits A+ S+ C+ Reintypen |||| |||| |||| Mischtypen ø ø ø AC+ AS+ SC+ A-S-C- Reintypen |||| |||| |||| Mischtypen ø ø ø AC-AS-SC- Tabelle 14: Ideale Repräsentanz der Dimensionen in den Items A+ S+ C+ Reintypen Mischtypen |||| |||| ø || || | AC+ AS+ SC+ A-S-C- contraitsReintypen Mischtypen ø | ø ø |||| |||| |||| | AC-AS-SC- Tabelle 15: Tatsächliche Repräsentanz der Dimensionen in den Items Noch gravierender als die wenigen reinen Items ist das problematische Ungleichgewicht zwischen den Dimensionen, sowohl global als auch abhängig von der Kodierrichtung. Unter den protraits sind 5+5 Items mit Aggressivität assoziiert, mit Submissivität nur 2+2 und mit Konventionalismus gar nur 1+2 Item(s). Unter den entgegen der Merkmalsrichtung kodierten Items ist das Problem noch gravierender: Bis auf ein einziges Aggressivitätsitem sind alle 11+4 Items mit (der Ablehnung von) Konventionalismus assoziiert. Es wäre daher denkbar, daß vermeintlich formale Unterschiede (wie die Kodierrichtung) die inhaltlichen Unterschiede verschleiern. Offenbar ist es bei der Bildung von contraits besonders schwierig, (Ablehnung von) Aggressivität und (Ablehnung von) Submissivität zu erfassen. Die Ablehnung von Konventionalismus hingegen ist leicht zu operationalisieren über die Betonung des Neuen, Fortschrittlichen, Aufgeklärten, aber auch des »Zeitgeistlichen« und geradezu Trivialen.107 Beim direkten Erfragen der Symptomatik von Autoritarismus ist die Itemfindung offenbar und verständlicherweise einfacher, da hier lediglich ohne weiteres Um107 z.B. »Vorehelicher Geschlechtsverkehr ist etwas ganz Normales.» · 129 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens denken die Definitionen umgesetzt werden müssen. Folgerichtig ist es Altemeyer hier auch besser gelungen, alle Facetten abzudecken. Besonderes Gewicht liegt hier dennoch auf der aggressiven Dimension; Konventionalismus taucht fast ausschließlich in Kombination mit autoritärer Aggressivität auf. Die erklärt sich durch folgende wiederkehrende Aussagenstruktur: Ursache/Begründung Konsequenz »Weil irgend etwas (nicht mehr) so und so ist, .. müssen die Autoritäten hart durchgreifen«. verletzte Konvention .. autoritäre Aggression. Tabelle 16: Aussagenstruktur einiger RWA-Items Relativierend muß daran erinnert werden, daß die Zuordnung zu den Rein- und Mischtypen entlang schwimmender Grenzen erfolgte. Andere Expertenrunden mögen zu weniger kritischen Einschätzungen gelangen; zudem dürfte die Einschätzung stark kulturabhängig sein. Unberührt von diesen Einschränkungen bleibt dennoch die Lehre, daß die einzelnen Dimensionen verschiedenes Gewicht in der RWA-Scale haben. Dies ist sowohl im übertragenen Sinne (a) gemeint als auch im rechnerischen (b). a) Das ungleiche Gewicht im übertragenen Sinne tangiert das Problem der mangelnden Konstruktvalidität. b) Unterstellt man vereinfachend die additive Zusammensetzung des Summenscores aus kognitiven Verrechnungen der Einstellungen zu den einzelnen Dimensionen, so muß der Summenscore zwangsläufig verzerrt sein. Im mir vorliegenden unveröffentlichten Begleittext zu seiner 20-Item RWA-Scale räumt Altemeyer dieses Problem in einer Fußnote ein: Paul Trapnell, while Ph.D. student at the University of British Columbia, sent me long, data-filled letters arguing that the two factors on the RWA Scale differed sub- stantially in content as well as in direction of wording. I eventually agreed he was right, but he will tell you it was quite a struggle. (Altemeyer, 2002). Altemeyer änderte auf diese Kritik hin einige der Items. Vor diesem Hintergrund läßt sich jedoch das Scheitern exploratorischer Strukturanalysen der bishr veröffentlichten Skalen (Kapitel 1, S.169ff.) deuten. · 130 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens 4.5.2.4. Fazit der quantifizierenden Evaluation der Items Die ernüchternden Einsichten aus Abschnitt 4.5 (S.115 ff.) bringen ambivalente Folgen mit sich. Einerseits ist dem ursprünglichen Vorhaben der Arbeit die not- wendige Grundlage für den Erfolg entzogen: Es läßt sich kein ausgewogenes Meßmodell spezifizieren, wenn die theoretischen Subdimensionen derart ungleich repräsentiert sind. Das gilt insbesondere für den Umstand, daß einige Subdimen- sionen nahezu gar keine reinen Items aufweisen, so daß wichtige »Anker« für kon- firmatorische Faktoranalysen fehlen würden. Diese frustrierende Erkenntnis ermutigt andererseits dazu, ein Mißverständnis hin- sichtlich des Anspruchs an den vorliegenden Aufsatz aufzuklären: Wären die Grundlagen für ein kompliziertes Meßmodell gegeben, so hätte die Leserin oder der Leser die Sinnhaftigkeit einer analytischen Trennung der Subdimensionen vom Gelingen oder Scheitern der Modellanpassung abhängig gemacht, diese gleichsam als Wahrheitskriterium (miß)verstanden. Es ging mir hingegen von An- beginn nicht um die halbherzige Verbesserung der RWA, sondern um das Zeigen der theoretischen Notwendigkeit und Möglichkeit, den Zusammenhang der Sub- dimensionen von Autoritarismus mit höherer Auflösung zu beschreiben. Die wesentliche Erkenntnis der inhaltsanalytischen Betrachtungen besteht darin, die Dialektik des Zusammenhang der Subdimensionen anzudeuten, der mit einer additiven Zusammensetzung höchst unzureichend beschrieben wäre. Indem ge- zeigt wurde, daß bestimmte analytische Schritte mutmaßlich nicht zum Ziel füh- ren können, wird die Suche nach anderen Wegen ermutigt. Die modifizierte Strategie wird in einem ersten Schritt versuchen, die widrige Aus- gangsposition der RWA derart zu verbessern, daß zumindest ein klareres Bild über den Zusammenhang der Subdimensionen gewonnen werden kann. Dazu ist es vonnöten, den Anteil der Misch-Items drastisch zu verringern und die Skala hin- sichtlich der Subdimensionen (geschachtelt unter die Kodierrichtung) zu balancie- ren. Die RWA³D (5.2.3, S.138ff.) stellt auf diesem Wege ein erfolgversprechendes Werkzeug dar. 4.6. Zusammenfassung zum methodischen Vorgehen Im vorangegangenen Abschnitt wurde das methodische Vorgehen skizziert, um die Binnenstruktur der Items der RWA-Skala zu analysieren. In einem ersten Schritt · 131 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens soll die Struktur mit Hilfe exploratorischer Verfahren dekomponiert werden. Dazu liegt bereist empirische Evidenz anderer Autoren vor, die repliziert and an kritikwürdiger Stelle verbessert wird. In einem zweiten Schritt werden theoriegeleitet verschiedene Modelle zur Rekomposition der RWA-Skala entwickelt. Die Modifikationen des Meßmodells gehen von einer Reformulierung der bisherigen Praxis der Mittelwertsbildung in Termini der Strukturgleichungsmodelle aus (4.2.4, S.92ff.). Alsdann werden inhaltsunabhängige Verbesserungen vorgeschlagen, die sich auf eine unterschiedliche Gewichtung der Items (4.2.5.1) bzw. auf eine Berücksichtigung der Kodierrichtung der Items (4.2.5.2) beziehen. Diese beiden Verbesserungsstrategien sind formaler Natur und daher auch auf viele analoge Meßprobleme der Psychometrie übertragbar. Auch für den konkreten Fall der Autoritarismusforschung liegt hier jenseits des ausgeblendeten Inhaltsbezuges ein Potential an Verbesserungsmöglichkeiten, das in der derzeitigen Forschungspraxis brach liegt und in Zukunft unbedingt ausgeschöpft werden sollte. Die inhaltsgeleiteten Verbesserungen des Meßmodells (4.2.6, S.101ff.) zielen darauf ab, die von mir vertretene theoretische Idee der Mehrdimensionalität von Autoritarismus adäquat in ein Meßmodell zu übersetzen. Dabei wird der Einführung dreier korrelierter Faktoren zentrale Bedeutung beigemessen. Die auf diese Weise theoretisch hergeleiteten Modelle befinden sich in einem schwachen Ordnungsverhältnis; während einige Modelle strenger und sparsamer und andere hingegen liberaler sind, gibt es darüber hinaus auch eine Reihe mathematisch äquivalenter Modelle, die sich allenfalls hinsichtlich der Interpretation unterscheiden. In einem letzten Schritt werden weitere Möglichkeiten zur Elaboration eines paßfähigen Meßmodells entwickelt (4.4, S.109ff.). Mit diesen Empfehlungen könnten höhere Modellpassungen an die empirischen Daten gelingen. Eine Robustheit und Übertragbarkeit dieser so gefundenen Modelle über viele Datensätze verschiedener Studien hinweg wird jedoch nicht behauptet, sondern eher angezweifelt. Gerade die letzte Bemerkung öffnet den Blick für ein forschungspraktisches Problem dieses Aufsatzes: es wird möglicherweise gelingen, mit den theoretisch hergeleiteten modifizierten Meßmodellen die Daten besser zu beschreiben. Unter Umständen sind die Modelle dann jedoch derart sophistiziert, daß sie sich nicht · 132 Friedrich Funke __________________________________________________________________ Herleitung des methodischen Vorgehens mehrheitsfähig in der Forschungspraxis kommunizieren und etablieren lassen. Daher wird neben der Beschreibung der vorgeschlagenen »best practice« ein hinreichend genaues aber dennoch einfaches Vorgehen vorgeschlagen. · 133 5. Die empirische Basis I: Skalenadaptation »Um ›eine Tatsache herzustellen‹ müssen Andere gefunden werden, die die eigenen Interpretationen teilen oder einem zumindest einen Vertrauensvorschuß geben.« (Gergen, 2002) 5.1. Vorgehen bei der Adaptation In den hier vorgestellten Studien kamen drei verschiedene Skalen zur Erfassung von rechtem Autoritarismus zum Einsatz. Bei zwei Skalen handelt es sich um eigene Adaptationen jeweils aktueller Versionen der RWA-Scale (RWA96 Altemeyer, 1996 S.12-15; RWA98 Altemeyer, 1998 S.49-51). Bei beiden Instrumenten lagen bislang keine deutschen Übersetzungen vor. Eine neuentwickelte dritte Skala (RWA³D) ist eine systematisch modifizierte Variante der RWA96 (Funke, 1999b). 5.1.1. Übersetzung Das Procedere der Übersetzung folgt der aufwendigen Translation-Backtranslation Technik (vgl. auch Sperber, DeVellis & Boehlecke, 1994; van de Vijver & Hambleton, 1996; van de Vijver & Leung, 1997; Banville, Desrosiers & Genet- Volet, 2000): Friedrich Funke __________________________________________________________________ Die empirische Basis I: Skalenadaptation 1. Drei voneinander unabhängige Übersetzungen Englisch – Deutsch (Transliterationen unter Beibehaltung der semantischen und syntaktischen Struktur des Originals) 2. Synthese zu einer Version der Transliteration 3. Blinde Rückübersetzung durch bilinguale kanadische Muttersprachlerin 4. Kritischer Vergleich der Rückübersetzung mit dem Original 5. Erneute Übersetzung auf der Basis der bis dahin gewonnenen Informationen Da die Items der Skalen Altemeyers sehr lang, grammatisch kompliziert und dadurch auch inhaltlich ambig sind, wurde in einem weiteren Schritt eine Vereinfachung der Items vorgenommen, wobei Kürze und Prägnanz der Items einerseits und sinnwahrende Nähe zum Original und zum Konstrukt andererseits optimiert werden sollten. 5.1.2. Antwortformat Bei Altemeyer haben in den letzten Jahren die RWA-Skalen jeweils ein 9-stufiges Antwortformat mit Ankern von –4 (very strongly disagree) bis 4 (very strongly agree). Ursprünglich verwendete er 7-stufige Antwortformate, begann dann aber Forschungen hinsichtlich der günstigsten Anzahl von Antwortkategorien (Altemeyer, 1988 S. 39ff.). Fünf und mehr Stufen führen häufig (aufgrund der besseren Verteilungseigenschaften der Antworten) zu höheren Reliabilitäten der Skalen (Remmers & Sageser, 1941; Remmers & Ewart, 1941; Masters, 1973, 1974; Komorita & Graham, 1965), obgleich auch für das gegenteilige Ergebnis empirische Evidenz vorliegt (Komorita, 1963; Masters & Evans, 1986; Bendig, 1954a; 1954b). Letztlich scheint das »optimale« Antwortformat sehr von dem zu Bewertenden und von den Bewertenden abzuhängen. Altemeyer selbst fand Hinweise auf eine Überlegenheit von sieben- und mehrstufigen Formaten, wobei er sich letztlich für neunstufige entschied, da hier die Befragten über den größten Differenzierungsspielraum verfügen. In den hier vorgestellten eigenen Studien kamen immer siebenstufige Antwortformate zum Einsatz. Einerseits ist der Unterschied in der internen Konsistenz von 5 zu 7 Stufen am größten, während er von 7 zu 9 Stufen nur noch schwach steigt · 135 Friedrich Funke __________________________________________________________________ Die empirische Basis I: Skalenadaptation oder gar abnimmt. Andererseits sollte der Tatsache Rechnung getragen werden, daß gerade Befragte mit geringerer Intelligenz nicht die angebotene Spannweite von zu vielen Kategorien ausnutzen.108 5.1.3. Instruktion Die Beantwortung der RWA-Skalen stand jeweils in einem besonderen Erhebungszusammenhang, der die Beantwortung »rahmte«. Es ist zu erwarten, daß die Ergebnisse systematisch davon beeinflußt werden, ob das Thema der Studie »Bundeswehreinsatz im Kosovo«, »Erziehung« oder »Strafrecht« lautet. Der unmittelbare Vortext ist jedoch sowohl bei Altemeyer als auch in den hier vorgestellten Studien nicht verändert worden. Altemeyer leitet die Skala jeweils mit der folgenden Instruktion ein: This survey is part of an investigation of general public opinion concerning a variety of social issues. You will probably find that you agree with some of the statements, and disagree with others, to varying extents.[…] (jeweils unverändert in Altemeyer, 1988, S.22; 1996, S.12; 1998, S.49) In den eigenen Studien wurde ein Einleitungstext gewählt, der eine gewisse Distanzierung von den Itemtexten ermöglicht. Dies erschien sinnvoll, da die Formulierungen sehr drastisch sind und in hohem Maße Reaktanz provozieren. Ein Distanzieren ermutigt gleichzeitig die Befragten zum Distanzieren und entlastet den Untersuchungsleiter davon, mit dem Inhalt identifiziert zu werden, was Reaktanz und Frustration bei den Befragten mindert. Der Effekt wurde noch verstärkt, indem die Items in Anführung gesetzt wurden. 108 Siebenstufige Antwortformate wurden auch in der klassischen Antisemitismusstudie von Levinson und Sanford verwand (Levinson & Sanford, 1944; Kemmelmeier, 2001). · 136 Friedrich Funke __________________________________________________________________ Die empirische Basis I: Skalenadaptation Im folgenden lesen Sie einige Aussagen. Bitte geben Sie an, wie sehr Sie persönlich diesen Sätzen zustimmen. Studien KosovoNet I+II Im folgenden haben wir zwölf Aussagen zusammengestellt, die man von Zeit zu Zeit hören kann. Wie stehen Sie zu den folgenden Meinungsäußerungen? Studie NEO II Altemeyer stellte über viele Jahre hinweg seiner Skala dieselbe Instruktion voran: You may find that you sometimes have different reactions to different parts of a statement. For example, you might very strongly disagree (-4) with one idea in a statement, but slightly agree (+1) with another idea in the same item. When this happens, please combine your reactions, and write down how you feel ›on balance‹ (i.e., a –3 in this case).” (jeweils unverändert in Altemeyer, 1988, S.22; 1996, S.12; 1998, S.49) Interessanterweise scheint sich Altemeyer, wie sich auch anderenorts zeigt, der Eigenart seiner Items (double barreled) bewußt zu sein. In seiner Instruktion vor den Items weist er seine Befragten an, nötigenfalls gewichtende »Berechnungen« beim Ankreuzen anzustellen. 5.1.4. Sprachniveau Die Originalitems der RWA sind in recht drastischer Weise formuliert. Bei Beibehaltung des Sprachniveaus der protraits hätte man extreme Stammtischparolen erhalten. Die Formulierungen wurden in der Übersetzung geringfügig abgeschwächt, ohne jedoch die Schärfe völlig zu nehmen. Auch wenn die Items viele Leser befremden mögen, so scheint dies bei »Autoritären« gerade nicht der Fall zu sein. Die Formulierungen treffen sowohl im Inhalt als auch in der Form »ihren Nerv«. Daher sind sie mit Bedacht so belassen worden. 5.2. Items und Trennschärfe 5.2.1. Right-Wing-Authoritarianism Scale RWA96 Diese Übersetzung bezieht sich auf Altemeyer (1996) und wurde in der Studie zur Bundestagswahl 1998 verwendet (Funke, 1998). Die Items sind mit den erzielten Trennschärfen im Anhang dokumentiert (Tabelle 111, S.332ff.). · 137 Friedrich Funke __________________________________________________________________ Die empirische Basis I: Skalenadaptation Die geringste Trennschärfe weist das »Zensuritem« 26 auf: »Im Interesse aller sollte der Staat Zeitschriften zensieren, damit die Menschen gar nicht mit widerwärtigem Schundmaterial in Berührung kämen.« (rit=.27). Die geringe Item-Total- Korrelation kommt hier dadurch zustande, daß die Befragten verschiedene Arten von »Schundmaterial« vor Augen haben. Für einige der Befragten steht die staatliche Intervention durch Zensur im Mittelpunkt, andere mögen Kinderpornographie und rechtsextreme Schriften im Sinne haben. Das verschleiert die Zusammenhangsstruktur. Das prototypische Item autoritärer Aggression (28) hat mit rit=.70 auch die höchste Trennschärfe: »Was wir in unserem Land anstelle von mehr ›Bürgerrechten‹ wirklich brauchen, ist eine anständige Portion Recht und Ordnung.«. Dieses Ergebnis wiederholt sich auch in anderen Skalen (vgl. Tabelle 130: Items der RWA³D, S.346). 5.2.2. Right-Wing-Authoritarianism Scale RWA98 Bei der RWA98 handelt es sich ebenfalls um eine eigene Übertragung des kanadischen Originals (Altemeyer, 1998). Die Trennschärfen und Itemformulierungen sind Tabelle 122 zu entnehmen (S. 340ff.). Altemeyers Anweisung beinhaltet wiederum den Hinweis, nicht alle Items zum Skalenwert zu aggregieren, sondern nur die Items 3 bis 32 in die Analyse aufzunehmen. Die 30 Items haben bei Altemeyer eine mittlere Inter-Item-Korrelation von rii= .29 bei einem Cronbach’s Alpha von a=.92.109 In einer Validierungsstudie der eigenen Adaption mit 261 Versuchspersonen lag die interne Konsistenz bei a=.91. 5.2.3. Reduktion der Skala auf reine Items – die RWA³D Ein Ziel der hier vorgelegten Arbeit ist es, auch abgeschlossene Studien mit der RWA-Skala aufgrund verbesserter Meßmodelle angemessener auswerten zu können. Rückwirkend besteht keine Einflußmöglichkeit auf die Wahl der Items in fremden Studien – es muß daher perspektivisch ein Weg gefunden werden, auch mit den gemischten Items sinnvoll umzugehen. 109 Verwirrenderweise nennt Altemeyer seine aktuelle Version die 1997er Fassung, publiziert aber die psychometrischen Ergebnisse der 1996er Studie. Die Veröffentlichung erfolgte 1998, worauf sich meine Namenswahl RWA98 bezieht. · 138 Friedrich Funke __________________________________________________________________ Die empirische Basis I: Skalenadaptation In einem ersten Schritt wurde jedoch versucht eine Skala zu bilden, die der Drei- dimensionalität in Annäherung Rechnung trägt. Gleichzeitig sollte die Itemformu- lierung des Originals so weit wie möglich beibehalten werden. Dazu wurden »rei- ne« Items der RWA96 gewählt und ggf. semantisch vereinfacht oder gekürzt. Teilweise wurden lange, mehrteilige Items zu neuen »reinen« Items aufgesplittet. Schließlich war es in einigen Fällen sinnvoll, Umkodierungen vorzunehmen, um somit die Balancierung sowohl global als auch innerhalb der theoretischen Subdi- mensionen sicherzustellen. Die RWA³D-Skala hatte im Ergebnis 12 Items (2×2×3)110 mit alternierender Codie- rung in der Sequenz C-A-S (s. Anhang Tabelle 130: Items der RWA³D, S.346ff. und Tabelle 131, S.347ff.). Die Bezeichnung der Variablen folgt der nachstehenden Konvention: Der vorletzte Buchstabe steht jeweils für die angezielte Dimension (c,a,s), der letzte Buchstabe zeigt die Kodierrichtung an (p: positiv; n: negativ). Die beiden ersten entgegen der Merkmalsrichtung formulierten Items sind auf- grund der trivialen, derzeit kaum widersprochenen Aussagen wenig trennscharf. Das trennschärfste Item hingegen ist prototypisch für die aggressive Facette von Autoritarismus: »Was wir in unserem Land anstelle von mehr ›Bürgerrechten‹ wirk- lich brauchen, ist eine anständige Portion Recht und Ordnung.« (Trennschär- fe/korrigierte Item-Total-Korrelation rit=0.63). 5.3. Interne Konsistenz im Vergleich Der Vergleich der beiden originalen Langformen der RWA mit der Kurzform RWA³D hinsichtlich der internen Konsistenz zeigt die erwartungsgemäße Überlegenheit der Langformen. Dennoch läßt sich die Zuverlässigkeit der Kurzform als durchaus befriedigend einschätzen, sodaß in Anbetracht des untersuchungs- ökonomischen Nutzens die RWA³D psychometrisch attraktiv ist. 110 Je zwei (2) gemäß bzw. entgegen der Merkmalsrichtung kodierte Items (2) pro inhaltliche Dimension (3). · 139 Friedrich Funke __________________________________________________________________ Die empirische Basis I: Skalenadaptation RWA96 RWA³D RWA98 Items 34 12 30 N (vollständig) 449 1458 261 Mittlere Inter-Item-Korrelation .312 .238 .242 Cronbach’s a: .936 .784 .900 Standardisiertes a .938 .790 .910 Spearman-Brown Koeffizienta .943 .835 .610 Guttman (Rulon) Koeffizienta .943 .831 .605 Split-Half-Reliabilität .811 .678 .610 Guttman Split-Half-Reliabilitätb .792 .664 .605 Cronbach’s a der Hälften (pos/neg) .914/.877 .800/.519 .896/.837 Korrelation der Hälften .682 .512 .439 Disattenuierte Korrelation der Hälftenb .762 .795 .506 a Systat 10 b Statistica 6.0 Tabelle 17: Interne Konsistenz der RWA96, RWA³D und RWA98 Die untere Schranke der Reliabilität der RWA³D bewegte sich in den einzelnen Studien zwischen a=.755 (Papier&Bleistift-Studie NEO I) und a=.813 (Internet- Studie NEO II). 5.4. Zusammenfassung Der vorangegangene Abschnitt beschrieb die Vorgehensweise bei der Adaptation bestehender Skalen (Altemeyer, 1996; 1998) und neu konstruierter Erhebungsinstrumente (Funke, RWA³D). Die ersten beiden Instrumente zeichnen sich durch eine hohe interne Konsistenz aus, was jedoch keine hinreichende Bedingung für Eindimensionalität ist. Bei der RWA³D war als explizites Konstruktionsprinzip die strukturell und inhaltlich harmonische Balancierung angezielt. Die Skala ist somit von vornherein teilweise111 mehrdimensional konzipiert. Die interne Konsistenz ist in Anbetracht der untersuchungsökonomisch günstigen Kürze der Skala durchaus befriedigend, sodaß die RWA³D eine attraktive Alternative darstellt, obgleich dies ursprünglich nicht das zentrale Ziel der Arbeit war. 111 Die Einschränkung »teilweise« bezieht sich auf die Tatsache, daß die verschiedenen Dimensionen ausdrücklich nicht annähernd als orthogonal unterstellt werden. Trotz der erwarteten hohen Interkorrelation wird jedoch eine gewisse diskriminante Validität erhofft. · 140 6. Die empirische Basis II: Erhebung und Stichproben »Everything should be made as simple as possible, but not simpler.« (Albert Einstein) Die empirische Überprüfung der theoretisch abgeleiteten Hypothesen stützt sich im wesentlichen auf die Datenbasis von neun Studien. Im folgenden werden die Stichproben charakterisiert und die Erhebungszusammenhänge kurz erläutert. 6.1. Studie I: RWAnet zur Bundestagswahl 1998 6.1.1. Erhebungsmodus und Erhebungszusammenhang Die Bundestagswahl im Herbst 1998 war die erste Parlamentswahl in Deutschland, bei der das Internet ansatzweise als Wahlkampfmedium genutzt wurde. Vor diesem Hintergrund gab es einen großen Informationsbedarf und entsprechendes Interesse bei den Internetnutzern. Das im allgemeinen große Interesse an Hochrechnungen und Umfrageergebnissen wurde durch das neue Medium noch gesteigert. Unter dem Schlagwort »online-wahl« wurde im Vorfeld der Wahlen zum Deutschen Bundestag 1998 eine Internetstudie ins Netz gestellt. Der Rahmen wurde durch Sonntagsfrage, Kandidaten- und Koalitionspräferenzen, Wahlprognosen und Kompetenzprofile der Parteien gesetzt. Die zahlreichen Items wurden als (ech Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben te oder hypothetische) Zitate eingeführt; primäres wissenschaftliches Interesse wurde nicht in den Mittelpunkt der Aufmerksamkeit der potentiellen Teilnehmer gestellt.112 6.1.2. Hauptfragestellungen und Instrumente Zentrale wissenschaftliche Fragestellung war der Zusammenhang von rechtem Autoritarismus (RWA) mit Ambiguitätsintoleranz sowie den Altemeyerschen Operationalisierungsversuchen von linkem Autoritarismus (Left-Wing-Authoritarianism Altemeyer, 1996) und Gruppenkohäsion (sensu Duckitt, 1989; 1990). Das Ausfüllen des Fragebogens dauerte i.a.R. ca. 15-20 min. und wurde subjektiv als kürzer empfunden. Dennoch sollte für »Laufkundschaft« eine kürzere Variante gefunden werden: eine Teilung in je zwei Halbskalen würde zwar die Reliabilität nur geringfügig senken, jedoch wäre diese Teilung ohne Kenntnis der Itemparameter willkürlich und die Bildung weitestgehend paralleler Formen wenig wahrscheinlich. Daher wurde daher den Befragten die Möglichkeit gegeben, einige Items zu überspringen. Um Reihenfolgeeffekte zu kontrollieren, wurde die Reihenfolge der Teilskalen durch ein serverseitiges Programm113 randomisiert. 112 Am Ende der Legislaturperiode schließt sich nunmehr auch der empirische Rahmen für die vorliegende Arbeit. Zur Zeit der Drucklegung läuft eine Internetstudie unter http://www.uni-jena.de/online- research/wahl2002/. 113 Hier gilt Marc Müller besonderer Dank. · 142 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben liAngetc llAAngDVU llAAiWilkommensbildschrm Persönl. aben Sonntagsfrage RWA1 LWA1 Group Cohesiveness DVU Sexuaverbrechen Wahrecht mnestie RAF Persönl. aben Sonntagsfrage etc RWA2 LWA2 Group Cohesiveness Sexuaverbrechen Wahrecht mnestie RAF randomizer LWA1 RWA1 LWA2 RWA2 bschcken Linkliste mit impliziter Normvorgabe ohne implizite Normvorgabe weitermachen oder Items überspringen Abbildung 20: Aufbau der Untersuchung RWAnet · 143 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben Angezielter und eingetretener Effekt dieser Darbietungsweise war, daß das Gros der Befragten die gesamte Skala ausfüllte (. lange Version und . die verkürzten Varianten, wobei letztere jeweils zu gleichen Teilen Daten lieferten, so daß Selbstselektions- und Ordnungseffekte aufgrund der Randomisierung keinen systematischen Einfluß haben sollten (vgl. Tabelle 18 auf dieser Seite und Tabelle 19 auf S.145).114,115 Lang oder Kurzversion kurz lang Total Version ohne Norm Count 119 241 360 % within Version 33.1% 66.9% 100.0% % within Lang oder Kurzversion 41.2% 47.8% 45.4% mit Norm Count 170 263 433 % within Version 39.3% 60.7% 100.0% % within Lang oder Kurzversion 58.8% 52.2% 54.6% Total Count 289 504 793 % within Version 36.4% 63.6% 100.0% % within Lang oder Kurzversion 100.0% 100.0% 100.0% Tabelle 18: Abbruchrate in Abhängigkeit von der Fragebogenversion 114 Es wurde angenommen, daß Autoritäre weniger abbrechen, da bewußt formuliert wurde »Möchten Sie die normale (sic!) Version ausfüllen oder hier abbrechen?«. Die Hypothese mußte jedoch verworfen werden. 115 Dieses Design hat den Vorteil, daß ein geplantes Muster fehlender Werte entsteht, woraus sich günstige Konsequenzen für die Imputation ergeben. Eine nähere Diskussion wird hier für den Zweck der vorliegenden Arbeit jedoch entbehrlich. · 144 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben Tabulated Patterns Number of Cases 45410837125 Missing a RWA25 X X Patterns RWA26 X X RWA27 X X RWA28 X X RWA29 X X RWA23 X X RWA22 X X RWA21 X X RWA24 X X RWA31 X X RWA32 X X RWA33 X X RWA34 X X RWA30 X X RWA13 X X RWA14 X X RWA6 X X RWA7 X X RWA8 X X RWA5 X X RWA11 X X RWA20 X X RWA19 X X RWA18 X X RWA16 X X RWA15 X X RWA17 X X RWA12 X X RWA9 X X RWA10 X X Complete if ... b 454 539 655 557 Patterns with less than 1% cases (7 or fewer) are not displayed. a. Variables are sorted on missing patterns. b. Number of complete cases if variables missing in that pattern (marked with X) are not used. Tabelle 19: Die häufigsten Muster fehlender Werte · 145 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben Die notwendige Aufteilung in zwei Versionen konnte genutzt werden, um weitere Bedingungen zu variieren. In einer Variante wurde die individuelle Wahlprognose nach der Darbietung aktueller Umfrageergebnisse (ZDF Politbarometer) erfragt. In der anderen Version wurde keine dahingehende Information gegeben. Theoretischer Hintergrund war hier die Suche nach dem false consensus Effekt (Brown, 1982; Wetzel & Walton, 1985; Fabrigar & Krosnick, 1995) und einer eventuellen Interaktion mit dem Autoritarismus der Befragten116. 6.1.3. Stichprobe Die Stichprobe war als anfallende selbstauswählende Stichprobe konzipiert, da i.d.R. die Befragten durch mehr oder weniger gezieltes »Surfen« oder im Ergebnis von Anfragen in Suchmaschinen auf die Website des Fragebogens gelangen (sog. Pull-Verfahren). Initial erfolgte ein Mailing an verschiedene Newsgroups und Mailinglisten, was erfahrungsgemäß zu einer Beantwortung in den ersten zwei Werktagen führt. Einen weiteren Anstieg gab es mit dem bei Printmedien üblichen Zeitversatz von einer Woche es nach einer redaktionellen Erwähnung der Studie im FOCUS- Magazin (Nr. 34/1989). Gegen Ende des Wahlkampfes nahm die Teilnehmerzahl 116 Es zeigte sich ein deutlicher Zusammenhang zwischen dem Wunschkandidaten und dem erwarteten Wahlausgang. Schröder-(SPD)-Anhänger erwarteten zu 76%, daß Schröder Kanzler wird. Gleichzeitig waren 82% der Kohl-(CDU)-Anhänger der Meinung, ihr Kandidat würde die Wahl gewinnen. Offensichtlich war hier der Wunsch der Vater des Gedanken – ein false consensus Effekt. Interessant ist nun die Interaktion mit der Fragebogenvariante und damit der Manipulation. Wur- den die Befragten mit dem Diagramm einer Wahlprognose konfrontiert, so milderte sich der false con- sensus Effekt: Die Salienz der öffentlichen Meinung wirkte gewissermaßen als Korrektiv für die eigenen Wunschvorstellungen. Bei den SPD-Anhängern sank die Siegeszuversicht von 83% auf 70%, bei den CDU-Anhängern geringer von 84% auf 80%. Der größere Unterschied bei den SPD-Anhängern ließe sich sicherlich mit der Unsicherheit der Herausforderer erklären, was durch die Studie freilich nicht em- pirisch gedeckt ist. Die Interaktion der Manipulation mit Autoritarismus ließ sich aufgrund der ungleichen Zellenbe- setzung nicht zuverlässig überprüfen. Unter den Kohlanhänger gab es fast keine gering Autoritären (Mediansplit). Daher seien hier nur die beiden konkurrierenden Hypothesen genannt: H1 Autoritäre lassen sich stärker von der öffentlichen Meinung beeinflussen (submissive, konformistische Facette). Bei ihnen tritt ein stärkerer false consensus Effekt auf. H2 Autoritäre zeigen einen geringeren false consensus Effekt aufgrund ihres rigideren Denkstils. Tendentiell zeigen sich eher Hinweise auf letztere Hypothese; wegen der genannten methodischen Problem sei hier aber eine Überinterpretation unterlassen. · 146 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben ohne weitere Werbung kontinuierlich zu, was auf ein aktives Suchverhalten der Befragten schließen läßt (Abbildung 21). Datum der Teilnahme 22.09.1998 15.09.1998 08.09.1998 01.09.1998 25.08.1998 18.08.1998 07.08.1998 30.07.1998 23.07.1998 16.07.1998 09.07.1998 11.06.1998 Percent 8 7 6 5 4 3 2 1 0 WahltagFOCUS 34/98Mailing Abbildung 21: Fluktuation der Teilnehmerzahlen Die Stichprobe war nicht (!) überwiegend studentisch, sondern hinsichtlich der Tätigkeit der Befragten zufriedenstellend heterogen. Sie kann als weitestgehend repräsentativ für die damaligen Internetnutzer angesehen werden. Dies implizierte jedoch zum damaligen Zeitpunkt ein Verhältnis von 9:1 mit einer Überrepräsentanz von Männern. Zwei Drittel der Befragten waren unter 30 Jahren alt. In die Analyse gingen die Fragebögen von 793 Befragten ein.117 6.2. Studie II: KosovoNet I zum Kosovokonflikt 6.2.1. Erhebungsmodus und Erhebungszusammenhang Am Abend des 24. März 1999 begannen die NATO-Luftangriffe gegen Ziele in Ju- goslawien.118 Dazu lag kein explizites Mandat der Vereinten Nationen vor. Insbe117 Datensatz »diss Bundestagswahl.sav« 118 »Yesterday evening around 8 p.m., Operation Allied Force began. Last night's operation was carried out with a broad participation by Allies. This demonstrates NATO solidarity, unity and resolve in carrying out Fortsetzung auf Folgeseite … · 147 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben sondere die deutsche Beteiligung an diesem Kampfeinsatz gegen einen souveränen Staat ist kritisch zu bewerten, da aufgrund der Verbrechen der Wehrmacht auf dem Balkan bis zu diesem Zeitpunkt selbst unter konservativen Regierungen militärisches Engagement kategorisch ausgeschlossen war. Aus diesem Grunde wurde durch die NATO im Allgemeinen und die rot-grüne Bundesregierung im Besonderen der Einsatz in einen argumentatorischen Zusammenhang gestellt, der den Einsatz folgerichtig und moralisch zwingend dar- stellte.119 Eine ethische, völkerrechtliche und politikwissenschaftliche Bewertung des Kosovokrieges ist an dieser Stelle nicht angezeigt, vielmehr geht es um das sozialpsychologische Charakterisieren der öffentlichen Diskussion um diesen Konflikt. Diese stellt gleichzeitig Anlaß und forschungsrelevantes Umfeld für die hier dargestellten Studien zum Kosovokrieg dar. Das besondere Dilemma bestand darin, daß der Diskurs nicht durch eine Polarisierung zwischen jeweils fundamentalistischen pazifistischen und bellizistischen Positionen hinreichend beschrieben werden kann. Fortsetzung der Fußnote: this action. Let me stress that strikes were conducted against carefully chosen military targets focussed on the air defence network of the Federal Republic of Yugoslavia.« (NATO-Generalsekretär Dr. Javier Solana, Pressekonferenz 25.März 15.00 Uhr NATO Hauptquartier) »Liebe Mitbürgerinnen und Mitbürger, heute Abend hat die NATO mit Luftschlägen gegen militärische Ziele in Jugoslawien begonnen. Damit will das Bündnis weitere schwere und systematische Verletzungen der Menschenrechte unterbinden und eine humanitäre Katastrophe im Kosovo verhindern. Der jugoslawische Präsident Miloševic führt dort einen erbarmungslosen Krieg. Wir führen keinen Krieg, aber wir sind aufgerufen eine friedliche Lösung im Kosovo auch mit militärischen Mitteln durchzusetzen.« (Gerhard Schröder in der ARD) Zur Dokumentation des NATO-Einsatzes: Offizielle Informationspolitik der NATO und ihrer Alliierten http://www.kforonline.com/ oder http://www.nato.int/kosovo/ sowie http://www.bundeswehr.de/im_einsatz/kfor/chronik/uebersicht.html kritische Dokumentationen z.B. bei Monitor: http://www.wdr.de/online/news/kosovoluege/ 119 Die zweifelsohne menschenverachtende Politik von Slobodan Miloševic – so die Argumentation – hätte die Weltöffentlichkeit mit ihrem gewachsenen Menschenrechtsbewußtsein gezwungen, ethnische Säuberungen gegen Albaner im Kosovo aufzuhalten. Die Kosovo-Konferenz von Rambouillet wurde als gescheitert angesehen, da die serbische Regierung die Stationierung einer 28.000 Mann starken Friedenstruppe als unannehmbaren Eingriff in ihre staatliche Souveränität ablehnte. Das Ultimatum der NATO mit Ablaufdatum 20. Februar 1999 entwickelte durch den drohenden Glaubwürdigkeitsverlust der NATO im Vorfeld ihres 50jährigen Jubiläums in der Folge einen eigendynamischen politischen Druck, dem standzuhalten sich auch die bundesdeutsche Regierung nicht in der Lage sah. · 148 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben Vielmehr lagen die Argumentationslinien »quer« zu diesen traditionellen Lagern. Durch den politischen Druck der NATO auf den EU-Rat (unter Präsidentschaft des bündnisgrünen Außenministers Joseph Fischer) war eine Lage entstanden, die nur durch euphemistische Informationspolitik nachträglich gerechtfertigt werden konnte. Die zentrale argumentatorische Figur war die Gleichsetzung der serbischen Politik mit Auschwitz: »Nie wieder Auschwitz ist die historische Mahnung, einen Völkermord oder eine Politik, die dahin führt, nicht zu akzeptieren.« 120 Auch ohne diese Gleichsetzung als ahistorisch und euphemistisch einzuschätzen bleibt sie Ausdruck des zugrundeliegenden moralischen Dilemmas zwischen Inkaufnahme von zivilen Opfern durch Krieg bzw. Verzicht auf Krieg. Jegliche Entscheidung für oder gegen den Krieg zur Durchsetzung von Menschenrechten führt, psychologisch gesprochen, zu einer kognitiven Dissonanz (Festinger, 1957) zwischen dem aversiven Zustand der Menschenrechtsverletzung und dem ebenfalls aversiven (vermeintlichen) Mittel des militärischen Eingreifens, zumindest solange in der Öffentlichkeit ein unausweichliches Junktim zwischen diesen beiden Alternativen hergestellt wird, das die Gangbarkeit Dritter Wege stillschweigend leugnet. In gewissem Sinne läßt sich genau dieses öffentliche Leugnen als sozial geteilte Strategie der Dissonanzreduktion auffassen. Vor diesem Hintergrund der politischen Kontroverse erschien es geboten, jenseits des ideologischen Disputs die sozialpsychologischen Prozesse der Einstellungsbildung und -änderung zu untersuchen. Hierzu wurde eine Internetuntersuchung durchgeführt, die unter der URL http://www.uni-jena.de/~sff/kosovo/ zugänglich war. 120 Heinz Loquai, General a. D. OSZE: »Hier muß ich mich wirklich beherrschen, weil der Vergleich mit Auschwitz und der Situation im Kosovo eine ungeheuerliche Behauptung ist. Man muß sich als Deutscher schämen, daß deutsche Minister so etwas getan haben, denn ein normaler Mensch, ein normaler Deutscher, wird vor Gericht zitiert, wenn er in derartigem Ausmaße Auschwitz verharmlost. Und daß ein deutscher Minister von KZs im Kosovo sprach, ist auf der gleichen Linie, denn KZs sind Einrichtungen einer bestimmten historischen Situation, nämlich der nationalsozialistischen Zeit in Deutschland. Und ich finde es im Grunde genommen ungeheuerlich, daß gerade Deutsche diese Vergleiche gewählt haben.« Manuskript der Monitor-Sendung des WDR vom 8.Februar 2001, 21.45 Uhr. http://www.wdr.de/online/news/kosovoluege/sendung_text.pdf · 149 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben 6.2.2. Hauptfragestellungen und Instrumente Die zentrale Frage der Untersuchung betraf den vermuteten Zusammenhang zwischen Autoritarismus und einer verstärkten Befürwortung aggressiver Politik. Das zugrundeliegende Rationale unterstellte vereinfacht eine Psychodynamik, die von einer wahrgenommenen Bedrohungssituation und geringer Ambiguitätstoleranz ausgehend zu dem Bedürfnis nach Komplexitätsreduktion führt, die ihrerseits ein Bestrafen der »Bösen« durch die »Guten« wünschenswert erscheinen läßt. Ähnlichen Fragestellungen wurde bereits im Vietnamkrieg und im Golfkrieg nachgegangen (Karabenick & Wilson, 1969; Larsen, 1969; Bailes & Guller, 1970; Izzett, 1971; Granberg & Corrigan, 1972; Granberg & May, 1972; Mann, 1973; Spellman & Holyoak, 1992; Doty, Winter, Peterson & Kemmelmeier, 1997). In einer weitergehenden Hypothese wurde vermutet, daß dieser in anderen Studien bereits gefundene Zusammenhang sich jedoch nicht global für alle Situationen zeigen läßt. Es wäre bspw. eine sinnvolle Mutmaßung, daß der besagte korrelative Zusammenhang mit zunehmender Schwere der bedrohenden Situation abnimmt, da in diesem Falle die Befragten leichter auf äußere Zwänge zur Rechtfertigung ihrer Entscheidung attribuieren können. Desweiteren sollte untersucht werden, in welchem Verhältnis die Einstellungen zum Kosovokonflikt zu sonstigen politischen Einstellungen stehen. Zum Prüfen der genannten Hypothesen wurde als Maß für Autoritarismus die balancierte Kurzform RWA³D (5.2.3, S.138ff.) vorgelegt, zur Erfassung der Aggressivitätstendenz konnte selbstredend nicht auf Bewährtes zurückgegriffen werden: Die Befragten wurden gebeten, für eine Reihe bereits eingetretener oder hypothetischer Situationen (Tabelle 20, S.151) diejenige Reaktion der NATO anzugeben, die sie am ehesten befürwortet hätten. Im Ergebnis ergab sich eine Situation×Reaktion- Matrix als Antwortmodell (Tabelle 21 S.152)121. 121 Die exemplarisch ausgefüllte Tabelle enthält jeweils die Modi als Antwort. · 150 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben Mögliche Situation Kurzbezeichnung 1. Einstellung der Luftangriffe und Aufheben der Sanktionen. 2. Befristete Feuerpause und Aufnahme neuer Verhandlungen. 3. Fortführung der Luftangriffe wie bisher. 4. Zusätzliche Stationierung von Bodentruppen in Nachbarstaaten, z.B. Makedonien und Bulgarien. 5. UÇK aufrüsten 6. Bodentruppen einsetzen, um Schutzzonen und Korridore zu schaffen. 7. Gesamten Kosovo besetzen. 8. Gesamte Bundesrepublik Jugoslawien besetzen. 9. Einsatz taktischer Nuklearwaffen. status quo ante bellum Feuerpause Luftangriffe Nachbarstaaten UÇK Schutzzonen Kosovo Jugoslawien Nuklearwaffen Tabelle 20: Hypothetische Situationen KOSOVOnet I Während die hypothetischen Situationen mit Bedacht keiner Reihenfolge unterlagen (etwa der Schwere der Herausforderung durch die serbische Seite), war das Antwortformat der »Reaktionen« als Ordinalskala intendiert. Die Extrempunkte waren »Einstellung der Luftangriffe und Aufhebung der Sanktionen« (status quo ante bellum) und »Einsatz taktischer Nuklearwaffen« (Tabelle 20). Die Unterstellung der Ordinalität entlang einer Dimension »Eskalationsgefahr« oder »Aggressivität der NATO-Reaktion« war zwar eine inhaltlich plausible, empirisch jedoch ungeprüfte Annahme. Allerdings sei darauf hingewiesen, daß durch die Formulierung (»zusätzliche Stationierung «) eine sukzessive Inklusivität im Sinne einer Guttman-Skala (Guttman, 1947; 1950a; 1950b) den Befragten nahegelegt wurde und daher als wahrscheinlich wahrgenommen angesehen werden kann. Zur empirischen Prüfung der Dimensionalität der Skala wurden in einem Expertenrating 10 Personen gebeten, die »Reaktionen « hinsichtlich ihrer Aggressivität zu rangieren. Die so gewonnenen Daten wurden zunächst über die Personen aggregiert (Spaltenmittelwert). Diese mittleren Rangplätze wurden nun ihrerseits rangiert, was als · 151 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben eine pragmatische Annäherung an eine »sozial geteilte Wahrnehmung« der Rangfolge aufgefaßt werden kann. status quo FeuerpauseLuftangriffeNachbarstaatenUÇKSchutzzonenKosovoJugoslawienNuklearwaffen Serbien erkennt die Autonomie des Kosovo an. .. Serbien erkennt die 5 Forderungen der NATO an. .. Makedonien und Albanien nehmen keine weiteren Flüchtlinge mehr auf. .. Weitere NATO Soldaten (z.B. auch Deutsche) .. werden Kriegsgefangene oder Opfer. Massenvergewaltigungen von Kosovoalbanerinnen werden offenkundig. .. Internierungslager (mit Folterung und Vernichtung) .. werden offenkundig. Serbien attackiert Makedonien. .. Rußland und/oder Weißrußland unterstützen Serbien .. mit offiziellen Truppen. Serbien attackiert NATO-Länder der Region (Ungarn, Italien, Griechenland). .. Serbische Terroristen greifen öffentliche Gebäude in NATO-Großstädten an. .. Tabelle 21: Beispiel der Situation×Reaktion-Matrix KOSOVOnet I · 152 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben Als Maß für die Güte dieser Übereinstimmung wurde die (Spalten)Varianz der Urteile herangezogen. In einem nächsten Schritt wurden die Ratings einer Multidimensionalen Skalierung (MDS) unterzogen, um 1. in einer eindimensionalen Lösung die inhaltlich intendierte Rangfolge zu reproduzieren bzw. Anhaltspunkte für nötige Umordnungen zu finden, sowie 2. in einer zweidimensionalen Lösung die Distanz von der ersten Dimen- sionsachse als Maß für mangelnde Anpassung einer »Reaktion« zu inter- pretieren. Die hier nicht näher dargestellten Ergebnisse decken sich weitestgehend mit der intendierten Rangfolge, als abhängiges Konstrukt »Eskalationsniveau« wurden schließlich zwei Variablen gebildet, deren Werte sich auf einer Ordinalskala abbilden lassen (Tabelle 22). Eskalationsstufe Rangplatz Oberkategorie modif. Rangplatz status quo 1 »Verhandeln» 1 Feuerpause 2 Luftangriffe 3 »Weiter wie bisher» 2 Nachbarstaaten 4 UÇK Schutzzonen gestrichen [5] 6 »Bodentruppen» 3 Kosovo 7 Jugoslawien 8 »Strafaktionen» 4 Nuklearwaffen 9 Tabelle 22: Operationalisierung Eskalationsniveau KOSOVOnet I Desweiteren wurde die Politische Orientierung (Links-Rechts-Orientierung) erfragt und die Sonntagsfrage zur Beantwortung vorgelegt. 6.2.3. Stichprobe Es wurde eine Internetuntersuchung durchgeführt, die wiederum nach dem Pull- Verfahren Internetnutzer befragte, die aktiv nach Informationen und Umfragen zum besagten Konflikt gesucht haben. Vom 14. Juni bis 1. Juli 1999 nahmen 152 Befragte an der Untersuchung teil. Bereits nach drei Tagen hatten ¾ der Stichprobe die Seite besucht und den Fragebogen ausgefüllt. Das Geschlechterverhältnis war ausgewogener als 1998 (. Frauen, . Männer, vgl. Seite 146). Der Modus des Lebensalters lag bei 22, das arithmetische Mittel bei 24 Jahren. Das Gros der · 153 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben Stichprobe bestand aus Studierenden (70%) sowie wissenschaftlichen Mitarbeitern und Angestellten (je 7%). Für die Charakterisierung der Stichprobe gelten die kri- tischen Bemerkungen von Abschnitt 6.1.3 S.146 ff. sinnentsprechend. Eine zusam- menfassende Kritik der Stichproben bei Internetbefragungen findet sich auf Seite 323. 6.3. Studie III: KosovoNet II zum Tschetschenienkonflikt 6.3.1. Erhebungsmodus und Erhebungszusammenhang Im Herbst 1999 eskalierte der schon länger andauernde bewaffnete Konflikt zwi- schen Rußland und Tschetschenien. Der damalige russische Präsident Jelzin recht- fertigte die massiven Militärschläge in offener Analogie zum Kosovokonflikt mit dem Kampf gegen separatistische Terroristen, die völkerrechtliche Lage (UNO, OSZE) verwehrte in ähnlicher Weise ein solches drastisches Vorgehen, die Jelzin- Administration setzte sich darüber hinweg und nahm die katastrophalen Folgen für die Bevölkerung nicht nur billigend in Kauf. Die Menschenrechtsverletzungen werden euphemistisch als Kollateralschäden verzeichnet. In der zweiten Januarhälfte 2000 suchte eine weitere Internetuntersuchung den Anschluß an die Studie zum Kosovokonflikt. 6.3.2. Hauptfragestellungen und Instrumente In der ersten Studie zum Kosovokrieg (Abschnitt 6.2 Seite 147ff.) stand der Zu- sammenhang zwischen Autoritarismus und einer prospektiven Befürwortung mili- tärischer Aktionen der NATO im Mittelpunkt. Die hier dargestellte Nachfolge- studie interessierte sich für die restrospektive moralische Einschätzung des Bundes- wehreinsatzes im Kosovokrieg sowie die eventuelle Übertragung der Recht- fertigungsstruktur auf den Tschetschenienkonflikt. · 154 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben Das Rationale läßt sich zusammenfassen: a. Wenn das NATO-Eingreifen aus moralischen Gründen als nötig und angemessen eingeschätzt wurde und b. die Konflikte als strukturell ähnlich angesehen werden, dann sollte c. auch für den Tschetschenienkonflikt ein militärisches Eingreifen als nötig und angemessen impliziert sein. Es wurde wiederum die RWA³D zur Erfassung von Autoritarismus vorgelegt; ebenso waren die Sonntagsfrage sowie die Frage nach der politischen Selbsteinordnung abermals dabei. Da der Tenor der Untersuchung nach dem Umgang mit Konflikten fragte, wurde eine Skala zur Erfassung von Konfliktstilen aufgenommen (Eher, Binter, Scholze & Aigner, 1997; Eher, Aigner, Demal & Serim, 1996). Weitere Frageblöcke beschäftigten sich mit den künftigen Aufgaben der Bundeswehr sowie mit der Einstellung zu verschiedenen Parteien und Organisationen (bspw. NATO, Kriegsverbrechertribunal, Vereinte Nationen, Burschenschaf- ten)122. Zwei randomisiert zugeteilte Versionen des Fragebogens123 enthielten eine sehr subtile Salienzmanipulation, bei der a) die personale Identität und b) die nationale Identität als Ebene der Selbstkategorisierung salient gemacht werden sollte. Dieses Vorgehen bezieht sich auf die Selbstkategorisierungstheorie von John Turner und Mitarbeitern (Turner & Oakes, 1989; Hogg & Turner, 1987; Turner et al., 1987) und folgt einem Paradigma von Verkuyten & Haagendorn (1998).124 Der Einleitungstext lautete in der personalen Bedingung: a) »Jeder Mensch ist einzigartig und unterscheidet sich von anderen in vielen Merkmalen und Eigenarten. Wie unterscheiden Sie sich von Ihren Mitmenschen? Dieser Fragebogen richtet den Blick auf Sie persönlich als Individuum.« und in der kollektiven Bedingung sinnentsprechend: 122 Diese Einstellung wurde als Sympathie bzw. Distanz auf einer siebenstufigen Skala operationalisiert. Diesem Vorgehen lag die Auswertungsabsicht zugrunde, die Einstellungen multidimensional zu skalieren und in diese Skalierung auch die RWA-Items eingehen zu lassen. 123 http://www.uni-jena.de/~sff/konfliktforschung/anfang.html bzw. http://www.uni-jena.de/~sff/konfliktforschung/beginn.html 124 Vergleiche die theoretischen Ausführungen dazu in Fußnote 30 auf Seite 43. · 155 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben b) »Menschen fühlen sich gewöhnlich verschiedenen sozialen Gruppen zugehörig: einer Berufsgruppe, ihrem Geschlecht, ihrer Nation, einer politischen Strömung oder einem Fußballverein. All diese Gruppen unterscheiden sich voneinander und sind in ihrer Eigenart einmalig. Dieser Fragebogen richtet den Blick auf Sie als Angehörige(n) Ihrer nationalen Gruppe.« Vertieft wurde die Salienzmanipulation mit a) einer offenen Frage nach persönlichen Hobbys und Eigenschaftswörtern, mit denen man sich selbst beschreiben würde bzw. b) mit einer offenen Frage nach der Nationalität und entsprechenden assoziierten Eigenschaftsworten. 6.3.3. Stichprobe Vom 17.-23.Januar 2000 nahmen 273 Teilnehmer an der Internetuntersuchung teil. Die meisten der Befragten waren zwischen 20 und 25 Jahren; wiederum waren die Männer überrepräsentiert (. vs .). Etwa zwei Drittel kamen aus den alten Bundesländern (s. a. Abschnitt 11.1 S.323). 6.4. Studie IV: NEO I zu Politik und Persönlichkeit 6.4.1. Erhebungsmodus und Erhebungszusammenhang Die Studie wurde als klassische Fragebogenuntersuchung (paper&pencil) konzipiert, die Bögen maschinell eingelesen125. Die Teilnehmer wurden gebeten, an einer Studie zum Thema »Persönlichkeitsstruktur und politische Orientierung« teilzunehmen. Es gab keine explizite Bezugnahme auf aktuelle politische Themen. 6.4.2. Hauptfragestellungen und Instrumente Es sollte der Zusammenhang von rechtem Autoritarismus als generalisierte, aber dennoch relativ konkrete Einstellung (Six, 1996) mit allgemeineren Persönlichkeitseigenschaften untersucht werden. Insbesondere die Einordnung von Autoritarismus in ein etabliertes Beschreibungssystem der Persönlichkeitspsychologie war hier von Interesse. Die einflußreichste und wissenschaftlich derzeit am besten belegte Persönlichkeitstheorie geht in ihrer strengen Auslegung davon aus, daß sich die Persönlichkeitsstruktur mit fünf übergeordneten Traits (»Big Five«) beschreiben läßt. Da diese als notwendig und hinreichend unterstellt werden, folgt daraus logisch zwingend, daß 125 Als Scansoftware kam FineReader™ zum Einsatz. · 156 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben Autoritarismus – wenn er als Persönlichkeitskonstrukt verstanden wird – mit einer oder mehreren dieser Beschreibungsdimensionen korrelieren muß. Hierzu gibt es erste Evidenz (Riemann, Grubich, Hempel & Mergl, 1993; Goldberg & Rosolack, 1994; Peterson, Smirles & Wentworth, 1997; Paulhus et al., 1995; Butler, 2000). Die 12 Items der RWA³D wurden zu 60 Items des NEO-FFI (Borkenau & Ostendorf, 1991; Costa & McCrae, 1992) in Beziehung gesetzt. Als weiteres persönlichkeitspsychologischen Konstrukt mit konzeptueller Nähe zu Autoritarismus wurde Ambiguitätsintoleranz erhoben. Dazu wurde die Scale for the Assessment of Intolerance of Ambiguity (SIA) vorgelegt (Wolfradt & Rademacher, 1999). Sonntagsfrage sowie politische Selbsteinordnung wurden ergänzt durch eine Reihe weiterer Fragen zu politischen Einstellungen: Nähe/Distanz zu politischen Parteien, politische Aktivität, Ausländerfeindlichkeit/-freundlichkeit (je drei Items) und ein inhaltsbereinigtes Maß für Politische Intoleranz (Content-controlled Measure of Political Intolerance, Sullivan, Piereson & Marcus, 1979; 1982). Der Fragebogen wurde in zwei Versionen konstruiert, die jeweils randomisiert vorgelegt wurden. Die Versionen variierten die Darbietungsreihenfolge der NEO- Items, um ein ausgewogenes Muster fehlender Werte zu erreichen.126 6.4.3. Stichprobe In Abweichung von den anderen hier dargestellten Studien handelte es sich bei dieser Untersuchung um eine klassische paper&pencil-Befragung. Folglich wurden auch die Teilnehmer auf abweichende Weise rekrutiert: Ausgehend von einer studentischen Arbeitsgruppe wurde in einem multizentrischen Schneeballverfahren (snowball sampling, chain referral, referential sampling) eine sehr heterogene Stichprobe angesprochen. Teilweise handelte es sich dabei um Studierende und ihre Eltern und Freunde (etwa zwei Drittel). Ein wesentlicher Teil der Stichprobe wird jedoch durch Schülerinnen und Schüler gebildet.127 Diese Zusammensetzung der Stichprobe erklärt auch die zweigipflige Altersstruktur: ¾ der Befragten waren un126 Jeweils dreißig Items des NEO-FFI wurden am Anfang und am Ende des Fragebogens präsentiert. Es machten jedoch nur 12 Personen von der Möglichkeit gebrauch, die zweite Hälfte wegzulassen. 127 Unter den Eltern der Befragten gab es einige Lehrer, die in ihrer Verantwortung ihre Schüler um eine Teilnahme gebeten haben. · 157 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben ter 30 Jahren, ein weiterer Gipfel bei der Altersgruppe 45-49 weist jedoch auf die Elterngeneration der Befragten hin. Das Geschlechterverhältnis war weitgehend ausgewogen (55% Frauen), Ostdeut- sche waren mit 80% überrepräsentiert. Insgesamt gingen 455 Befragte in die Unter- suchung ein. 6.5. Studie V: NEO II zu Politik und Persönlichkeit 6.5.1. Erhebungsmodus und Erhebungszusammenhang Wie bereits in der Studie NEO I wurden Politische Einstellungen mit Persönlich- keitseigenschaften in Beziehung gesetzt. Der Erhebungsmodus einer Internetunter- suchung ermöglichte die randomisierte Zuweisung der Befragten zu fünf quasiex- perimentellen Bedingungen. 128 Diese Manipulation variierte den Erhebungs- zusammenhang für die Befragten: Zunächst bekamen alle Befragten die 12 Items der RWA³D vorgelegt.129 Nach Absenden und Speichern dieses ersten Fragebogen- teils gelangten die Untersuchungsteilnehmer auf eine zweite Seite, die mit »Aktuel- le Politische Themen« überschrieben war. In Abhängigkeit von der zugewiesenen Untersuchungsbedingungen wurde der anknüpfende Fragebogenteil auf eine der nachstehenden Weisen eingeleitet (s.a. Tabelle 23 auf der Folgeseite): 128 http://www.uni-jena.de/~sff/politik/ 129 »Erster Teil: Allgemeine Fragen – Im folgenden haben wir zwölf Aussagen zusammengestellt, die man von Zeit zu Zeit hören kann.« · 158 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben Die jüngste Welle rechter Gewalt hat in Deutschland eine neue Diskussion um den Rechtsextremismus hervorgerufen. Politiker beraten über Parteienverbote für NPD, Bedingung I DVU oder Republikaner. »pro-Verbot-Argumente« Für ein Verbot 130 werden unter anderem die folgenden Argumente ins Feld geführt: […] […] Gegen ein Verbot werden jedoch Bedingung II unter anderem die folgenden Argumente »kontra-Verbot-Argumente« ins Feld geführt: […] […] Einige der pro- und kontra-Argumente, Bedingung III die zur Zeit diskutiert werden: […] »pro- und kontra « Nun ist es auch in Deutschland soweit. Na- türlich haben die BSE-Erreger nicht an der Grenze halt gemacht. Kontrollgruppe I [gefolgt von ein paar vertiefenden allgemeine (unpolitische) Bedrohung Bemerkungen über die Bedrohlichkeit für die Verbraucher] Ohne einleitenden Satz, nur Überschrift: Kontrollgruppe II »Zweiter Teil – keine Bedrohung Aktuelle politische Themen« Fragebogenvariante (Bedrohungs-Manipulation) Cumulative Frequency Percent Valid Percent Percent Valid nur pro Verbot 81 19.5 19.5 19.5 nur kontra Verbot 83 20.0 20.0 39.4 pro- und kontra 87 20.9 20.9 60.3 KG BSE 78 18.8 18.8 79.1 KG keine Bedrohung 87 20.9 20.9 100.0 Total 416 100.0 100.0 Tabelle 23: Quasiexperimentelle Versuchbedingungen NEO II Die Intention hinter der quasiexperimentellen Manipulation wird aus dem nachfolgenden Abschnitt 6.5.2 deutlich. 6.5.2. Hauptfragestellungen und Instrumente Die quasiexperimentelle Manipulation der Bedrohungssituation diente der systematischen Untersuchung des Zusammenhangs von Bedrohung und Bestrafungs130 Im Original ohne Hervorhebung · 159 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben tendenz.131 Die globale Hypothese erwartete einen positiven korrelativen Zusammenhang zwischen Bedrohung und Punitivität (sozialpsychologische Argumentation). Gleichzeitig wurde ein (differentialpsychologischer) Interaktionseffekt mit dem individuellen Autoritarismus der Befragten vermutet. Diesem Gedanken folgend müßten Autoritäre generell eine erhöhte Punitivität zeigen, vor allem aber Bedrohungssituationen sollten als Auslöser bestrafender Impulse dienen. Wiederum wurden die 12 Items der RWA³D zu maximal 60 Items des neo-ffi (Borkenau & Ostendorf, 1991; Costa & McCrae, 1992) in Beziehung gesetzt. Die Befragten hatten die Wahl, sich für die volle Fragebogenlänge zu entscheiden oder aber eine Kurzversion aus 30 oder 10 Items. Die Items wurden durch einen Randomisierungsalgorithmus (ohne Zurücklegen) unter Wahrung der Dimensionalität gezogen. Dadurch wurde ein Muster fehlender Werte erreicht, das die notwendige Annahme der Missingness completely at Random (mcar, vgl. Graham, Taylor & Cumsille, 2001; Wothke, 2000; Bernaards & Sijtsma, 1999; Graham, Hofer & MacKinnon, 1996) a priori sicherstellt.132 Die Punitivitätsneigung wurde durch das Vorlegen vermeintlicher Agenturmeldungen erhoben (Beispiel in Abbildung 22). Zu jedem von vier Delikten sollten die Befragten in der Rolle der Staatsanwaltschaft Strafanträge stellen. Das Antwortformat reichte von Freispruch über Geld- und Bewährungsstrafen bis zur Festlegung einer zu spezifizierenden Haftstrafe.133 131 Ein Manipulation-Check kontrollierte das subjektive Bedrohungsempfinden. 132 Meines Erachtens impliziert jedoch hinsichtlich der inhaltlichen Konstruktvalidität selbst MCAR nicht völlige nonignorability, obgleich sich letztere auch einer empirischen Prüfung entzieht. 133 Todesstrafe wurde ebenfalls zur Auswahl gestellt, obgleich sie nicht mehr verhängbar ist. · 160 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben Abbildung 22: Stimuli (fingierte Agenturmeldungen) Die anderen Delikte bestanden in Sexuellem Mißbrauch, schwerer Körperverletzung gegen Ausländer und in Polizeigewalt gegen Demonstranten. Letzterer Straftatbestand ist insofern interessant, als hier die zu bestrafenden Täter selbst zur »Autorität « gehören. Hier könnte ein Suppressionseffekt erwartet werden (vgl. Feather, 1998; Henkel, Sheehan & Reichel, 1997; Hageman, 1985). Eine grobe O- · 161 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben perationalisierung der so erhobenen Bestrafungstendenz aggregierte die verhängten Haftstrafen über alle vier Delikte hinweg.134 Im weiteren Sinne gehört auch das Verbotsbegehren gegenüber politischen Partei- en, namentlich der Nationaldemokratischen Partei Deutschlands (NPD), zur Pu- nitivität. Hierzu wurden drei dahingehende Items formuliert. 6.5.3. Stichprobe Entsprechend der Anlage der Untersuchung als netzbasierte Studie erfolgte die Rekrutierung der Teilnehmer per Werbung in verschiedenen Newsgoups und per Handzettel. Von 20. September 2000 bis 13. März 2001 nahmen 416 Personen an der Untersuchung teil. Das Geschlechterverhältnis war ausgewogen (45% weiblich, 55% männlich), das mittlere Alter der Befragten lag bei 25 Jahren (Median 23). Gemessen an der Grundgesamtheit waren Westdeutsche mit 53% leicht relativ un- terrepräsentiert. 6.6. Studie VI: RWAnet98/Zukunft 6.6.1. Erhebungsmodus und Erhebungszusammenhang Im Frühjahr 2001 wurde im Zusammenhang mit medialen »Enthüllungen« über die militante Jugend der Bundesminister Trittin und Fischer der Wertewandel der 68er Generation diskutiert.135 Vor diesem Hintergrund bot es sich an, eine Inter- netuntersuchung zum Thema »Jugend, Elterngeneration und politischer Einstel- lungswandel« durchzuführen. Unter der URL http://www.uni-jena.de/~sff/zukunft wurden Internetnutzer zur Teilnahme eingeladen. Teilweise wurden die Befragten aus einem im Aufbau be- findlichen Panel rekrutiert (vgl. auch 6.6.3 S.164ff.). 134 Der Vorteil bestand im dadurch erreichten Intervallskalniveau. Dazu mußten jedoch die Extrempunkte des Antwortformats ausgeklammert werden. Für die Auswertung auf Basis der gesamten Spannweite möglicher Antworten sind nonparametrische Verfahren indiziert. 135 Vgl. hierzu z.B. http://wdr.de/online/news/joschkasjugendsuenden/; http://www.spiegel.de/politik/deutschland/0,1518,113488,00.html; http://www.wsws.org/de/2001/mar2001/fisc-m10.shtml · 162 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben RWA 6.6.2. Hauptfragestellungen und Instrumente Die zentrale wissenschaftliche Absicht bestand in einer Adaption der bisher unübersetzten neuen Autoritarismusskala von Bob Altemeyer (Altemeyer, 1998) für den deutschen Sprachraum. Dazu wurden die 30 Items der 97er Version der 136 lege artis ins Deutsche übertragen (vgl. auch das Vorgehen bei der RWA96 in Abschnitt 5.1.1 S.134ff.) und gemeinsam mit der RWA³D den Befragten vorgelegt. Zwei randomisierte Versionen variierten die Reihenfolge der Items. In einer Fassung wurden die Befragten gebeten, die 12 Items der RWA³D aus der Sicht ihrer Eltern zu beantworten, in der anderen folgte dieser Fragebogenteil isoliert am Ende. Hier wurde vermutet, daß die räumliche Nähe zu einer stärkeren Kontrastierung zu den (Antworten der) eigenen Eltern führt. Im Mittelteil folgten wie in allen anderen hier besprochenen Studien Fragen zum Politischen Selbstverständnis. Im Abschluß wurde an einen zu dieser Zeit aktuellen medialen Diskurs über Erziehungsstile angeknüpft: Die Befragten sollten retrospektiv ihre selbst erfahrene Erziehung auf den Dimensionen Wertschätzung (support) und Lenkung/Strenge (control) einschätzen (Baumrind, 1968; 1971; 1975; Weiss & Schwarz, 1996). Abschließend folgte die retrospektive Einschätzung, welche Erziehungsziele in der eigenen Adoleszenz zentral waren. Durch die Versionszuweisung wurde hier variiert, ob sich diese Ziele allgemein auf die Erziehung oder auf konkrete Konfliktsituationen beziehen. Aus den erhobenen Konstrukten folgt plausibel die Fragestellung des multivariaten Zusammenhangs zwischen aktuellen politischen Einstellungen einerseits und retrospektiver Einschätzung der eigenen Erziehung andererseits. Hierbei sei ausdrücklich betont, daß aus der zeitlichen Vorgeordnetheit kein kausaler Zusammenhang zwischen Erziehung und späterer politischer Einstellung im Sinne einer Prägung abgeleitet werden soll. Gleichermaßen plausibel ist eine retrospektive konsistenzwahrende Rekonstruktion und damit einhergehende Verzerrung der Erziehung, mit der die Befragten ihre aktuellen politischen Einstellungen legitimieren. 136 vgl. Fußnote 109 S.138. · 163 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben 6.6.3. Stichprobe Die Stichprobe wurde im Wesentlichen wie bei den vorangegangenen Internetun- tersuchungen rekrutiert (vgl. 6.1.3 S.146.; 6.2.3 S.153.; 6.3.3 S.156; 6.5.3 S.162). Ab- weichend von den anderen Internetstudien kam darüber hinaus ein Push- Verfahren zur Anwendung, indem Teilnehmer aus vorangegangenen Studien, die ihre e-mail-Adresse hinterlassen hatten, wiederum zur Teilnahme aufgefordert wurden. Dadurch wurde es möglich, die Wiederholungstestreliabilität der RWA³D zu schätzen (vgl. im Anhang Tabelle 141, S.361). Das Geschlechterverhältnis war mit eine leichten Imbalance seitens der weiblichen Befragten (55%) nahezu ausgewogen. Es handelte sich um eine überwiegend (aber nicht ausschließlich) studentische Stichprobe (69%), wodurch das durchschnittli- che Lebensalter der Befragten bei 26 Jahren lag (Median 24). Die meisten Befrag- ten (72%) wuchsen in den alten Bundesländern auf. Da in der Studie die Bezie- hungen zu den Eltern thematisiert wurden, sei hier erwähnt, daß 20% der Teilnehmenden Einzelkinder waren, 87% hatten noch keine eigenen Kinder, bei 16% waren die Eltern geschieden. Vom 8. Juni bis 19. Juli 2001 gingen 289 Datensätze in die Auswertung ein. 6.7. Studie VII: Strafvollzug 6.7.1. Erhebungsmodus und Erhebungszusammenhang Die folgende Untersuchung unterscheidet sich von den anderen bisher unter Punkt 5.2.3 (S.138ff.) vorgestellten Studien dadurch, daß sie nicht durch den Autor durchgeführt, sondern lediglich inhaltlich und methodisch begleitet wurde. Christiane Müller (2001) untersuchte Insassen einer Jugendstrafanstalt hinsichtlich der Veränderung politischer Einstellungen und Persönlichkeitseigenschaften wäh- rend der Verbüßung der Haftstrafe. 6.7.2. Hauptfragestellungen und Instrumente Die zentrale Fragestellung befaßt sich mit der Veränderung politischer Einstellun- gen und Persönlichkeitseigenschaften – insbesondere Autoritarismus – im Kontext einer Haftstrafe. · 164 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben Diesem Ziel folgend war es sinnvoll, verschiedene Maße zur Erfassung von Autori- tarismus und ähnlichen Konstrukten vorzulegen, die sich vor allem hinsichtlich ih- rer Veränderungssensitivität unterscheiden. Dies war zu vermuten bei der RWA- Scale von Altemeyer (in dem Falle der RWA³D – Funke, 1999), der verhaltensnä- heren Autoritarismusskala von Detlef Oesterreich (1996; 1998) und der ebenfalls in dem Zusammenhang diskutierten Social Dominance Orientation Scale (SDO) von Jim Sidanius und Mitarbeitern (Pratto et al., 1994; Pratto et al., 2000; Sidani- us & Pratto, 1999). Ebenfalls erhoben wurden verschiedene Fragen zur Gewaltbe- reitschaft und Ausländerfeindlichkeit (vgl. bspw. Frindte, 1995; Frindte et al., 1999; Funke et al., 1999). 6.7.3. Stichprobe Dem Design der Untersuchung entsprechend wurden unerfahrene und erfahrene Gefangene (mind. 6 Monate Strafhaft bereits verbüßt). Von den anfänglich 50 Er- fahrenen nahmen 36 auch an der zweiten Erhebung teil. Die Anzahl der Unerfah- renen reduzierte sich von 46 auf 29. Die Teilstichproben sind homogen hinsicht- lich Alter und Schulbildung. Ein problematisches Ungleichgewicht besteht – naturgemäß – hinsichtlich der begangenen Delikte: unter den »Erfahrenen« sind mehr schwere Fälle (vor allem Gewaltdelikte), während in der Gruppe der Uner- fahrenen Verstöße gegen das Betäubungsmittelgesetz überwiegen. Im Fazit handelt es ich um eine sehr kleine aber interessante Fokusstichprobe, für die sich jedoch Strukturgleichungsmodelle als Analysemethode ausschließen. 6.8. Studie VIII: Terror und Politische Kultur 6.8.1. Erhebungsmodus und Erhebungszusammenhang Nach den Terroranschlägen in Washington und New York vom 11. September 2001 änderte sich die politische Kultur sowohl auf internationaler Ebene als auch in einzelnen Staaten. Die Frage nach der Berechtigung »präventiver« Militärschlä- ge gegen Länder, die den Terrorismus billigend in Kauf nehmen oder unterstützen bekam eine neue Qualität. Gleichzeitig wurden durch die Einführung von Anti- Terror-Gesetzen in vielen Staaten die Bürgerrechte teilweise drastisch einge- schränkt. All dies sind Veränderungen in der politischen Kultur und dem damit · 165 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben verbundenen normativen Rahmen, die im Zusammenhang mit Autoritarismus di- rekte Relevanz erkennen lassen. Aus psychologischer Sicht ist auch die fatale Kanalisierung des öffentlichen Dis- kurses in »die Guten und die Bösen« höchst interessant.137 In sechs Wochen von Dezember 2001 bis Februar 2002 wurde daher eine Internet-Studie zu den Folgen der Terroranschläge auf die politische Kultur und die internationale Sicherheitsla- ge durchgeführt.138 6.8.2. Hauptfragestellungen und Instrumente Folgerecht wurde Autoritarismus in Beziehung gesetzt zu makrosozialen Stresso- ren, zur Befürwortung des Afghanistankrieges und zur Einschränkung der demo- kratischen Rechte in Deutschland. Die unterstellte Psychodynamik liegt auf der Hand: Autoritäre fühlen sich stärker terrorisiert und reagieren unter dieser tatsäch- lichen oder konstruierten Bedrohung mit ihrem üblichen vereinfachenden Reper- toire: Bestrafungstendenz, Rache, Einschränkung der Demokratie. 6.8.3. Stichprobe Im Untersuchungszeitraum gingen die Antworten von 381 Teilnehmern in die Auswertung ein. Das Geschlechterverhältnis war in dieser Studie perfekt ausgewo- gen. Der Modus des Lebensalters lag bei 23 Jahren, über die Hälfte der Befragten waren zwischen 20 und 30 Jahre alt. 6.9. Studie IX: Bundestagswahl 2002 Den vorläufigen Abschluß der Studien mit einer unveränderten Version der RWA³D bildet die während der Drucklegung dieses Aufsatzes noch laufende Untersuchung zur Bundestagswahl 2002139. Die Befragung im Internet ist modular aufgebaut und thematisch sehr breit angelegt. Die Besonderheit besteht einerseits 137 vgl. auch George W. Bushs Rede zur Lage der Nation: State of the Union Address http://www.whitehouse.gov/news/releases/2002/01/20020129-11.html) 138 http://www.uni-jena.de/~sff/terror/ 139 Pressemitteilung in der Thüringer Landeszeitung (31. August 2002), http://www.tlz.de/tlz/tlz.politik.volltext.php? [in einer Zeile!] id=221068&zulieferer=tlz&rubrik=Thueringen&kategorie=THU®ion=National · 166 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben in einem Wiederholungsmessungsdesign, das Einstellungsänderungen durch den Ausgang der Wahl fokussiert. Andererseits wird durch ein Priming die Salienz der sozialen Kategorie manipuliert. In Anlehnung an das Paradigma von Maykel Ver- kuyten und Louk Hagendoorn (1998) wurde versucht, entweder die personale, na- tionale bzw. die Geschlechtsidentität salient zu machen (vgl. auch Reynolds et al., 2001). Die Untersuchung steht unter http://www.uni-jena/online-research/wahl2002/ im Internet zur Verfügung. 6.10. Zusammenfassung der ersten fünf Studien mit der RWA³D In fast allen der hier besprochenen Studien wurde den Befragten die RWA³D zur Beantwortung vorgelegt. Bei den ersten fünf Untersuchungen wurden ähnliche Stichproben angezielt, die sich hinsichtlich der demographischen Zusammensetzung nicht wesentlich voneinander unterschieden. Der Befragungsmodus wich lediglich in der dritten Studie (NEO1) ab; hier wurden die Daten in konventioneller Weise mit Fragebögen erhoben (paper & pencil). Die vier anderen Erhebungen wurden im Internet durchgeführt. Daher wurde die Vergleichbarkeit der Stichproben aus den ersten fünf Studien mit der RWA³D überprüft, um die Datensätze ggf. für die Itemanalysen zusammenzufassen oder zumindest teilweise zusammengefaßt darzustellen. Dies dient lediglich dem Ziel, bei hinreichender Vergleichbarkeit der Stichproben die Überprüfung der alternativen Meßmodelle auf eine breitere Datenbasis zu stützen. Dieses Vorgehen betrifft lediglich die Phase der Modellfindung und –modifikation. Die Validierung erfolgt selbstverständlich nur innerhalb der einzelnen studienbezogenen Stichpro- ben.140 Die in Tabelle 24 wiedergegebenen Häufigkeiten beziehen sich auf die Stichprobengrößen nach Löschung aller Datensätze, bei denen mindestens ein RWA³D-Item nicht beantwortet wurde. Dieses konservative Vorgehen führte zu einer Verringerung der Stichprobengröße von 1585 auf 1458 (92%). Dennoch war 140 Während der Arbeit an diesem Aufsatz wurden etwa halbjährlich weitere Studien zur Validierung durchgeführt. Der zeitliche Rahmen ist durch die beiden Bundestagswahlen 1998 und 2002 abgesteckt. · 167 Friedrich Funke __________________________________________________________Die empirische Basis II: Erhebung und Stichproben dies sinnvoll, da ein fehlender Wert auf der 12-Item-Skala meist ein Abbrechen nach mehr oder weniger willkürlichem Ankreuzen impliziert. Cumulative Frequency Percent Valid Percent Percent Valid KosovoNet1 134 9.2 9.2 9.2 KosovoNet2 242 16.6 16.6 25.8 NEO1 425 29.1 29.1 54.9 NEO2 368 25.2 25.2 80.2 Zukunft 289 19.8 19.8 100.0 Total 1458 100.0 100.0 Tabelle 24: Stichprobengrößen der eigenen Studien II-VI mit der RWA³D Der Anhang dokumentiert die Itemanalysen hinsichtlich der zentralen Tendenz (12.1.4.2) und Varianz (12.1.4.3) als auch der Verteilungsform (12.1.4.4) der Itemantworten (S. 340ff.) · 168 7. Empirisches I – Dekomposition »Exploratory factoring is used when you have little or no idea of what ›components‹ exist in the data. Confirmatory factor analysis is used to test hypotheses about what factors underlie a set of results. The difference is essentially that between ›I wonder what the heck is going on‹ and ›I wonder if what I think is going on is going on‹.« (Altemeyer, 1996, S.53) 7.1. Sinn und Zweck der Dekomposition In Anlehnung an das in Abschnitt 4.1 auf den Seiten 77ff. beschriebene Prozedere werden im Folgenden die Ergebnisse der exploratorischen Verfahren dokumentiert und diskutiert. Ziel dieser Suche ist das Auffinden charakteristischer Strukturen in den Antwortmustern der Befragten, von denen man auf eine von den Personen in die Items »hineingelegte« konzeptuelle Struktur schließen könnte. Absichtsvoll werden dabei die traditionell üblichen Verfahren genutzt, um die Forschungspraxis mit ihren Grenzen zu verdeutlichen. An einigen Stellen werden Friedrich Funke __________________________________________________________________________ Empirisches I – Dekomposition Empfehlungen für das Überschreiten dieser Grenzen durch leichte Modifikationen gegeben. 7.2. Konventionen der Darstellung der Dekomposition Bei der Darstellung der Ladungsmatrizen ist es in vielen Veröffentlichungen und Testmanualen üblich geworden, lediglich die jeweils höchste Ladung jedes Indikators zu berichten und die Sekundärladungen auf den weiteren Komponenten zu löschen. Diese Praxis trägt zweifellos zur besseren Übersichtlichkeit bei. Gleichwohl suggeriert dies irreführend, daß es keine von 0 verschiedenen Sekundärladungen gäbe, was aber nur bei restringierten bzw. konfirmatorischen Faktoranalysen der Fall ist. Aus diesem Grunde werden in den hier dargestellten Hauptkomponentenanalysen a) die Ladungen pro Faktor der Größe nach geordnet und b) alle Sekundärladungen angegeben, die größer gleich 0.3 sind. 7.3. Dekomposition der RWA96 7.3.1. Globale Hauptkomponentenanalysen Zunächst wurde eine PCA über die Korrelationsmatrix der 30 Items (rwa_5 bis rwa_34) gerechnet. Die ersten vier Aussagen der RWA-Skala sind lediglich »Auf- wärmitems« (sog. »tablesetters«, s. Altemeyer, 1996, S.15). Fehlende Daten wurden paarweise gelöscht 141 . Die entgegen der Merkmalsrichtung formulierten Items (contraits) wurden vor der Analyse rekodiert, so daß hohe Werte generell eine star- ke Ausprägung von Autoritarismus bedeuten142. Die Voraussetzungen zur Durch- führung einer Faktoranalyse sind gegeben (vgl. Anhang Tabelle 113, S.333).143 141 Dieses Vorgehen führte zu 65 (Item 1) bis 180 (Item 15) fehlenden Werten. 142 Die Wahl der Variablennamen soll die charakteristischen Merkmale der Items unterstreichen: P und N am Anfang geben die Polung wieder (positiv vs negativ), dem folgt eine grobe Zuordnung zu den drei Dimensionen (A vs S vs C und Mischtypen). Die Zahl bezieht sich auf die Itemnummer der Skala von Al- temeyer, 1996. 143 Das KMO-Kriterium ist eine Statistik, die den Anteil gemeinsamer Varianz der Variablen beschreibt. Ho- he Werte sind daher ein Indiz dafür, daß die gemeinsame Varianz durch einen »Faktor« erklärt werden kann. Die obere Grenze des KMO liegt bei 1.0, unter 0.5 gilt das Verfahren als nicht angemessen. Der Fortsetzung auf Folgeseite … · 170 Friedrich Funke __________________________________________________________________________ Empirisches I – Dekomposition 7.3.1.1. Extraktion nach Kaiserkriterium Nach dem sogenannten Kaiser- oder Kaiser-Guttman-Kriterium (Guttman, 1954b; Kaiser & Dickman, 1959) werden alle Faktoren extrahiert, die einen Eigenwert .>1 haben. Dies sollte jedoch lediglich als obere Grenze der bedeutsamen Faktoren angesehen werden, da diese Extraktionspraxis in aller Regel zu einer Überfaktorisierung führt. Das es sich bei dem genannten Kriterium jedoch um die Standardeinstellung von SPSS handelt, werden die Ergebnisse dargestellt, um die gängige Forschungspraxis nachzuvollziehen (»Little Jiffy«)144. Sowohl die varimax-rotierte Lösung (Kaiser, 1958; 1959) als auch die schiefwinklige oblimin-Lösung (Jennrich & Sampson, 1966) sind im Anhang dargestellt (vgl. Tabelle 113 und Tabelle 114, S.333ff.)145. Es werden fünf Hauptkomponenten extrahiert. Die fünfte Hauptkomponente wird lediglich durch ein einziges Item (p_a_26) beschrieben. Der Grund hierfür erschließt sich aus dem Inhalt: »Im Interesse aller sollte der Staat Zeitschriften zensieren, damit die Menschen gar nicht mit widerwärtigem Schundmaterial in Berührung kämen.« Einerseits ist es die Intention des Items, ein autoritär aggressives Durchgreifen abzufragen. Ein Teil der Befragten jedoch »ergänzt« wohl die angesprochenen Zeitschriften um das Attribut »rechtsextreme […]«, da dies durch den Kontext der anderen Items und vor allem durch die aktuelle öffentliche Diskussion naheliegt bzw. nahegelegt wird. Diese Befragten beantworten das Item aus ihrer Sicht sozial erwünscht oder politisch korrekt, indem sie sich von rechten Zeitschriften distanzieren. Die Folge von diesem Antwortverhalten ist der besagte Artefakt. Auch in der schiefwinklig rotierten Lösung wird die fünfte Komponente lediglich durch das Zensuritem p_a_26 konstituiert. Diese fünfte Komponente liegt auch nahezu orthogonal zu den anderen Faktoren, wie aus der fünften Spalte in Tabelle 115 (S.335) zu entnehmen ist. Die anderen Komponenten hingegen »profitieren« Fortsetzung der Fußnote: Bartlett-Test prüft gegen die Hypothese, daß es sich bei der Korrelationsmatrix um eine Einheitsmatrix handelt. Auch in diesem Falle wäre die Faktoranalyse kein angemessenes Verfahren. 144 Zur Kritik dieser »Little Jiffy«-Praxis (jiffy=Minütchen) siehe Fabrigar, Wegener, MacCallum & Strahan, 1999; Ford, MacCallum & Tait, 1986 145 Auf die Darstellung der ebenfalls schiefwinkligen PROMAX Rotation (Hendrickson & White, 1964; Stenner, 1998) wurde hier verzichtet, da sich daraus keine weiteren wesentlichen Informationen ableiten lassen. · 171 Friedrich Funke __________________________________________________________________________ Empirisches I – Dekomposition von der Relaxation der Orthogonalitätsbedingung und korrelieren im Bereich r=.228 bis r=.408. Wie bereits oben angedeutet, führt die Extraktion nach dem Kaiser-Guttmann- Kriterium weder bei orthogonalen noch bei obliquen Rotationen zu theoretisch plausibel interpretierbaren Ladungsmustern; in jedem Falle führten diese Verfahren (erwartungsgemäß) nicht zur Extraktion dreier korrelierter Faktoren, die sich mit den inhaltlichen Dimensionen Aggressivität, Submissivität und Konventionalismus decken würden. 7.3.1.2. Extraktion dreier Faktoren Eine Inspektion des Eigenwertverlaufs und des entsprechenden Eigenwertdiagramms (Scree-Plot) legt jedoch die Extraktion von nur drei Faktoren nahe (Cattell & Vogelmann, 1977). Hier könnte man vermuten, daß diese drei Faktoren inhaltlich interpretierbar sein könnten (Abbildung 23, S.172). 33312927252321191715131197531 Eigenvalue 14 12 10 8 6 4 2 0 Component Number Abbildung 23: Scree-Plot Aus diesem Grunde wurden in einem nächsten Schritt drei Faktoren extrahiert. Es wird nur die schiefwinklige Lösung dargestellt, da dies eher den inhaltlichen Annahmen entspricht (Tabelle 25). · 172 Friedrich Funke __________________________________________________________________________ Empirisches I – Dekomposition Pattern Matrixa Component 1 2 3 P_ASC_32 .824 P_A_21 .823 P_A_17 .818 P_A_28 .739 P_AC_23 .734 P_ASC_7 .682 P_AC_34 .676 P_AC_5 .656 P_AC_15 .639 P_A_11 .621 P_S_30 .615 P_SC_9 .556 P_A_26 N_C_25 .732 N_C_19 .687 N_C_6 .665 N_C_13 .638 N_C_14 .612 N_SC_8 .604 N_C_10 .602 N_C_22 .576 N_C_16 .517 N_SC_20 .315 .510 N_C_24 .464 .379 N_SC_27 N_C_33 .356 .688 Component Correlation Matrix N_SC_29 .648 Component 1 2 3 N_C_31 .349 .423 1 1.000 .473 .308 P_SC_12 .392 .422 2 .473 1.000 .328 P_C_18 .369 .416 3 .308 .328 1.000 Tabelle 25: Erzwungene Dreifaktorenlösung Tabelle 26: Korrelationen der Faktoren (OBLIMIN) Die naheliegende Dreifaktorenstruktur läßt sich nicht theoriekonform inhaltlich interpretieren. Zwar läßt sich die erste Hauptkomponente durch eine starke Repräsentanz von »Aggressions-Items« beschreiben (A), während auf der zweiten Komponente vor allem Konventionalismus-Items (C) laden. Hier kann jedoch ge- · 173 Friedrich Funke __________________________________________________________________________ Empirisches I – Dekomposition zeigt werden, daß es sich um einen Artefakt der Altemeyerschen Skalenkonstruktion handelt (vgl. die Diskrepanz zwischen Tabelle 14: Ideale Repräsentanz der Dimensionen in den Items und Tabelle 15: Tatsächliche Repräsentanz der Dimensionen in den Items auf S. 129). 7.3.1.3. Extraktion zweier Faktoren Erzwingt man hingegen die Extraktion von lediglich zwei Hauptkomponenten, so läßt sich das Ladungsmuster sinnvoll interpretieren. Alle in Merkmalsrichtung formulierten Items laden hoch auf der ersten Hauptkomponente, alle rekodierten Items auf der zweiten (Tabelle 116 S.336). Zusammenfassend läßt sich somit folgern, daß exploratorische Verfahren aufgrund der besonderen Art und Weise der Skalenkonstruktion keine mehrdimensionale Struktur auffinden, die inhaltlich begründbar wäre. Offensichtlich ist lediglich eine Aufteilung in positiv formulierte und rekodierte Items. Bemerkenswert ist hierbei, daß diese beiden Komponenten nur moderat146 miteinander korrelieren (r=.54 Tabelle 117), daß mithin durch die Formulierungsrichtung weit größerer Einfluß auf die Beantwortung ausgeübt wird als wünschenswert wäre. Daraus ergibt sich jedoch die Plausibilität des nächsten Analyseschrittes, der dieselben Verfahren für jeweils die positiven und negativen Items getrennt vorsieht147. 7.3.2. Getrennte Hauptkomponentenanalysen Die Hälfte der Items 5-34 sind sogenannte contraits, also entgegen der Merkmalsrichtung formulierte Aussagen. Die separate Analyse dieser Items legt die Extraktion nur einer Hauptkomponente nahe (Tabelle 118) 148. Allerdings zeigt sich hier das bereits angesprochene Problem der Skalenkonstruktion (vgl. S. 129) Kein einziges der negativ formulierten Items wurde durch die Experten als »Aggressivitätsitem « eingestuft. Insofern fehlte schon die notwendige Bedingung für das Auffinden der drei inhaltlichen Dimensionen. Aber auch die erzwungene Extrakti146 Da hier Dasselbe erfaßt werden soll, würde man eine Korrelation nahe 1.0 erwarten. 147 Wiederum erweist sich das Zensur-Item 26 als problematisch. Es hat weder auf der ersten noch auf der zweiten Komponenten Ladungen über .30. 148 Da nur eine Komponente extrahiert wurde, wird hier die unrotierte Komponentenmatrix wiedergegeben. · 174 Friedrich Funke __________________________________________________________________________ Empirisches I – Dekomposition on von nur zwei Hauptkomponenten ergäbe nicht das theoretisch unterstellte Bild (Tabelle 119 im Anhang). Analysiert man die Items der zweiten Hauptkomponente auf semantischer Ebene, so fällt auf, daß in diesen Aussagen bezug auf die Träger (bzw. Gegner) von Kon- ventionen genommen wird, nicht jedoch auf die Konventionen selbst149: n_c_24 Unser Land braucht freie Denker, die die Courage haben, sich traditionellen Sitten zu widersetzen, selbst wenn dies viele Menschen empört. n_sc_29 Die Leute, die unsere Regierung herausfordern, die Religion kritisieren und die »normalen Verhaltensregeln« ignorieren, gehören zu den besten in unserem Land. n_sc_27 Es ist großartig, daß die jungen Leute heutzutage größere Freiheiten haben, »ihr eigenes Ding zu machen« und gegen Dinge zu protestieren, die sie nicht mögen. n_c_33 Neue Ideen sind das Herzblut progressiven Wandels. Daher sollten wir Andersdenkenden und Radikalen mit offenen Armen und offenen Ohren gegenüberstehen. n_c_31 Man sollte sich von eingefahrenen Gleisen losreißen und viele verschiedene neue Ideen und Erfahrungen ausprobieren, anstatt an überkommenen Prinzipien festzuhalten. In den Items der ersten Komponente hingegen werden die Konventionen direkt angesprochen und von ihren Trägern gelöst. Die folgenden exemplarischen Aussagen sollen dies illustrieren: n_c_13 FKK-Zeltplätze sind etwas völlig Normales. n_c_19 Ein jeder sollte seinen eigenen Lebensstil, religiösen Glauben und sexuelle Vorlieben haben, selbst wenn er sich darin von allen anderen unterscheidet. n_c_25 Vorehelicher Geschlechtsverkehr ist etwas ganz Normales. 149 Der Kursivsatz findet sich nicht im Original, sondern dient hier zur Hervorhebung der angesprochenen Träger bzw. Gegner von Konventionen. · 175 Friedrich Funke __________________________________________________________________________ Empirisches I – Dekomposition Dieser Unterschied führt bei den Befragten zu spezifischem Antwortverhalten, was seinerseits die zweite Komponente erklärt. Auf die Wiedergabe der Ladungsmatrix der positiven Items kann hier verzichtet werden, da sich lediglich eine Komponente nach dem Kaiser-Kriterium extrahieren läßt. Somit folgt, daß sich auch bei getrennt durchgeführten exploratorischen Faktorenanalysen die theoretisch unterstellbare Dreifaktorenstruktur nicht zeigen läßt. 7.3.3. Weitere struktursuchende Verfahren Wie in Abschnitt 4.1.3 ausgeführt, können andere struktursuchende Verfahren u.U. besser geeignet sein, Feinheiten der Dimensionstruktur zu »erkennen«. So haben hierarchische Clusterverfahren nicht das Problem sukzessiver Extraktion, sondern gehen von der feinsten Partition aus. Das Dendrogramm in Abbildung 24 verdeutlicht das mustererkennende Potential der Clusteranalyse. 0 N_SC_8 N_SC_27 N_C_14 N_C_24 N_C_19 N_C_31 N_SC_20 N_SC_29 N_C_16 N_C_33 P_A_11 P_SC_12 1 2 3 4 Distances P_AC_5 N_C_6 P_ASC_7 P_SC_9 N_C_10 N_C_13 P_AC_15 P_A_17 P_C_18 P_A_21 N_C_22 P_AC_23 N_C_25 P_A_26 P_A_28 P_S_30 P_ASC_32 P_AC_34 Abbildung 24: Dendrogramm RWA96 (WARD-Verfahren, Gammadistanz) · 176 Friedrich Funke __________________________________________________________________________ Empirisches I – Dekomposition Die 5-Cluster-Lösung ließe sich plausibel aufgrund des Iteminhalts interpretieren. Allerdings soll hier auf eine weiterführende Darstellung verzichtet werden, um die post hoc Interpretationen trotz ihrer deutlichen Nachvollziehbarkeit nicht zu hoch zu bewerten. 7.4. Dekomposition der RWA98 7.4.1. Globale Hauptkomponentenanalysen Wie bereits in 7.3.1 (S. 170) für die RWA96 geschehen wurde auch über die Korre- lationsmatrix der Items der RWA98 eine Hauptkomponentenanalyse gerechnet. 7.4.1.1. Extraktion nach Kaiserkriterium Nach dem Kaiser-Guttman-Kriterium wäre die Extraktion von sieben Hauptkom- ponenten indiziert (Tabelle 124, im Anhang S.341). Die schiefwinklige oblimin-Rotation konvergierte erst nach 30 Iterationen ( Tabelle 125, S.342). Die erste und siebte Hauptkomponente sind recht hoch korre- liert (.42), was sich auch in dem spezifischen Doppelladungsmuster in der Struk- turmatrix niederschlägt ( Tabelle 123, S. 340; s. a. Tabelle 125, S. 343). Erwartungsgemäß entziehen sich die sieben Hauptkomponenten der Interpretier- barkeit i.S. der theoretischen Dimensionen. 7.4.1.2. Extraktion dreier Faktoren Ebensowenig ist die erzwungene Dreifaktorlösung inhaltlich interpretierbar (Tabelle 27 S. 178). · 177 Friedrich Funke __________________________________________________________________________ Empirisches I – Dekomposition Pattern Matrixa Component 1 2 3 RWA9827P .846 RWA9830P .761 RWA9817P .723 RWA9821P .717 RWA985P .715 RWA9825P .684 RWA9823P .666 RWA9820P .660 .432 RWA981P .660 RWA9812P .656 RWA988P .634 RWA9815P .465 -.335 RWA9810P .390 RWA9824N .362 .303 RWA989N .725 RWA9818N .666 RWA9822N .655 RWA9816N .640 RWA9826N .630 RWA9828N .576 RWA982N .544 RWA9819N .537 .324 RWA984N .517 RWA987N .445 RWA986N .439 Component Correlation Matrix RWA9829N .409 .348 RWA9814P .395 .401 Component 1 2 3 RWA9811N .652 1 1.000 .288 .139 RWA9813N .346 .529 2 .288 1.000 .172 RWA983P .489 3 .139 .172 1.000 Tabelle 27: Tabelle 28: Korrelation der Komponenten Erzwungene Dreifaktorenlösung (OBLIMIN) 7.4.1.3. Extraktion zweier Faktoren Die daraufhin im nächsten Schritt erzwungene Zweifaktorenlösung klärt kumulativ 39% der Varianz auf (1. Komponente 27%, 2. Komponente 12%). Die Ladungsmatrix (Tabelle 127) zeigt wiederum das charakteristische Muster, das Items mit derselben Kodierrichtung zusammenfaßt. Daher sind die Ladungsmatrizen in den Anhang ausgelagert. Die Korrelation der beiden Komponenten fällt mit r=.34 noch deutlich geringer aus als bei der RWA96 (r=.54, vgl. Tabelle 117 S. 336). · 178 Friedrich Funke __________________________________________________________________________ Empirisches I – Dekomposition 7.4.2. Getrennte Hauptkomponentenanalysen Im Abschnitt 7.3.2 auf S. 174ff. wurden die Korrelationsmatrizen der positiven und negativen Items der RWA96 getrennt faktorisiert, um die Kodierrichtung als faktorbildende Quelle a priori auszuschließen. Die theoretisch zugrundeliegenden Dimensionen konnten nicht gefunden werden, was z.T. auf Besonderheiten (bzw. Versäumnisse) der Skalenkonstruktion zurückzuführen ist: so sind in den negativ formulierten Items der RWA96 Hinweise auf (niedrige) autoritäre Aggressivität mangelhaft repräsentiert. Der Eigenwertsverlauf legt bei den positiv formulierten Items der RWA98 die Extraktion von nur einer Hauptkomponente nahe; nach dem Kaiser-Kriterium könnten drei Faktoren extrahiert werden. Erwartungsgemäß ist wiederum keine sinnvolle Interpretation der Dreifaktorenlösung möglich. Pattern Matrix Component 123 RWA9827P .849 RWA9823P .812 RWA9830P .764 RWA9825P .674 -.358 RWA9812P .659 RWA9820P .537 -.456 RWA981P .524 .351 RWA9821P .518 -.310 RWA9817P .501 .344 RWA988P .455 .372 Component Correlation Matrix RWA983P -.859 RWA9815P .759 Component 1 2 3 RWA9814P .653 1 1.000 -.282 .446 RWA985P .386 .540 2 -.282 1.000 -.178 RWA9810P -.388 .493 3 .446 -.178 1.000 Tabelle 29: Tabelle 30: Korrelation der Komponenten Dreifaktorenlösung protraits (OBLIMIN) Dies gilt auch für die entgegen der Merkmalsrichtung formulierten Items. Hier lassen sich nach dem Kaiser-Kriterium vier Faktoren extrahieren, der Eigenwertsverlauf legt wiederum eine Einfaktorlösung nahe. · 179 Friedrich Funke __________________________________________________________________________ Empirisches I – Dekomposition Component Correlation Matrix Component 1 2 3 4 1 1.000 .233 .418 .119 2 .233 1.000 .251 .011 3 .418 .251 1.000 .103 4 .119 .011 .103 1.000 Tabelle 31: Komponentenkorrelation der contraits (4 Faktoren) Pattern Matrix Component 1 2 3 4 RWA984N .768 RWA9816N .690 RWA9822N .575 RWA982N .557 RWA9826N .417 .344 RWA9819N .365 .321 RWA9811N .807 RWA9813N .699 RWA9818N .760 RWA9829N .374 .695 RWA9828N .614 RWA987N .366 .533 RWA989N .354 .492 RWA986N .707 RWA9824N .412 -.608 Tabelle 32: Ladungsmatrix der contraits (4 Faktoren) Wie auch bei der RWA96 entziehen sich die separaten Faktoranalysen der protraits und contraits der RWA98 einer inhaltlichen Interpretation gemäß der theoretischen Dimensionsstruktur. Dies verwundert nicht angesichts der Tatsache, daß viele Items mit Bedacht mehrere der Subdimensionen ansprechen. 7.4.3. Weitere struktursuchende Verfahren Auf weitere struktursuchende Verfahren wird hier verzichtet. Dies ist die Lehre aus 7.3.3 (S.176ff.). Zwar liefert auch hier die hierarchische Clusteranalyse Hinweise auf semantische Besonderheiten der Items; eine ausführliche Darstellung würde aber deren Bedeutung überbewerten. · 180 Friedrich Funke __________________________________________________________________________ Empirisches I – Dekomposition 7.5. Dekomposition der RWA³D Die exploratorische Struktursuche hat bei der RWA³D-Skala keine vergleichbar große Bedeutung wie bei den anderen beiden Skalen. Exploratorische Faktoranalysen sind zweckdienlich, wenn nur wenig über die inhaltliche Dimensionalität bekannt ist. Bei der RWA³D hingegen ist das Konstruktionsprinzip jedoch expliziert. Die nachfolgenden Analysen werden zeigen, ob diese Struktur durch exploratorische Faktoranalysen auffindbar ist. Dies darf bezweifelt werden, weil sowohl die inhaltliche Dimensionalität als auch die Gerichtetheit der Items (contraits vs protraits) zu dem spezifischen Korrelationsmuster führt. 7.5.1. Globale Hauptkomponentenanalysen Bei der Extraktion nach dem Kaiser-Kriterium werden zwar drei Hauptkompo- nenten extrahiert, jedoch entspricht das Ladungsmuster auch nach schiefwinkliger Rotation nicht der inhaltlichen dreidimensionalen Struktur (Tabelle 33). Pattern Matrixa Component 123 RWA8AP .783 RWA6SP .780 RWA12SP .765 RWA2AP .761 RWA10CP .635 RWA1CN .693 RWA4CP .401 .593 Component Correlation Matrix RWA5AN .374 -.501 .305 RWA3SN .681 Component 1 2 3 RWA9SN .661 1 1.000 .003 .366 RWA7CN .304 .608 2 .003 1.000 .074 RWA11AN -.319 .532 3 .366 .074 1.000 Tabelle 33: Dreifaktorlösung (OBLIMIN) Tabelle 34: Korrelation der Hauptkomponenten Auffällig ist, daß die zweite Komponente – die weitgehend orthogonal zu den anderen ist – Besonderheiten der Konventionalismus-Items zusammenzufassen scheint. Die erzwungene Extraktion von zwei Komponenten führt bei den langen Originalskalen meist zum zusammenfassen der positiven bzw. negativen Items. Dieser Effekt ist bei der RWA³D nicht in dieser Deutlichkeit zu zeigen (Tabelle 35). · 181 Friedrich Funke __________________________________________________________________________ Empirisches I – Dekomposition Pattern Matrixa Component 1 2 RWA2AP .830 RWA8AP .749 RWA6SP .734 RWA5AN .685 RWA12SP .588 .308 RWA10CP .511 .324 RWA11AN .409 RWA1CN .775 RWA7CN .643 Component Correlation Matrix RWA4CP .592 Component 1 2 RWA3SN .511 1 1.000 .280 RWA9SN .300 .363 2 .280 1.000 Tabelle 35: Zweifaktorlösung (OBLIMIN) Tabelle 36: Korrelation der Hauptkomponenten Die schiefwinklig rotierte Zweifaktorlösung offenbart tendentiell eher eine Gegenüberstellung der Aggressivitätsitems gegenüber den Submissions- und Konventionalismusitems. 7.5.2. Getrennte Hauptkomponentenanalysen Das Erzwingen zweifaktorieller Lösungen in exploratorischen Faktoranalysen über die RWA führt meist zu einer Gruppierung der protraits gegenüber den contraits. Insofern ist es plausibel, isolierte Analysen für eine vielversprechende Strategie zu halten (vgl. S.77). Zumindest wird die Kodierrichtung als mögliche Einflußquelle per definitionem ausgeschaltet. Auch bei getrennten Analysen kann hier die inhaltliche Struktur nicht gezeigt werden. Wiederum zeigt sich jedoch tendentiell die Ähnlichkeit von Submissivitäts- und Konventionalismus-Items (Tabelle 37 und Abbildung 25). · 182 Friedrich Funke __________________________________________________________________________ Empirisches I – Dekomposition Component Plot in Rotated Space 1.0.50.0-.5-1.0 Component 2 1.0 .5 0.0 -.5 -1.0 rwa7cn rwa1cn rwa9sn rwa3sn rwa11an rwa5an Component 1 Abbildung 25: Ladungsplot contraits RWA³D Structure Matrix Component 1 2 RWA7CN .739 RWA1CN .678 RWA3SN .651 Component Correlation MatrixRWA5AN .784 Component 1 2 RWA11AN .688 1 1.000 .164 RWA9SN .502 .536 2 .164 1.000 Tabelle 37: Zweifaktorlösung (OBLIMIN) Tabelle 38: Korrelation der Hauptkomponenten Bemerkenswert ist der stabile Befund, daß sich bei den in Merkmalsrichtung formulierten (»positiven«) Items nur eine Komponente extrahieren läßt. Dies konnte auch bei den Items der RWA96 beobachtet werden (vgl. 7.3.2, S.174ff.). · 183 Friedrich Funke __________________________________________________________________________ Empirisches I – Dekomposition 7.5.3. Weitere struktursuchende Verfahren Die Daten der RWA³D wurden einer Multidimensionalen Skalierung (proxscal) unterzogen. Dieses Verfahren ist geeignet, wahrgenommene Ähnlichkeiten von Einstellungsobjekten in niedrigdimensionalen Räumen darzustellen. Im konkreten Fall wurde daher versucht, die von den Befragten implizit konstruierten Relationen zwischen den einzelnen Aussagen der RWA³D zweidimensional abzubilden. Es läßt sich eine aufschlußreiche Konfiguration erkennen (Abbildung 26). Dimension 2 .8 .6 .4 .2 -.0 -.2 -.4 -.6 -1.0 -.5 0.0 .5 1.0 1.5 Dimension 1 RWA7CN RWA1CN RWA10CP RWA4CP RWA9SN RWA3SN RWA12SP RWA6SP RWA11AN RWA5AN RWA8AP RWA2AP Abbildung 26: Partitionierung der PROXSCAL-Skalierung (RWA³D-Items) Alle in Merkmalsrichtung formulierten Items liegen im Inneren des gemeinsamen Darstellungsraumes. Weiterhin wird der Raum durch Speichen in drei Sektoren geteilt. In jedem der nunmehr sechs Sektoren liegt jeweils ein Paar von Items derselben inhaltlichen Dimension und Kodierrichtung (vgl. auch die schematische Abbildung 27). · 184 Friedrich Funke __________________________________________________________________________ Empirisches I – Dekomposition Conventionalism protrait contrait SubmissivenessAggressiveness Abbildung 27: Abstrahierte PROXSCAL-Skalierung (RWA³D-Items) In einer facettentheoretischen Deutung dieser Partitionierung läßt sich ein regionales Gesetz erkennen, das man als Radex-Konfiguration bezeichnet. Man schriebe die Facetten als Kodierrichtung ={ protrait contrait} , theoretisches Konstrukt ={ Aggressivität Submissivität Konventionalismus} [7.1] ,, Das inhaltlich-theoretische Konstrukt wird als polare Facette abgebildet; das formale Kriterium der Kodierrichtung führt als modulierende Facette zur Partitionierung in zwei konzentrische Bänder (vgl. auch Guttman, 1954a). Auch die hierarchische Clusteranalyse zeigt ein gut interpretierbares Bild (Abbildung 28). · 185 Friedrich Funke __________________________________________________________________________ Empirisches I – Dekomposition 0 1 2 3 1 3 2 4 5 6a 6b Distances RWA2AP RWA8AP RWA5AN RWA11AN RWA6SP RWA12SP RWA3SN RWA9SN RWA4CP RWA10CP RWA1CN RWA7CN Abbildung 28: Dendrogramm Clusteranalyse RWA³D Vier Itempaare gleicher Kodierrichtung und gleicher inhaltlicher Gewichtung liegen an einem gemeinsamen Endzweig (sn-sn:1, sp-sp:2, an-an:3, ap-ap:4). Bei dem Endzweig cp-cn (5) bleibt die Gemeinsamkeit der inhaltlichen Ausrichtung sichtbar. Die einzigen unpaarigen Items in dieser Konfiguration sind zwei Konventionalismusitems, die jeweils nahe bei Submissivitätsitems zu liegen kommen (6). Dies bestätigt abermals die von den Befragten wahrgenommene Nähe zwischen Submissivität und Konventionalismus (vgl. Abschnitt 7.5.2 S.182ff. und Fußnote 149 auf S. 175). Diese beiden Beispiele mögen genügen um zu demonstrieren, daß bestimmte voraussetzungsarme exploratorische Verfahren durchaus geeignet sein können, Strukturen zwischen den Items zu erkennen. Mithilfe der derart veranschaulichten Relationen lassen sich Rückschlüsse auf die impliziten Theorien der Befragten über die zugrundeliegenden Konstrukte ziehen. Dieser Ansatz begreift die Subjekte der Untersuchung als Experten, die nicht notwendigerweise Wissen über ihre Expertise haben, aber letztlich durch ihre Antworten die sozialen Konstruktionen über die Gestalt des Konstrukts »Autoritarismus« widerspiegeln. · 186 Friedrich Funke __________________________________________________________________________ Empirisches I – Dekomposition 7.6. Zusammenfassung – ist die Dekomposition möglich? In den Studien mit verschiedenen Versionen der RWA-Skala, die zur Dimensionstruktur explizit Stellung nehmen, werden in aller Regel Hauptkomponentenanalysen mit varimax-Rotation zur Argumentation zurate gezogen. Überdies erfolgt meist die (Über)Extraktion nach dem Kaiser-Kriterium (Lee & Comrey, 1979). Konsensual wird entweder eine Einfaktorstruktur berichtet oder aber ein zweifaktorielles Muster, das die positiv formulierten Items (protraits) den umgepolten contraits gegenüberstellt (Altemeyer, 1981, S.182ff.; 1996, S.53; Schneider, 1997a; Six, 1997). In schiefwinkligen Rotationen korrelieren die beiden Hauptkomponenten meist moderat zwischen .40 und .70.150 Auch die Ergebnisse der hier berichteten Exploratorischen Faktoranalysen über die RWA96, RWA98 und RWA³D weisen in diese Richtung. Faktorisiert man die Korrelationsmatrix aller Items, lassen sich meist zwei Hauptkomponenten extrahieren, die jeweils positive und negative Items zusammenfassen. Auch die getrennte Analyse enttäuscht, da hier folgerichtig nur eine Einfaktorstruktur zu zeigen ist. Eine gewisse inhaltliche Zusammenhangsstruktur ist dennoch in Ansätzen zu erkennen: einige der hier dargestellten Ergebnisse sprechen für eine stärkere Nähe der Submissivitäts- und Konventionalismusitems, die sich beide von den Aggressivitätsitems abheben. Dies wird nachvollziehbar, wenn man Konventionalismus als die Unterordnung (Submission, sic!) unter überkommene kleinbürgerliche Normen redefiniert. Gleichzeitig ist die Betonung der Unterordnung (der Jüngeren unter die Älteren, der Frauen unter die Männer, der Untergebenen unter die staatlichen und kirchlichen Autoritäten) integraler Bestandteil der angesprochenen kleinbürgerlichen Konventionen. Beide Umstände begründen plausibel die größere Nähe der beiden Subdimensionen. Diese Nähe impliziert gleichzeitig die Kontrastierung gegenüber der aggressiven Komponente. 150 In Gesprächen mit Jim Sidanius, Bernd Six und John Duckitt wurde übereinstimmend meine Vermutung geteilt, daß sich der robuste Befund zweier scheinbar formaler Faktoren unter Umständen durch die inhaltliche Konfundierung erklären ließe. (Vgl. hierzu Tabelle 15: Tatsächliche Repräsentanz der Dimensionen in den Items, S.129) · 187 Friedrich Funke __________________________________________________________________________ Empirisches I – Dekomposition Eine vertiefende und integrierende Diskussion bleibt den Abschnitten 10.5.1 und folgenden, S.310ff. vorbehalten. · 188 8. Empirisches II – Rekomposition »For so it is, oh Lord my God, I measure it, but what it is that I measure I do not know.« (Christie, 1991) 8.1. Sinn und Zweck der Rekomposition Die folgenden Analysen sind die empirische Umsetzung der unter 4.2 (S. 85ff.) theoretisch eingeführten Modelle. Es konnte gezeigt werden, daß Vorwissen sinnvoll eingesetzt werden kann, um theoretisch begründete Modelle vor (und unabhängig von) empirischer Prüfung aufzustellen und zu testen. Das folgende Kapitel führt die Modelle einer empirischen Überprüfung zu. Im Wesentlichen geht es um die Überprüfung des Nutzens folgender Modifikationen: Es wird eine Gewichtung der Items eingeführt und der zufällige Meßfehler in das Meßmodell einbezogen, der Kodierrichtung der Items wird Rechnung getragen, und schließlich wird die Kovarianzstruktur der Items durch drei korrelierte Faktoren statt durch lediglich einen erklärt. Dieser letzte Punkt hat den größten theoretischen Bezug zum konkreten Forschungsgegenstand. Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition 8.2. Konventionen der Darstellung der Rekomposition Die Beurteilung der Güte von Strukturgleichungsmodellen sollte auf mindestens drei Ebenen erfolgen: 1. Globale Modellanpassung (omnibus fit) 2. Evaluation der einzelnen Meßmodelle (Reliabilität, Ladungen) 3. Bedeutsamkeit einzelner Parameter und Modellgleichungen (t-Werte, Determinationskoeffizienten) Dabei ist die Literatur zu globalen Fit-Indizes sehr umfangreich und ständigem Wandel unterzogen. Die Anbieter von Software zur Schätzung von Strukturgleichungsmodellen sind bemüht, neue Kennwerte mit aufzunehmen, häufig jedoch bevor diese einer systematischen Prüfung in Simulationsstudien unterzogen werden konnten. Zudem ist bei fast allen Fit-Indizes (abgesehen vom .²-Test) die Kennwerteverteilung unbekannt, so daß keine wohldefinierten Schwellenwerte existieren. Ungeachtet des geringen Konsens über den besten Fit-Index hat sich ein gewisser Kanon des zu Berichtenden herausgebildet (Hoyle & Panter, 1995; Hu & Bentler, 1995). Als Klassifikationsdimension zur Einteilung von Fitindizes hat die Unterscheidung in absolute und inkrementelle Maße weitgehend Fuß gefaßt (Bollen, 1989; Sugawara & MacCallum, 1993; La Du & Tanaka, 1995; Marsh, Balla & McDonald, 1988).151 Dabei erfassen absolute Indizes direkt die Güte der Passung von empirischer und modellimplizierter Kovarianzmatrix. Im Gegensatz dazu vergleichen inkrementelle Fitindizes die Anpassungsgüte des jeweiligen Modells mit dem eines darin geschachtelten Baselinemodells. Dabei handelt es sich meist um ein sogenanntes Nullmodell, das lediglich die Varianzen schätzt und somit von der Unkorreliertheit der Variablen ausgeht (Bentler & Bonett, 1980). Andere restringierte Vergleichsmodelle sind ebenfalls möglich (Sobel & Bohrnstedt, 1985). 151 Inzwischen finden sich sowohl absolute als auch komparative Fitindizes in den etablierten Programmen zur Schätzung von Strukturgleichungsmodellen. Ursprünglich jedoch wurden die absoluten Fit-Indizes von LISRELTM (Scientific Software International, 2002) favorisiert, die inkrementellen von EQSTM . · 190 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition 8.2.1. Absolute Fit-Indizes Der basale absolute Fit-Index ist die generalisierte likelihood-ratio (G²), die in großen Stichproben als .²-Statistik interpretiert wird. Der .²-Test kann als Signifikanztest für die (mangelnde) Übereinstimmung der empirischen und der vom Modell implizierten Kovarianzmatrix verstanden werden152. Da der .²-Wert nur im Verhältnis zu den Freiheitsgraden richtig interpretiert werden kann, schlug Karl Jöreskog vor, beim normierten .² durch die Freiheitsgrade zu dividieren (Jöreskog, 1970). Ein Wert unter 1.0 indiziert hier ein overfitting, Werte über 2 bis 3 oder – etwas liberaler – über 5 verweisen auf unbefriedigende Modellanpassung (Carmines & McIver, 1981, S.80; Marsh & Hocevar, 1985; Wheaton, Muthén, Alwin & Summers, 1977; Byrne, 1989)153. Problematisch ist jedoch die hohe Teststärke (power) des .²-Tests bei großen Stichproben154 (Bentler & Bonett, 1980; Fan, Thompson & Wang, 1999; MacCal152 Der .²-Wert hat ein theoretisches Minimum von 0 bei saturierten Modellen ohne Freiheitsgrade. Die Diskrepanz zwischen empirischer und vom Modell implizierter Kovarianzmatrix resultiert aus überidentifizierenden Restriktionen des Modells. 153 »... it seems clear that a ratio > 2.00 represents an inadequate fit.« (Byrne, 1989, S. 55) 154 Da die dialektische Beziehung zwischen Stichprobengröße und Modellpassung in der Forschungspraxis zuweilen großen Mißverständnissen unterliegt, seien hier einige Bemerkungen extensiv zitiert: »The power of the test to detect an underlying disagreement between theory and data is controlled largely by the size of the sample. With a small sample an alternative hypothesis which departs violently from the null hypothesis may still have a small probability of yielding a significant value of .². In a very large sample, small and unimportant departures from the null hypothesis are almost certain to be detected.« (Cochran, 1952) »If the sample is small then the .² test will show that the data are ›not significantly different from‹ quite a wide range of very different theories, while if the sample is large, the .² test will show that the data are significantly different from those expected on a given theory even though the difference may be so very slight as to be negligible or unimportant on other criteria.« (Gulliksen & Tukey, 1958, pp. 95 - 96) »Such a hypothesis [of perfect fit] may be quite unrealistic in most empirical work with test data. If a sufficiently large sample were obtained this .²statistic would, no doubt, indicate that any such nontrivial hypothesis is statistically untenable.« (Jöreskog, 1969, p. 200) »... in very large samples virtually all models that one might consider would have to be rejected as statistically untenable .... In effect, a nonsignificant chi-square value is desired, and one attempts to infer the validity of the hypothesis of no difference between model and data. Such logic is well-known in various statistical guises as attempting to prove the null hypothesis. This procedure cannot generally be justified, since the chi-square variate v can be made small by simply reducing sample size.« (Bentler & Bonett, 1980, p. 591) Fortsetzung auf Folgeseite … · 191 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition lum, Browne & Sugawara, 1996; Marsh et al., 1988; Yadama & Pandey, 1995; Yuan & Bentler, 1998; Steiger & Lind, 1980; Bentler, 1990a; Kaplan, 1995). Paradoxerweise führt dies gerade bei den geforderten großen Stichproben zu einem allzu häufigen Verwerfen der Nullhypothese und damit des Modells. In der Konsequenz sind Forscher geneigt, zusätzliche Parameter in das Modell aufzunehmen (um die Freiheitsgrade zu erhöhen). Diese Modelle verlieren jedoch zunehmend ihren konfirmatorischen Charakter und sind in Replikationsversuchen schwer reproduzierbar155. Der .²-Wert sollte dennoch in jedem Falle berichtet werden156. Falls die Normalitätsannahme für die manifesten Variablen stark in Frage steht, sollte zusätzlich das adjustierte Scaled .² berichtet werden (Satorra & Bentler, 1988, dort Gleichung 4.1).157 Ein einfacher Adjustierungsansatz für die aufgeblähten .²-Werte besteht im Subtrahieren der Freiheitsgrade (Noncentrality Parameter ncp) bzw. in der zusätzlichen Division durch die Stichprobengröße (Scaled Noncentrality Parameter sncp, vgl. McDonald & Marsh, 1990; Raykov & Penev, 1998). Weitere sinnvolle Alternativen ergeben sich aus einer Bewertung der Residuen zwischen empirischer und modellimplizierter Kovarianzmatrix. Das rmsr (Root Mean Square Residual) eignet sich besonders bei der Verwendung von Korrelationsmatrizen als Datengrundlage. Besonders zuverlässige Aussagen erlaubt das rmsea (Root Mean Square Error of Approximation), vor allem im Vergleich alternativer Modelle und bei großen Stichproben (Nevitt & Hancock, 2000; Steiger, 2000). Wie auch beim rmsr weisen niedrige Werte auf einen guten Fit hin. Zumindest für das rmsea hat sich .05 als konventioneller Schwellenwert akzeptabler Modelle durch- Fortsetzung der Fußnote: »Our opinion ... is that this null hypothesis [of perfect fit] is implausible and that it does not help much to know whether or not the statistical test has been able to detect that it is false.« (Browne & Mels, 1998). 155 Ein weiterer Kritikpunkt betrifft die Sensitivität des .²-Wertes für die Anzahl der Antwortkategorien der beobachteten Variablen. 156 Notwendig zur Bewertung des .²-Wert es sind zwingend die zugehörigen Freiheitsgrade, die sich als Differenz zwischen nicht-redundanten bekannten Parametern und gesuchten, zu schätzenden Parametern errechnen. Aus dem Verhältnis folgt eine ebenfalls zu berichtende Irrtumswahrscheinlichkeit p. 157 In LISREL erhält man das Satorra-Bentler-.², sobald man eine asymptotische Kovarianzmatrix bereitstellt und als Schätzmethode explizit Maximum Likelihood verlangt. Unterläßt man letzteres, so schätzt LISREL mit dem WLS-Algorithmus. · 192 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition gesetzt. Infolge dieser Konvention testen einige SEM-Programme gegen die Nullhypothese rmsea =.05 und geben ein Measure of Close Fit aus. Zu den obligatorisch zu berichtenden absoluten Fitindizes gehört auf jeden Fall der gfi (Goodness of Fit Index), der in Analogie zum R² bei der multiplen Regression interpretiert werden kann (Tanaka, 1987; Tanaka & Huba, 1985; 1989; Maiti & Mukherjee, 1990; MacCallum & Hong, 1997). Schließt man eine Straffunktion für die Aufnahme zusätzlicher Parameter in die Berechnung ein, erhält man den adjustierten gfi (agfi) (Jöreskog & Sörbom, 1993). Allerdings sprechen die Ergebnisse mehrerer Simulationsstudien gegen eine Verwendung des agfi (Marsh et al., 1988, Mulaik, James, van Alstine & Bennett, 1989). 8.2.2. Inkrementelle Fit-Indizes Inkrementelle oder komparative Fitindizes vergleichen die Anpassung des jeweiligen Modells mit dem eines darin geschachtelten Baselinemodells. Diese Gruppe von Fitindizes läßt sich noch weiter klassifizieren, z.B. in Typ 1 und Typ 2 (Marsh et al., 1988) oder Typ 1 bis 4 (Hu & Bentler, 1995).158 Das klassische Beispiel eines Typ 1 Index ist der populäre Normed Fit Index nfi (Bentler & Bonett, 1980). Eine davon abgeleitete Variante findet sich bei Ken Bollen (Bollen, 1986; vgl. auch BL86 bei Hu & Bentler, 1995). Die Indizes des Typ 1 stehen in starker Kritik, da sie systematisch in Abhängigkeit von der Stichprobengröße verzerrt sind (Bearden, Sharma & Teel, 1982; Bollen, 1986; 1989; Hu & Bentler, 1999; La Du & Tanaka, 1989; Tanaka, 1987). Sie sollten daher aus nachvollziehbaren Gründen nicht verwendet werden (Hu & Bentler, 1995). Typ-2-Indizes stützen sich zusätzlich auf Verteilungsannahmen, so daß sie zuverlässiger sein können; dies gilt jedoch nur dann, wenn die Verteilungsannahmen richtig sind. Wichtigster Vertreter dieser Gruppe ist der Tucker-Lewis-Index tli (Tucker & Lewis, 1973), der später Nonnormed Fit Index nnfi genannt wurde (Bentler & Bonett, 1980). Typ-3-Indizes stützen sich auf die nichtzentrale .²-Verteilung (Satorra, 1989). Ein typischer Vertreter ist der bfi (Bentler’s Fit Index) bzw. der identische Relative Noncentrality Index (Bentler, 1990b; McDonald & Marsh, 1990). Peter Bentler 158 Letztgenannte Autoren kritisieren die Klassifikation von Marsh und Mitarbeitern. · 193 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition modifizierte den BFI später zum Comparative Fit Index (cfi), da der bfi auch Werte kleiner 0 und größer 1 annehmen kann. Für 0 < bfi < 1 gilt bfi=cfi (Goffin, 1993). Der cfi ist identisch mit dem relative noncentrality index rni 159 von McDonald und Marsh (1990). 8.2.3. Sparsamkeitsindizes Die sogenannten parsimonious fit indices setzen die Anpassungsgüte ins Verhältnis zur Anzahl der geschätzten Parameter. Das Ziel besteht somit in der Diagnose von overfitting durch das Einführen bzw. Aufnehmen zu vieler Parameter. Das Vorgehen ist analog zur Adjustierung des R² in der multiplen Regression. So schlugen James, Mulaik und Brett (James, Mulaik & Brett, 1982) vor, den NFI mit der parsimony ratio160 zu multiplizieren. Stan Mulaik und Mitarbeiter (Mulaik et al., 1989) adjustierten auf diese Weise den gfi, in amos™ wird auf ebensolche Art auch der cfi (Bentler, 1990a) angepaßt. 8.2.4. Schlußfolgerung für die Darstellung Es ist bei dem gegenwärtigen Forschungsstand schwierig, eine eindeutige Entscheidung für oder gegen bestimmte Fit-Indizes zu treffen. Mehr noch, es wäre – zugespitzt ausgedrückt – kaum mehr als eine Frage des Geschmacks, könnte man nicht systematisch seine Auswahl begründen. Les Hayduk kam zu der drastischen Einschätzung, man solle sich nicht zu tiefgreifend mit dem Thema beschäftigen, wenn man Strukturgleichungsmodelle als Mittel zum Zweck und nicht als Beruf betrachtet. Researchers interested in structural equation modeling as a tool, and not as a vocation, are advised to avoid detailed pursuit of the plethora of new fit indices for the next few years. (Hayduk, 1996) 159 Mit der Ausnahme, daß der CFI auf den Wertebereich zwischen 0 und 1 trunkiert wird. 160 Quotient aus den Freiheitsgraden des evaluierten Modell und der Freiheitsgrade des Nullmodells (Independence model). · 194 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition Die minimale Empfehlung Hayduks lautet: 1. .² mit Freiheitsgraden df und p-Wert, 2. agfi sowie 3. eine Diskussion eventueller Auffälligkeiten im Muster der Residuen. Rex Kline trägt der Tatsache Rechnung, daß Forscher – zurecht – geneigt sind, verschiedene Facetten der absoluten und relativen Modellpassung darzustellen und ihre jeweiligen diagnostischen Vorteile zu nutzen (Kline, 1998). Als minimal zu Berichtendes schlägt er vor: 1. .² mit Freiheitsgraden df und p-Wert, 2. ein Index zur Beschreibung der insgesamt aufgeklärten Varianz (alternativ gfi, nfi oder cfi) 3. ein Index, der den aufgeklärten Varianzanteil hinsichtlich der Modellkomplexität adjustiert (nnfi, nicht jedoch agfi) sowie schließlich 4. ein Index, auf der Grundlage der standardisierten Residuen (srmr) Zwei wichtige Beschränkungen der Aussagekraft von Fit-Indizes dürfen nicht verkannt werden. Die erste ist eine mathematische, die zweite eine wissenschafts- oder erkenntnistheoretische: Omnibus-Indizes können lediglich eine »durchschnittliche « Anpassung anzeigen, sodaß auch bei guten Kennzahlen lokale Fehlanpassungen verschleiert werden können.161 Noch schwerer wiegt jedoch meines Erachtens, daß ein guter Fit nichts über die theoretische Plausibilität der inhaltlichen Implikationen des Modells auszusagen vermag. Auch kann ein Modell zwar »passen«, die Vorhersagekraft162 aber dennoch gering sein. Rick Hoyle und Abigail Panter schließlich geben in ihrem Aufsatz »Writing about Structural Equation Models« umfassende Empfehlungen für alle Aspekte des zu Berichtenden, auch jenseits der Fit-Indizes (Hoyle & Panter, 1995). 161 Umgekehrt gilt Sinngemäßes. 162 »Vorhersagekraft« i.S. von Varianzaufklärung. · 195 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition Der Vorschlag hinsichtlich letzterer läßt sich zusammenfassen: 1. .² mit Freiheitsgraden df und p-Wert, bei Verletzung der Normalverteilungsannahme zusätzlich das Scaled .² (Satorra & Bentler, 1988), 2. ein Index zur Beschreibung der absoluten Modellanpassung analog zur insgesamt aufgeklärten Varianz (gfi), 3. zumindest bei exzessiver Anzahl frei zu schätzender Parameter (overfitting) der sparsamkeitsadjustierte pgfi 4. mindestens je einen (Typ 2 und Typ 3) inkrementellen Fit-Index163; o Typ 2: tli/nnfi oder ifi/Bollen89164, letzterer bevorzugt aufgrund seiner robusteren Eigenschaften bei gls o Typ 3: bfi/rni165 oder cfi, letzterer bevorzugt aufgrund seiner Trunkierung auf den Bereich von 0 bis 1. Unter bestimmten Umständen können weitere Fit-Indizes sinnvoll sein, sei es aufgrund verschiedener verwendeter Schätzalgorithmen oder aber im Falle modellvergleichender Bewertung der Anpassungsgüte. Zusammenfassend sei auf die Übersichtsarbeiten zu Fit-Indizes verwiesen (Bollen, 1989; Tanaka, 1987; La Du & Tanaka, 1989; Marsh et al., 1988; Hu & Bentler, 1995; Mulaik et al., 1989; Schumacker & Lomax, 1996; Yang-Wallentin & Jöreskog, 2001). In der vorliegenden Arbeit wird weitestgehend einer Integration der Konventionen von Hoyle und Panter (1995) sowie Kline (1989) gefolgt. Diese Angaben werden ergänzt um Hirotugu Akaikes Informationskriterium aic (Akaike, 1987) sowie 163 Diese Wahl impliziert gleichzeitig ein Aussprechen gegen Fit-Indizes des Typs 1 wie Bollen86 oder NFI. Damit folgen sie der Kritik von Hu und Bentler (1995). 164 Tucker-Lewis-Index TLI (Tucker & Lewis, 1973)und Nonnormed Fit Index NNFI (Bentler & Bonett, 1980) sind baugleich, BL89 und IFI synonym. 165 Der Bentler Fit-Index BFI (Bentler, 1990a; 1990b) und der Relative Noncentrality Index RNI (Siegman, 1962; 1963; Singh, Huang & Thompson, 1962; Omar, Eid, Majdalani & Lindgren, 1965; McDonald & Marsh, 1990) sind baugleich, im Wertebereich zwischen 0 und 1 entsprechen sie Bentlers Comparative Fit Index CFI (Hu & Bentler, 1995; Kagitçibasi, 1967; 1970; 1978). · 196 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition Hamparsum Bozdogans Korrektur desselben (caic consistent Akaike Information Criterion, Bozdogan, 1987; 2000; Bozdogan & Ramirez, 1988), was besonders für den Modellvergleich interessant ist.166 Weiterhin fiel die Entscheidung für das Berichten des Kreuzvalidierungsparameters ecvi (Expected Single-Sample Cross- Validation Index) als einen Index zum Abschätzen der Generalisierbarkeit des Modells (Cudeck & Browne, 1983; Browne & Cudeck, 1989). Schließlich gibt Hoelters Maß der kritischen Stichprobengröße ein Gefühl für die hohe Teststärke des .²-Tests und illustriert, bei welcher Stichprobengröße das getestete Modell überhaupt eine »Chance« gehabt hätte, nicht falsifiziert zu werden (Hoelter, 1983). Liegt das kritische N deutlich unter der tatsächlichen Stichprobengröße, so ist die Widerlegung der H0 nahezu unvermeidlich. Die globale Güte der Modellanpassung wird aufgrund des bisher Gesagten in einer Übersicht analog der exemplarischen Tabelle 39 beschrieben. .² =886.79 df =76 gfi =.94 rmsea =.096 p =0.000 pgfi =.92 srmr =.15 ecvi =.76 Hoelters cn =142.7 aic =890.79 ifi/.2 =.58 cfi =.58 caic =902.92 Tabelle 39: Konventionen der Darstellung der Anpassungsgüte Der .²-Wert (mit beigeordneten Freiheitsgraden und p-Wert) ist aufgrund seiner zentralen Bedeutung prominent dargestellt. Die in derselben Zeile stehenden Indizes gfi und pgfi sowie die Maßzahlen zur Beschreibung der Residuen stellen das konventionelle Minimum dar, das eine globale Evaluation des Modellfits ermöglicht. Die vertikale Ausrichtung hingegen erleichtert das schnelle Erfassen der Modellpassung, da hier Indizes zusammengefaßt sind, die aufgrund ihres Wertebe166 Hierbei handelt es sich um eine Modifikation des vom .² abgeleiteten AIC, das neben der Modellkomplexität auch die Stichprobengröße berücksichtigt. · 197 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition reichs vergleichbar sind. In der mittleren Spalte wird eine gute Modellpassung durch möglichst hohe Werte indiziert (perfekter Fit: 1.0). Bei den Indizes der rechten Spalte gilt diese Regel nicht: rmsea und srmr müssen möglichst klein (nahe 0.0) werden (rmsea<.05), die Informationskriterien desgleichen, ohne je- doch einen definierten Wertebereich zu haben. 8.3. Modellvergleich der a priori Meßmodelle für die RWA³D Im abstrakt methodischen Teil der Arbeit wurde ein Prozedere der Testung ver- schiedener alternativer Meßmodelle hergeleitet und sowohl formal als auch inhalt- lich begründet (zusammenfassend Abschnitt 4.3 S.104ff.). Die 12 ineinander ge- schachtelten Modelle werden im folgenden an die Daten von 1458 Befragten angepaßt (Tabelle 40). Zunächst dient als Datengrundlage die Kovarianzmatrix, da diese mehr Informati- onen enthält als Korrelationsmatrizen und hier vor allem die Standardfehler richtig berechnet werden (Cudeck, 1989). Als Schätzverfahren kommt Maximum Likeli- hood zur Anwendung, da ML auch bei ungünstiger Datenlage (z.B. exzessive Kur- tosis, kleine Stichproben) eine gute Performanz zeigt. Der zusätzliche Datenrück- griff auf die asymptotische Kovarianzmatrix 167 ermöglicht das Berechnen des Satorra-Bentler .2 (C3 bei Jöreskog, vgl. S.192f., S.196; Satorra & Bentler, 1988)168. Desweiteren wurde der Tatsache Rechnung getragen, daß die Auswertung auf I- temebene auf Daten zurückgreift, für die das Intervallskalniveau mitnichten unter- stellt werden kann. Vielmehr ist zur Beschreibung von Antworten auf Likert- Skalen (Likert, 1932) im günstigsten Fall das Ordinalskalniveau angemessen (vgl. dazu auch Jöreskog, 2001)169. In der Konsequenz verbietet sich zur Beschreibung der Assoziation zwischen den Itemantworten eine anderenfalls wünschenswerte Kovarianzmatrix. Vielmehr muß hier die polychorische Korrelationsmatrix be- rechnet werden. Zieht man wiederum die asymptotische Kovarianzmatrix als Ge- wichtung hinzu, eröffnet sich die Möglichkeit eines Schätzverfahrens (wls, Weigh- 167 In den LISREL-Steuerkarten auf der Supplements-CD werden zwei asymptotische Kovarianzmatrizen ge- nutzt. Bei der ML-Schätzung auf der Basis der Kovarianzmatrix wird 1458.asy genutzt, bei der WLS- Schätzung mit der Polychorischen Korrelationsmatrix 1458.acm. 168 In Lisrel 8.51 findet sich der Satorra-Bentler Index als C3 bezeichnet. 169 http://www.ssicentral.com/lisrel/column7.htm · 198 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition ted Least Squares)170, das nicht nur dem ordinalen Skalenniveau angemessen ist, sondern auch verläßlichere Parameterschätzungen liefert (vgl. hierzu auch Powell, 1999; Molenaar & Nesselroade, 1998; Curran, West & Finch, 1996; Chan, Yung & Bentler, 1995; Yung & Bentler, 1994; Henly, 1993; Muthén & Kaplan, 1992; Kaplan, 1991; Chou, Bentler & Satorra, 1991; Mooijaart & Bentler, 1985). Die Ergebnisdarstellung verzeichnet daher auch die Ergebnisse dieser Untersuchungen. Die Anzahl der zu berechnenden Modelle reduziert sich hier jedoch:171 Bei der Verwendung von Korrelationsmatrizen implizieren gleiche Ladungen (t-Äquivalenz)172 zwingend gleiche Fehlervarianzen (Parallelität), so daß in der Konsequenz diese beiden Modelle nicht unterscheidbar sind. Die freigesetzten Fehlervarianzen im .- äquivalenten Modell werden daher auf dieselben Werte geschätzt, als wären sie restringiert gewesen. Die jeweils strengeren Modelle (Paralleltestmodelle) sind daher nach Sparsamkeitskriterien zu bevorzugen und werden hier dargestellt. 170 In AMOS wird dasselbe Schätzverfahren in Anlehnung an Browne (1984) ADF (Asymptotic Distribution Free) genannt. 171 Vgl. Ed Rigdon in SEMNET http://bama.ua.edu/cgi-bin/wa?A2=ind0105&L=semnet&D=0&P=24099 172 Abweichend von der üblichen Bezeichnung als t-Äquivalenz, die den abstrakten Fall beschreibt, werden die konkreten empirischen Modelle hier .-äquivalent genannt. · 199 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition Schätzmethode Anzahl »Methodender Faktoren faktor» Ladungsmatrix ml wls/adf .-kongenerisch 3_c_mf_cm 3_c_mf_pm Ja .-äquivalent 3_e_mf_cm ø parallel 3_p_mf_cm 3_p_mf_pm Dreifaktormodell .-kongenerisch 3_c_nmf_cm 3_c_nmf_pm Nein .-äquivalent 3_e_nmf_cm ø parallel 3_p_nmf_cm 3_p_nmf_pm .-kongenerisch 1_c_mf_cm 1_c_mf_pm Ja .-äquivalent 1_e_mf_cm ø parallel 1_p_mf_cm 1_p_mf_pm Einfaktormodell .-kongenerisch 1_c_nmf_cm 1_c_nmf_pm Nein .-äquivalent 1_e_nmf_cm ø parallel 1_p_nmf_cm 1_p_nmf_pm Tabelle 40: Zwölf alternative Meßmodelle Die folgenden Abschnitte dokumentieren die Ergebnisse der Schätzung der theoretisch abgeleiteten hierarchisch aufeinander aufbauenden Meßmodelle. Eine zusammenfassende Würdigung erfolgt in Abschnitt 8.3.2. S.213ff.. 8.3.1. Anpassungsgüte der a priori Modelle Im folgenden sind die Pfaddiagramme mit den Parametern der standardisierten Lösungen wiedergegeben. Die Standardisierung verschleiert i.a.R. die gesetzten Gleichheitsrestriktionen, die sich auf die unstandardisierten Lösungen beziehen. · 200 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition 8.3.1.1. Einfaktormodell ohne Methodenfaktor (parallel) 0.77 0.77 0.77 0.77 0.77 0.77 0.77 0.77 0.77 0.77 0.77 rwa 0.77 rwa2ap rwa8ap rwa5an rwa11an 0.48 0.48 rwa6sp rwa12sp rwa3sn rwa9sn rwa4cp rwa10cp rwa1cn rwa7cn 0.48 0.48 0.48 0.48 0.48 0.48 0.48 0.48 0.48 0.48 1.00 Abbildung 29: Pfaddiagramm Einfaktormodell ohne Methodenfaktor (parallel) .² = 3412.17 SB df = 76 gfi = .70 rmsea = .17 p = 0.000 pgfi = .68 srmr = .20 ecvi = 2.34 Hoelters cn = 50.78 ifi/.2 = .26 aic = 3416.17 cfi = .26 caic = 3428.74 Tabelle 41: Anpassungsgüte Einfaktormodell ohne Methodenfaktor (parallel) · 201 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition 8.3.1.2. Einfaktormodell ohne Methodenfaktor (.-äquivalent) rwa2ap rwa8ap rwa5an 0.51 0.80 0.88 0.82 0.60 0.68 0.83 0.82 rwa 1.00 rwa11an 0.48 0.34 rwa6sp rwa12sp rwa3sn rwa9sn rwa4cp rwa10cp rwa1cn rwa7cn 0.45 0.43 0.48 0.55 0.63 0.57 0.46 0.41 0.42 0.77 0.70 0.79 0.74 0.77 Abbildung 30: Pfaddiagramm Einfaktormodell ohne Methodenfaktor (.-äquivalent) .² = 2147.39 SB df = 65 gfi = .77 rmsea = .15 p = 0.000 pgfi = .65 srmr = .17 ecvi = 1.49 Hoelters cn = 73.83 ifi/.2 = .56 aic = 2173.39 cfi = .56 caic = 2255.09 Tabelle 42: Anpassungsgüte Einfaktormodell ohne Methodenfaktor (.-äquivalent) · 202 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition 8.3.1.3. Einfaktormodell ohne Methodenfaktor (.-kongenerisch) rwa12sp rwa3sn rwa9sn 0.61 0.59 0.50 0.93 0.87 0.63 0.85 rwa2ap rwa8ap rwa5an rwa11an 0.74 0.45 rwa6sp rwa4cp rwa10cp rwa1cn rwa7cn 0.64 0.33 0.72 0.71 0.26 0.40 0.36 0.13 0.39 0.80 0.89 0.48 0.84 0.98 rwa 1.00 0.45 Abbildung 31: Pfaddiagramm Einfaktormodell ohne Methodenfaktor (.-kongenerisch) .² = 905.83 SB df = 54 gfi = .89 rmsea = .100 p = 0.000 pgfi = .61 srmr = .077 ecvi = .65 Hoelters cn = 128.59 ifi/.2 = .79 aic = 953.83 cfi = .79 caic = 1104.67 Tabelle 43: Anpassungsgüte Einfaktormodell ohne Methodenfaktor (.-kongenerisch) · 203 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition 8.3.1.4. Einfaktormodell mit Methodenfaktor (parallel) mf rwa6sp 0.49 0.48 0.49 0.48 0.49 0.49 0.48 0.48 0.49 0.49 0.48 0.48 rwa 1.00 0.21 0.21 0.21 0.21 0.21 0.21 rwa2ap rwa8ap rwa5an rwa11an rwa12sp rwa3sn rwa9sn rwa4cp rwa10cp rwa1cn rwa7cn 0.76 0.72 0.72 0.72 0.76 0.76 0.72 0.72 0.76 0.76 0.76 0.72 1.00 Abbildung 32: Pfaddiagramm Einfaktormodell mit Methodenfaktor (parallel) .² = 3449.85 SB df = 75 gfi = .70 rmsea = .18 p = 0.000 pgfi = .67 srmr = .20 ecvi = 2.37 Hoelters cn = 142.7 ifi/.2 = .26 aic = 890.79 cfi = .27 caic = 902.92 Tabelle 44: Anpassungsgüte Einfaktormodell mit Methodenfaktor (parallel) · 204 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition 8.3.1.5. Einfaktormodell mit Methodenfaktor (.-äquivalent) 0.36 0.59 0.63 0.58 rwa mf 0.51 0.49 0.44 0.52 0.49 0.55 0.43 0.44 1.00 0.25 0.24 0.32 0.35 0.25 0.20 rwa2ap rwa8ap rwa5an rwa11an rwa6sp rwa12sp rwa3sn rwa9sn rwa4cp rwa10cp rwa1cn rwa7cn 0.76 0.83 0.74 0.48 0.76 0.70 0.76 0.75 0.73 0.73 0.65 0.56 1.00 Abbildung 33: Pfaddiagramm Einfaktormodell mit Methodenfaktor (.-äquivalent) .² = 1963.00 SB df = 64 gfi = .79 rmsea = .14 p = 0.000 pgfi = .65 srmr = .18 ecvi = 1.37 Hoelters cn = 75.81 ifi/.2 = .58 aic = 1991.00 cfi = .58 caic = 2078.99 Tabelle 45: Anpassungsgüte Einfaktormodell mit Methodenfaktor (.-äquivalent) · 205 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition 8.3.1.6. Einfaktormodell mit Methodenfaktor (.-kongenerisch) 0.33 0.71 0.26 0.40 0.36 0.39 0.37 0.48 0.20 mf 0.57 0.43 0.74 0.45 0.64 0.72 0.61 0.13 rwa 1.00 0.25 0.27 0.27 rwa2ap rwa8ap rwa5an rwa11an rwa6sp rwa12sp rwa3sn rwa9sn rwa4cp rwa10cp rwa1cn rwa7cn 0.77 0.84 0.72 0.88 0.63 0.92 0.80 0.46 0.49 0.73 1.00 Abbildung 34: Pfaddiagramm Einfaktormodell mit Methodenfaktor (.-kongenerisch) .² = 751.71 SB df = 53 gfi = .91 rmsea = .095 p = 0.000 pgfi = .62 srmr = .069 ecvi = .55 Hoelters cn = 156.37 ifi/.2 = .83 aic = 801.71 cfi = .83 caic = 958.83 Tabelle 46: Anpassungsgüte Einfaktormodell mit Methodenfaktor (.-kongenerisch) · 206 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition 8.3.1.7. Dreifaktormodell ohne Methodenfaktor (parallel) rwa2ap rwa8ap rwa5an rwa11an 0.56 0.56 rwa6sp rwa12sp rwa3sn rwa9sn rwa4cp rwa10cp rwa1cn rwa7cn 0.56 0.56 0.56 0.56 0.56 0.56 0.56 0.56 0.56 0.56 rwa_a rwa_s rwa_c 0.68 0.68 0.68 0.68 0.68 0.68 0.68 0.68 0.68 0.68 0.68 0.80 0.88 0.49 0.68 Abbildung 35: Pfaddiagramm Dreifaktormodell ohne Methodenfaktor (parallel) .² = 2534.97 SB df = 73 gfi = .76 rmsea = .15 p = 0.000 pgfi = .71 srmr = .20 ecvi = 1.75 Hoelters cn = 56.92 ifi/.2 = .36 aic = 2544.97 cfi = .36 caic = 2576.40 Tabelle 47: Anpassungsgüte Dreifaktormodell ohne Methodenfaktor (parallel) · 207 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition 8.3.1.8. Dreifaktormodell ohne Methodenfaktor (.-äquivalent) 0.56 0.52 0.53 0.67 0.63 0.53 0.57 0.68 0.84 0.63 0.55 0.61 0.68 0.88 0.61 rwa2ap rwa8ap rwa5an rwa11an 0.40 rwa6sp rwa12sp rwa3sn rwa9sn rwa4cp rwa10cp rwa1cn rwa7cn 0.49 0.61 0.48 0.48 rwa_a rwa_s rwa_c 0.72 0.76 0.72 0.77 0.77 0.79 0.72 Abbildung 36: Pfaddiagramm Dreifaktormodell ohne Methodenfaktor (.-äquivalent) .² = 1975.66 SB df = 62 gfi = .79 rmsea = .15 p = 0.000 pgfi = .63 srmr = .17 ecvi = 1.38 Hoelters cn = 77.38 ifi/.2 = .60 aic = 2007.66 cfi = .60 caic = 2108.22 Tabelle 48: Anpassungsgüte Dreifaktormodell ohne Methodenfaktor (.-äquivalent) · 208 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition 8.3.1.9. Dreifaktormodell ohne Methodenfaktor (.-kongenerisch) 0.52 0.34 0.74 0.76 0.27 0.42 0.46 0.27 0.48 0.43 0.79 0.52 0.45 rwa2ap rwa8ap rwa5an rwa11an 0.84 rwa6sp rwa12sp rwa3sn rwa9sn rwa4cp rwa10cp rwa1cn rwa7cn 0.68 0.69 rwa_a rwa_s rwa_c 0.29 0.54 0.73 0.89 0.93 0.82 0.93 0.77 0.80 0.83 0.63 Abbildung 37: Pfaddiagramm Dreifaktormodell ohne Methodenfaktor (.-kongenerisch) .² = 601.19 SB df = 51 gfi = .92 rmsea = .086 p = 0.000 pgfi = .60 srmr = .068 ecvi = .45 Hoelters cn = 171.46 ifi/.2 = .85 aic = 655.19 cfi = .85 caic = 824.88 Tabelle 49: Anpassungsgüte Dreifaktormodell ohne Methodenfaktor (.-kongenerisch) · 209 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition 8.3.1.10. Dreifaktormodell mit Methodenfaktor (parallel) 0.59 0.57 rwa6sp rwa3sn rwa9sn 0.59 0.57 0.59 0.59 0.57 0.57 0.59 0.59 0.57 0.57 0.65 0.65 0.65 0.65 0.65 0.65 0.87 0.28 0.28 0.28 0.28 0.28 0.28 mf1.00 rwa2ap rwa8ap rwa5an rwa11an rwa12sp rwa4cp rwa10cp rwa1cn rwa7cn rwa_a rwa_s rwa_c 0.60 0.60 0.60 0.60 0.60 0.60 0.79 0.50 Abbildung 38: Pfaddiagramm Dreifaktormodell mit Methodenfaktor (parallel) .² = 2395.17 SB df = 72 gfi = .77 rmsea = .15 p = 0.000 pgfi = .71 srmr = .20 ecvi = 1.65 Hoelters cn = 58.32 ifi/.2 = .39 aic = 2407.17 cfi = .39 caic = 2444.88 Tabelle 50: Anpassungsgüte Dreifaktormodell mit Methodenfaktor (parallel) · 210 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition 8.3.1.11. Dreifaktormodell mit Methodenfaktor (.-äquivalent) mf rwa2ap rwa8ap rwa5an rwa11an 0.63 0.43 rwa6sp rwa12sp rwa3sn rwa9sn rwa4cp rwa10cp rwa1cn rwa7cn 0.59 0.51 0.59 0.68 0.67 0.64 0.57 0.62 0.51 0.51 rwa_a rwa_s rwa_c 0.61 0.66 0.76 0.65 0.54 0.40 0.46 0.67 0.61 0.66 0.66 0.80 0.86 0.63 0.29 0.29 0.36 0.38 0.29 0.24 0.65 1.00 Abbildung 39: Pfaddiagramm Dreifaktormodell mit Methodenfaktor (.-äquivalent) .² = 1581.47 SB df = 61 gfi = .83 rmsea = .13 p = 0.000 pgfi = .65 srmr = .19 ecvi = 1.11 Hoelters cn = 82.63 ifi/.2 = .63 aic = 1615.47 cfi = .63 caic = 1722.32 Tabelle 51: Anpassungsgüte Dreifaktormodell mit Methodenfaktor (.-äquivalent) · 211 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition 8.3.1.12. Dreifaktormodell mit Methodenfaktor (.-kongenerisch) .72 .46 .30 .18 .59 .29 .30 .21 .50 .13 .75 .77 .40 .45 .70 .46 .28 .27 .37 .27 .25 .54 .43 .50 .73 .57 .27 rwa2ap rwa8ap rwa5an rwa11an .85 .51 .80 .82 .64 rwa6sp rwa12sp rwa3sn rwa9sn rwa4cp rwa10cp rwa1cn rwa7cn .68 .33 .24 .24 rwa_a rwa_s rwa_c .20 .48 mf_neg .70 .82 .41 .71 .70 .79 .87 Abbildung 40: Pfaddiagramm Dreifaktormodell mit Methodenfaktor (.-kongenerisch) .² = 418.26 SB df = 50 gfi = .95 rmsea = .071 p = 0.000 pgfi = .61 srmr = .060 ecvi = .33 Hoelters cn = 236.63 ifi/.2 = .90 aic = 474.26 cfi = .90 caic = 650.24 † Spezifiziert man statt dessen den »Methodenfaktor« für die positiven Items, so sinkt das .² auf 407.30. Tabelle 52: Anpassungsgüte Dreifaktormodell mit Methodenfaktor (.-kongenerisch) · 212 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition 8.3.2. Zusammenfassende Würdigung der Modellanpassung Die folgenden Abschnitte integrieren die kritische Würdigung der globalen Modellanpassung sowie die Konsequenzen für Ladungsmatrizen und Interkorrelation der latenten Konstrukte. Abschließend werden die Besonderheiten der Methodenfaktoren in den einzelnen Modellen diskutiert. 8.3.2.1. Globale Anpassungsgüte Alternative oder konkurrierende Modelle lassen sich hinsichtlich ihrer Anpassung auf der deskriptiven Ebene sehr einfach vergleichen. Tabelle 53 weist jeweils die mit den Freiheitsgraden gewichteten .²-Werte aus.173 Die empirische Kovarianzstruktur zwischen den 12 Items der RWA³D wird unter den bislang betrachteten Alternativen am besten durch ein Modell beschrieben, das die Items als kongenerische Maße dreier interkorrelierter (inhaltlicher) Faktoren zuzüglich eines »Methodenfaktors« auffaßt.174 Die besten und schlechtesten Modellanpassungen sind in Tabelle 53 jeweils fett gedruckt 175. 173 In Lisrel ist die Satorra-Bentler skalierte .²-Statistik mit C3 bezeichnet. Sie wird hier bei der ML- Schätzung mit Kovarianzmatrix und asymptotischer Kovarianzmatrix angegeben. Die andere .²-Statistik ist das minimum fit function .² C1. 174 Der »Methodenfaktor« ist in allen hier dargestellten Modellen für die negativen Items spezifiziert worden. Da dieser Faktor der Diskrepanz zwischen (sic!) den beiden Methoden Rechnung tragen soll, sollte es irrelevant sein, ob der Faktor die negativen oder positiven Items reflektiert. Empirisch ist dies jedoch durchaus von Belang. Im konkreten Fall des hier favorisierten Dreifaktormodells mit Methodenfaktor paßt das Modell besser, wenn der formale Faktor die Besonderheiten der protraits widerspiegelt. Allerdings erbrachte dieses Modell erst dann eine Lösung, als ich für die Kovarianzmatrix F der drei Faktoren angemessene Startwerte setzte. Andernfalls konvergiert der Schätzalgorithmus zu fatalen »Lösungen«, ohne daß Lisrel dies reklamiert. 175 Die Modelle mit Gleichheitsrestriktionen wurden in strengen Varianten geschätzt. Die Gleichheit wird hier über alle Konstrukte hinweg gefordert. Eine schwächere Forderung wäre gewesen, lediglich pro Konstrukt die Gleichheit zu verlangen. Die schwachen Varianten liegen auf der Supplements-CD zusätzlich auch als LISREL-Steuerkarten vor. · 213 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition Schätzmethode ml wls/adf Anzahl »Methodender Faktoren faktor« Satorra min. fit min. fit Bentler function function Ladungsmatrix .²/df .²/df .²/df .-kongenerisch 8.37 9.42 7.94 Ja .-äquivalent 25.93 26.21 ø parallel 33.27 36.30 12.10 Dreifaktormodell .-kongenerisch Nein .-äquivalent parallel 11.79 12.97 9.23 31.87 27.94 ø 34.73 37.12 12.08 .-kongenerisch 14.18 14.13 9.18 Ja .-äquivalent 30.67 28.37 ø parallel 46.00 41.64 13.77 Einfaktormodell .-kongenerisch Nein .-äquivalent parallel 16.77 17.14 10.43 33.04 29.06 ø 44.90 41.43 13.81 Tabelle 53: Globaler Fit der a priori Meßmodelle Die Unterschiede lassen sich jedoch nicht ohne weiteres auf statistische Signifikanz testen, da die Verteilungen der meisten Fit-Indizes unbekannt sind. Bauen die zu vergleichenden Modelle hierarchisch aufeinander auf (nested), so lassen sich die Anpassungen mit dem Likelihood-Ratio(LR)-Test auf statistische Signifikanz testen (Kaplan, 2000): ..2 = nFML1 -FML2) [8.1] ( Üblicherweise wird hier die Differenz 176 der .2-Schätzungen zur Differenz der Freiheitsgrade in Beziehung gesetzt. Ein p-Wert unterhalb des konventionellen a-Fehlerniveaus deutet hier darauf hin, daß das restriktivere Modell signifikant schlechter paßt.177 Alternativen zum LR-Test bestehen im Wald-Test und im Lagrangian-Multiplier- Test. Im Unterschied zum LR-Test muß hier nur eines der zu vergleichenden Modelle geschätzt werden. Der Wald-Test prüft, ob zusätzliche Restriktionen ein liberales Modell bedeutsam verschlechtern. In umgekehrter Logik fragt der Lagrangi176 Gemeint ist die Differenz jeweils zwischen restringiertem und liberalem Modell. 177 Unter der Bedingung, daß das liberalere Modell »korrekt« ist. · 214 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition an-Multiplier-Test, ob Restriktionen aufgegeben werden können. Die drei Verfahren stellen asymptotisch äquivalente Vorgehensweisen dar (Bollen, 1989 S.295). In Abschnitt 4.3 (S.104ff.) konnte gezeigt werden, daß die 12 Meßmodelle einer komplexen Nestungsstruktur unterliegen. Zwei Modelle stellen jedoch insofern Extrema dar, als sich vom liberalsten Modell alle anderen ableiten lassen und unter das restriktivste Modell keines der anderen geschachtelt ist. Es bleibt aufgrund dieser Struktur die vereinfachte Möglichkeit, alle Modelle hinsichtlich ihrer relativen Anpassungsverschlechterung gegenüber dem liberalsten Modell (Dreifaktor, kongenerisch, mit Methodenfaktor) zu testen. Dies geschieht hier mit einem LR-Test, namentlich dem .2-Differenzen-Test (Tabelle 54). Ausnahmslos alle Modelle sind signifikant schlechter als das kongenerische Dreifaktormodell mit Methodenfaktor. Dies gilt ebenso für die ML-Schätzung auf Basis der Kovarianzmatrix (linke Spalte) wie auch für die wls/adf-Schätzung auf der Grundlage der polychorischen Korrelationsmatrix (rechte Spalte). Da bei letzterer Methode den Itemspezifika stärkeres Gewicht eingeräumt wird, passen diese Modelle besser, sodaß die Modellverschlechterungen durch Restriktionen auch nicht derart dramatisch ausfallen. · 215 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition Anzahl »Methoden-..²/.df) der Faktoren faktor« Ladungsmatrix Schätzmethode ml178 wls/adf .-kongenerisch Referenzmodell ja .-äquivalent 102.56 ø parallel 97.38 21.56 Dreifaktormodell .-kongenerisch 190.59 73.49 nein .-äquivalent 105.11 ø parallel 97.35 21.07 .-kongenerisch 92.62 29.78 ja .-äquivalent 96.05 ø parallel 106.08 25.41 Einfaktormodell .-kongenerisch 113.72 41.50 nein .-äquivalent 94.55 ø parallel 103.00 25.08 Tabelle 54: Relativer Fit der a priori Meßmodelle (..2-Test) Ignoriert man die Kodierrichtung der Items und wählt als Referenzmodell ein kongenerisches Dreifaktormodell, bleiben dennoch alle fünf darunter geschachtelten Modelle signifikant schlechter (Tabelle 55). Assuming model Dreifaktor eta-kongenerisch oMF to be correct: nfi ifi rfi tli df cmin p .1 .2 .1 .2 Dreifaktor .-äquivalent oMF 11 1070.75 0.00 0.25 0.26 0.23 0.24 Einfaktormodell .-kongenerisch oMF 3 264.30 0.00 0.06 0.06 0.07 0.07 Einfaktor .-äquivalent oMF 14 1227.63 0.00 0.29 0.30 0.25 0.26 Dreifaktor .-parallel oMF 22 2048.47 0.00 0.49 0.49 0.38 0.38 Einfaktor .-parallel oMF 25 2487.51 0.00 0.59 0.60 0.45 0.45 Tabelle 55: ..2-Test mit kongenerischem Dreifaktormodell ohne Methodenfaktor als Referenz 178 Zum Modellvergleich wurden die Modelle in AMOS 4.0 spezifiziert, da hier der .²-Differenzentest mit ausgegeben wird. Allerdings sind hier die Modelle mit Gleichheitsrestriktionen zum Erreichen der Nestung in strengen Varianten geschätzt wurden. Die Gleichheit wird hier über alle Konstrukte hinweg gefordert. Eine schwächere Forderung wäre gewesen, lediglich pro Konstrukt die Gleichheit zu verlangen. Die schwachen Varianten liegen zusätzlich auch als LISREL-Steuerkarten vor. · 216 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition Eine graphische Darstellung der Anpassungsgüte erleichtert die Einschätzung, welche der Modellmodifikationen den größten Gewinn mit sich bringt. Modellvergleich (Anpassungsgüte steigt von links nach rechts) 0 RMSEA GFI .05 .10 .15 .20 .65 .70 .75 .80 .85 .90 .95 AIC GFIAkaike-Informationskriterium 500 1000 1500 2000 2500 3000 3500 0.00 1.00 RMSEA M F MF F F F F nM F F M F MF M F MF M M M M M n n n n n a r a r n n ui v ui v a r a r v i v n o n o p 3 p 1 p 3 p u i u o o 1 c 3 c q q 1 c 3 c q q e 3 e 1 e 3 e 1 1 Abbildung 41: Graphischer Modellvergleich Die Modelle sind in Abbildung 41 nach ihrer Anpassungsgüte geordnet. Der Stufenplot zeigt den wünschenswerten Abfall des Akaike Informationskriteriums vom Baselinemodell hin zu den hier vorgeschlagenen Modifikationen (Akaike, 1987). Die nach oben gerichteten Dreiecke symbolisieren, daß hohe Goodness-of-Fit- Werte (gfi) für eine bessere Modellanpassung sprechen (möglichst gfi>.90; vgl. S.193). Hingegen sollte das rmsea möglichst klein werden (nach unten gerichtete Dreiecke; rmsea<.05; vgl. S.196). Es wird eine bemerkenswerte Systematik deutlich: die .-kongenerischen Modelle rangieren blockweise vor den .-äquivalenten und parallelen Modellen. Darin geschachtelt ist die Modellierung der inhaltlichen Struktur der Items: die hier vorgeschlagenen Dreifaktormodelle passen regelmäßig besser als die Einfaktormodelle. · 217 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition Erst als drittes Ordnungskriterium wird das Beachten oder Ignorieren der Kodierrichtung relevant.179 8.3.2.2. Evaluation der Ladungsmatrizen Die Evaluation der Mikroebene der Meßmodelle (Ladungsmatrizen und Fehlervektor) offenbart Qualität und Schwächen der einzelnen Items. Als problematisch erweisen sich in allen Modellen die Items rwa_1_cn, rwa_3_sn und rwa_11_an. Diese Variablen sind sämtlich entgegen der Merkmalsrichtung kodiert und weisen eine sehr asymmetrische Verteilungsform auf. Diese abträglichen Charakteristika werden im Modell durch eine geringe Ladung sowie eine hohe Fehlervarianz bestraft. Der Determinationskoeffizient (smc, R²) liegt bei diesen Items teilweise unter .20, beim parallelen Einfaktormodell jeweils bei .23. 8.3.2.3. Interkorrelation der latenten Konstrukte Die zentrale Argumentation der vorliegenden Arbeit unterstellt eine Dreifaktorenstruktur. Dabei ist die Kovarianz zwischen diesen latenten Konstrukten nicht restringiert und damit auch im Mittelpunkt des Interesses. In der Subdiagonalmatrix F stehen drei Kovarianzen; die Kovarianz zwischen den inhaltlichen Subdimensionen und einem eventuellen strukturellen »Methodenfaktor« ist verwehrt. Korrelation der Subdimensionen Anzahl »Methodender Faktoren faktor« Ladungsmatrix .AS.AC .SC .-kongenerisch .80 > .64 < .82 ja .-äquivalent .80 > .63 < .86 parallel .79 > .50 < .87 Dreifaktormodell .-kongenerisch .80 > .63 < .83 nein .-äquivalent .79 > .61 < .88 parallel .80 > .49 < .88 Tabelle 56: Korrelation der Subdimensionen Die zusammenfassende Inspektion der Korrelation zwischen den drei latenten Subdimensionen offenbart ein regelmäßiges Muster: 179 Vor diesem Hintergrund wird es überlegenswert, in den Validierungsstudien die Kodierrichtung zu ignorieren, da es hier zahlreiche Möglichkeiten gäbe, diese Besonderheit zu modellieren. Da sich diese Modelle Außenstehenden schwer kommunizieren lassen, mag aus Sparsamkeitsgründen auf diese überangepaßten Modelle verzichtet werden. · 218 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition 1. Der korrelative Zusammenhang zwischen Submissivität und Konventiona- lismus übersteigt in allen Modellen die anderen paarweisen Zusammen- hänge. Die geringste Assoziation ist – wiederum in allen Modellen – zwi- schen Aggressivität und Konventionalismus zu finden. 2. Für die F-Matrix ist es praktisch irrelevant, ob ein Methodenfaktor spezifi- ziert ist oder nicht. Das schafft Interpretationssicherheit für die inhaltlich zu deutenden Subdimensionen. 3. Die Modelle mit liberalisierten Fehlervarianten unterscheiden sich kaum voneinander. Die Restriktion im parallelen Modell berührt nicht die Kor- relationen AS und SC, läßt hingegen AC drastisch sinken. 8.3.2.4. Varianz der »Methodenfaktoren« Die »Methodenfaktoren« klären bei der Verwendung von Polychorischen Korrelationsmatrizen weniger Varianz auf als bei der Schätzung auf der Basis von Kovarianzmatrizen (Tabelle 57). Anzahl »Methodender Faktoren faktor« Ladungsmatrix Datenbasis Polychor. Kovarianzmatrix Korrelationsmatrix .-kongenerisch ja .-äquivalent parallel .23 .11 .32 ø .27 (-.03) Dreifaktormodell .-kongenerisch nein .-äquivalent parallel .-kongenerisch ja .-äquivalent parallel .23 .11 .23 ø .14 (-.04) Einfaktormodell .-kongenerisch nein .-äquivalent parallel Tabelle 57: Varianz des Methodenfaktors Der Einfluß des Methodenfaktors verringert sich in den Paralleltestmodellen; bei Verwendung der Polychorischen Korrelationsmatrix schwindet diese Varianzquelle plausiblerweise völlig. · 219 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition 8.3.2.5. Zusätzliche Absicherung durch Bootstrapping Eine der zentralen Forderungen bei der Analyse von Strukturgleichungsmodellen ist die multivariate Normalverteilung der zu untersuchenden Variablen. Ist diese Annahme verletzt, werden meist die Standardfehler unterschätzt. Ein attraktiver Ausweg zur verläßlicheren Berechnung der Parameter besteht im sogenannten Bootstrapping180 (Linhart & Zucchini, 1986; Efron & Tibshirani, 1985). Bei diesem Resampling-Verfahren werden aus den empirischen Daten wiederholt Zufallsstichproben (mit Zurücklegen) gezogen, die denselben Umfang wie die Mutterstichprobe haben. Über die so gewonnenen Bootstrap-Stichproben lassen sich die interessierenden Parameter aggregieren und somit auf empirischem Wege ohne weitere Verteilungsannahmen approximativ bestimmen. Dieser Logik folgend ist es auch möglich, die Schätzung der Anpassungsgüte auf empirischem Wege auf Robustheit zu überprüfen. Beim Vergleich mehrerer Modelle werden die konkurrierenden Modelle an jede Bootstrap-Stichprobe angepaßt. Im nächsten Schritt läßt sich nach jeder Analyse die Diskrepanz zwischen den implizierten Matrizen der jeweiligen Bootstrap-Stichprobe und der Bootstrap- Population181 berechnen. Für jedes alternative Modell werden die Diskrepanzen über alle Boostrap-Samples aggregiert. Das Modell mit dem niedrigsten Mittelwert wäre zu favorisieren (vgl. Arbuckle & Wothke, 1999; Nevitt & Hancock, 2001; Raykov, 2001; Zucchini, 2000; Chan, Yung, Bentler & Tang, 1998; Bollen & Stine, 1993). 180 Bootstrapping = sich wie Münchhausen am Stiefelriemen selbst aus dem Sumpf ziehen. 181 Die Population ist beim Bootstrapping die empirische Stichprobe. · 220 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition Parametric Nonparametric Modellname Monte Carlo Bootstrap Bootstrap 3_c_mf 484.90 * 485.80 * 490.13 * 496.88 ****** 495.37 ***** 507.96 ****************** ML discrepancy (implied vs pop) 500.61 505.85 511.09 ************ ******************* ******************** 519.05 530.13 541.21 ******************** ************* ****** 516.33 **************** 552.30 *** N = 10000 521.57 *********** 563.38 * Mean = 511.8 526.81 ****** M=520.614 574.47 * S. e. = 0.0946493 532.04 *** 0.157995 585.55 * 537.28 * 596.63 * 542.52 * 607.72 * 547.76 * 618.80 * 553.00 * 629.88 * 558.24 * 640.97 * Tabelle 58: Bootstrapverteilung 3_c_mf Parametric Nonparametric Modellname Monte Carlo Bootstrap 1_p_nmf 3151.44 3156.34 ** ************** 3150.65 3155.63 3161.23 ******************** 3160.61 ML discrepancy (implied vs pop) 3166.13 3171.02 3175.91 ************** ******* *** 3165.59 3170.57 3175.55 3180.81 * 3180.52 N = 10000 3185.70 * 3185.50 Mean = 3163.42 3190.59 * M=3164.04 3190.48 S. e. = 0.0634154 3195.49 * 0.0691232 3195.46 3200.38 * 3200.44 3205.28 * 3205.41 3210.17 3210.39 3215.06 3215.37 3219.96 * 3220.35 Bootstrap * *********** ******************** *************** ********* **** ** * * * * * * * Tabelle 59: Bootstrapverteilung 1_p_nmf Die Abbildungen auf den Anhangseiten 363-368 dokumentieren wie Tabelle 58 und Tabelle 59 die Ergebnisse des Modellvergleichs durch Bootstrapping. Es wurden in amos 4.0 zunächst jeweils 10,000 Bootstrap-Samples aus simulierten multivariat normalverteilten Daten gezogen, die dieselben Mittelwerte, Varianzen und Kovarianzen wie die empirische Stichprobe aufweisen (parametrisches Monte Car- · 221 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition lo Bootstrapping - Efron & Tibshirani, 1985). Die rechte Tabellenhälfte dokumentiert die Ergebnisse des zweiten Schrittes (nonparametrisches Bootstrapping), bei dem die empirischen Daten selbst die Mutterstichprobe darstellten. Anzahl »Methodender Faktoren faktor» Ladungsmatrix Bootstrap Monte Carlo nonparametrisch .-kongenerisch 511.8 520.6 ja .-äquivalent 1628.5 1631.6 parallel 2631.6 2633.2 Dreifaktormodell .-kongenerisch 701.6 709.8 nein .-äquivalent 1760.4 1762.8 parallel 2727.2 2728.4 .-kongenerisch 786.5 794.0 ja .-äquivalent 1842.0 1844.8 parallel 3138.4 3139.6 Einfaktormodell .-kongenerisch nein .-äquivalent parallel 962.6 969.5 1914.2 1916.3 3163.4 3164.0 Tabelle 60: Zusammenfassender Modellvergleich durch Bootstrapping Der zusammenfassende Modellvergleich auf Basis des Resampling durch die Boot- strap-Methode bestätigt das kongenerische Dreifaktormodell mit Berücksichtigung der Kodierrichtung der Items als das beste Modell. Einfaktorielle Modelle mit ignorierten Itembesonderheiten, wie sie die übliche Praxis darstellen, erlauben nur eine sehr schlechte Anpassung an die empirische Datenlage. Die Absicherung durch Resamplingmethoden führt im vorliegenden Fall des Vergleichs der zwölf Modelle nicht zu wesentlich abweichenden Schlußfolgerungen. Die Rangordnung der Modelle weicht nur an zwei Stellen von der Rangordnung bei einfacher Modellschätzung ab. 8.4. Feinabstimmung des Meßmodells 8.4.1. Modifikationsindizes Die Inspektion der Modifikationsindizes dient hier ausdrücklich diagnostischen Zwecken. Von einer Ableitung veränderter Auswertungsvorschriften auf dieser Grundlage wird entschieden abgeraten. · 222 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition Einerseits wird durch Hinzunahme zusätzlicher Pfade das Sparsamkeitsprinzip verletzt, die latenten Konstrukte büßen ihre »Wohldefiniertheit« ein. Andererseits ist nicht garantiert, daß sich die Veränderungen als tragfähig erweisen, wenn die Modelle an andere Datensätze angepaßt werden. Folgende Liberalisierungen würden eine bessere Modellanpassung mit sich bringen: 1. Aufgabe der Gleichheitsrestriktion in der Ladungsmatrix des Methodenfaktors. 2. Aufgabe der Unkorreliertheit des Methodenfaktors mit den Subdimensionen von Autoritarismus. 3. Aufgabe der Unkorreliertheit der Meßfehler bei einigen Itempaaren aufgrund semantischer Nähe. Das kongenerische Anbinden des Methodenfaktors (1) vermindert m.E. dessen Interpretierbarkeit. Der Faktor wurde eingeführt, um den formalen Unterschied zwischen contraits und protraits abzubilden. Diese Dichotomie läßt per definitionem keine weiterführende Abstufung zu.182 Die Aufgabe der Unkorreliertheit des »Methodenfaktors« (2) wäre nicht völlig undenkbar (vgl. die Argumentation auf S.113). Die Korrelation dieses formalen Faktors mit den inhaltlichen ist durchaus plausibel. Sie wird empirisch relativ hoch und in theoriekonformem Muster gefunden: .84 mit Konventionalismus, .66 mit Unterordnung und am geringsten mit Aggressivität (.54). Gleichwohl wird Sparsamkeit und Interpretierbarkeit verletzt. Ebenfalls plausibel – aber nicht sparsam – ist die zugelassene paarweise Fehlerkorrelation zwischen semantisch ähnlichen Items. Prominente Beispiele sind hier die Items rwa_1_cn und rwa_4_cp, die sich mit religiöser Tradition beschäfti- gen.183 Zusammenfassend läßt sich sagen, daß die Modifikationsindizes in Richtungen weisen, die vorhersehbar waren und bei der theoretischen Herleitung der Modelle 182 Denkbar wäre in der Tat auch ein konstruktspezifisches Ladungsmuster. Dies trüge dem Umstand Rechnung, daß in Abhängigkeit von der theoretischen Dimension das »Gegenteil« eine völlig eigenartige Bedeutung hat. Dies ist sehr plausibel, hat jedoch mit der absichtsvoll restriktiven Vorstellung eines rein formalen Faktors nichts gemein. 183 Die potentielle Korrelation läge hier bei .22. · 223 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition bereits in Aussicht gestellt wurden. Der Nutzen läge bei einem Absenken der .²-Statistik deutlich unter 200, was einer Halbierung gleichkommt. Durch die Liberalisierungen gingen etwa zehn Freiheitsgrade verloren. Die Nullhypothese der Punktgleichheit von empirischer und implizierter Kovarianzmatrix bleibt signifikant abgelehnt. Das Zurückweisen der post hoc Veränderungen auf Grundlage von Modifikationsindizes bleibt jedoch unberührt. 8.4.2. Polychorische Korrelationsmatrizen In der zusammenfassenden Ergebnisdarstellung der a priori Modelle wurde neben der ML-Schätzung bereits auch die wls/adf-Schätzung angegeben. Als Datengrundlage ging hier nicht die Kovarianzmatrix ein, sondern die Polychorische Korrelationsmatrix. Die Polychorische Korrelation ist eine ML-Schätzung für die Korrelation der zugrundeliegenden latenten Variablen. In Lisrel 8.51 wird die Polychorische Korrelation geschätzt durch Maximierung von mm2 ln L = ..nij log ij( ) [8.2] 1 p. i=1 j=1 wobei gilt p. , ij() = Pr [z1 = i z 2 = j] (1) (2) ti tj [8.3] = ..F2(, ) u v dudv (1) (2) i-1 t t j-1 und 12 F2(, ) = 21 -.2 )e - 2(1 -.2) (u2 -2puv +v ) 1 uv p( [8.4] (1) (1),…t(1) - , Dabei seien t t 2 die Schwellen der Variablen z1* . 1 m1 1 Von praktischer Relevanz ist die Tatsache, daß die Polychorischen Korrelationen größer sind als die gewöhnlichen Pearson-Korrelationen. Ein Ausschnitt der beiden Korrelationsmatrizen mag dies illustrieren (Tabelle 61, S.225). · 224 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition Correlation Matrix (polychorisch) RWA3SN RWA9SN RWA4CP RWA10CP RWA1CN RWA7CN RWA3SN 1.000 RWA9SN 0.366 1.000 RWA4CP 0.179 0.188 1.000 RWA10CP 0.265 0.293 0.323 1.000 RWA1CN 0.218 0.142 0.340 0.169 1.000 RWA7CN 0.456 0.327 0.269 0.312 0.294 1.000 Correlation Matrix (klassisch) RWA3SN RWA9SN RWA4CP RWA10CP RWA1CN RWA7CN RWA3SN 1.000 RWA9SN 0.264 1.000 RWA4CP 0.133 0.156 1.000 RWA10CP 0.180 0.244 0.293 1.000 RWA1CN 0.161 0.122 0.317 0.150 1.000 RWA7CN 0.323 0.281 0.241 0.291 0.278 1.000 Tabelle 61: Polychorische Korrelationen im Vergleich zu Pearson-Korrelationen Zusammenfassend läßt sich sagen, daß die Schätzung auf Grundlage der Polychorischen Korrelationsmatrizen mit WLS zu besseren Modellanpassungen führt. Dies gilt insbesondere für die restriktiveren Modelle. Dabei sei einschränkend davor gewarnt, bei zu kleinen Stichproben WLS zu verwenden. Was hier bei dem gepoolten Datensatz gerechtfertigt war, wäre bei der Auswertung der Teilstudien kontraindiziert. Daher wird in den Validierungsanalysen mit Bedacht darauf verzichtet. 8.5. Alternative Meßmodelle Im Abschnitt 4.4 (Weitere Elaboration des Meßmodells; S.109 ff.) wurden theoriegeleitet weitere Modelle vorgeschlagen, die einerseits eine bessere Anpassung an die Datenlage erlauben und andererseits weitere Interpretationsmöglichkeiten eröffnen. Im Folgenden werden einige dieser Modelle einer empirischen Prüfung unterzogen. 8.5.1. Faktor zweiter Ordnung Abschnitt 4.4.1 diskutiert Vor- und Nachteile von CFA-Modellen mit drei Faktoren erster Ordnung, deren Zusammenhang auf höherem Niveau durch einen Faktor zweiter Ordnung erklärt wird. Im folgenden werden die Ergebnisse der empirischen Prüfung dokumentiert. Als Datenbasis diente die gepoolte Kovarianzmatrix aus fünf Studien mit 1458 Befrag- · 225 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition ten ohne fehlende Werte. Zusätzlich wurde die asymptotische Kovarianzmatrix zur Adjustierung der ML-Schätzung hinzugezogen. Die Anpassung des Modells zweiter Ordnung ist aufgrund der Äquivalenz dieselbe wie der Fit des Modells mit drei korrelierten Faktoren: .²(51, N=1458)=601.19, p=0.000. Ebenfalls gleich sind folglich die Fehlervarianzen, Ladungen und quad- rierten multiplen Korrelationen (Abbildung 42 a und b). .80 .34 .46 .48 rwa2ap rwa8ap rwa5an rwa11an .84 .52 .83 .63 rwa6sp rwa12sp rwa3sn rwa9sn rwa4cp rwa10cp rwa1cn rwa7cn .68 .74 .76 .27 .42 .69 .27 rwa_a rwa_s rwa_c .29 .29 .54 .54 .73 .73 .89 .89 .45 .45 .43 .43 .93 .93 .82 .82 .79 .79 .52 .52 .93 .93 .77 .77 .84 .52 .68 .27 .69 .27 1.03 rwa2ap rwa8ap rwa5an rwa11an rwa6sp rwa12sp rwa3sn rwa9sn rwa4cp rwa10cp rwa1cn rwa7cn .34 .74 .76 .42 .46 .48 rwa_a rwa_s rwa_c .78 .81 rwa Abbildung 42: Dreifaktormodell ohne (a) und mit (b) Faktor höherer Ordnung Bemerkens- und erwähnenswert ist eine Auffälligkeit in der Zusammenhangsstruktur zwischen dem Faktor zweiter Ordnung (»allgemeiner Autoritarismus«) und den Subdimensionen, die auf der ersten Ebene modelliert sind. Die Residualvarianz von Submission wird (unzulässigerweise) leicht negativ geschätzt ( . =-.06 ); folg22 lich wäre es ein angemessener Analyseschritt, diese Fehlervarianz auf Null zu setzen (Pfaddiagramm auf S.227). Dieses Modell paßt nur minimal (obgleich signifikant) schlechter: .²(51, N=1458)=601.19 respektive .²(52, N=1458)=606.31, also ..²(1, N=1458)=5.12, p=.024. · 226 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition .29 .54 .73 .89 .45 .43 .93 .82 .79 .52 .93 .77 .29 .54 .73 .89 .45 .43 .93 .82 .79 .52 .93 .77 rwa2ap rwa8ap rwa5an rwa11an rwa6sp rwa12sp rwa3sn rwa9sn rwa4cp rwa10cp rwa1cn rwa7cn .84 .68 .52 .34 .74 .76 .27 .42 .46 .69 .27 .48 .37 rwa_a .79 FIX 0.0 rwa_s impl. 1.0 rwa Identität .82 rwa_c .33 ..a ..b .52 .27 .42 .46 .27 .48 .37 .33 rwa2ap rwa8ap rwa5an rwa11an .84 rwa6sp rwa12sp rwa3sn rwa9sn rwa4cp rwa10cp rwa1cn rwa7cn .68 .34 .74 .76 .69 rwa_a rwa_c .79 .82 rwa Abbildung 43: Modell höherer Ordnung mit restringierter Residualvarianz (a: ausführlich; b: schlank) · 227 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition Die alternative Schreibweise des Pfaddiagramms in der Teilabbildung b offenbart eine interessante Interpretationsmöglichkeit: Der Faktor zweiter Ordnung ist praktisch ununterscheidbar von der latenten Variable »Submissivität« auf der ersten Ebene. Damit wird letztere auf der ersten Ebene entbehrlich und bekommt infolgedessen den Charakter eines Generalfaktors, dessen indirekter Einfluß auf die anderen Indikatoren durch zwei Subdimensionen (A und C) mediiert wird. Diese formale Eigenschaft ließe sich auch inhaltlich diskutieren: es wird die zentrale Bedeutung der Submissivität für das gesamte mehrdimensionale Konstrukt des Autoritarismus deutlich. Man lese das Pfaddiagramm etwa in der Art: »Das wesentliche am Autoritarismus ist die Unterordnung. Aggressivität und Konventionalismus sind weitere Facetten, die hinzukommen. Sie bauen jedoch auf Submissivität (auf).« Etwas behutsamer klingt die Interpretation, daß das Gemeinsame (i.S. einer Korrelation) zwischen Autoritärer Aggressivität und Konventionalismus durch etwas Drittes beschrieben werden kann: durch Submissivität. Das fragwürdige Übersetzen statistischer Zusammenhänge in theoretischen Sinn wäre in der Tat unzulässig, wenn man die Grenzen der Verallgemeinerbarkeit ignoriert. Im engen Rahmen184 scheinen die dargestellten Schlüsse jedoch nicht nur plausibel, sondern auch richtig induziert. Es sei daran erinnert, daß das Finden eines Meßmodells lediglich einen ersten Schritt darstellt, der nur die notwendige Bedingung für komplexere Erklärungszusammenhänge bildet. Vergleicht man nun ein Dreifaktormodell mit dem Modell zweiter Ordnung in Bezug auf die Erklärungsgewalt für abhängige Variablen, so kann leicht ein Mißverständnis entstehen, das hier ausgeräumt werden soll: Die Regressionsgewichte von den Subdimensionen zu potentiellen abhängigen Variablen bleiben völlig unberührt davon, ob der Zusammenhang zwischen den Subdimensionen als Korrelation oder als Faktor höherer Ordnung dargestellt ist (vgl. das Beispiel aus der Studie NEO 1 in Abbildung 44 auf S.229). 184 … Operationalisierung von Autoritarismus durch die RWA³D mit den bekannten zwölf Items sowie mit den beschriebenen Stichproben. · 228 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition l.23 .11 -.20 .56 .05 l.23 .11 -.20 .56 .05 rwa rwa2ap rwa8ap rwa5an rwa11an rwa6sp rwa12sp rwa3sn rwa9sn rwa4cp rwa10cp rwa1cn rwa7cn rwa_a rwa_s rwa_c rwa2ap rwa8ap rwa5an rwa11an rwa6sp rwa12sp rwa3sn rwa9sn rwa4cp rwa10cp rwa1cn rwa7cn rwa_a rwa_s rwa_c Intoeranz Ausländerfeindlichkeit .23 Intoeranz Ausländerfeindlichkeit .23 gleiche Regressionspfade gleiche Regressionspfade Abbildung 44: Gleiche Regressionsgewichte in Modellen erster und zweiter Ordnung · 229 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition 8.5.2. Generalfaktor Das Generalfaktormodell ähnelt dem CFA-Modell zweiter Ordnung insofern, als hier Gemeinsames oder Übergeordnetes ebenso modelliert wird wie Spezielles. (vgl. 4.4.2). Das Gemeinsame wird durch einen Generalfaktor modelliert. Darüber hinaus laden jeweils vier Items auf einem Faktor, der ihre inhaltlichen Eigenheiten widerspiegelt. Wie bereits im theoretischen Teil erwähnt, lassen sich unter bestimmten Bedingungen CFA-Modelle höherer Ordnung in Generalfaktormodelle überführen. Besonders einfach ist dies, wenn die Ladungsmuster jeweils durch Einheistmatrizen charakterisiert sind. Die folgenden beiden Modelle sind zur Illustration in dieser Weise spezifiziert. Die Modellanpassung ist in beiden Modellen aufgrund der Äquivalenz gleich, jedoch auf unbefriedigendem Niveau von .²(62, N=1458)=1676.73 und einem rmsea von .134. .50 .41 .47 .58 .50 .54 .58 .49 .50 .52 .59 rwa2ap rwa8ap rwa5an rwa11an .69 rwa6sp rwa12sp rwa3sn rwa9sn rwa4cp rwa10cp rwa1cn rwa7cn .64 .57 rwa_a rwa_s rwa_c .75 .67 .83 .77 .66 .75 .71 .66 .76 .75 1.15 .67 .83 rwa Abbildung 45: Generalfaktormodell und CFA zweiter Ordnung im Vergleich (second order mit unity.ls8) · 230 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition .48 .44 .46 .46 rwa_s .75 .77 .75 .76 .75 rwa2ap rwa8ap rwa5an rwa11an .66 rwa6sp rwa12sp rwa3sn rwa9sn rwa4cp rwa10cp rwa1cn rwa7cn .61 .55 .36 .42 .51 .51 .55 rwa_a rwa_c .52 .59 .67 .83 .66 .71 .66 .19 .19 .19 .18 .14 .16 .23 .28 .24 .20 .17 .17 rwa Abbildung 46: Generalfaktormodell und CFA zweiter Ordnung im Vergleich (general factor mit unity.ls8) Im Fazit bleibt festzustellen, daß die Restriktion aller Ladungen auf 1.0 eine gute Modellanpassung vereitelt. Zugleich bringt jedoch auch die Liberalisierung eine Reihe von Problemen mit sich. Teilweise erwachsen Schätzprobleme, die zu unzulässigen Lösungen führen. Mein zentrales Gegenargument bezieht sich jedoch auf die Praktikabilität. Diese ist drastisch eingeschränkt, da bei der Überführung der Modelle implizite Restriktionen notwendig sind (vgl. hierzu Schmid-Leiman Dekomposition, Schmid & Leiman, 1957; Rindskopf & Rose, 1988; Mulaik & Quartetti, 1997; Yung et al., 1999). Ich stelle daher den Nutzen eines solchen Prozedere ernsthaft infrage und verzichte auf eine weiterführende Darstellung meiner Analysen in dieser Richtung. 8.5.3. Alternative Ansätze zur Modellierung der Kodierrichtung der Items In 4.4.3 (S.111ff.) wurden alternative Ansätze zur Modellierung der Kodierrichtung der Items diskutiert. Ausgewählte Modelle werden im Folgenden einer empirischen Prüfung unterzogen. Die Datenbasis wird wiederum durch den gepoolten Datensatz aus 1458 gültigen Fällen gebildet. · 231 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition 8.5.3.1. Methodenfaktor auf den positiv formulierten Items Dies stellt keinen echten alternativen Ansatz, sondern eher eine Variante des bereits Vorgestellten dar. In Fußnote 174 (S. 213) wurde bereits dargestellt, daß es durchaus von Belang ist, ob der »Methodenfaktor« die protraits oder die contraits reflektiert.185 8.5.3.2. Kongenerischer Methodenfaktor Die Aufgabe der Gleichheitsrestriktion für die Ladungsmatrix des Methodenfaktors erbringt eine statistisch signifikante Verbesserung von .²(50, N=1458)=407.30 auf .²(45, N=1458)=324.87, also ..²(5, N=1458)=82.43, p<.00. .22 .62 .50 .58 .32 .53 .62 .82 .46 .82 .57 .57 .67.57 .57 .53 mit niirwa2ap rwa8ap rwa5an rwa11an .66 rwa6sp rwa12sp rwa3sn rwa9sn rwa4cp rwa10cp rwa1cn rwa7cn .45 .42 .47 .42 .41 .46 .40 .66 rwa_a rwa_s rwa_c .42 .66 .78 .84 .79 .44 .47 .48 mf_pos Kongenerischer Methodenfaktor cht restringerten Ladungen Abbildung 47: Kongenerischer Methodenfaktor (3_c_mf_congeneric.ls8) 185 Auf der Supplement-CD findet sich die Steuerkarte auch für dieses Modell ..\post hoc anpas- sung\3_c_mf_pos.ls8 und ..\3_c_mf_pos_error.ls8 · 232 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition Gleichzeitig bleibt die Skepsis bestehen wegen der eingeschränkten Interpretierbarkeit bestehen. In diesem Fall ist der Methodenfaktor nicht mehr eindimensional (vgl. S.101 ). 8.5.3.3. Korrelierte Methodenfaktoren In der Literatur zu mtmm-Designs und Methodenfaktoren werden sowohl unkorrelierte als auch korrelierte Methodenfaktoren diskutiert. Im vorliegenden Fall nur zweier »Methoden« ist nach den Empfehlungen von Michael Eid (2000) lediglich ein Methodenfaktor indiziert, sodaß sich die Frage korrelierter Faktoren erübrigt. Der Vollständigkeit halber sei auf die Syntax des Modells auf der Supplement-CD verwiesen: ..\2_MF_nicht_korreliert.ls8 .²(49, N=1458)=503.69 und ..\2_MF_korreliert.ls8 .²(48, N=1458)=246.44. Es kommt aufgrund der Überspezifizierung zu paradoxen »Lösungen« mit negativ korrelierten inhaltlichen Faktoren (Subdimensionen). Einige Items sind durch leicht negative Ladungen mit ihren latenten Konstrukten assoziiert. Im Falle zugelassener Korrelation zwischen den »Methodenfaktoren« liegt diese bei .45 stand.=.67. Denkt man dieses Modell zuende, so zeigt sich dennoch ein diagnostischer Wert: Die relativ hohe Korrelation ist eine vorsichtige Annäherung an einen Faktor. Wir befinden uns damit auf dem Weg zu einem »Rollentausch« der latenten Variablen. Die als formal konzipierten Faktoren »vereinen« einen erheblichen Teil der Varianz der Items; die anfänglich als inhaltlich vorgesehenen Faktoren (Subdimensionen) werden dadurch in gewisser Weise degradiert.186 8.5.3.4. Korrelierte Meßfehlervarianzen – CTCU Bei den sogenannten ctcu-Modellen wird die Diagonalität der Fehler(ko)varianz- matrizen in systematischer Weise aufgegeben (Marsh & Hocevar, 1988; Marsh, 186 Bemerkenswerterweise stabilisiert sich die Lösung, wenn man die zwei Methodenfaktoren zur perfekten Korrelation zwingt. Dadurch entsteht ein Generalfaktor, die ehemals inhaltlichen Faktoren beschreiben nun zusätzliche Eigenheiten der einzelnen Subdimensionen. Diese korrelieren nun in sinnvollen Bereichen (um .70). Die bereits als schlecht identifizierten Items haben auf diesen konstruktspezifischen Faktoren keine signifikante Ladung mehr (vgl. ..\super_mf.ls8) · 233 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition 1989; Marsh & Bailey, 1991). Im vorliegenden Fall zweier »Methoden« lassen sich drei ctcu-Modelle spezifizieren: mit zugelassenen Kovarianzen zwischen jeweils allen positiv formulierten (..\ctcu pos.ls8) bzw. allen negativ formulierten Items (..\ctcu neg.ls8) sowie der Kombination aus beidem (..\ctcu pos neg.ls8). Das erste Modell paßt schlechter als das zweite: .²(36, N=1458)=308.51 resp. 285.57. Beim dritten Modell gibt es Identifikationsprobleme. Dies war nicht unerwartet (Marsh & Bailey, 1991; Marsh, Byrne & Craven, 1992). Fixiert man jedoch eine der Fehlervarianzen auf einen Wert in sinnvoller Größe, so erhält man zumindest eine »Lösung«, die die Fehlersuche ermöglicht. .e protraits contraits A S C A S C 2 8 6 12 4 10 5 11 3 9 1 7 RWA2AP .73 RWA8AP .37 .86 RWA6SP .36 .35 .82 RWA12SP .35 .33 .40 .82 RWA4CP .16 .15 .12 .20 .88 RWA10CP .29 .31 .27 .31 .15 .82 RWA5AN .29 RWA11AN -.16 .74 RWA3SN -.14 -.06 .86 RWA9SN -.18 -.04 .00 .54 RWA1CN -.22 -.06 .02 -.12 .79 RWA7CN -.18 -.04 .09 -.12 -.04 .53 Tabelle 62: Fehlerkovarianzmatrix des nicht identifizierten CTCU-Modells Bemerkenswert ist das Korrelationsmuster zwischen den Meßfehlern. Die Meßfehler der contraits sind i.d.R. nicht (!) signifikant miteinander korreliert, die Werte rangieren von 0 in den negativen Bereich. 8.5.3.5. Kodierrichtungsspezifische Konstrukte Bislang wurde die Kodierrichtung der Items in Analogie zur mtmm-Literatur als »Methode« interpretiert. Die Bedenken gegen dieses Vorgehen sind in 4.4.3.4 (S.113ff.) zusammengefaßt. Das Konstruktionsprinzip der RWA³D gestattet jedoch auch die Spezifikation von Faktoren, die das jeweilige Konstrukt kodierrichtungspezifisch modellieren. Hier liegt mit einfachen Worten die begründete Annahme zugrunde, daß das »Gegenteil« von Autoritärer Submissivität etwas qualita- · 234 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition tiv Anderes ist, nicht einfach nur die Negation, die durch Umkodieren wieder auszugleichen wäre. Das Modell mit nunmehr sechs korrelierten Faktoren liegt hinsichtlich der Anpassungsgüte in dem Bereich, der auch bei den bisher diskutierten Modellen gefunden wurde: .²(39, N=1458)=318.14. Dieses Modell ist aus mathematischer Sicht attraktiv, da hier die latenten Konstrukte wohldefiniert sind. Hingegen läßt sich für praktische Anwendungen ein solch komplexes Modell schlecht kommunizieren, die inhaltliche Interpretation fällt hier sehr schwer. Hinzu kommt, daß sechs latente Konstrukte bei jeweils nur zwei Indikatoren gewiß eine Überfaktorisierung darstellen (..\2 mal 3.ls8). Davon unberührt bleibt, daß sich dieses Modell wie keines der anderen zu diagnostischen Zwecken eignet. Dies sei an der Korrelationsmatrix der latenten Konstrukte demonstriert: PHI RWA_A_p RWA_A_n RWA_S_p RWA_S_n RWA_C_p RWA_C_n RWA_A_p 1.00 RWA_A_n 0.81 1.00 RWA_S_p 0.83 0.52 1.00 RWA_S_n 0.48 0.56 0.58 1.00 RWA_C_p 0.76 0.46 0.86 0.62 1.00 RWA_C_n 0.32 0.27 0.47 0.79 0.71 1.00 Tabelle 63: Implizierte Korrelationen der latenten Konstrukte (Phi) Hier sollte erwartet werden, daß die monotrait-heteromethod-Koeffizienten (in der Tabelle fett gesetzt) höher sind als die heterotrait-monomethod-Koeffizienten. RWA_A_positiv korreliert mit dem umkodierten RWA_A_negativ theoriekonform hoch (r=.81), jedoch in ebensolcher Weise über die Konstrukte hinweg mit RWA_S_positiv (r=.83). Noch dramatischer ist die niedrige monotrait-hetero- method-Korrelation bei Konventionalismus (r=.71) und erst recht bei Submissivität (r=.58). Eine abgeschwächte Ungleichheits-Forderung wäre, daß über die Konstrukte hinweg die monomethod-Korrelationen die heteromethod-Korrelationen übersteigen. · 235 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition RWA_A_p RWA_A_n RWA_S_p RWA_S_n RWA_C_p RWA_C_n RWA_A_p RWA_A_n RWA_S_p RWA_S_n RWA_C_p RWA_C_n 1.00 max. 0.83 . 0.48 0.76 . 0.32 . . . (.) 1.00 0.52 0.56 0.46 (.) 0.27 1.00 max. 1.00 0.86 . 0.62 1.00 .. 0.47 . 0.79 max. 1.00 Tabelle 64: Implizierte Korrelationen der latenten Konstrukte (Phi) mit erwartetem Gefälle Diese Größenverhältnisse sind mit einer Ausnahme gegeben: Die monomethod- heterotrait-Korrelation zwischen jeweils negativ formuliertem Konventionalismus und Aggressivität wird mit r=.27 unerwartet niedrig geschätzt, wodurch zwei Korrelationen nicht erwartungsgemäß ausfallen. Der Rückgriff auf 2×3 latente Konstrukte läßt sich ausbauen und übersichtlicher abbilden, indem die Konstrukte jeweils einer Kodierrichtung zu Faktoren zweiter Ordnung zusammengefaßt werden (..\a priori Modelle\post hoc\2 mal 3 plus second order.ls8). Die Anpassungsgüte ist bei der gegebenen Stichprobengröße akzeptabel: .² (47, N=1458)=395.32, die positiv bzw. negativ formulierten Konstrukte korrelieren auf der zweiten Ebene r=.79. · 236 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition .73 .77 .48 .91 .70 .79 rwa4cp rwa10cp .52 rwa11an rwa5an .68 rwa_c_p .54 .59 .64 rwa_a_n rwa3sn rwa9sn .63 rwa1cn rwa7cn .64 rwa_s_n .60 .59 .50 .30 rwa_c_n rwa2ap rwa8ap .83 rwa6sp rwa12sp .71 rwa_a_p .31 .50 .41 .33 .77 .82 rwa_s_p .85 .85 .92 rwa_neg .95 .90 .96 rwa_pos Abbildung 48: Pfaddiagramm (..\2 mal 3 plus second order.ls8) Die relativ hohen Regressionsgewichte in der (G)-Matrix zwischen den Faktoren erster und zweiter Ordnung offenbaren, daß die diskriminante Validität der bereinigten Subdimensionen relativ gering ist. 8.6. Meßmodelle für die RWA96/98 Anfänglich bestand ein formuliertes Ziel der Arbeit in der Spezifizierung angepaßter Meßmodelle für die problematische RWA in ihrer ursprünglich Form. Das größte Problem stellen hier die konfundierten Inhalte in den Items dar (double barreled). · 237 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition Ein denkbares Herangehen wäre hier das Zulassen von Doppelladungen, unter Umständen das Einführen von Intervallrestriktionen. Ungleichheitsrestriktionen sind bisher m.W. in keiner SEM-Software implementiert; dies ist bedauerlich, da solche »Größer-als-Aussagen« theoretisch begründbare Hypothesen sind, die sich nun jedoch nicht empirisch testen lassen. Das entscheidenden Problem ist hier indes nicht von technischer, sondern von theoretischer Natur. Der Spezifikation eines Meßmodells muß die zwingende Ent- scheidung vorausgehen, welche Items zu welchen latenten Konstrukten in wel- chem Maße eine Beziehung haben. Wie eigene Untersuchungen mit mehreren Ra- tern hier zeigen konnten, ist der Konsens nicht allzu hoch, was Skepsis gebietet (vgl. 4.5.2, S.118ff.). Noch kritischer dürfte dieses Problem werden, wenn die Skala in anderen Kulturen nach demselben Prozedere evaluiert würde. Hier vermute ich eine mangelhafte Robustheit über Zeit und Kulturen hinweg. Vor dem Hintergrund dieser Argumente scheint bei gegebenem Ziel die Analyse auf der Basis der RWA³D erfolgversprechender. 8.7. Analyse auf Itemebene oder Aggregatebene? In den bisherigen Analysen wurde immer auf Itemebene gerechnet; die Information jeder einzelnen Variable ging in die Analyse ein. Die Kehrseite dieser hochauflösenden Sichtweite sind sehr komplexe Modelle mit vielen zu schätzenden Parametern und einem ungünstigen Parameter-Stichprobe-Verhältnis (item-to-subject ratio vgl. Marsh & Hocevar, 1988; Nunnally, 1978). In der Forschungspraxis (und im übrigen auch im Rahmen von Strukturgleichungsmodellen) ist es daher üblich, mehrere Variablen jeweils zu Aggregaten zusammenzufassen (Mittelwert, Summe). Es werden eine Reihe von Vorteilen solcher Itemparcels ins Feld geführt: Itemparcels seien reliabler, hätten symmetrischere Verteilungseigenschaften187, führten zu robusteren Lösungen, die sich besser replizieren lassen (Cattell & Burdsal, 1975). Das Nutzen von Aggregaten vermindert per definitionem den idiosynkratischen Einfluß von Itemformulierungen (Marsh & O' Neill, 1984). Die ins Feld geführ- 187 Während die Verteilungen einzelner Items häufig einer deutlichen Schiefe unterliegen, ähneln die Ver- teilungen von Aggregaten eher einer Normalverteilung. Multivariate Normalverteilung ist eine zentrale Forderung zur Durchführung von Schätzverfahren wie Maximum Likelihood. · 238 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition ten Argumente sind jedoch nicht unwidersprochen geblieben (MacCallum, Widaman, Zhang & Hong, 1999; Marsh, Hau, Balla & Grayson, 1998, zusammenfassend Bandalos & Finney, 2001). In der bislang in diesem Text dokumentierten Suche nach adäquaten Meßmodellen wurde mit Bedacht auf Itemebene gerechnet, um keine Information zu ignorieren, die in den Daten zur Verfügung steht. Die Argumentation basierte fast ausschließlich auf einer relativen Modellevaluation. Es konnte gezeigt werden, daß kongenerische Meßmodelle mit drei korrelierten Faktoren eher angemessen sind als strenge Einfaktormodelle. Einschränkend muß jedoch eingeräumt werden, daß der exakte Fit (.² bzw. rmsea) nicht befriedigt. Teilweise ist dies der großen Teststärke aufgrund der Stichprobengröße geschuldet, die deskriptiven inkrementellen Indizes liegen kommod über den Konventionen (Hu & Bentler, 1999; Marsh et al., 1988). In den vorzustellenden Validierungsstudien wird auf Stichproben geringeren Umfangs zurückgegriffen. Folglich verschlechtert sich das Parameter-Stichprobe- Verhältnis, sodaß es naheliegend wäre, verschlankte Modelle zu verwenden. Hier kann es jedoch keine optimale Strategie geben; welcher Weg auch gewählt wird, man setzt sich der Kritik aus, daß die Alternative bestimmte Nachteile nicht gehabt hätte. Das Dilemma sei kurz skizziert, bevor eine pragmatische Entscheidung getroffen wird. 8.7.1. Itemparcels Die Vorteile der Aggregation von Items zu sogenannten Itemparcels liegen auf der Hand und wurden weiter oben bereits angedeutet (S.238, vgl. auch MacCallum et al., 1999; Bandalos & Finney, 2001). Monte-Carlo-Studien von Herbert Marsh und Mitarbeitern lassen hingegen vermuten, daß der vermeintlich bessere Fit von Modellen mit einem kleineren p /f -Verhältnis lediglich ein Artefakt des Verhaltens der .²-Statistik sei, was die Autoren (zumindest bei großen Stichproben) für viele Indikatoren pro Faktor plädieren läßt (Marsh et al., 1998). Ein anderes Problem scheint mir schwerwiegender: Die Aggregation von Items über eine Mittelwertsbildung müßte bei dem vorliegenden Forschungsinteresse das Vorwissen über die inhaltlichen und strukturellen Charakteristika der Items berücksichtigen. Das Konstruktionsprinzip der RWA³D würde es zulassen, jeweils · 239 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition zwei Items zusammenzufassen, ohne auf eine Inhalt/Struktur-Kombination zu verzichten. So ist jede inhaltliche Dimension in jeder Kodierrichtung paarig repräsentiert und könnte folglich zusammengefaßt werden. Dies würde jedoch als notwendige Bedingung voraussetzen, daß die Binnenkorrelation dieser Paare die Korrelationen mit anderen Items übersteigt. In Tabelle 65 sollte jede zweite in der Subdiagonale stehende Korrelation maximal für das jeweilige Item sein. Correlation Coefficient Spearman's rho RWA2AP RWA8AP RWA5AN RWA11AN RWA6SP RWA12SP RWA3SN RWA9SN RWA4CP RWA10CP RWA1CN RWA7CN 2AP 8AP 5AN 11AN 6SP 12SP 3SN 9SN 4CP 10CP 1CN 7CN 1.00 .56** .45** .28** .53** .49** .16** .28** .22** .43** -.04 .23** .56** 1.00 .34** .18** .46** .42** .15** .15** .18** .39** -.01 .13** .45** .34** 1.00 .27** .30** .22** .09** .22** .04 .20** -.08** .14** .28** .18** .27** 1.00 .22** .12** .09** .22** .08** .21** .03 .18** .53** .46** .30** .22** 1.00 .58** .13** .31** .21** .41** .03 .22** .49** .42** .22** .12** .58** 1.00 .19** .31** .32** .49** .12** .28** .16** .15** .09** .09** .13** .19** 1.00 .26** .13** .20** .15** .33** .28** .15** .22** .22** .31** .31** .26** 1.00 .15** .25** .11** .27** .22** .18** .04 .08** .21** .32** .13** .15** 1.00 .29** .31** .23** .43** .39** .20** .21** .41** .49** .20** .25** .29** 1.00 .13** .27** -.04 -.01 -.08** .03 .03 .12** .15** .11** .31** .13** 1.00 .23** .23** .13** .14** .18** .22** .28** .33** .27** .23** .27** .23** 1.00 **. Correlation is significant at the .01 level (2-tailed). Tabelle 65: Korrelationen der RWA³D-Items Die folgende Tabelle faßt zusammen, ob diese Forderung erfüllt ist. Als problematisch erweisen sich offenbar abermals die negativ formulierten Items sowie die Konventionalismusfragen. A S positiv negativ positiv negativ positiv negativ Binnenkorrelation in potentiellen Parcels ist maximal? ja nein ja nein nein nein Tabelle 66: Eignung für Parcels aufgrund der Korrelationen der RWA³D-Items Vor diesem Hintergrund ist kaum zu rechtfertigen, die Parcels auf diesem Wege zusammenzufassen. Dadurch würde der (einsichtige) Zusammenhang mit anderen Items ignoriert und »verschmiert«. Hinzu kommt, daß zwei Items pro Konstrukt keine Skala, auch keine Subskala rechtfertigen. · 240 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition Alternativ könnte man auf die Berücksichtigung der Kodierrichtung verzichten und könnte demzufolge vier Items aggregieren. Correlation Coefficient Spearman's rho 2AP 8AP 5AN 11AN 6SP 12SP 3SN 9SN 4CP 10CP 1CN 7CN RWA2AP 1.00 .56** .45** .28** .53** .49** .16** .28** .22** .43** -.04 .23** RWA8AP .56** 1.00 .34** .18** .46** .42** .15** .15** .18** .39** -.01 .13** RWA5AN .45** .34** 1.00 .27** .30** .22** .09** .22** .04 .20** -.08** .14** RWA11AN .28** .18** .27** 1.00 .22** .12** .09** .22** .08** .21** .03 .18** RWA6SP .53** .46** .30** .22** 1.00 .58** .13** .31** .21** .41** .03 .22** RWA12SP .49** .42** .22** .12** .58** 1.00 .19** .31** .32** .49** .12** .28** RWA3SN .16** .15** .09** .09** .13** .19** 1.00 .26** .13** .20** .15** .33** RWA9SN .28** .15** .22** .22** .31** .31** .26** 1.00 .15** .25** .11** .27** RWA4CP .22** .18** .04 .08** .21** .32** .13** .15** 1.00 .29** .31** .23** RWA10CP .43** .39** .20** .21** .41** .49** .20** .25** .29** 1.00 .13** .27** RWA1CN -.04 -.01 -.08** .03 .03 .12** .15** .11** .31** .13** 1.00 .23** RWA7CN .23** .13** .14** .18** .22** .28** .33** .27** .23** .27** .23** 1.00 **. Correlation is significant at the .01 level (2-tailed). Tabelle 67: Korrelationen der RWA³D-Items Die in der Tabelle fett gesetzten Korrelationen verheißen auch hier nicht, daß dies eine sinnvolle Strategie wäre. 8.7.2. Single Indicators Eine radikale Form von Itemparcels würde in der Verwendung von sog. single indicators münden. Damit gäbe man jedoch die wertvolle Idee der Modellierung latenter Variablen auf. In jedem Falle wäre es ein Fehler, die single indicators als perfekte Maße in die Strukturgleichung eingehen zu lassen. Vielmehr müssen systematische Restriktionen sowohl auf die Fehlerterme als auch die Ladungen gelegt werden. Bei der Verwendung von Kovarianzmatrizen gilt 1 SMC = () ii iVar x . d+ [8.5] und nach Umstellen ii. d()(1 )Var x i SMC = - . [8.6] Die festzusetzende Ladung wird berechnet nach 2 () 1 ()ki Var Var x ..= [8.7] · 241 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition und wiederum nach Umstellen ki. = () () Var x Var . , [8.8] was sich bei standardisierter latenter Variable vereinfachen läßt zu ki. = ()Var x . [8.9] Bei der Verwendung von Korrelationsmatrizen ist auch die Varianz des single indicators 1.0, so daß sich [8.6] vereinfacht zu ii. d1 SMC = - [8.10] und ki. = SMC . [8.11] Als Annäherung für smc bietet sich eine Reliabilitätsschätzung aus spss an, die sich nach der Bildungsvorschrift der single indicators ableitet (Split-Half-Reliabilität, Korrelation zweier Items, Cronbach's a). 8.7.3. Tilgen problematischer Items Eines der Konstruktionsprinzipien der Items verlangte die Auswahl von Aussagen mit unterschiedlichem »Schwierigkeitsgrad«, um die Trennschärfe hinsichtlich Autoritarismus sowohl im niedrigen Bereich als auch bei hoher Ausprägung zu gewährleisten. Bei den hier untersuchten Stichproben sind »Hoch-Autoritäre« unterrepräsentiert. Dies hat zur Folge, daß einige Items einen starken Boden- bzw. Deckeneffekt aufweisen, also extrem schiefe Verteilungsformen erkennen lassen, da die Aussagen von fast allen Befragten abgelehnt bzw. bejaht werden. In der Korrelationsmatrix resultiert dies in spärlichen Koeffizienten, da mangelnde Varianz die potentielle Kovarianz mit anderen Variablen einschränkt. Bei einer exploratorischen ML-Faktoranalyse in Lisrel 8.51 provoziert das extrem schief verteilte Item rwa_3_sn unzulässige Parameterschätzungen (Heywood-Case). · 242 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition Maximum Likelihood Factor Analysis for 5 Factors Unrotated Factor Loadings Factor 1 Factor 2 Factor 3 Factor 4 Factor 5 Unique Var RWA2AP 0.339 1.108 -0.383 0.205 -0.054 0.742 RWA8AP 0.415 1.313 -0.705 -0.378 0.441 0.856 RWA5AN 0.380 1.212 -0.979 0.851 -0.281 4.564 RWA11AN 0.187 0.369 -0.226 0.598 0.039 1.384 RWA6SP 0.279 1.118 0.018 0.072 -0.164 1.030 RWA12SP 0.359 1.097 0.453 -0.165 -0.192 0.324 RWA3SN 1.565 -0.011 -0.001 -0.001 -0.001 0.000 W_A_R_N_I_N_G: A Heywood case occurred RWA9SN 0.414 0.341 0.118 0.354 -0.120 0.818 RWA4CP 0.251 0.469 0.412 0.118 0.411 1.260 RWA10CP 0.367 0.763 0.132 0.080 0.163 1.085 RWA1CN 0.327 0.066 0.654 0.200 0.683 1.169 RWA7CN 1.039 0.552 0.474 0.600 0.221 3.105 Tabelle 68: Unzulässige Parameterschätzungen durch Item 3 Dieser Argumentation folgend bietet sich die Alternative an, problematische Items aus den Analysen auszuschließen. Diese Variablen steuern kaum wertvolle Information bei, da sie nicht zwischen den Befragten diskriminieren. In Strukturgleichungsmodellen führt dies zu hohen Fehlervarianzen und geringen Ladungen, mithin zu niedrigen Reliabilitäten. Eine Verfälschung der sonstigen Parameterschätzungen ist sehr wahrscheinlich. Gegen eine Löschung dieser Items spricht das post hoc-Vorgehen, das zuweilen nicht frei von Willkür ist. Hier ist wissenschaftliche Disziplin vonnöten, um nicht die Items zu löschen, die hypothesengerechte Ergebnisse vereiteln. Doch auch wenn hohe forschungsethische Standards eingehalten werden, wird durch das Löschen von Items – zumal bei kurzen Skalen – das Gütekriterium der Konstruktvalidität bzw. Kontentrepräsentativität gefährdet. Mit anderen Worten verzichtet man bei der Auswertung auf die Breite des zu Erfassenden, da bestimmte Aspekte oder Geltungsbereiche nicht mehr in die Analyse eingehen. Der Ausweg aus dem Dilemma ist ein sorgfältiges Abwägen der Vor- und Nachteile; eine eindeutige und immergültige Regel kann hier nicht formuliert werden. In jedem Falle muß vor bzw. ohne Ansehen der Daten eine Entscheidungstrategie expliziert werden, nach der die Tilgung erfolgen soll. Im hier vorliegenden Falle wäre denkbar, die Items mit extrem schiefer Verteilungsform, geringer Trennschärfe und geringer Korrelation mit allen anderen Items zu löschen. Angesichts des Konstruktionsprinzips sollte die intendierte Balance nicht über Gebühr verletzt werden. Sollte dies gelingen, wäre eine geringfügige Kürzung der Skala eine der suboptimalen Alternativen, um die Modelle zu verschlanken. · 243 Friedrich Funke__________________________________________________________________________Empirisches II – Rekomposition · 244 Tabelle 131 S.347 bietet eine Entscheidungsgrundlage anhand der Trennschärfe hinsichtlich der gesamten Skala. Hier muß auch die Trennschärfe innerhalb der theoretischen Subskalen zur Bewertung herangezogen werden. Auch diese Analyse führt zu einer konsistenten Entscheidung (Tabelle 69). Variable Itemformulierung in RWA³D Trennschärfe rwa11an »Es ist wichtig, die Rechte von Radikalen und Abweichlern in jeder Hinsicht zu wahren.« 0.319 rwa3sn »Die Zeiten, in denen sich Frauen ihren Männern unterzuordnen hatten, sollten der Vergangenheit angehören. Der ›Platz einer Frau‹ in der Gesellschaft sollte sein, wo immer sie möchte.« 0.291 rwa1cn »Man sollte seine eigenen Moralvorstellungen über ›Gut und Böse‹ entwickeln und weniger der Bibel oder anderen alten, traditionellen Glaubenssätzen Beachtung schenken.« 0.165 Tabelle 69: Problematische RWA³D-Items Die Ursachen der minderen Qualität der Items sind hier verschieden. Während die Items 3 und 1 von den Befragten als trivialer »Gemeinplatz« überwiegend be- jaht werden, was zum besagten »restriction of range«-Effekt führt, ist die Verteilung der Antworten zum Item 11 nicht zu beanstanden, ganz im Gegenteil (Abbildung 49). Normal Q-Q Plot of RWA3SNObserved Value876543210Expected Normal3.02.52.01.51.0.50.0-.5 Normal Q-Q Plot of RWA11ANObserved Value876543210Expected Normal2.01.51.0.50.0-.5-1.0-1.5-2.0 Abbildung 49: Verteilungsformen der problematischen Items 3 und 11 Beim »Radikalen-Item« liegt das Problem an der Semantik, nicht an der Vertei- lungsform. In einigen der hier vorgestellten Studien mögen Kontexteffekte dazu geführt haben, daß einige Befragte unter »Radikalen« Rechtsextreme verstanden haben, andere hingegen Autonome. Auf struktureller Ebene ist Intoleranz gegen- über Radikalen und vor allem das Absprechen der bürgerlichen Rechte freilich Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition per se Zeugnis eines zweifelhaften Demokratieverständnisses. Insofern ist gerade dieses Item möglicherweise ein guter [sic!] Indikator für Autoritarismus bei Rechten und bei dogmatischen Linken. Im Zusammenhang mit Items zur Ausländerfeindlichkeit könnte die Aussage zur emotionsgeleiteten »reflexartigen« Ablehnung einladen und einige Befragte gleichsam in die autoritäre Falle locken. Dies dürfte wahrscheinlicher sein, wenn die Befragten durch Zeitnot, Ermüdung oder geringe Motivation unkonzentriert sind oder wenn sie ein gesteigertes Motiv haben, (vermeintlich) sozial erwünscht zu antworten. Das Ergebnis in den Daten ist eine moderierte Korrelation des Items mit den anderen Items bzw. der Gesamtskala.188 Problematisch ist dabei, daß dieser Moderator nicht mit einer der erhobenen Variablen zusammenfällt, sondern ein nicht näher untersuchtes oder untersuchbares latentes Konstrukt ist. Entschiede man sich für eine Kürzung der Skala, so scheint bei den genannten Vorbehalten die Tilgung der Items 1_cn, 3_sn und 11_an geboten. All diese Items haben nicht zufällig gemein, daß sie entgegen der Merkmalsrichtung formuliert sind. Die inhaltliche Balancierung wäre nicht dramatisch gefährdet, da aus jeder der Subdimensionen je eine Variable gelöscht würde. Es ließe sich noch radikaler kürzen, indem man auch die drei »schlechtesten« in Merkmalsrichtung formulierten Items löschte. Man erhielte auf diese Weise ebenso sparsame Modelle wie bei der Itemparcel-Bildung, allerdings wäre die Konstruktvalidität m.E. unzulässig eingeschränkt. 8.7.4. Beschränkung auf in Merkmalsrichtung formulierte Items Eine weitere Variante bestünde in der Beschränkung auf diejenigen Items, die in Merkmalsrichtung formuliert sind (protraits). Man erreichte dadurch eine Kürzung um die Hälfte bei bestehen bleibender inhaltlicher Balancierung. Alle Probleme mit der Kodierrichtung, wie sie bisher ausführlich diskutiert wurden, fielen per definitionem weg. Zudem sind diese Items klarer in ihrem Gehalt und garantieren eine höhere Konstruktvalidität. Gegen diese Strategie spricht, daß Zustimmungstendenzen nicht mehr scheidbar wären von tatsächlich hoher Ausprägung von Autoritarismus (vgl. auch S.98ff., 188 Diese Moderation führt zur Suppression der Korrelation in der Gesamtstichprobe. · 245 Friedrich Funke __________________________________________________________________________ Empirisches II – Rekomposition Lentz, 1930; Lentz, 1938; Couch & Keniston, 1961; Messick & Jackson, 1957; Mahler, 1962; Ayidiya & McClendon, 1990; Paulhus, 1991; Billiet & McClendon, 2000). 8.8. Zusammenfassung zur Rekomposition Die Überlegungen zur optimalen Rekomposition sollten – auf den ersten Blick – in eine definitive Empfehlung münden. Ich habe mich nach langem Abwägen hingegen absichtsvoll dagegen entschieden, da damit eine Endgültigkeit suggeriert würde, die sich weder theoretisch abschließend begründen noch empirisch als robust zeigen ließe. Zum ersten Teil des Arguments sei gesagt, daß es viele verschiedene Wege gibt, um der Kodierrichtung der Items Rechnung zu tragen. Eine große Reihe wurde in den vorangegangenen Ausführungen in extenso vorgestellt. Keiner der Ansätze rechtfertigt seine Qualifikation als der einzig richtige Weg, die Vor- und Nachteile sind jeweils im Einzelfall und in Abhängigkeit der Fragestellung gegeneinander abzuwägen. Der empirische Teil des Arguments zielt auf den ermutigenden und Gelassenheit spendenden Umstand ab, daß für es für einige zentrale Punkte des Meßmodells nahezu irrelevant ist, welcher Ansatz gewählt wird. Namentlich meine ich damit die Interpretationssicherheit hinsichtlich der Korrelation der drei latenten Konstrukte. Dieses Interkorrelationsmuster bleibt von der Art des »Methodenfaktors« nahezu unberührt (vgl. 8.3.2.3 Interkorrelation der latenten Konstrukte, S.218ff.). Die theoretischen Argumente und die empirische Unterstützung decken meine forschungspraktische Auffassung, daß es von Wert ist, bei Meßmodellen großen psychometrischen Aufwand zu treiben; für die Anwendung hingegen sollte den »Praktikern« eine einfach vermittelbare Struktur an die Hand gegeben werden.189 189 Dieses pragmatische Vorgehen befürworte ich dabei nur angesichts der Tatsache, daß noch keine revi- dierte Version der RWA³D vorliegt. Sollte in der Zukunft – was im Rahmen dieser Arbeit nicht intendiert war – die Konstruktion einer überdauernden Skala gelingen, so ist auch das Bereitstellen eines anwen- dungsbereiten Auswertungsprogramms indiziert, in dem der Kodierrichtung in adäquater Weise Rech- nung getragen ist. · 246 9. Exemplarische externe Validierung »There is nothing so practical as a good theory.« (Kurt Lewin) 9.1. Sinn und Bedeutung des Validierens Die Einführung besserer Meßmodelle bliebe purer Selbstzweck, richtete sie sich lediglich nach einer besseren Modellanpassung. Der bessere Fit komplexerer Modelle gegenüber restriktiven ist methodisch folgerecht und nahezu trivial. Inhaltliche Bedeutsamkeit hingegen erlangt die Verbesserung lediglich, wenn durch die höhere »Auflösungskraft« der Messung differentialpsychologische Hypothesen geprüft werden können, die vorher nicht möglich waren. Derartige Hypothesen werden im Folgenden einer Prüfung zugeführt. Im Einzelnen kann erwartet werden, daß die Erklärungskraft einzelner Teildimensionen von Autoritarismus größer ist als die anderer. Dies könnte über sehr viel zu Erklärendes hinweg gelten – so könnte etwa zeigbar sein, daß die entscheidende Dimension von Autoritarismus immer die autoritäre Aggressivität ist, während Konventionalismus (in der heutigen Zeit) sehr an Erklärungswert verloren hat. Die Folge derartiger Erkenntnisse müßte ein Überdenken der Konzeptualisierung von Autoritarismus sein. Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Es wäre jedoch auch denkbar, daß für ein zu erklärendes Konstrukt eine der Sub- dimensionen bedeutsam ist, für ein anderes externes Kriterium jedoch eine andere. Diese differentielle Erklärungskraft der einzelnen Subdimensionen für mannigfache abhängige Konstrukte würde in der Konsequenz starke Argumente für eine dimen- sionale Betrachtungsweise von Autoritarismus liefern. Beiden vorgenannten Frage- stellungen wird im Abschnitt 9.2 nachgegangen. Eine implizierte Folge der Differenzierung auf der Konstruktebene ist die Verlage- rung des Fokus' auf die Personenebene. Gelänge eine plausible Differenzierung, so müßte in der Konsequenz auch bei verschiedenen Menschen190 die eine oder ande- re Subdimension relativ zu den anderen verschieden sein. Dieser Klasse von Frage- stellungen wird im Abschnitt 9.2.2 auf den Seiten 249ff. nachgegangen. 9.2. Strategie 9.2.1. Konstruktebene Im folgenden wird für verschiedene Erklärungszusammenhänge jeweils das klassi- sche Mittelwertsmodell gegen alternative mehrdimensionale Modelle kontrastiert. Als Diagnostikum für die potentielle Überlegenheit hochauflösender Modelle wird hier gewertet, wenn a) durch drei Dimensionen mehr Varianz der abhängigen Variable erklärt werden kann als durch den (einen) Skalenmittelwert, wenn b) die Regressionsgewichte der einzelnen als Prädiktoren eingeführten Sub- dimensionen voneinander verschieden sind191, und wenn schließlich c) über verschiedene Erklärungszusammenhänge hinweg sich die Ordnungsrelation der Regressionsgewichte verändert. Die Validierung erfolgt hier mit Bedacht nur exemplarisch und nicht umfassend, da bereits das Zeigen der Überlegenheit in einem Fall ausreicht. Ziel der vorlie- genden Arbeit ist die Suche nach einem neuen Weg, nicht das Ablaufen aller damit möglich werdenden Pfade. 190 … oder denselben Menschen in verschiedenen Situationen. 191 Ich habe dies andernorts »inter-dimension-discrepancy «genannt (Funke, 2002). · 248 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung 9.2.2. Personenebene Die Arbeit unterstellt eine analytische Unterscheidbarkeit der drei Subdimensionen von Autoritarismus. Eine logische Konsequenz dieser Unterscheidung auf der Konstruktebene wäre die prinzipielle Möglichkeit, auch verschiedene »Typen« von Autoritären abzuleiten und zu identifizieren. Falls die Konstrukte in gewissem Maße unabhängig voneinander sind, so sollte es beispielshalber auch eine(n) Autoritär Aggressive(n) geben, die/der nur wenig Tendenz zur Unterordnung zeigt.192 Diese Überlegung war geradezu der Ausgangspunkt dieses Forschungsprogramms. Ich habe solche Typen oder Varietäten unterstellt, das Problem verdeutlicht, daß verschiedene Personen dessenungeachtet gleiche RWA-Werte aufweisen können und daraus die Notwendigkeit abgeleitet, die Konstrukte analytisch zu differenzieren. Auf zwei Einschränkungen lege ich hier ausdrücklichen Wert: Einerseits distanziere ich mich von der vulgarisierenden Vorstellung statischer Typen. Es geht ausdrücklich um ein Mittel zur besseren Phänomenbeschreibung. Dabei ist völlig unerheblich, ob diese Typen lebenslang und unveränderlich sind oder ob sie nur als Beschreibung einer Person in einer Situation dienen, die wenige Sekunden an- hält.193 Die zweite Einschränkung bezieht sich auf die dennoch hohe Interkorrelation der Subdimensionen von Autoritarismus. Ich habe zu keinem Zeitpunkt infrage gestellt, daß die drei Dimensionen zusammengehören, wohl aber halte ich graduelle Unterschiede im Niveau dieser oder jener Subdimension für unterscheidbar und deren systematische Untersuchung für lohnend. 9.2.3. Person-Umwelt-Interaktion Die radikale Lesart der Persönlichkeitspsychologie betont die Stabilität und Verhaltensrelevanz von Persönlichkeitsmerkmalen; gleichzeitig ignoriert die radikale sozialpsychologische Lesart diese Unterschiede und fokussiert die nahezu ausschließliche Situationsabhängigkeit. 192 Altemeyer unterstellt in seinem Aufsatz über Soziale Dominanzorientierung implizit auch die Existenz verschiedener Typen, indem er ausführt: »[…] the RWA Scale contains items that both submissive and dominant persons could endorse.« (Altemeyer, 1998, S.53). 193 Meine Entscheidung für Letzteres ist dabei offenbar. · 249 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Beide Hypothesen sind vulgäre Vereinfachungen, die längst überwunden sein sollten; gleichwohl kennzeichnen sie ungeachtet theoretischer und empirischer Arbeiten zu dieser Problematik nach wie vor große Teile der Forschungspraxis. Walter Mischel und Yuichi Shoda (1995) faßten in ihrem Aufsatz die Kontroverse zur Person-Situation-Interaktion zusammen und versöhnten die Extrempositionen durch den Vorschlag einer gemäßigt konstruktivistischen systemtheoretischen Sichtweise. Das Dilemma besteht im Gegensatz zwischen der intuitiven Überzeugung, die Persönlichkeit müsse mehr oder weniger stabil sein, und dem empirischen Befund, daß das Verhalten von Personen über verschiedene Situationen hinweg alles andere als konsistent ist. Der Theorie entsprechend wird Persönlichkeit nicht den Situationen gegenübergestellt, sondern vielmehr als System aufgefaßt, das vermittelt, auf welche Weise ein Individuum Informationen auswählt und seine soziale Wirklichkeit konstruiert: It predicts that the person's behaviors in a domain will change from one situation to another – when the if changes, so will the then – even if the personality system were to remain entirely unchanged. (Mischel & Shoda, 1995) Diese Sichtweise erleichtert keineswegs die Forschung, ist aber der entscheidende theoretische Schlüssel zru Erklärung vieler paradoxer Untersuchungsergebnisse. Eine saubere theoretische Unterscheidbarkeit der Subdimensionen von Autoritarismus und ein praktikables Instrumentarium zur validen und reliablen Quantifizierung (9.2.1, S.248ff.) sind notwendige Bedingungen für die Beantwortung der Frage nach der Person-Umwelt-Interaktion. Neben der zuverlässigen »Persönlichkeitsdiagnostik « bedarf es aber auch einer Klassifizierung von Situationsklassen nach ihrem Aufforderungscharakter, dieses oder jenes Verhalten zu provozieren oder zu promovieren (vgl. ausführlich dazu Funke, 1999a, S.139ff.). In einem nächsten Schritt können diese Elemente systemtheoretisch aufeinander bezogen werden. Es ist zu vermuten, daß genau hier das interessanteste Forschungsfeld der Autoritarismusforschung für die nächsten zwei Jahrzehnte liegen dürfte. Der vorliegende Aufsatz hat sich jedoch das Ziel gesetzt, einen Beitrag zur Lösung des ersten Problems zu leisten. Das zweite ist noch weitgehend unberührt, sodaß im Rahmen dieser Arbeit außer dem Plädoyer für derartige experimentelle Forschung auf die em- · 250 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung pirische Untersuchung des Problems der Person-Situation-Interaktion verzichtet werden muß. 9.3. Beispiel I: Autoritarismus und Fremdenfeindlichkeit Fremdenfeindlichkeit ist das originäre Anwendungsfeld der Autoritarismusforschung. Zu diesem Zweck wurde diese Forschungstradition in den 1940er Jahren gestiftet. Da die aggressive Abwertung alles Fremden nach wie vor zentrales Ideologieelement der Neuen Rechten ist, qualifiziert sich Autoritarismus hier im Analogieschluß als erklärendes Konstrukt. Die sozialwissenschaftlichen Theorien zur Erklärung von Rechtsextremismus verzichten selten auf diesen Ansatz (vgl. S.32 und S.41 in diesem Aufsatz). Unter den hier vorgestellten eigenen Studien beschäftigten sich »NEO 1« und »Strafvollzug« mit Ausländerfeindlichkeit (6.4, S.156ff. und 6.7, S.164ff.). Im folgenden wird auf »NEO 1« bezuggenommen.194 Die RWA³D (Gesamtskala) ist stark mit Ausländerfeindlichkeit assoziiert:195 Unstandardized Coefficients Standardized Coefficients Correlations Model B Std. Error Beta Zeroorder Partial Part 1 (Constant) LI_RE Politische Orientierung RWA Right-wing Authoritarianism -.481 .289 .853 .191 .042 .059 .261 .553 .500 .666 .316 .576 .236 .499 a. Dependent Variable: AF Ausländerfeindlichkeit Kurzskala Tabelle 70: Regression RWA³D (gesamt) und Ausländerfeindlichkeit Nimmt man statt der Gesamtskala die Subdimensionen der RWA³D in die Analyse als Prädiktoren auf, steigt der adjustierte Determinationskoeffizient von R²=.497 auf R²=.529. Dieser Zuwachs ist relativ gering; interessant ist jedoch der differentielle Effekt der einzelnen Subdimensionen auf Ausländerfeindlichkeit. 194 Es sei vorangeschickt, daß ich ungeachtet der dargestellten Analyseschritte nicht unterstelle, Fremdenfeindlichkeit ließe sich allein durch Autoritarismus erklären. Auch jedes andere persönlichkeitspsychologische Konstrukt muß versagen, wenn soziale und ökonomische Gründe ignoriert werden. 195 Aufgrund der inhaltlichen (und statistischen) Konfundierung der Links-Rechts-Orientierung mit Autoritarismus werden beide mit in die Regression aufgenommen. · 251 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Coefficientsa Unstandardized Coefficients stand. Correlations Model B Std. Error Beta t Sig. Zeroorder Partial Part 1 (Constant) 1.453 .167 8.699 .000 LI_RE Politische Orientierung .554 .046 .500 11.916 .000 .500 .500 .500 RWA_A Right-wing Authoritarianism aggressiveness RWA_S Right-wing Authoritarianism submissiveness RWA_C Right-wing Authoritarianism conventionalism 2 (Constant) -.405 .188 -2.161 .031 LI_RE Politische Orientierung .304 .041 .275 7.431 .000 .500 .340 .247 RWA_A Right-wing Authoritarianism aggressiveness .364 .040 .356 9.204 .000 .591 .408 .306 RWA_S Right-wing Authoritarianism submissiveness .395 .058 .290 6.789 .000 .579 .313 .226 RWA_C Right-wing Authoritarianism conventionalism .060 .047 .050 1.288 .199 .355 .062 .043 a. Dependent Variable: AF Ausländerfeindlichkeit Kurzskala Tabelle 71: Regression RWA³D (Subskalen) und Ausländerfeindlichkeit Aggressivität und Unterwürfigkeit zeigen einen mittleren Effekt (ß=.36 resp. ß=.29), der partielle »Einfluß« von Konventionalismus wird jedoch nicht statistisch bedeutsam.196 Dieses Ergebnis bleibt stabil, wenn man das Modell auf latenter Ebene schätzt. Als Schätzmethode kam in diesem Fall Maximum Likelihood zur Anwendung, da die Rohdaten (einschließlich einiger fehlender Werte) als Datenbasis dienten. Hier bietet sich Full Information Maximum Likelihood als fortschrittliches Verfahren an (Wothke, 2000; Enders & Bandalos, 2001). 196 Vernachlässigt man die Links-Rechts-Orientierung als Prädiktor, so sind alle drei Subdimensionen von signifikantem Einfluß, aber auch hier ist der Einfluß von Konventionalismus wesentlich geringer als der der anderen beiden Subdimensionen. · 252 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Die Politische Links-Rechts-Orientierung wurde als Kovariate in das Modell aufgenommen, da ihr Zusammenhang sowohl mit Autoritarismus als auch mit Ausländerfeindlichkeit evident ist und empirisch stets gezeigt werden kann (vgl. zu diesem Vorgehen ausführlich Abschnitt 12.2, S.369ff.) 197 ll () ) ii .50 .59 P N N N P P PolModename: congeneric RWA / congeneric AFStandardized estimatesChi²=468.254 (143 dfp=.000 Chi²/df-ratio=3.275 IFI=.879 Tucker-Lewis=.837 AIC=600.254 RMSEA=.071 close fit=.000 GFI, AGFI, PGFI, cAIC ncht definiert beFIML; .17 Aggress .07 RWA11AN eps1 .26 .25 RWA5AN eps2 .50 RWA8AP eps3 .71 .65 RWA2AP eps4 .80 .16 Submiss .04 RWA3SN eps5 .12 RWA9SN eps6 RWA12SP eps7 .63 RWA6SP eps8 .21 .35 .77 .79 .24 Convent .06 RWA1CN eps9 .27 RWA7CN eps10 .43 RWA10CP eps11 .20 RWA4CP eps12 .25 .52 .66 .45 .68 AuslFeind .43 AF6_eps13 .44 AF1_eps14 .61 AF2_eps15 .52 AF4_eps16 .66 .66 .78 .72 .48 AF5_eps17 .69 .54 AF3_eps18 .74 .51 .21 .04 Zeta AF itische Orientierung eps19 eps20 eps21 .40 .49 .41 .22 .76 .40 .68 Abbildung 50: RWA³D und Ausländerfeindlichkeit Die Inspektion des Meßmodells offenbart abermals die Schwächen einzelner Items (insbesondere rwa3_sn, rwa11_an, rwa1_cn mit R² unter 0.1). Dennoch sollten sie nicht aus dem Modell getilgt werden (vgl. hierzu die Bemerkungen in 8.7.3 auf S. 242 und Marsh et al., 1998). Neben dem hier dargestellten liberalen Modell mit kongenerischen Indikatoren in allen Sub-Meßmodellen wurden drei strengere Varianten geschätzt, bei dem Autoritarismus, Ausländerfeindlichkeit oder beide Konstrukte jeweils als Paralleltests unterstellt wurden. Erwartungsgemäß lassen sich diese Modelle signifikant schlechter an die Daten anpassen (Tabelle 55). 197 Darüberhinaus wurde diese Variable auch in den vorstehenden manifesten Analysen berücksichtigt. · 253 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Assuming model congeneric RWA / congeneric AF to be correct: nfi ifi rfi tli df cmin p .1 .2 .1 .2 parallel RWA / congeneric AF 18 534.941 .000 .189 .199 .198 .213 parallel RWA / parallel AF 28 678.570 .000 .240 .252 .230 .247 congeneric RWA / parallel AF 10 143.378 .000 .051 .053 .048 .052 Tabelle 72: ..2-Test RWA³D und Ausländerfeindlichkeit Eine weitere Verbesserung der Anpassungsgüte gelingt durch Zulassen der Kovarianz zwischen allen negativ formulierten Items (i.S. eines ctcu-Modells, vgl. 4.4.3.3, S. 112). Hierdurch sinkt das rmsea in den Bereich des close fit bei .² (107, N=455)=270.30. Ich halte dieses Vorgehen jedoch für ein unnötiges Aufgeben von Sparsamkeit. In jedem Fall berührt die mögliche Verbesserung der Anpassungsgüte bzw. der bewußte Verzicht darauf nicht das Wesen des hier gefolgerten Schlusses: Der empirisch stets gezeigte Zusammenhang zwischen Autoritarismus und Ausländerfeindlichkeit scheint in erster Linie auf die aggressive Komponente von Autoritarismus zurückzuführen sein, die beiden anderen Komponenten treten in den Hintergrund. 9.4. Beispiel II: Autoritarismus und Toleranz gegenüber politischen Gegnern Zum alltagssprachlichen Bedeutungshof von »autoritär« gehört Intoleranz gegenüber Andersdenkenden. Dieses Wesensmerkmal liegt eher auf der strukturellen Ebene von Autoritarismus und ist vergleichsweise ideologiefern. In einer der hier vorgestellten Studien wurde knapp fünfhundert Befragten ein »Inhaltsbereinigtes Maß für Politische Intoleranz« vorgelegt (Content-controlled Measure of Political Intolerance, Sullivan et al., 1979; Sullivan, Piereson & Marcus, 1982, Studie »NEO 1«, Abschnitt 6.4.2, S.156ff.): · 254 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Bitte sehen Sie sich in der links stehenden Tabelle nochmals an, welcher Partei Sie AM FERNSTEN stehen. Beantworten Sie dann die folgenden Fragen: stimmt stimmt nicht . genau Mitglieder(n) dieser Partei … –3 –2 –1 1 2 3 … … … … … … sollte das Recht abgesprochen werden, für Landtag oder Bundestag zu kandidieren. sollte es erlaubt sein, in öffentlichen Schulen zu unterrichten. sollten die bürgerlichen Ehrenrechte entzogen bekommen. sollten in dieser Stadt öffentliche Reden halten dürfen. sollten durch den Staat (z.B. Verfassungsschutz) abgehört werden. sollten in dieser Stadt Kundgebungen veranstalten dürfen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tabelle 73: Content-controlled Measure of Political Intolerance Die Befragten nutzten die gesamte Breite des Antwortmodells; der Skalenwert ist nahezu normalverteilt. Es ist anzunehmen, daß Intoleranz gegenüber politischen Gegnern mit Autoritarismus positiv korreliert. Dieser Zusammenhang fällt jedoch erstaunlich gering aus. Die im ersten Regressionsmodell als Prädiktor eingeführte Politische Orientierung bleibt zunächst ohne linearen Einfluß; unter Hinzunahme der RWA³D steigt das Bestimmtheitsmaß signifikant an (R²=.035), die Links-Rechts-Orientierung hat nunmehr einen leicht negativen Einfluß198, Autoritarismus einen positiven (Tabelle 74 und Tabelle 75). Model Summary Change Statistics Model R R Square Adjusted R Square Std. Error of the Estimate R Square Change F Change Sig. F Change 1 .051a .003 .000 1.36934 .003 1.114 .292 2 .198b .039 .035 1.34564 .037 16.033 .000 a. Predictors: (Constant), Politische Orientierung b. Predictors: (Constant), Politische Orientierung, Right-wing Authoritarianism Tabelle 74: Regression RWA³D (gesamt) und Politische Intoleranz - Modell 198 Dies ist interessant, denn die Skala Politischer Intoleranz ist »inhaltsbereinigt«, wobei der Inhalt gerade die Politische Orientierung ist. Es wäre daher durchaus plausibel, wenn kein korrelativer Zusammenhang gefunden würde. Stattdessen zeigt sich jedoch, daß tendentiell eine demonstrative linke Orientierung mit geringer Toleranz rechter Parteien einhergeht. · 255 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Coefficientsa Unstandardized Coefficients stand. Correlations Model B Std. Error Beta t Sig. Zeroorder Partial Part 1 (Constant) 4.344 .183 23.750 .000 Politische Orientierung -.047 .051 -.045 -.924 .356 -.045 -.045 -.045 Right-wing Authoritarianism 2 (Constant) 3.635 .252 14.399 .000 Politische Orientierung -.143 .055 -.137 -2.574 .010 -.045 -.125 -.123 Right-wing Authoritarianism .312 .078 .212 4.001 .000 .153 .192 .191 a. Dependent Variable: Content-controlled Measure of Political Intolerance (Sullivan et al.,1982) Tabelle 75: Regression RWA³D (gesamt) und Politische Intoleranz - Parameter Die Aufnahme der einzelnen Subdimensionen in die Regression offenbart abermals deren differentielle Kriteriumsvalidität: der Zusammenhang der Gesamtskala mit Politischer Intoleranz ist nahezu ausschließlich auf die aggressive Facette von Autoritarismus zurückzuführen (Tabelle 76). Coefficientsa Unstandardized Coefficients stand. Correlations Zero- Model B Std. Error Beta t Sig. order Partial Part 1 (Constant) 4.367 .184 23.754 .000 Politische Orientierung -.054 .051 -.051 -1.055 .292 -.051 -.051 -.051 Right-wing Authoritarianism aggressiveness Right-wing Authoritarianism submissiveness Right-wing Authoritarianism conventionalism 2 (Constant) 3.608 .249 14.50 .000 Politische Orientierung -.141 .055 -.134 -2.560 .011 -.051 -.124 -.120 Right-wing Authoritarianism aggressiveness .278 .053 .289 5.237 .000 .229 .248 .246 Right-wing Authoritarianism submissiveness -.067 .078 -.052 -.852 .395 .062 -.042 -.04 Right-wing Authoritarianism conventionalism .035 .063 .031 .563 .574 .023 .027 .026 a. Dependent Variable: Content-controlled Measure of Political Intolerance (Sullivan et al.,1982) Tabelle 76: Regression RWA³D (Subskalen) und Politische Intoleranz Dieses Ergebnis verwundert nicht, da die aggressive Komponente die Abwertung »der Anderen« geradezu als definitorisches Element in sich trägt. Als bemerkenswert wird hier lediglich unterstrichen, daß es allein eine der Dimensionen ist, die mit dem zu Erklärenden zusammenhängt. Da der Einfluß der anderen beiden · 256 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Dimensionen zu vernachlässigen ist, unterschätzt hier die klassische Analyse auf Gesamtskalaniveau potentielle Zusammenhänge. Die Untersuchung des Zusammenhangs von Politischer Intoleranz mit den Subdimensionen von Autoritarismus auf der Basis von Strukturgleichungsmodellen bringt weitere Erkenntnis. Zunächst bestätigt sich der Verdacht, daß das geringe Bestimmtheitsmaß der durchgeführten Regressionsanalyse gegen eine überdauernde Interpretierbarkeit der Pfade spricht. Das R² der Politischen Intoleranz ist mit .047 ausgesprochen niedrig, Autoritäre Aggressivität bleibt der stärkste Prädiktor. Unterwürfigkeit hingegen ist bei der latenten Modellierung im Gegensatz zur manifesten Analyse negativ mit der Politischen Intoleranz assoziiert. i(ii) Chi) ilii.48 .33 .50 .45 l .51 Pol.40 »congenerc RWA / congeneric Intol« Standardzed estmates ²=544.569 (143 dfp=.000 Chi²/df-rato=3.808 IFI=.821 Tucker-Lewis=.756 AIC=676.569 RMSEA=.079 cose ft=.000 GFI, AGFI, PGFI, cAIC nicht definiert be FIML; .17 Aggress .07 RWA11AN eps1 .27 .23 RWA5AN eps2 .48 RWA8AP eps3 .69 .68 RWA2AP eps4 .82 .16 Submiss .03 RWA3SN eps5 .11 RWA9SN eps6 .60 RWA12SP eps7 .64 RWA6SP eps8 .18 .78 .80 .24 Convent .06 RWA1CN eps9 .25 RWA7CN eps10 .45 RWA10CP eps11 .20 RWA4CP eps12 .25 .67 .05 PolInto.10 INTOL5_P eps13 .26 INTOL2_N eps14 .76 INTOL4_N eps15 .79 INTOL6_N eps16 .32 .87 .89 .17 INTOL3_P eps17 .41 .32 INTOL1_P eps18 .56 .29 -.24 .16 Zeta AF itische Orientierung eps19 eps20 eps21 .49 .41 -. 17 .76 .40 .67 Abbildung 51: RWA³D und Politische Intoleranz Die Interpretation dieses paradox negativen Parameters hat großen Reiz; es ist je- doch aufgrund der niedrigen Bestimmtheit des Gesamtmodells davor zu warnen, weshalb hier darauf verzichtet wird. Zur Absicherung der Frage, ob es sich um einen artifiziellen oder aber robusten – wenn auch schwachen – Zusammenhang handelt, läßt sich die Korrelationsmatrix zwischen den Submissions- und Intoleranzitems inspizieren (Tabelle 77, S. 258). Sie offenbart, daß diese Korrelationen sämtlich nicht signifikant sind. Dieser Um- stand stützt die gebotene Vorsicht beim Deuten. · 257 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Pearson Correlation INTOL3_PPolitical Intolerance INTOL5_PINTOL2_NINTOL4_NINTOL6_N Submission RWA6SPRWA12SPRWA3SN Political INTOL5_P .317** Intolerance INTOL2_N .130** .090 INTOL4_N .325** .229** .478** INTOL6_N .334** .304** .445** .783** Submission RWA6SP .118* .039 -.005 -.006 .016 RWA12SP .118* .104* -.041 -.010 -.033 .633** RWA3SN .023 -.045 -.074 -.081 -.037 .076 .108* RWA9SN .080 .070 -.034 -.045 .082 .263** .225** .234** **. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed). Tabelle 77: Korrelationsmatrix zwischen den Submissions- und Intoleranzitems Schätzt man das Strukturgleichungsmodell auf Itemebene, so ist auch hier das Anpassen von kongenerischen Meßmodellen bei endogenen und exogenen Konstrukten indiziert: Assuming model congeneric RWA / congeneric Intol to be correct: nfi ifi rfi tli df cmin p .1 .2 .1 .2 parallel RWA / congeneric Intol 18 530.675 .000 .223 .237 .229 .249 parallel RWA / parallel Intol 28 775.869 .000 .326 .347 .312 .339 congeneric RWA / parallel Intol 10 245.594 .000 .103 .110 .108 .118 Tabelle 78: ..2-Test RWA³D und Politische Intoleranz Beim vorliegenden Beispiel ist die Zusammenhangsstruktur generell als eher schwach zu bezeichnen. Als deutliches Ergebnis bleibt dennoch festzuhalten, daß der gesamte Zusammenhang von Autoritarismus und politischer Intoleranz nahezu ausschließlich auf die aggressive Komponente zurückzuführen ist. Dies ist ein augenfälliges Indiz für die differentielle Vorhersagevalidität der einzelnen Subdimensionen. · 258 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung 9.5. Beispiel III: Autoritarismus und Politisches Selbstverständnis In fast allen hier vorgestellten Studien wurden die Teilnehmer gebeten, ihre Politische Orientierung grob auf einer Skala von 1 »links« bis 7 »rechts« anzugeben. Es bestand auch die Möglichkeit, diese Links-Rechts-Dimension als veraltet abzulehnen. Als weiteres Kriterium zur Beschreibung der Politischen Präferenzen der Befragten wurde die Sonntagsfrage vorgelegt. Durch diese Kontinuität in der Fragestellung ist es nunmehr möglich, die einzelnen Dimensionen von Autoritarismus zum Politischen Selbstverständnis der Befragten auf breiter Datenbasis in Beziehung zu setzen. Nach Löschung von Datensätzen mit unvollständiger RWA³D gründen sich die folgenden Analysen auf 1836 Personen. 9.5.1. RWA und Links-Rechts-Orientierung Bob Altemeyer nannte sein Konstrukt mit Bedacht Right-Wing Authoritarianism: You have probably noticed that I use the term authoritarian whenever I get tired of writing out right-wing authoritarian. Obviously, though, modifying the noun with right-wing implies there might be a left-wing authoritarian, and even a flightless, unwinged authoritarian in the middle too. (Altemeyer, 1988 S. 7) Vor diesem Hintergrund verwundert es nicht, daß RWA positiv mit der Selbsteinschätzung der Politischen Orientierung korreliert. Altemeyer fand wiederholt unerwartet starke Zusammenhänge zwischen Autoritarismus und (dichotomer) Parteipräferenz in den USA (Republikaner und Demokraten) und Kanada (NDP und Conservatives). Die punktbiseriellen Korrelationen lagen deutlich über .50, bei einigen Studien gar bei .87 (Altemeyer 1996, S.260-272). Aus den nordamerikanischen Studien gibt es keine Befunde über den Zusammenhang von RWA mit der (quasi-kontinuierlichen) Links-Rechts-Orientierung, da dies in der dortigen politischen Kultur keine sinnvolle Unterscheidungsdimension ist. In allen hier diskutierten Studien korreliert RWA jedoch augenfällig mit dieser Selbstauskunft über die symbolische Politische Verortung. Die Korrelationen liegen zwischen r=.44 und r=.56 (Tabelle 79). · 259 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Pearson Correlation Subdimensions Right-wing Right-wing Right-wing Right-wing Authoritarianism Authoritarianism Authoritarianism Authoritarianism Studie aggressiveness submissiveness conventionalism RWA3D KosovoNet1 Politische Orientierung .431** .277** .401** .476** Politikinteresse . a . a . a . a KosovoNet2 Politische Orientierung .440** .359** .319** .479** Politikinteresse -.201** -.166** -.014 -.166** NEO1 Politische Orientierung .302** .345** .362** .437** Politikinteresse -.333** -.120* -.013 -.215** NEO2 Politische Orientierung .400** .429** .464** .555** Politikinteresse . a . a . a . a Zukunft Politische Orientierung .412** .378** .397** .503** Politikinteresse -.400** -.175** .006 -.260** Terror Politische Orientierung .434** .444** .449** .557** Politikinteresse -.311** -.159** .069 -.184** **. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed). a. Cannot be computed because at least one of the variables is constant (Variable was not included in this study). Tabelle 79: Korrelation von Politischer Orientierung und Interesse mit Autoritarismus Die Korrelation mit der Gesamtskala übersteigt dabei jeweils die Korrelation mit den Einzelskalen. Hierbei handelt es sich jedoch zumindest teilweise um einen Artefakt: die Gesamtskala hat aufgrund ihrer 12 Items eine höhere Reliabilität als die Subskalen mit nur vier Items. Mit anderen Worten ist der Fehleranteil in den kürzeren Subskalen höher, sodaß die obere Grenze der erreichbaren Korrelation mit einem Validierungskriterium kleiner 1.0 und auch kleiner als bei der Gesamtskala ist. Nach einer Attenuationskorrektur lägen die geschätzten Korrelationen der kürzeren und daher weniger reliablen Subskalen mit Links-Rechts-Orientierung höher (vgl. drei Beispiele in Abbildung 52). · 260 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Attenuationskorrektur bei verschieden reliablen Skalen .90 (geschätzte) korrigierte Korrelation .80 .70 .60 r=.6 r=.5 .50 .40 r=.4 0.00 a=.99) leiiabiliiabili), Die zweite Variable wird fast perfekt gemessen ( Unkorrigierte Korreation bei Ignoranz der ngeschränkten Reltät der Variablen: Je geringer die Reltät der Skala (x-Achseumso höher ist die attenuationskorrigierte Korrelation 0.00 .50 .60 .70 .80 .90 1.00 Reliabilität der Skala Abbildung 52: Attenuationskorrektur in Abhängigkeit von der Reliabilität der Skala Die attenuationskorrigierten Korrelationen der Subskalen unterscheiden sich nunmehr kaum noch von der Korrelation der Gesamtskala mit der Politischen O- rientierung.199 Attenuationskorrigierte Korrelationen (alle Studien) Pearson Correlation Right-wing Right-wing Right-wing Right-wing Authoritarianism Authoritarianism Authoritarianism Authoritarianism aggressiveness submissiveness conventionalism RWA3D Politische Orientierung .401 .387 .406 .505 .482** .488** .529** .568** Politikinteresse -.363 -.204 -.035 -.268 -.436** -.257** -.046* -.302** **. Attenuationskorrigierte Korrelation (Berechnung mit Statistica 6.0) *. n.s. Tabelle 80: Attenuationskorrigierte Korrelationen mit Politischer Orientierung und Politikinteresse Die Attenuationskorrektur bringt zwar zutage, daß die besagten Unterschiede nicht so groß sind, wie sie scheinen. Von nennenswerten differentiellen Effekten der Subskalen kann jedoch kaum gesprochen werden. 199 Bei diesem Beispiel wird von einer fast perfekten Messung der Politischen Orientierung ausgegangen (a=.99). · 261 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Dies ändert sich auch nicht, wenn man über Korrelationsanalysen als Auswertungsstrategie hinaus geht. Der Zusammenhang ist augenscheinlich linear; dies gilt im Wesentlichen für alle Subskalen. 95% Konfidenzintervall 7 6 5 4 Aggressiveness 3 Submission 2 1 Conventionalism links 3 rechts 5 eher link s 4 eher rec hts Politische Orientierung Abbildung 53: Zusammenhang von Politischer Orientierung und Autoritarismus Auch die Aufnahme quadratischer Terme in die Regression bringt keine dramatisch veränderten Ergebnisse zutage.200 Independent: LI_RE Dependent Mth Rsq d.f. F Sigf b0 b1 b2 RWA3D_A LIN .161 1635 313.97 .000 1.9162 .4652 RWA3D_A QUA .162 1634 157.44 .000 2.0714 .3582 .0159 RWA3D_S LIN .150 1635 289.03 .000 1.3072 .3125 RWA3D_S QUA .158 1634 153.14 .000 1.7396 .0145 .0443 RWA3D_C LIN .165 1635 324.01 .000 1.7726 .3903 RWA3D_C QUA .166 1634 162.73 .000 1.9289 .2826 .0160 RWA3D LIN .255 1635 559.94 .000 1.6653 .3893 RWA3D QUA .258 1634 283.86 .000 1.9133 .2185 .0254 Tabelle 81: Lineare und quadratische Regression Politische Orientierung × Autoritarismusdimensionen 200 Die dargestellte Tabelle ist i.e.S. kein direkter Test auf Linearität der Regression. · 262 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Etwas anders sieht der Zusammenhang mit politischem Interesse aus. Die Tabellen auf den Seiten 260 und 261 zeigen einen deutlichen differentiellen Effekt der Subskalen: Während die Gesamtskala RWA³D mit dem Interesse für Politik leicht negativ korreliert (r=-.30), ist der lineare Zusammenhang mit der Aggressivitätsdimension weit stärker (r=-.44), aber mit Konventionalismus gar nicht festzustellen. 95% Konfidenzintervall 7 6 5 4 3 Aggressiveness Submissiveness 2 1 Conventionalism niedrig2 3 4 5 6 hoch Politikinteresse Abbildung 54: Zusammenhang von Politischem Interesse und Autoritarismus Während der Zusammenhang von Interesse für Politik und Konventionalismus sowie Unterwürfigkeit kaum zu zeigen ist, »sinkt« mit steigendem Interesse die autoritäre Aggressivität. Niedriges bis mittleres201 Interesse geht einher mit erhöhter autoritärer Aggressivität. Demonstrativ geäußertes Interesse scheint (zumindest in den hier diskutierten Stichproben) gegen autoritäre Aggressivität zu »immunisieren «. Es konnte wiederholt gezeigt werden, daß Politisches Interesse und Politische Orientierung in einem kurvilinearen Zusammenhang stehen. An den Extremen des 201 Das Ankreuzen von »mittlerem« Interesse dürfte bei einem Teil der Befragten nur eine andere Form von Desinteresse (zum Beantworten der Frage) bedeuten. · 263 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Links-Rechts-Kontinuums ist das Politische Interesse am höchsten, während es im Graubereich ein Minimum hat (Sidanius & Ekehammar, 1976; 1977; Sidanius, 1984; 1985). Dies rechtfertigt die Interpretation von Politischem Interesse als Grad der »Elaboriertheit« der Politischen Einstellungen. Die gleichzeitige Betrachtung von Orientierung und Interesse bringt eine signifikante Interaktion zutage: Dependent Variable: Right-wing Authoritarianism RWA3D Source df F Sig. Corrected Model 20 29.283 .000 Intercept 1 4673.081 .000 Haupteffekte Links-Rechts- Orientierung 6 57.079 .000 Interesse 2 3.721 .024 Interaktion 12 2.107 .014 Error 1248 Total 1269 Corrected Total 1268 Tabelle 82: Interaktion Interesse × Politische Orientierung Während bei eher rechts Orientierten kein moderierender Einfluß des Politikinteresses zu sehen ist, zeigt sich bei den sich als »links« Bezeichnenden ein diskutierenswerter Effekt (Abbildung 55). · 264 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Right-wing Authoritarianism RWA3D 5.0 4.5 4.0 Estimated Marginal Means 3.5 3.0 Interesse 2.5 niedrig 2.0 mittel 1.5 hoch links 3 5 Politische Orientierung Abbildung 55: Interaktion Interesse × Politische Orientierung Gering Interessierte haben ungeachtet ihres vor sich hergetragenen linken Selbstverständnisses höhere Autoritarismuswerte. Ihre wenig elaborierten Politischen Einstellungen basieren zu einem gewissen Teil auf unreflektiert übernommenen Meinungen. Dieser Erklärungsansatz ließe sich untermauern, wenn besonders die Unterordnungsdimensionen von Autoritarismus von dieser Interaktion betroffen wären. Between-Subjects Effect (nur Interaktion) Source: NINTER * LI_RE rechts Dependent Variable df F Sig. Right-wing Authoritarianism aggressiveness 12 .819 .631 Right-wing Authoritarianism submissiveness 12 2.321 .006 Right-wing Authoritarianism conventionalism 12 2.087 .015 Tabelle 83: Interaktion Interesse × Politische Orientierung auf Subdimensionen · 265 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung In der Tat wird die Interaktion nicht signifikant für autoritäre Aggressivität, wohl aber für Submission (Unterordnung unter Autoritäten) als auch für Konventionalismus (Unterordnung unter Konventionen). Die Implikation für die Politische Bildung ließe sich zusammenfassen mit »Denn sie wissen (nicht), was sie tun.«. Der Autoritarismus von Rechten ist besonders hoch, wenn sie politisch interessiert sind.202 Politisch interessierte Linke sind auch nicht autoritär. Wenn Uninteressierte jedoch ihre linke Orientierung in erster Linie als Symbol vor sich hertragen, kann auch ihr Autoritarismus erhöht sein. Dies gilt – erwartungsgemäß – insbesondere für die Subdimensionen, die eine Unterordnungsfacette berühren: Submission und Konventionalismus. Beide Ergebnisse sind auf ihre jeweilige Art Hinweise auf die Ideologieimmanenz autoritärer Konstruktionen. 9.5.2. Parteipräferenz und Autoritarismus Das wiederholte Erheben der Parteipräferenz über die Sonntagsfrage gestattet mir, das (potentielle) Wahlverhalten zum Autoritarismus der Befragten in Beziehung zu setzen. Es konnte bereits im letzten Abschnitt gezeigt werden, daß die einzelnen Subdimensionen der RWA³D auf differentielle Weise mit der Links-Rechts- Orientierung zusammenhängen. Ungeachtet der unscharfen Definition von »Links« und »Rechts« scheinen diese Begriffe dennoch auf sozial geteilte Konstruktionen über den (Be)Deutungsgehalt dieser Kategorien zurückzugreifen. Dies zeigt sich auch im Zusammenhang von Parteipräferenz und Politischer Selbstbeschreibung. 202 Überspitzt gesagt handelt es sich hier um die gut informierte, politisch interessierte rechte Kaderelite. · 266 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung 95% CI Politische Orientierung 5.0 4.5 4.0 3.5 "Links" und "Rechts" 3.0 sind noch 2.5 sinnvolle Begriffe 2.0 sind keine 1.5 sinnvollen Begriffe N = 183 59 224 76 277 90 89 39 188 89 PD S B90/Grüne SPD CDU/CSU FD P Parteipräferenz (Sonntagsfrage) Abbildung 56: Zusammenhang von Parteipräferenz und Politischer Selbstbeschreibung Erwartungsgemäß gliedern sich besonders – aber nicht nur – diejenigen in das traditionelle Schema, die es auch als gültig akzeptieren. Der gefundene korrelative Zusammenhang zwischen Links-Rechts-Orientierung und RWA³D läßt erwarten, daß sich selbiges Muster auch für die Assoziation von Parteipräferenz und Autoritarismus zeigen läßt. Folgt man der Argumentation von Extremismustheoretikern (und dem derzeitigen öffentlichen Diskurs in der Bundesrepublik Deutschland), so sollte jedoch zumindest bei der PDS das Muster differenzierter aussehen und einen erhöhten Autoritarismus bei den Anhängern dieser Partei erkennen lassen (Abbildung 57). Dies ist in der Tat der Fall; bei der Interpretation wäre jedoch auch nachvollziehbar, daß sich besonders die Anhänger links-alternativer Bürgerbewegungen 203 demonstrativ durch niedrigen Autoritarismus auszeichnen. Auch dies würde den charakteristischen Bruch in der Darstellung erklären. 203 Gemeint sind hier konkret Bündnis 90/Die Grünen. · 267 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung 95% Konfidenzintervall (RW A³D gesamt) RWA3D 4.0 3.5 3.0 2.5 2.0 N = 260 335 409 152 307 PDS B 90/Grüne SPD FD P CDU Sonntagsfrage (geordnet) Abbildung 57: Zusammenhang von Parteipräferenz und RWA³D Analysiert man analog zum bisherigen Vorgehen die Subdimensionen isoliert voneinander, so zeigt sich, daß der erhöhte RWA³D-Wert der PDS-Sympathisanten in erster Linie durch die erhöhte autoritäre Aggressivität zu erklären ist.204 204 Auch hier muß konkretisiert werden, daß die erhöhte autoritäre Aggressivität bei den PDS- Sympathisanten lediglich relativer Natur ist. Die niedrigen Werte bei den Grünen-Anhängern lassen die PDS-Werte höher erscheinen, als sie sind. Tatsächlich bewegen sie sich im Rahmen der SPD- oder FDP- Anhänger. · 268 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung 95% Konfidenzintervall 5.0 4.5 4.0 3.5 3.0 Aggressiveness 2.5 Submission 2.0 1.5 Conventionalism N = 260 260 260 335 335 335 409 409 409 152 152 152 307 307 307 PDS B90/Grüne SPD FDP CD U/CSU Parteipräferenz (Sonntagsfrage) Abbildung 58: Zusammenhang von Parteipräferenz und Subdimensionen der RWA³D Um der Extremismusthese und der Suche nach linkem Autoritarismus weiter nachzugehen, habe ich jeweils innerhalb jeder Parteianhängerschaft einen Mediansplit hinsichtlich der Politischen Orientierung durchgeführt.205 Anschaulich gesprochen erhalte ich damit Aussagen über linke und rechte Flügel innerhalb der Partei. Hier zeigt sich erwartungsgemäß ein Haupteffekt der Politischen Orientierung: Die »eher rechten« Parteisympathisanten sind jeweils autoritärer als der linke Flügel. Hinzu kommt jedoch eine besonders große Diversifizierung zwischen verschiedenen PDS-Anhängern (Abbildung 59). 205 Hier mag die unterschiedliche Größe der Substichproben verwundern. Dies hängt mit dem Entscheidungsalgorithmus von SPSS zusammen. Es wird beim Trennen der Kategorien konservativ in dem Sinne vorgegangen, daß nur ganzzahlige Variablenwerte zugelassen werden. Dadurch wird verhindert, daß Personen mit gleicher Ausprägung in verschiedene Teilstichproben fallen. · 269 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung iiiiilit li95% CI Rght-w ng Autho rtaranism RW A3D 4.5 4.0 3.5 3.0 2.5 2.0 1.5 Medanspehernks eher rechts N = 163 83 154 261148 112 92 16437 114 PD S SP D B 90/G rüne CD U FD P S onntagsfrage (geordnet) Abbildung 59: Zusammenhang von Parteipräferenz × »Flügel« und RWA³D Denkt man bei der Interpretation der Abbildung 59 jedoch die Extremismusargumentation zuende, so sollten sich die Graphen hier überkreuzen. Gerade die »linken « PDS-Sympathisanten sollten autoritärer sein als die »moderaten«. Auf diese Weise hätten die zweifellos existierenden Dogmatiker identifiziert werden können. Die Ergebnisse sprechen jedoch eine andere Sprache. Es bleibt als interpretierenswerter Schluß, daß besonders die PDS-Anhängerschaft sehr heterogen ist. Dies erklärt auf plausible Weise, warum Befürworter der Extremismusthese ihre Unterstellung der PDS als Hort der Autoritären ebenso bestätigt sehen wie Vertreter der Auffassung, daß der Stalinismus in der Partei des Demokratischen Sozialismus überwunden wäre. Der Weg zur Wahrheit liegt hier – wie so oft, banal und wahr – in der Mitte.206 206 Meine Interpretation der Datenlage wäre grob mißverstanden, wenn sie als Antwort auf die Frage nach einem linken Autoritarismus gesehen würde. Dazu kann mit den hier verwandten Erhebungsinstrumenten keine Aussage formuliert werden. · 270 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Tests of Between-Subjects Effects Source: PARTEI5 * NTI001 Type III Sum Dependent Variable of Squares df Mean Square F Sig. RWA3D_A Right-wing Authoritarianism 20.590 4 5.148 3.365 .009 aggressiveness RWA3D_S Right-wing Authoritarianism 2.489 4 .622 .825 .509 submissiveness RWA3D_C Right-wing Authoritarianism 5.888 4 1.472 1.272 .279 conventionalism Tabelle 84: Interaktion Parteipräferenz × Politische Orientierung Auch in diesem Beispiel zeigen sich Hinweise auf die Überlegenheit des dreidimensionalen Ansatzes. Die Interaktion Parteipräferenz × Politische Orientierung erweist sich lediglich für Autoritäre Aggressivität als statistisch signifikant. 9.6. Beispiel IV: Autoritarismus und Punitivität Zur Phänomenologie autoritärer Konstruktionen gehört eine vermehrte Bestrafungstendenz (Punitivität). Diese wurde bereits in den klassischen Studien beschrieben und in zahlreichen Experimenten empirisch untersucht (vgl. S.68ff. in diesem Aufsatz, siehe auch Altemeyer, 1981, S. 232ff.; 1988, S. 181; Wylie & Forest, 1992; Bray & Noble, 1987; Hartlaub, 1998; McAbee & Cafferty, 1982; Mitchell & Byrne, 1973; Ray, 1985c; Sherman & Dowdle, 1974; Stenner, 1998; Wagner et al., 2000). Eine Reihe von Untersuchungen ging der Frage nach, ob Autoritäre in der Rolle von Richtern oder Geschworenen härtere Strafen vergeben würden als Personen mit geringer ausgeprägten autoritären Einstellungen. Diesem Paradigma folgte auch eine der hier vorgestellten Studien (NEO II, 6.5, S.158ff.). 9.6.1. Hypothetische Verhängung von Haftstrafen Vier fiktive Delikte wurden in Zeitungsmeldungen wiedergegeben; die Befragten sollten die Strafanträge der Staatsanwaltschaft stellen. Die Delikte bestanden in einer Schutzgelderpressung, Sexuellem Mißbrauch durch einen Arzt, schwerer Körperverletzung gegen Ausländer und in exzessiver Polizeigewalt gegen (linke) Demonstranten. Letzterer Straftatbestand ist insofern interessant, als hier die zu · 271 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung bestrafenden Täter selbst zur staatlichen »Autorität« gehören. Hier könnte ein Suppressionseffekt erwartet werden (vgl. Feather, 1998; Henkel et al., 1997; Hageman, 1985). Eine grobe Operationalisierung der so erhobenen Bestrafungstendenz aggregierte die verhängten Haftstrafen über alle vier Delikte hinweg.207 Zunächst werden hier diese Ergebnisse dargestellt. Der oberflächliche geringe korrelative Zusammenhang der Gesamtskala mit der Länge der verhängten Haftstrafen (r=.18) verschleiert eine weit höhere differentielle Kriteriumsvalidität der Dimension autoritäre Aggressivität (r=.30). Coefficientsa Unstandardized Coefficients stand. Correlations Model B Std. Error Beta t Sig. Zero-order Partial Part 1 (Constant) 6.384 .814 7.847 .000 Right-wing Authoritarianism .934 .273 .178 3.427 .001 .178 .178 .178 Unstandardized Coefficients stand. Correlations Model B Std. Error Beta t Sig. Zero-order Partial Part 1 (Constant) 6.535 .809 8.080 .000 Right-wing Authoritarianism aggressiveness 1.257 .212 .348 5.937 .000 .298 .301 .300 Right-wing Authoritarianism submissiveness -.372 .344 -.072 -1.083 .279 .078 -.057 -.055 Right-wing Authoritarianism conventionalism -.213 .240 -.053 -.890 .374 .000 -.047 -.045 a. Dependent Variable: Haftstrafe in Jahren (Mittelwert über Delikte) Tabelle 85: Regression RWA³D (Gesamtskala und Subskalen) und Punitivität Wiederum ist es allein die aggressive Komponente, die für den Zusammenhang »verantwortlich« ist. Der Nulleffekt der anderen beiden Subskalen suprimiert die Korrelation der Gesamtskala mit dem Validierungskriterium, was zu einem Unterschätzen der Assoziation führt (vgl. oben Seite 256). Dieses Muster ist über alle vier Delikte hinweg konsistent: 207 Dazu mußten die Extrempunkte des Antwortformats ausgeklammert werden. · 272 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Pearson Correlation Haftstrafe in Jahren Brutale Gewalt Mittelwert Schutzgeld-Sexuelle gegen Gewalt in über erpressung Misshandlung Ausländer Uniform Delikte Right-wing Authoritarianism .181** .073 .155** .156** .178** Subdimensionen Right-wing Authoritarianism aggressiveness .195** .270** .265** .215** .295** Right-wing Authoritarianism submissiveness .110* -.023 .075 .088 .091 Right-wing Authoritarianism conventionalism .096 -.123* -.008 .021 -.001 **. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed). Tabelle 86: Korrelation RWA³D und Punitivität Bei allen fiktiven Delikten a) ist der Zusammenhang der Gesamtskala mit der Länge der verhängten Haftstrafe gering, b) ist die aggressive Subdimension von Autoritarismus am stärksten mit der Punitivität assoziiert, c) wird der Zusammenhang der Gesamtskala mit Punitivität durch die submissive und konventionalistische Dimension supprimiert. Dieser Suppressionseffekt führt beim Beispiel des Sexuellen Mißbrauchs gar dazu, daß die Gesamtskala der RWA³D nicht mit der Bestrafungstendenz korreliert, da Konventionalismus leicht negativ mit der Länge der verhängten Haftstrafe zusammenhängt. Dies muß näher hinterfragt werden. Die Daten legen nahe, daß Konventionalismus damit einhergeht, daß tendentiell geringere Haftstrafen beim Szenario »Sexueller Mißbrauch in der Arztpraxis« vergeben werden. Für dieses auf den ersten Blick paradoxe Ergebnis gibt es eine plausible Erklärung: es wäre denkbar, daß »altmodische« Befragte in ihrem Glauben an eine gerechte Welt stärker dazu neigen, die Opfer sexueller Gewalt abzuwerten und die Täter im Umkehrschluß von ihrer Schuld zu entlasten. Dieses Muster ist gerade im Zusammenhang mit sexuellem Mißbrauch oder Vergewaltigungen häufig zu beobachten und dürfte gerade bei Autoritären anzutreffen sein. Diese Interpretation kann jedoch nicht empirisch belegt werden, da Gerechte-Welt-Glaube oder Identifikation mit dem Täter nicht erfragt wurde. · 273 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Ferner sollten Frauen stärker für das Thema sensibilisiert sein, da sie häufiger in der Opferrolle sind. Möglicherweise zeigen sich die Effekte besonders in der weiblichen Teilstichprobe. Die beiden folgenden Diagramme weisen in diese Richtung. iil i iiil 20 18 16 14 12 10 lweiblili17 16 Estmated MargnaMeans of Sexuelle Msshandlung Haftstrafen Jahren Extrem gruppen RW A aggressiveness üb er 4 .5 3.5 b s 4.5 bis 3 .5 Estim ated Marg naMeans Geschecht B efragte ch männch Abbildung 60: Interaktion Geschlecht × Autoritäre Aggressivität Estimated M arginal Means 15 14 13 12 Geschlecht Befragte 11 weiblich 10 männlich bis 3.5 3.5 bis 4.5 Extremgruppen RWA conventionalism Abbildung 61: Interaktionen Geschlecht × Konventionalismus Bereits eingangs wurde erwähnt, daß das Antwortmodell der beantragten Strafen nonparametrisches Auswerten verlangt. Die Befragten hatten zwar die Möglich- · 274 über 4.5 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung keit, die Haftstrafen in Jahren anzugeben, die Kategorien wurden jedoch nicht gleichberechtigt ausgenutzt. Folgendes Beispiel mag dies illustrieren: 80 60 40 20 0 * k ho B b 2 J 3 4 J * 5Jah 6 7 J 8 9 *1 11 1 13 14Jah *1 17 18Jah 1 2 * T o e i 2 9 0 l a hr s 1JahrH Jah Jah Jah Jah eb 0 5 h w ah a d e J Jah J J J Jah hr es e a a a a J J ä n e a ah r r r r r hr h h hr sstr hr e S e e e e e e e ns h r r r r r r r B e e e e e e e e r r e u H H H H H H H uß e e l a ä t n Ha Ha H H H H Ha H Ha ra a a a a a a a f ng H Ha g e ge f f f ft f f ft a af a a a tst t ts tst t f ss a a f f f f f f f str s str s e f l t t t t t t t t f t i tr t t ft f l tr st s st st s st st st c t st t d r ra r ra str s t str t af af af af af h af ra r r ra r ra ra r ra t f f a a a a r e e e e e e e e a a a f f f f f f f f f e e e e e e e e f e fe f e Sexuelle Misshandlung in der Arztpraxis. Abbildung 62: Häufung bei »runden« Antwortkategorien Die »runden« Antwortkategorien (0, 5, 10, 15 Jahre etc.) werden häufiger gewählt. Dieses Muster zeigt sich bei allen Delikten. Erwartungsgemäß ist dieser Schubladeneffekt vor allem bei den Autoritären zu beobachten. Daher wurden alle Hypothesen auch mit nichtparametrischen Verfahren nachgeprüft; die Ergebnisse werden dadurch nicht infrage gestellt, sodaß sich eine ausführliche Darstellung hier erübrigt. Der vom Strafgesetzbuch vorgesehene Strafrahmen hat für Sexuellen Mißbrauch (StGB §§ 174, 176, 182) bei 10 Jahren seine Obergrenze. Es verwundert nicht, daß hier weit höhere Strafen gewünscht werden. Selbst die Todesstrafe ist eine Option. Diese wird in erster Linie von Autoritären gefordert (p<.05). Aufgrund der genannten problematischen Verteilungseigenschaften der vier verhängten Haftstrafen verbietet sich die Auswertung mit Hilfe von linearen Strukturgleichungsmodellen. Zu viele Voraussetzungen sind dafür verletzt. · 275 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung 9.6.2. Nur Bestrafung oder auch Wiedereingliederung? Eine globale Frage zur Punitivität ging der relativen Gewichtung verschiedener Strafzwecke nach. Geht es den Befragten eher um die Straffunktion oder haben sie einen sozialpädagogischen Anspruch? Der Wortlaut der Frage war: »Die Bestrafung von Tätern ist für mich wichtiger als ihre soziale Wiedereingliederung.« Die Antworten sind weitgehend symmetrisch um den Mittelwert 3.7 verteilt. Coefficientsa Unstandardized Coefficients stand. Correlations Model B Std. Error Beta t Sig. Zero-order Partial Part 1 (Constant) 2.001 .311 6.432 .000 LI_RE Politische Orientierung .502 .093 .335 5.412 .000 .335 .335 .335 RWA_A Right-wing Authoritarianism aggressiveness RWA_S Right-wing Authoritarianism submissiveness RWA_C Right-wing Authoritarianism conventionalism 2 (Constant) 1.214 .359 3.383 .001 LI_RE Politische Orientierung .290 .107 .193 2.710 .007 .335 .176 .161 RWA_A Right-wing Authoritarianism aggressiveness .398 .091 .301 4.390 .000 .392 .279 .260 RWA_S Right-wing Authoritarianism submissiveness 2.04E-02 .142 .011 .144 .886 .244 .009 .009 RWA_C Right-wing Authoritarianism conventionalism 5.65E-02 .103 .040 .547 .585 .214 .036 .032 a. Dependent Variable: RESOZ Die Bestrafung von Tätern ist für mich wichtiger als ihre soziale Wiedereingliederung. Tabelle 87: Strafe wichtiger als Wiedereingliederung? Wiederum ist es die autoritär aggressive Subdimension, die positiv mit der stärkeren Gewichtung des Strafzwecks einhergeht. Die beiden anderen Komponenten lassen keinen linearen Zusammenhang erkennen. · 276 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung .67 eps16 eps15 iChi( .37 .45 i.43 .51 .76 .41 .37 .41 .40 .50 Politi i i.53 .75 .40 »congenerc RWA« ²=227.912 IFI=.880 Tucker-LewGFI, AGFI, PGFI, cAIC n.28 Aggress .14 RWA11AN .29 RWA5AN .53 RWA8AP .67 RWA2AP .82 .28 Submss .17 RWA3SN .26 RWA9SN .57 RWA12SP RWA6S P .41 .65 Convent .16RWA1CN RWA7CN RWA10C P .25 RWA4CP .61 .64 .55 -. 27 .18 sche Orenterung eps17 eps18 .64 .53 .80 .10 .27 69 df) p=.000 ChRMSEA=.074 close f Die Bestrafung von T ätern ist für mich wichtiger als ihre soziale Wieder einglieder ung . (Standardized estimates) i²/df-ratio=3.303 is=.813 AIC=327.912 it=.000 icht definiert bei FIML; Abbildung 63: Strafe wichtiger als Wiedereingliederung? Wie das Pfaddiagramm zeigt, ist die submissive Komponente scheinbar leicht negativ mit dem Bestrafungsmotiv assoziiert.208 Dieser Effekt schwindet jedoch vollends, wenn jeweils die problematischsten Items von der Analyse ausgeschlossen werden.209 9.7. Beispiel V: Befürwortung von »Friedenseinsätzen« Drei der durchgeführten Studien beschäftigten sich unter anderem mit der Befürwortung oder Ablehnung von friedenserzwingenden Kriegseinsätzen durch die NATO. Die zugrundeliegende Idee unterstellt einen positiven Zusammenhang vor allem zwischen der aggressiven Komponente von Autoritarismus und der Unterstützung solcher Einsätze. Allerdings wurde vermutet, daß dieser Zusammenhang in linearer Form nicht gefunden werden kann, da die Motivlage heutzutage wesentlich komplexer und widersprüchlicher sein dürfte als auf dem Höhepunkt des Kalten Krieges (Vietnam-Krieg, Golfkriege, Falkland/Malwinas-Krieg). Die Ergebnisse scheinen dies zu bestätigen. In der Studie Kosovonet1 wurde zunächst ein schwacher positiver Zusammenhang zwischen der Gesamtskala RWA³D und schärferen Reaktionen der NATO gefunden (Tabelle 88). 208 Die »critical ratio« weist darauf hin, daß auch dieser Parameter nicht signifikant ist. Lediglich der Regressionspfad von Aggressivität ist statistisch bedeutsam. 209 vgl. die Ausführungen in 8.7.3 auf S. 242ff. sowie die AMOS-Modelle auf der Supplement-CD ..\neo2 strafzweck.amw und ..\neo2 strafzweck nur 9 items.amw. · 277 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Coefficientsa Unstandardized Coefficients Standardized Coefficients Model B Std. Error Beta t Sig. 1 (Constant) 1.713 .152 11.298 .000 RWA_MEAN .151 .050 .247 2.999 .003 a. Dependent Variable: REAC_R Tabelle 88: Regression RWA³D und Schärfe des NATO-Vorgehens Dieser Zusammenhang schwindet jedoch, wenn im ersten Schritt die Politische Orientierung eingeführt wurde. Das adjustierte Bestimmtheitsmaß liegt zudem unbefriedigend niedrig bei R²=.106. Dadurch verbietet sich eine verallgemeinernde Interpretation der Parameter. Coefficientsa Unstandardized Coefficients Standardized Coefficients Model B Std. Error Beta t Sig. 1 (Constant) 1.633 .134 12.226 .000 Politische Orientierung .156 .039 .328 4.058 .000 RWA_MEAN 2 (Constant) 1.508 .163 9.268 .000 Politische Orientierung .130 .043 .272 3.007 .003 RWA_MEAN .074 .055 .121 1.340 .182 a. Dependent Variable: REAC_R Tabelle 89: Regression RWA³D/Politische Orientierung und Schärfe des NATO-Vorgehens Verwendet man in Analogie zum bisherigen Vorgehen bei den anderen Studien auch hier die einzelnen Subdimensionen als Prädiktoren, so verändert sich die Gesamtlage nur geringfügig (Tabelle 90). · 278 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Coefficientsa Unstandardized Coefficients Standardized Coefficients Model B Std. Error Beta t Sig. 1 (Constant) 1.633 .134 12.226 .000 Politische Orientierung .156 .039 .328 4.058 .000 RWA_C RWA_A RWA_S 2 (Constant) 1.553 .162 9.599 .000 Politische Orientierung .150 .044 .314 3.436 .001 RWA_C -.057 .045 -.118 -1.265 .208 RWA_A -.015 .042 -.035 -.349 .728 RWA_S .137 .054 .259 2.540 .012 a. Dependent Variable: REAC_R Tabelle 90: Regression Subdimensionen RWA³D/Politische Orientierung und Schärfe des NATO-Vorgehens Was in jedem Fall bleibt ist die Feststellung, daß die Gesamtskala RWA³D nicht, wohl hingegen einzelne Subdimensionen mit der abhängigen Variable »Schärfe des NATO-Vorgehens« assoziiert sind. Der Grund für den insgesamt schwachen Zusammenhang dürfte am ehesten an zwei Stellen zu suchen und zu finden sein: a) Einerseits ist die individuelle Einstellung für oder gegen einen Einsatz militärischer Gewalt zur Erreichung friedlicher Ziele nicht mehr monokausal aus der Ideologie abzuleiten. Die Entscheidung ist vielmehr das Ergebnis einer komplizierten und widersprüchlichen Güterabwägung; Kriegsbefürworter sind nicht mehr schlicht »Kriegstreiber«, sondern plädieren für das kleinere Übel. b) Andererseits dürfte die Operationalisierung der abhängigen Variable problematisch sein. Es ist unwahrscheinlich, daß hier die beste Variante gefunden wurde. Zumindest letzterer Mangel läßt sich teilweise beheben: Es wurden verschiedene andere Variablen erhoben, deren Validität eindeutiger ist. In der Folgestudie Kosovonet II wurden durch die Befragten verschiedene Bundeswehraufgaben bewertet. Neben den klassischen und grundgesetzlich verbrieften Aufgaben der reaktiven Landesverteidigung (auch im Rahmen der Bündnispflicht innerhalb der NATO) wurden einige potentielle Aufgaben formuliert, die sich auf eine proaktive Rolle in · 279 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung »friedenserzwingenden Missionen«210 beziehen. Daraus wurde ein Index gebildet, der als »interventionistische Bundeswehraufgaben« in die nachfolgenden Analysen einging. Coefficientsa Unstandardized Coefficients Standardized Coefficients Model B Std. Error Beta t Sig. 1 (Constant) -.709 .196 -3.611 .000 rwa_mean .257 .068 .233 3.786 .000 Unstandardized Coefficients Standardized Coefficients Model B Std. Error Beta t Sig. 1 (Constant) -.557 .191 -2.908 .004 RWA_AGGR .278 .049 .394 5.677 .000 RWA_SUB -.012 .078 -.011 -.151 .880 RWA_CONV -.097 .056 -.112 -1.722 .086 a. Dependent Variable: Bundeswehraufgabe "interventionistisch" Tabelle 91: Regression RWA³D (gesamt und einzeln) und Schärfe des NATO-Vorgehens Die drei Subdimensionen führen zu einer etwas besseren Bestimmtheit des Modells (R²=.137) als wenn die Gesamtskala RWA³D als einziger Prädiktor eingeht (R²=.054). Wiederum ist es die aggressive Komponente, die als einzige einen signifikanten »Einfluß« auf die Befürwortung interventionistischer Bundeswehraufgaben hat. Nahezu dasselbe Muster zeigt sich bei der retrospektiven Befürwortung des NATO-Einsatzes im Kosovo (R²=.155 resp. R²=.109; Tabelle 93 und Tabelle 93). Coefficientsa Unstandardized Coefficients Standardized Coefficients Model B Std. Error Beta t Sig. 1 (Constant) 1.562 .370 4.217 .000 rwa_mean .730 .128 .331 5.718 .000 Tabelle 92: Regression RWA³D (gesamt) und retrospektive Befürwortung des NATO-Vorgehens 210 Ich halte trotz oder auch gerade wegen der sich wandelnden öffentlichen Meinung die gewählten Bezeichnungen für Euphemismen, weshalb ich sie in Anführung setze. · 280 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Unstandardized Coefficients Standardized Coefficients Model B Std. Error Beta t Sig. 1 (Constant) 1.812 .368 4.921 .000 RWA_AGGR .528 .094 .374 5.612 .000 RWA_SUB .112 .148 .052 .759 .448 RWA_CONV -4.425E-02 .109 -.025 -.407 .684 a. Dependent Variable: Das militärische Eingreifen in Form eines Luftkrieges war ein geeignetes und angemessenes Mittel. Tabelle 93: Regression RWA³D (einzeln) und retrospektive Befürwortung des NATO-Vorgehens Hier dürften sich die Antworten gegenseitig beeinflußt haben: a) Auf der Hand liegt das Befürworten des konkreten Einsatzes aufgrund der allgemeinen Unterstützung von instrumentellen Militärinterventionen. b) Ebenso halte ich jedoch die umgekehrte Interpretation für wahrscheinlich, derzufolge aus der Selbstwahrnehmung der eigenen Einstellung zum konkreten Einsatz die allgemeine Einstellung abstrahiert wird.211 Die Ergebnisse tragen mehrere Lehren in sich. Zum einen zeigt sich in Übereinstimmung mit der Argumentation dieser Arbeit, daß die Subdimensionen differentielle Erklärungskraft tragen. Der hohe Einfluß der aggressiven Komponente wird durch die Insignifikanz der beiden anderen Subdimensionen suprimiert. 9.8. Beispiel VI: Autoritarismus und »Big Five« »In other words, to varying degrees, personality theories tend to stack the cards in their favor before the game even starts.« (Sloan, 1997, S.91) 9.8.1. Theoretische Annahmen Das sogenannte Fünf-Faktoren-Modell der Persönlichkeit (Big Five, ffm) stellt derzeit den kleinsten gemeinsamen Nenner der Persönlichkeitspsychologie dar. 211 Zur Theorie der Selbstwahrnehmung vgl. auch Woodyard, 1973. · 281 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Mit den fünf Faktoren212 können – so die Verfechter – traditionelle Taxonomien integriert werden. Da diese als notwendig und hinreichend unterstellt werden, folgt daraus, daß Autoritarismus mit einer oder mehreren dieser Beschreibungsdimensionen korrelieren muß (vgl. 6.4.2, S. 156ff.). In jedem Falle handelt es sich bei dem Fünf-Faktoren-Modell aufgrund seines pragmatischen Werts um einen sinnvollen Rahmen, in den feiner auflösende Persönlichkeitsbeschreibungen hineinprojiziert werden können. Im Folgenden werden die einzelnen »O.C.E.A.N.«-Faktoren (Openness, Conscientiousness, Extraversion, Agreeableness, Neuroticism) hinsichtlich ihres theoretischen Zusammenhangs mit Autoritarismus diskutiert. 9.8.1.1. Neurotizismus Neurotizismus beschreibt eine emotionale Labilität, die den Menschen vor allem unter Belastung für Ängstlichkeit, Unzufriedenheit und übermäßige Besorgnis anfällig macht. Vor dem psychoanalytischen Hintergrund der Berkeley-Gruppe (Adorno et al., 1950) erinnert dieses Konstrukt an die beschriebene Ich-Schwäche der Autoritären, die daher zu neurotischen Abwehrmechanismen Zuflucht nehmen. Unter den neun Facetten der autoritären Persönlichkeit zielen beispielsweise Destruktivität und Zynismus sowie Projektivität in diese Richtung. Eine positive Korrelation von Autoritarismus mit Neurotizismus würde in diesem Sinne Evidenz für die klassischen psychodynamischen Hypothesen liefern. 9.8.1.2. Extraversion Extraversion beschreibt eine Persönlichkeitseigenschaft, die durch Offenheit und Aufgeschlossenheit der Umwelt gegenüber sowie durch die Suche nach sozialen Kontakten gekennzeichnet ist. Der Begriff wurde schon früh für Taxonomien verwendet, er taucht bereits bei C.G.Jung auf und spielt vor allem in der Theorie Eysencks eine zentrale Rolle (Eysenck, 1954; Christie, 1956; Bhushan, 1970; Mehryar, 1970; Eysenck & Wilson, 1978; Ray & Bozek, 1981; Heaven, Connors & Trevethan, 1987; Rigby & Slee, 1987; Goldberg & Rosolack, 1994). 212 Neuroticism/Emotional stability, Extroversion, Openness to Experiences, Agreeableness/Friendliness und Conscientiousness · 282 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Extraversion ist assoziiert mit Konstrukten wie Soziabilität, Assertivität oder Aktivität. Damit qualifiziert sich diese Dimension für die Beschreibung von Führungspersönlichkeiten. Extrovertierte suchen soziale Situationen aktiv auf und agieren in diesen eher dominant. Das erschwert die theoretische Vorhersage, wie Autoritarismus plausiblerweise mit Extraversion zusammenhängen mag. Der dominante Selbstgeltungsdrang paßt zur Phänomenologie des nach unten Tretenden. Hingegen wird der autoritäre Obrigkeitshörige eher als unsicher und introvertiert gezeichnet. Am ehesten erwarte ich daher einen Nullzusammenhang, da beide Dynamiken einander zuwiderlaufen und sich dadurch in der Summe aufheben könnten. Es wäre denkbar und willkommen, daß die Subdimensionen sensitiv dafür sind und autoritäre Aggressivität positiv mit Extraversion korreliert, wohingegen autoritäre Unterordnung eher mit Introversion einhergehen sollte. 9.8.1.3. Offenheit für neue Erfahrungen Offenheit beschreibt ein breites, tiefes, originelles und komplexes Erfahrungsleben. Es ist daher als entgegengesetzter Pol zu closed-mindedness konzipiert. Dieses Konstrukt wurde als kognitivistisches Alternativkonzept zu Autoritarismus etabliert. Milton Rokeach (1960, S. 397) definierte Dogmatismus als das Ausmaß, mit dem sich der gesamte Geist eines Menschen eher als offen oder geschlossen beschreiben läßt. Damit ist psychologiehistorisch augenscheinlich, daß Offenheit negativ mit Autoritarismus korreliert sein sollte (Rokeach & Fruchter, 1956; Rokeach, 1960; Warr et al., 1969; Hanson, 1969; Hanson, 1976; Granberg & Corrigan, 1972; Thompson & Michel, 1972; Steininger & Lesser, 1974; Vacchiano et al., 1968). Das Bild des Autoritären verträgt sich nicht mit dem einer Person, die offen für neue Erfahrungen ist, die vor ihren Entscheidungen viele – und auch widersprüchliche – Informationen abwägt und die Entscheidungen dann relativ autonom trifft. Vielmehr verläßt sich der oder die Autoritäre – vereinfachend gesprochen – auf Quasi-Informationen, die bereits abrufbereit vorliegen. Dies können die Einstellungen Dritter sein, namentlich die Einstellungen von Autoritäten, oder aber auch stereotype Schemata, nach denen bereits erfolgreich entschieden wurde. Ersteres paßt gut zur Subdimension »Unterordnungsbereitschaft« (submission), letztgenanntes zu Konventionalismus sowie zur Unterordnung unter das dominante Dogma der Kultur. In das Erklärungskonzept fehlender Offenheit fügen sich be- · 283 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung merkenswerterweise verschiedene Aspekte des klassischen Autoritarismus. Ich denke hierbei an fehlende Vorstellungskraft, Rigidität, Stereotypie, Ambiguitätsintoleranz und Anti-Intrazeption (siehe vor allem Adorno et al., 1950; Frenkel-Brunswik & Sanford, 1945, aber auch Davids, 1955; Shaffer & Hendrick, 1974; Chabassol & Thomas, 1975; Sidanius, 1988; Ray, 1990a; Funke, 1996; Durrheim, 1998). Es liegt bereits empirische Evidenz vor, die für eine negative Korrelation von Offenheit und Autoritarismus spricht (r=-.30 Goldberg & Rosolack, 1994; r=-.36 Peterson et al., 1997; r=-.57 Trapnell, 1994; r=-.32/r=-.48 Butler, 2000; r=-.50 Konservatismus und Offenheit bei Riemann et al., 1993; vgl. auch Costa & McCrae, 1992; McCrae, 1996 und für einen Überblick Eckhardt, 1991). Aufgrund der vorliegenden empirischen Befunde, vor allem aber angesichts der ins Feld geführten theoretischen Argumente, erwarte ich eine deutliche Assoziation zwischen Autoritarismus und einer geringen Offenheit für neue Erfahrungen. 9.8.1.4. Verträglichkeit Verträglichkeit erlangt ebenso wie Extraversion vor allem im interpersonalen Bereich Bedeutung. Personen mit hohen Werten auf dieser Skala zeichnen sich durch Harmoniebedürfnis, Kooperationsbereitschaft und Altruismus aus, Streitsucht, Egozentrismus und Mißtrauen sind ihnen eher fremd. Bei einer breiteren Auffassung von Verträglichkeit ist damit Humanismus oder Moralität gemeint. Insofern wäre es wahrscheinlich, daß Autoritäre gering »verträglich« sind. Jedoch gibt es auch hier die Möglichkeit, daß eine entgegenlaufende Psychodynamik diese Korrelation mindern könnte. Verträgliche Personen sind auch in hohem Maße sozial angepaßt; eine Eigenschaft, die sie mit Autoritären teilen. Dies dürfte vor allem auf Submissivität zutreffen. Die unter 9.8.1.3 genannten Studien konnten kaum Zusammenhänge zwischen Verträglichkeit und Autoritarismus finden. Lediglich McCrae (1996) beschrieb Autoritarismus als Funktion von geringer Offenheit und geringer Verträglichkeit. Die dünne empirische Befundlage und meine theoretischen Argumente lassen mich eine geringe negative Korrelation zwischen Verträglichkeit und Autoritarismus erwarten. · 284 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung 9.8.1.5. Gewissenhaftigkeit Hohe Werte von Gewissenhaftigkeit gehen einher mit Erfolgen im Beruf, vor allem akademischem Vorwärtskommen (Digman, 1990). Gewissenhafte Personen sind zielstrebig, ehrgeizig, fleißig, ausdauernd, systematisch und genau. Dies sind gewiß sozial erwünschte Eigenschaften. In ihrer Übersteigerung liegt jedoch ein Problem: Willenstärke, Zuverlässigkeit, Ordnung und Disziplin haben einen bitteren Beigeschmack, wenn sie zum Dogma erhoben werden. Sie sind ein Charakteristikum der traditionellen protestantischen Arbeitsethik und preußische Sekun- därtugenden.213 An dieser Stelle dürfte auch ein Berührungspunkt mit Autoritarismus bestehen: Menschen, die Ordnung und Disziplin nicht als Mittel zum guten Zweck, sondern als Lebensziel in eigenem Recht mißverstehen, weisen genau die »Blockwartmentalität « auf, die zur Phänomenologie des Autoritären gehört. Eine Reihe korrelativer Studien weist in diese Richtung (r=.23 bei Goldberg & Rosolack, 1994; r=.11 bei Trapnell, 1994; r=.25/r=.10 n.s. bei Butler, 2000; r=.45 Konservatismus und Gewissenhaftigkeit bei Riemann et al., 1993). Vor diesem Hintergrund scheint eine leicht positive Korrelation zwischen Autoritarismus und Gewissenhaftigkeit wahrscheinlich. 9.8.2. Exploratorische Faktoranalysen auf Itemebene Faktorisiert man die Korrelationsmatrix aller 12 RWA³D-Items und aller 60 neo-ffi-Items, so sammeln sich theoriekonform die entsprechenden Aussagen um die »Kondensationskerne« der Big Five. Bei der Fünf-Faktorenlösung verteilen sich die Autoritarismusitems auf zwei der Hauptkomponenten.214 213 Im Übrigen gehörten sie auch zum Ideal der Sozialistischen Persönlichkeit. 214 Aufgrund der Größe der Mustermatrix werden hier nicht alle Ladung widergegeben, sondern lediglich die Items in absteigender Höhe der jeweils höchsten Ladungen. · 285 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Komponente 1 Komponente 2 Komponente 3 Komponente 4 Komponente 5 N11_P N6_P N10_N N2_P N5_P N7_N N3_P N9_P N4_N N8_P N12_P N1_N E9_N O7_N O2_N RWA2AP O4_N O9_P RWA6SP RWA8AP O10_N O5_N O12_P RWA5AN RWA10CP O11_N RWA12SP O3_P O6_P RWA11AN V8_N V12_N V2_N V5_N E5_P V10_P V3_N V4_P V11_N V1_P G9_N G3_N E1_P E4_P E8_P E2_P E3_N E11_P E6_N E7_P E12_N V7_P G7_P G10_P G4_P G5_P G6_N G1_P G12_P G8_P O1_N G2_P RWA7CN G11_N RWA4CP RWA1CN O8_N RWA9SN V6_N Tabelle 94: Hauptkomponentenanalyse RWA³D und Big Five Die auf den Autoritarismus bezogenen Aussagen ordnen sich entweder in den Faktor »Gewissenhaftigkeit« oder aber in (mangelnde) »Offenheit gegenüber neuen Erfahrungen« ein. Räumt man den Items durch Extraktion eine sechsten Faktors mehr Liberalität ein, so faßt diese sechste Komponente die Items der Subdimensionen Konventionalismus und Unterordnung zusammen. Alle Aggressionsitems laden (negativ) auf dem Offenheitsfaktor. Diese beiden Komponenten weisen mit r=.183 die höchste paarweise Korrelation der oblique rotierten Komponenten auf. · 286 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Komponente 1 Komponente 2 Komponente 3 Komponente 4 Komponente 5 Komponente 6 N11_P O2_N V8_N E1_P G10_P O8_N N6_P O10_N V12_N E4_P G4_P RWA12SP N10_N O9_P V5_N E8_P G7_P RWA7CN N2_P O5_N V2_N E2_P G8_P RWA1CN N5_P O12_P V11_N E3_N G1_P RWA4CP N7_N O4_N V10_P E11_P G6_N RWA10CP N3_P O3_P E5_P E6_N G5_P RWA6SP N9_P RWA2AP V4_P E7_P G2_P RWA3SN N4_N RWA5AN V3_N E12_N G12_P RWA9SN N8_P RWA8AP V1_P V7_P G11_N N1_N O11_N V6_N O1_N N12_P O6_P G3_N V9_N E9_N RWA11AN G9_N O7_N E10_P Tabelle 95: Hauptkomponentenanalyse RWA³D und Big Five + 1 Zwei Aspekte dieses Ergebnisses sind bemerkens- und nennenswert: Das Gemeinsame besteht darin, daß alle Autoritarismusitems auf den beiden ähnlichsten Hauptkomponenten laden, die ansonsten nur Offenheitsitems vereinen. Der zweite – nun aber trennende – Aspekt besteht darin, daß die Aggressivitätsitems isoliert von den anderen RWA³D-Items sind. Letzteres stellt Evidenz für die hier behauptete diskriminante Validität dar. Die hohe Korrelation mit (mangelnder) Offenheit für neue Erfahrungen erinnert an die alte Diskussion um open-/closed-mindedness (Rokeach, 1960; Vacchiano et al., 1968; Shaver & Richards, 1971; Helwig & Smallie, 1973). 9.8.3. Exploratorische Faktoranalysen auf Skalenebene Löst man sich bei den exploratorischen Faktoranalysen von der Itemebene und faktorisiert die Kovarianzmatrix der Aggregate (Skalenmittelwerte), so stehen vier der Big Five mit Hauptladungen auf einer Komponente den RWA-Subskalen mit den Hauptladungen auf der anderen gegenüber. Die beiden Komponenten sind auch bei schiefwinkliger Rotation nicht korreliert. · 287 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Pattern Matrixa Component 1 2 submissiveness .844 aggressiveness .742 Offenheit ggü. Neuem -.714 conventionalism .674 Neurotizismus -.735 Gewissenhaftigkeit .322 .693 Extraversion .640 Verträglichkeit .548 Extraction Method: Principal Component Analysis. Rotation Method: Oblimin with Kaiser Normalization. a. Rotation converged in 3 iterations. Tabelle 96: Ladungsmatrix der PCA über NEO-und RWA-Subskalen Auch dieses Ergebnis ist ein Indiz sowohl für die diskriminante Validität von Autoritarismus gegenüber den Big Five als auch für die große Nähe von Autoritarismus und geringer Offenheit für neue Erfahrungen. Die einzelnen Korrelationen sind in Tabelle 97 dokumentiert. Pearson Correlation A S CNEOV aggressiveness submissiveness .529** conventionalism .266** .522** Neurotizismus .129** .020 -.055 Extraversion -.023 -.084* -.036 -.383** Offenheit ggü. Neuem -.454** -.449** -.293** .007 .111** Verträglichkeit -.049 -.090* -.024 -.114** .129** .068 Gewissenhaftigkeit .143** .194** .209** -.324** .181** -.121** .312** **. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed). Tabelle 97: Korrelation der NEO- und RWA-Subskalen (manifeste Skalenwerte) 9.8.4. Latente Modellierung der attenuationskorrigierten Korrelationen Auf latenter Ebene wurde an die Daten von 871 Befragten ein konfirmatorisches Meßmodell angepaßt, daß die drei Subdimensionen von RWA³D auf Einzelite- · 288 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung mebene als kongenerisches Correlated-State-Modell unterstellt. 215 Die Big Five sind jeweils durch zwei kongenerische Itemparcels repräsentiert, die die contraits und protraits zusammenfassen. Die Spezifikation von Methodenfaktoren zur Abbildung der Besonderheiten der contraits wurde in der gewohnten Weise vorgenommen, der Nutzen für die Modellanpassung ist jedoch gering und wird mit eingeschränkter Sparsamkeit bezahlt.216 Das angepaßte Meßmodell zur Schätzung der attenuationskorrigierten Korrelationen der latent modellierten Sub-Dimensionen der RWA³D und der Big Five weist eine zufriedenstellende Anpassungsgüte auf: .² (181, N=871)=881.58; .²/df=4.87; rmsea=.067. Damit kann F hier als schrumpfungskorrigierte Korrelationsmatrix interpretiert werden. F A S C N E O V G Aggression .796 .595 Submission .840 Konventionalismus Neurotizismus .190 .056 -.054 -.517 -.001 -.169 -.462 Extraversion -.010 -.031 .003 .079 .307 .269 Offenheit -.591 -.604 -.537 .140 -.177 Verträglichkeit -.129 -.125 -.065 .555 Gewissenhaftigkeit .178 .268 .332 Tabelle 98: Attenuationskorrigierte Korrelation der NEO- und RWA-Subskalen (latente Variablen) Die beiden Dreiecksmatrizen widerspiegeln die Binnenkorrelationen innerhalb der zusammengehörigen Konstrukte. Die Korrelationen zwischen den RWA³D-Sub- skalen sollen per definitionem hoch, hingegen sollten die Big Five weitgehend unabhängig voneinander sein. Letzteres ist zumindest für einige Paare entschieden abzulehnen. So geht Neurotizismus und emotionale Labilität verständlicherweise mit Introversion und Menschenscheu einher(. =-.52), Verträglichkeit korreliert ne unerwartet hoch mit Gewissenhaftigkeit (. vg=.56).217 215 Supplement-CD ..\neo 1 und 2 big 5.amw 216 Das RMSEA sinkt durch die Einführung der Methodenfaktoren von .067 auf .060. 217 Zur Diskussion des letztgenannten kontraintuitiven Ergebnisses erinnere ich an meine Ausführungen zur »Positivsymptomatik« von Gewissenhaftigkeit; erst die zwanghafte Übersteigerung wird zum Problem. Hier ist also eine Diskontinuität in der Zusammenhangsstruktur zu erwarten, so daß die Zusammen- Fortsetzung auf Folgeseite … · 289 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Die hier interessierende Information findet sich jedoch in erster Linie in der Rechtecksmatrix zwischen den Subdimensionen der RWA³D einerseits und den Superfaktoren der Big-Five-Persönlichkeitstheorie andererseits. 9.8.5. Zusammenfassung: Big Five und Little Three Alle Subdimensionen der RWA³D gehen mit geringer Offenheit gegenüber neuen Erfahrungen einher (closed-mindedness). Dies entspricht den Erwartungen aus 9.8.1.3 (S.283ff.) und deckt sich mit den empirischen Ergebnissen der Kollegen. Hervorhebenswert ist das subskalenspezifische Korrelationsmuster. Ich habe unterstellt, daß Menschen, deren Geist kaum für neue Erfahrungen offen ist, sich eher auf die Meinungen Dritter verlassen – eine Fremdorientierung, die der autoritären Unterordnung sehr ähnlich ist. Die Ergebnisse widersprechen meiner Hypothese nicht: autoritäre Submissivität weist die (betragsmäßig) größte Korrelation mit Offenheit auf. Alle Subdimensionen von Autoritarismus, vor allem jedoch Konventionalismus, sind mit Gewissenhaftigkeit assoziiert. Auch dieses Ergebnis war erwartet und wurde – wenn auch in geringerer Höhe – von Anderen gefunden. Aus theoretischer und empirischer Sicht wurde für die anderen drei Superfaktoren des Fünf-Faktoren-Modells der Persönlichkeit kein starker Zusammenhang mit Autoritarismus gemutmaßt. Neurotizismus ist nur mit einer der Subdimensionen – nämlich Aggressivität – schwach assoziiert. Dies ist vor dem Hintergrund von Autoritarismustheorien interessant, die Bedrohung als »Auslöser« für autoritär aggressives Handeln unterstellen (Oesterreich, 1996; 1997; Sales, 1972; Sales, 1973b; 1973a; Sales & Friend, 1973; McCann & Stewin, 1987; McCann, 1991; 1997; 1999; Greenberg, Pyszczynski, Solomon & Rosenblatt, 1990; Doty et al., 1991; Feldman & Stenner, 1997; Rickert, 1998; Lavine et al., 1999). Dieses Ergebnis leistet aufgrund des geringen Zusammenhanges kaum einen Beitrag zur Unterstützung der psychodynamischen Theorie, die Autoritäre als Ichschwache, psychisch labile Menschen zeichnet, die (vor allem unter) Streß neuro- Fortsetzung der Fußnote: setzung der Stichprobe entscheidenden Einfluß auf Größe und Richtung der linearen Assoziation hat (restriction-of-range-effect). · 290 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung tisch reagieren. Gleichwohl kann diese theoretische Auffassung damit auch nicht widerlegt werden.218 Der Profilplot in Abbildung 64 veranschaulicht die Besonderheiten Hoch- und Niedrigautoritärer vor dem Hintergrund der Fünffaktorentheorie der Persönlichkeit. Eine Diskriminanzanalyse (Tabelle 99) unterstützt die große Bedeutsamkeit von Offenheit und Gewissenhaftigkeit für die Unterscheidung und disqualifiziert gleichzeitig die anderen drei Persönlichkeitsfaktoren.219 .8 .6 .4 .2 0.0 -.2 -.4 Extremgruppen RWA -.6 unterstes Quartil -.8 oberstes Quartil Neurotizismus Extraversion Verträglichkeit Gewissenhaftigkeit Offenheit Abbildung 64: Standardisierte Big-Five-Profile Hoch- und Niedrigautoritärer Function Function 1 1 Offenheit ggü. Neuem .894 Neurotizismus -.304 Gewissenhaftigkeit -.317 Offenheit ggü. Neuem .912 Extraversion a .152 Verträglichkeit .195 Neurotizismus -.075 Gewissenhaftigkeit -.465 Verträglichkeit .072 Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions Variables ordered by absolute size of correlation within function. a. This variable not used in the analysis. Tabelle 99: Diskriminanzanalyse: (a) Strukturmatrix, (b) stand. kanonische Diskriminanzfunktionskoeffizienten 218 Ich halte sie aus erkenntnistheoretischer Sicht prinzipiell für nicht widerlegbar. 219 81% richtig klassifiziert. · 291 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Autoritäre sind deutlich weniger offen für neue Erfahrungen (O), neigen häufiger zu übersteigerter Gewissenhaftigkeit mit Betonung von penibler Ordnung und Disziplin (G). Nicht signifikant sind die Unterschiede auf den anderen drei Superfaktoren, jedoch sind die Unterschiede sämtlich tendentiell in plausibler Richtung: Autoritäre sind demnach eher unterdurchschnittlich verträglich, freundlich und kooperativ (V), sind eher introvertiert und sozial ängstlich (E) und neigen zu psychischer Labilität (N). Trotz der deutlichen und theoriekonformen Ergebnisse muß einem Mißverständnis vorgebeugt werden. Korrelationen zwischen den Big Five und den drei Subdimensionen bilden noch lange keine Theorie. In mehreren Punkten möchte ich hier Einschränkungen unterstreichen: Ich unterstelle nicht, daß sich quasipolitische generalisierte Einstellungen (Autoritarismus) ausschließlich oder auch nur vorwiegend mit Begriffen der Persönlichkeitspsychologie beschreiben ließen. Autoritarismus hat nichts »Naturgegebenes«, fatalistisch Unveränderbares. Ebensowenig behaupte ich eine Unabhängigkeit von situativen Faktoren.220 Die mehrfach gefundenen Zusammenhänge zwischen Persönlichkeitsfaktoren und Autoritarismus sehe ich durch biographische Entscheidungen vermittelt. Bestimmte persönlichkeitspsychologisch beschreibbare Dispositionen mögen die Menschen dabei beeinflussen, sich mit diesen oder aber jenen Mitmenschen zu umgeben. Individuen suchen sich mehr oder weniger bewußt und mehr oder weniger aktiv »ihre « Umwelt. In diesem Sinne wäre es beispielsweise wahrscheinlich, daß Personen mit »geschlossenem Geist« sich von einfachen Antworten auf die komplizierten Fragen des Lebens angezogen fühlen (vgl. auch need for structure und need for closure bei Chabassol & Thomas, 1975; Freund et al., 1985; Webster & Kruglanski, 1994; Wolfradt, Sommer & Rademacher, 1999; Wolfradt & Rademacher, 1999; Kemmelmeier, 1997). In der Einflußsphäre dieser populistischen Parteien etwa finden die Betroffenen schließlich auch ein Feld sozialen Lernens, sodaß die autoritären Anschauungen generalisiert werden. Auch eine aktive Rekrutierung geeigneter »Kader« durch die Parteien ist denkbar und würde den gefundenen korrelativen Zusammenhang erklären. 220 Altemeyer: »Oh, I know as a card –carrying social psychologist that personal authoritarianism will interact with situational factors. No one, I hope, expects High RWAs always to submit to authority or to betray their dislike of minorities indiscriminately.« (1996: 45) · 292 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung 9.9. Beispiel VII: Autoritarismus und Geschlecht Die Frage nach Geschlechtsunterschieden hinsichtlich des uns interessierenden Autoritarismus ist mehr als die Frage nach einem Mittelwertsunterschied. Autoritarismus berührt die Frage nach sozialen Hierarchien, nach Hegemonien. Bei den Geschlechterbeziehungen haben wir es ebenfalls in besonderer Weise mit einem hegemonischen Verhältnis zu tun. Die Untersuchung von Geschlechtsunterschieden darf sich daher vor allem bei dem Gegenstand »Autoritarismus« nicht auf die quantitative Gegenüberstellung beschränken; die Unterschiede sind vielmehr qualitativer Natur (vgl. auch Rippl & Seipel, 1999; Holzkamp & Rommelspacher, 1991). Die Geschlechtsspezifik ist hier nicht der Gegenstand. Dafür sei auf weiterführende Arbeiten verwiesen, vor allem auch auf die Aufsätze zur Social Dominance Orientation (Sidanius et al., 1994a; 1994b; Duncan et al., 1997; Pratto et al., 1997; Lippa & Arad, 1999; Whitley, 1999; Whitley & Lee, 2000; Whitley & Ægisdóttir, 2000, siehe auch S.69ff. in dieser Arbeit). Dennoch möchte ich – ausdrücklich auf der Oberfläche der Daten – einige Ergebnisse der Vollständigkeit halber diskutieren, um Argumente gegen eine Reihe von Vorurteilen und Mißverständnissen zu liefern. Die Besonderheit liegt hier teilweise nicht in Unterschieden, sondern gerade im frappierenden Gleichmaß von Autoritarismuswerten, aus dem jedoch nicht die Wesensgleichheit abgeleitet werden kann. Im Gegenteil sollte die Gleichheit der Gesamtskalenwerte im Konzert mit der unterschiedlichen Plausibilität hoher Autoritarismuswerte bei Männern und Frauen verstören und zur näheren Untersuchung ermuntern. 9.9.1. Mittelwertsunterschiede auf Skalenebene Die folgenden Ergebnisse beziehen sich auf eine Datenbasis von 1836 Personen, von denen jedoch nicht alle ihr Geschlecht angegeben haben.221 221 Es ist hier nicht zu beweisen, aber ein im Internet nicht unübliches Verhalten, das Geschlecht zu verschleiern. Es wäre also denkbar, daß einige der »Frauen« in Wahrheit Männer sind. · 293 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Geschlecht Frequency Percent Valid Percent Cumulative Percent Valid weiblich 838 45.6 47.1 47.1 männlich 942 51.3 52.9 100.0 Total 1780 96.9 100.0 Missing System 56 3.1 Total 1836 100.0 Tabelle 100: Geschlechterverhältnis Bemerkenswert ist, daß sich trotz der großen Stichprobe und der damit verbundenen hohen Teststärke kein (!) Unterschied im Gesamtwert der RWA³D bestätigen läßt. Robust Tests of Equality of Means Statistica df2 Sig. Right-wing Authoritarianism aggressiveness Welch 20.96 1777.163 .000 Brown-Forsythe 20.96 1777.163 .000 Right-wing Authoritarianism submissiveness Welch 5.38 1771.166 .021 Brown-Forsythe 5.38 1771.166 .021 Right-wing Authoritarianism conventionalism Welch 17.36 1778.000 .000 Brown-Forsythe 17.36 1778.000 .000 Right-wing Authoritarianism RWA3D Welch .07 1776.942 .796 Brown-Forsythe .07 1776.942 .796 a. Asymptotically F distributed. Tabelle 101: Mittelwertsunterschiede Geschlecht × Autoritarismus (Teststatistik) Dies ist bereits ohne Ansehen des Inhalts der Skalen erstaunlich; beim möglichen Wertebereich von 1 bis 7 ist das arithmetische Mittel für Männer und Frauen bis zur zweiten Nachkommastelle identisch. Erwartungsgemäß erreichen die Frauen geringere Werte auf den Skalen Submissivität und Konventionalismus. Gerade hier werden Geschlechterrollen teilweise explizit tangiert. Konventionalismus ist als starres Festhalten an den sozialen Konventionen definiert, die durch die Autoritäten aufrechterhalten werden. Durch die männliche Dominanzkultur ist es geradezu tautologisch, daß diese Konventionen die Benachteiligung von Frauen zumindest in subtiler Weise konsolidieren. Frauen sollten hier daher in geringerem Maße zustimmen. · 294 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Ähnliches gilt für Submissivität. Hier wird nicht nur die eigene Unterordnungsbereitschaft operationalisiert, sondern vor allem auch die Auffassung, daß Unterordnung einen wichtigen Wert darstellt. Namentlich geht es um die Unterordnung von Kindern unter ihre Eltern und Frauen [sic!] unter ihre Männer. Auch hier ist es banal, für Frauen niedrigere Zustimmungswerte zu erwarten. Für beide Skalen gilt, daß die Unterschiede in der erwarteten Richtung auf dem 5%-Niveau statistisch signifikant sind, aber die Effektgröße in ihren Spärlichkeit verwundert (Tabelle 102). Group Statistics Geschlecht Mean Std. Deviation Std. Error Mean Right-wing Authoritarianism aggressiveness weiblich männlich 3.5104 3.2051 1.33969 1.47370 .04628 .04802 Right-wing Authoritarianism submissiveness weiblich männlich 2.2223 2.3309 .96111 1.01543 .03320 .03308 Right-wing Authoritarianism conventionalism weiblich männlich 2.8845 3.1160 1.10339 1.24011 .03812 .04041 Right-wing Authoritarianism RWA3D weiblich männlich 2.8724 2.8840 .88024 1.01408 .03041 .03304 Tabelle 102: Mittelwertsunterschiede Geschlecht × Autoritarismus (deskriptiv) Der Gesamtmittelwert unterscheidet sich nicht; auf den Subskalen Konventionalismus und Submissivität weisen Frauen geringere Werte auf. Folgerecht müssen sich Frauen in der Konsequenz autoritär aggressiver darstellen. Ihr Wert ist 0.3 Skalenpunkte höher als bei den befragten Männern. Dies entspricht unter Umständen nicht den Klischees über Frauen als milde und subdominant. Eine Inspektion der Profile auf der Basis der Einzelitems offenbart, daß es nur ganz bestimmte Aussagen sind, die in der Konsequenz zu der beschriebenen Ähnlichkeit der Gesamtskalenwerte beitragen. 9.9.2. Mittelwertsunterschiede auf Itemebene Die folgenden Itemprofile und Teststatistiken dokumentieren die geschlechtsspezifischen Mittelwertsunterschiede auf Itemebene. Die befragten Männer zeigten bei drei Submissivitäts- bzw. Konventionalismusitems höhere Werte. Die Frauen in diesem Datensatz befürworteten ausschließlich Aggressivitätsitems stärker als Männer. · 295 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung 4.5 4.0 3.5 3.0 2.5 2.0 Geschlecht 1.5 weiblich 1.0 männlich Me Me Me Me Me Me M Me Me M Me Me ea ea a a a a a a a a a a n n n n n n n n n n n n RW RW RW R RW R RW RW RW RW RW RW W WA A1 A7 A3 A A5AN A2AP A8AP A9 A6 A1 A4 1 12 1 S S C C 0 C S N P N C S AN N N P P P Abbildung 65: Geschlechtsspezifische Itemprofile RWA³D Robust Tests of Equality of Means Brown-Forsythe Statistica df1 df2 Sig. RWA1CN .934 1 1753.1 .334 RWA3SN 69.073 1 1636.1 .000 RWA5AN 10.407 1 1771.7 .001 RWA7CN 82.668 1 1762.1 .000 RWA9SN .556 1 1770.7 .456 RWA11AN 26.136 1 1776.5 .000 RWA2AP 10.092 1 1758.0 .002 RWA4CP 1.736 1 1770.0 .188 RWA6SP .650 1 1749.3 .420 RWA8AP 3.234 1 1768.9 .072 RWA10CP 16.018 1 1778.0 .000 RWA12SP 2.007 1 1776.2 .157 a. Asymptotically F distributed. Tabelle 103: Geschlechtsspezifische Itemmittelwertsunterschiede (Teststatistik) · 296 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Signifikant Variable Endfassung RWA³D höherer Mittelwert bei … rwa7cn »Gleichgeschlechtliche Lebensgemeinschaften Männern .81 sollten der Ehe gleichgestellt werden.« (-) rwa3sn »Die Zeiten, in denen sich Frauen ihren Männern unterzuordnen Männern .35 hatten, sollten der Vergangenheit angehören. Der ›Platz einer Frau‹ in der Gesellschaft sollte sein, wo immer sie möchte.« (-) rwa10cp »Tugendhaftigkeit und Gesetzestreue Männern .31 bringen uns auf lange Sicht weiter als das ständige Infragestellen der Grundfesten unserer Gesellschaft.« rwa11an »Es ist wichtig, die Rechte von Radikalen und Abweichlern Frauen -.43 in jeder Hinsicht zu wahren.« (-) rwa5an »Es gibt kein Verbrechen, Frauen -.36 das die Todesstrafe rechtfertigen würde.« (-) rwa2ap »Was wir in unserem Land anstelle von mehr ›Bürgerrechten‹ wirklich Frauen -.27 brauchen, ist eine anständige Portion Recht und Ordnung.« Tabelle 104: Geschlechtsspezifische Itemmittelwertsunterschiede (deskriptiv) Es bleibt zu resümieren, daß Frauen in plausibler Weise vor allem bei denjenigen Items weniger zustimmen, in denen explizit die Geschlechterbeziehungen tangiert werden. Sie gleichen dies jedoch – und das ist erwähnenswert – vor allem bei Aggressivitätsitems wieder aus. Frauen sind bei drei Recht-und-Ordnung-Aussagen eher bereit, diesen zuzustimmen.222 Für die Forschungspraxis resultiert daraus die dringende Forderung, Geschlechtsunterschiede auf Gesamtskalenebene nicht vorschnell zu interpretieren. Zunächst sollte, in Analogie zur interkulturellen Forschung, die Methodenäquivalenz überprüft werden (van de Vijver & Leung, 1997, in anderem Zusammenhang auch Wolf & Kröhne, 2002; Kröhne & Wolf, 2002). 222 Über die Ursachen kann naturgemäß nur spekuliert werden. In verschiedenen Ansätzen wird Autoritarismus im Zusammenhang mit Bedrohungserleben diskutiert. Aufgrund der männlichen Dominanzkultur kann man für Frauen ein latentes Bedrohungsgefühl annehmen. Dieser Einschätzung könnten Frauen dadurch entgegenwirken, daß sie das Bestrafen potentieller Täter durch die Autoritäten befürworten (»Es gibt kein Verbrechen, das die Todesstrafe rechtfertigen würde.« [umkodiert]). Ebenfalls in Richtung dieser Argumentation läßt sich die Vermutung diskutieren, daß Frauen aufgrund ihrer tatsächlichen und wahrgenommenen Opferrolle, etwa bei Vergewaltigungen und sexuellen Mißhandlungen, leichter eine Einstellung formulieren können, die die Bestrafung von Tätern zum Thema hat. · 297 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Für die Gesamtskala der RWA³D ist die Äquivalenz nachdrücklich infrage zu stel- len. 9.10. Beispiel VIII: »Typen« von Autoritären Im Abschnitt 9.2.2 (Seite 249ff.) wurde dargestellt, daß die analytische Unter- scheidbarkeit dreier Subdimensionen die Ableitung von Typen auf der Personen- ebene theoretisch ermöglicht. Gleichzeitig wurde einschränkend davon Abstand genommen, diese Typen als statische, lebenslang unveränderliche Charaktere miß- zuverstehen (vgl. auch ausführlich Funke, 1999). Auch ein methodisches Argument wurde ins Feld geführt, das erklären würde, wa- rum diese »Typen« eventuell nicht identifiziert werden können: die dennoch hohe Korrelation zwischen den drei Subdimensionen von Autoritarismus vereitelt eine klare Unterscheidbarkeit. Zunächst wurde eine hierarchische Clusteranalyse über die Subskalen von etwa 1800 Befragten gerechnet. In den Clustern C3 und C5 sind Frauen etwa 60/40 über- repräsentiert. Umgekehrtes Verhältnis zeigt sich bei den restlichen Clustern C1, C2 und C4. 54321 400 300 200 100 0 lweibli99 207 117 137133 257 235 76 Clusternummer Geschecht ich männlch 162 357 Abbildung 66: Clustergrößen nach Geschlechtern getrennt · 298 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Geschlecht * Ward Method Crosstabulation Count Ward Method 1 2 3 4 5 Total Geschlecht weiblich 76 235 257 133 137 838 männlich 117 357 162 207 99 942 Total 193 592 419 340 236 1780 Tabelle 105: Clustergrößen nach Geschlechtern getrennt Das kleinste Cluster C1 faßt diejenigen 193 Befragten zusammen, die auf allen Subskalen hohe Werte aufweisen. Das spiegelbildliche Cluster C2 vereinigt etwa ¼ der Befragten und ist durch niedrige Werte auf allen Skalen charakterisiert. Neben einer unauffälligen mittleren Gruppe weisen die Cluster C4 und C5 Profile auf, die auf eine deutliche Unterscheidung der Subdimensionen beruhen: Während sich beide kaum hinsichtlich ihrer Submissivität unterscheiden, ist jeweils entweder die Aggressivität oder der Konventionalismus überdurchschnittlich ausgeprägt. Dabei ist das »aggressive« Cluster stärker mit Frauen besetzt, im konventionellen überwiegen die Männer. ilii.5 iiile iConventonasm Submssion Aggression z-scores 2.0 1.5 1.0 0.0 -.5 -1.0 -1.5 Ward Method all hghs all lows medums KonventonelAggressve Abbildung 67: Profile der fünf Cluster · 299 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Zur Überprüfung der Qualität der Clusterlösung bzw. zur Entscheidungsfindung, wie viele Cluster angenommen werden sollen, kann man die Entwicklung der Fehlerquadratsumme beobachten. Die Entscheidung folgt dann einem ähnlichen Kriterium wie bei der Faktoranalyse (Ellbow-Kriterium, vgl. auch Scree-Plot bei der efa). Bei der großen Anzahl zu klassifizierender Objekte (in dem Falle Personen statt Variablen) ist dieses Vorgehen jedoch nicht praktikabel oder zielführend. Man muß hier schlicht die Begrenztheit des klassifizierenden Verfahrens eingestehen. Im Ergebnis dessen fällt es auch nicht mehr schwer, die Entscheidung für eine der Clusterlösungen nach dem pragmatischen Kriterium der inhaltlichen Interpretierbarkeit zu fällen. Fünf Cluster stellen hier einen guten Kompromiß zwischen Verschiedenheit der Cluster und Überschaubarkeit der Darstellung dar. Bei der Viercluster-»Lösung« würden die Cluster 2 und 3 zu einem sehr großen Cluster zusammengefaßt (N=1030). Das entstehende Cluster würde all jene Befragten vereinen, die auf allen drei Subdimensionen unterdurchschnittliche Werte aufweisen (z˜-.5). Die Klassifikationsgüte (Diskriminanzananlyse) ist bei 4 Clustern geringfügig größer als bei 5 Clustern (91.7% vs 89.5%, vgl. Tabelle 106). Classification Resultsa % Ward Predicted Group Membership Method 1 2 3 4 5 Total Original 1 88.8 .0 .0 7.3 3.9 100.0 2 .0 93.0 4.8 2.2 .0 100.0 3 .0 7.7 86.4 3.3 2.6 100.0 4 2.3 4.8 6.2 84.7 2.0 100.0 5 1.6 .0 4.0 .8 93.5 100.0 a. 89.5% of original grouped cases correctly classified. Tabelle 106: Clustertrefferquote auf der Basis der standardisierten Subskalen Auf Basis einer der durchgeführten Studien (6.4, S.156ff) soll exemplarisch gefragt werden, ob sich aus diesen »Typen« bei aller gebotenen Vorsicht Konsequenzen für die Vorhersage anderer Eigenschaften ergeben, die bei der Clusterbildung ausdrücklich nicht beteiligt waren. Die Cluster, zur Erinnerung, basieren allein auf den drei Subskalen. · 300 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung 2.5 2.0 1.5 1.0 .5 0.0 -.5 -1.0 -1.5 RW A A S C LiRe ausländerfeindlich Abbildung 68: Profilplot auf der Basis von 5 »Autoritarismusclustern« Mit Bedacht wurde in Abbildung 68 auf die Wiedergabe der Legende verzichtet. Am deutlichsten (und uninteressantesten) sind das »hohe« Cluster C5 (N=26, 6%) und das »niedrige« Cluster C1 (N=151, 33%). C5 vereint die Personen mit hohem Autoritarismus, der durch hohe Werte auf allen drei Subskalen zustande kommt. Diese Personen definieren sich eher als rechts und haben in erwarteter Weise eher ausländerfeindliche Einstellungen. Hier gehen, wie von den klassischen Autorita- rismustheorien »gefordert«, alle drei Subdimensionen miteinander einher. Spiegelbildlich und damit ebenso theoriekonform finden sich in C1 die nichtauto- ritären, sich als »links« darstellenden Ausländerfreunde wieder. Für das in dieser Arbeit diskutierte Problem sind die anderen drei Cluster jedoch interessanter. Deren Profile sind in Abbildung 69 widergegeben. · 301 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung 2.0 1.5 1.0 .5 Ward Method 2 0.0 32% Subskalen sind vorläufig ausgeblendet, um die verfügbare Datenlage nach dem klassischen Vorgehen ohne Subdimensionen zu verdeutlichen. 3 10% 4 16% RW A A S C LiRe ausländerfeindlich Abbildung 69: Profilplot (Cluster 2-4) auf der Basis von 5 »Autoritarismusclustern« Die relativ geringste (durchschnittliche) Ausländerfeindlichkeit geht in C4 mit dem ebenfalls relativ geringsten und durchschnittlichen Gesamtscore der RWA³D einher. Die Cluster C2 und C3 unterscheiden sich jedoch in ihrem überdurchschnittlichen RWA³D-Gesamtwert nicht, wohl aber in ihrer Ausländerfeindlichkeit. Der leicht höhere Autoritarismus in C3 ist paradoxerweise mit einer geringeren [sic!] Ausländerfeindlichkeit assoziiert – ein Ergebnis, das mit dem klassischen Vorgehen nicht erklärbar wäre. Im folgenden Profilplot sind auch die Ausprägungen der Subdimensionen ablesbar. C4 ist – wie bereits erwähnt – durch unauffällige Werte auf RWA³D und Ausländerfeindlichkeit charakterisiert. · 302 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung 2.0 1.5 1.0 .5 Ward Method 2 0.0 32% 3 10% 4 16% RW A A S C LiRe ausländerfeindlich Abbildung 70: Profilplot (Cluster 2-4) auf der Basis von 5 »Autoritarismusclustern« Wie die Inspektion der Subskalen offenbart, weisen diese Befragten vergleichsweise hohe Aggressivitätswerte auf. Zur Diskussion der Ergebnisse sei daran erinnert, daß sich autoritäre Aggressivität am ehesten als law-and-order-Einstellung beschreiben läßt. Vor dem Hintergrund der eher »linken« Selbstdefinition und der geringen Ausländerfeindlichkeit zeichnet sich hier vage das Bild eines »linken Au- toritarismus«223 ab. Diese Spekulation findet bestechende Unterstützung in den höchsten Werten dieses Clusters auf der inhaltsbereinigten Skala zur Politischen Intoleranz.224 Wir haben es hier also – plakativ gesprochen – mit demonstrativen 223 Eine abschließende Diskussion der Lehren aus meinen Studien sollte die Frage beantworten, ob wir es beim isolierten Auftreten von hohen Werten auf nur einer der Subdimensionen überhaupt mit Autoritarismus zu tun haben. Im Moment neige ich dazu, diese Definition nicht anzutasten. Mit anderen Worten: »Ja, zum Autoritarismus bedarf es aller drei Subdimensionen.«. Ich sehe keine Veranlassung, Altemeyers konsensuale Definition herauszufordern und infrage zu stellen. Gleichwohl bleibt von dieser Auffassung unberührt, daß natürlich durch den Gesamtskalenwert die differentielle Ausprägung der einzelnen Subdimensionen verschleiert werden kann. Genau dieser Fall liegt hier vor. 224 Diese Werte sind im Profilplot nicht dargestellt. · 303 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Ausländerfreunden zu tun, deren Toleranz jedoch beim politischen Gegner am rechten Rand ihre Grenze findet. Dabei sei darauf hingewiesen, daß der Gesamtwert der RWA³D bei dieser Gruppe vollkommen unauffällig ist. Aufgrund der erwähnten Instabilität der Cluster und dem damit verbundenen spekulativen Charakter der Interpretationen distanziere ich mich von einer zu ausführlichen Deutung der beiden Cluster C2 und C3. Ein rein formales Argument genügt jedoch, um die Überlegenheit des alternativen hochauflösenden Ansatzes gegenüber der klassischen Vorgehensweise zu stützen: Die Cluster C2 und C3 unterscheiden sich nicht in ihrem überdurchschnittlichen RWA³D-Gesamtwert, wohl aber in ihrer Ausländerfeindlichkeit. Eine Inspektion der beiden Profile offenbart zwei vollkommen verschiedene Verläufe bei den Subdimensionen. Cluster Aggressivität Submissivität Konventionalismus C2 Ü Ü Ú C3 Ú Ú ..Ü Tabelle 107: Gleiche RWA³D-Werte, aber unterschiedlich ausgeprägte Subskalen Das sehr stark besetzte Cluster C2 (32%) hat leicht überdurchschnittliche Werte bei den zentralen Autoritarismusdimensionen Aggressivität und Unterordnung; Konventionalismus ist lediglich durchschnittlich ausgeprägt. Dieses Profil veranschaulicht eine abgemilderte Variante des Autoritarismus in seiner klassischen Lesart. Es handelt sich um eine moderne Variante, der die antiquierten Anschauungen über »Sitte und Moral« fehlen, das Hierarchiedenken jedoch nicht. Das ändert jedoch nichts an der Vorhersagekraft für Ausländerfeindlichkeit. Ich werte dies als Indiz dafür, die beiden hierarchie- und machtrelevanten Konstrukte als zentral und wesensbestimmend für Autoritarismus anzusehen, während Konventionalismus in der heutigen Zeit an Bedeutung verlieren dürfte. Dieser Sichtweise widerspricht auch nicht das Cluster C3 mit der spiegelbildlichen Konfiguration: extrem hoher Konventionalismus bei unauffälligen Ausprägungen von Aggressivität und Submissivität. Folgt man der Argumentation aus Fußnote 223, so würde auch diese (seltene) Kombination eher nicht als »autoritär« bezeichnet werden. Der Wert auf der Gesamtskala ist deutlich überdurchschnittlich, was · 304 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung jedoch allein durch auffällig hohe Konventionalismuswerte zustande kommt, die den Gesamtmittelwert in die Höhe treiben. Die Besonderheiten der Cluster lassen vermuten, daß das Geschlechterverhältnis in den einzelnen Clustern nicht ausgewogen ist, sodaß die Cluster zumindest teilweise auch Geschlechtsunterschiede widerspiegeln. Die Abbildung 71 gibt Grund, dieser Vermutung Glauben zu schenken. Im »links-aggressiven« Cluster C4 sind fast doppelt so viele Frauen wie Männer vertreten (vgl. auch ausführlich 9.9, S.293ff.). 54321 100 80 60 40 20 0 lweibli11 2323 76 59 15 45 18 64 89 Clusternummer Count Geschecht ich männlch Abbildung 71: Clustergrößen nach Geschlechtern getrennt Im Fazit kann festgehalten werden, daß in der Tat »Gruppen« von Personen identifizierbar sind, die (bei gleichem RWA-Gesamtwert) eine unterschiedliche Kombination ihrer Subskalenwerte aufweisen. Dabei unterstreiche ich nochmals meine Bemerkung aus Fußnote 223 (S. 303), daß a) für die Cluster keine Stabilität im Sinne unveränderlicher, scharfer Grenzen unterstellt wird, und daß b) verschiedene Kombinationen von hoch oder niedrig ausgeprägten Subdimensionen auftreten können. Von diesem Umstand bleibt die Frage völlig unberührt und letztlich ohne Belang, ob es sich dann noch um »Autoritarismus« handelt. · 305 Friedrich Funke _______________________________________________________________________ Exemplarische externe Validierung Ich neige dazu, keine Veranlassung zum Antasten der klassischen Definition zu se- hen, die das gemeinsame Auftreten aller drei Komponenten als wesensbestimmend ansieht. Das mag nach dem Lesen dieser Arbeit verwundern, steht aber keineswegs im Widerspruch zu meiner Argumentation. Das Problem liegt in der Operationali- sierung, die bei gleichem Skalengesamtwert den Blick auf die womöglich völlig un- terschiedlich ausgeprägten Subdimensionen verwehrt. Dies exemplarisch zu zeigen war das Ziel dieser Clusteranalysen. Die Ergebnisse sprechen für das Gelingen die- ses Vorhabens.225 9.11. Einige Lehren aus den Beispielen Eine Zusammenfassung der Lehren des vorangegangenen Kapitels scheint wünschenswert; gleichwohl lassen sich Argumente anführen, die den Sinn der Zusammenfassung infrage stellen: Die dargestellten Ergebnisse wurden mit Bedacht »Beispiele « genannt, um den exemplarischen Charakter zu unterstreichen. Es ging nicht um Vollständigkeit – dies ist ein Grund, warum eine integrierende Zusammenfassung wenig sinnvoll ist. Die argumentatorische Kraft der Beispiele liegt jenseits der Einzelergebnisse: Es konnte gezeigt werden, daß die Subdimensionen diskriminant valide sind, daß die Erklärungskraft der Subdimensionen unterschiedlich ist und daß letzteres vor allem in Abhängigkeit von verschiedenen zu erklärenden Konstrukten gilt. Dies zu zeigen war das zentrale Ziel des Aufsatzes; die dadurch eröffneten Wege zu be- schreiten ist eine Aufgabe jenseits dieses Textes. 225 Die gerade erst beginnende Annäherung von Strukturgleichungsmodellen an die Item-Response-Theorie könnte in den nächsten Jahren die Möglichkeit eröffnen, ausgereifte Methoden zur Latent Class Analysis (LCA) mit SEM für die hier vorliegende Fragestellung anzuwenden. Die Software MPlus von Bengt und Linda Muthén (http://www.statmodel.com/) scheint hier vielversprechend zu sein. Um das Ziel des vo- rangegangenen Abschnitts zu erreichen genügte jedoch die Demonstration auf Basis von Clusteranaly- sen mit den manifesten Variablen. Bei der Art der Erhebung der Daten (siebenstufiges Antwortmodell) müßte die Stichprobe zudem erheblich umfänglicher sein, um die große Anzahl unbekannter Parameter zuverlässig zu schätzen. · 306 10. Diskussion »Einen unausgebrüteten Gedanken muß man zart behandeln um ihn am Leben zu erhalten. Man darf von ihm noch nichts verlangen und muß ihn im weichen Medium der fortwährenden Unsicherheit betten. Ist er flügge dann verläßt er dieses Nest von selbst.« (Wittgenstein, 1995/1931) 10.1. Ausblick auf die Diskussion Auf den nächsten Seiten beabsichtige ich keine ausufernde Diskussion, da viele Ergebnisse bereits »an Ort und Stelle« kommentiert und in ihrer Bedeutung gewürdigt wurden. Die folgenden Bemerkungen sind deshalb zuweilen eher ein fast thesenhaftes, dialogisches Zusammenfassen der Antworten auf die Fragen, die die Arbeit gestellt hat. Friedrich Funke ____________________________________________________________________________________________Diskussion 10.2. Ist die Dekomposition geglückt? Die Ergebnisse der hier berichteten Exploratorischen Faktoranalysen über die RWA96, RWA98 und RWA³D weisen sämtlich in die Richtung, daß sich meist zwei Hauptkomponenten extrahieren lassen, die jeweils positive und negative Items zusammenfassen. Die getrennte Analyse enttäuscht jedoch ebenfalls.; hier ist folgerichtig nur eine Einfaktorstruktur zu zeigen. Eine gewisse inhaltliche Zusammenhangsstruktur zeigt sich jedoch in der Nähe der Submissivitäts- und Konventionalismusitems, die sich beide von den Aggressivitätsitems abheben. Weiter oben wurde nachvollziehbar argumentiert, daß Konventionalismus als die Unterordnung (m Submission) unter überkommene kleinbürgerliche Normen redefiniert werden kann. Gleichzeitig ist die Betonung der Unterordnung integraler Bestandteil der angesprochenen kleinbürgerlichen Konventionen. Beide Umstände begründen plausibel die größere Nähe der beiden Subdimensionen und damit für die Kontrastierung gegenüber der aggressiven Komponente. 10.3. Ist die Rekomposition geglückt? Die Antwort auf diese Frage wurde bereits in 8.8 (S.246ff.) in der gebotenen Ausführlichkeit gegeben. Ziel der Rekomposition war das Finden eines theoretisch in jedem Detail begründeten Meßmodells, daß die dreidimensionale Zusammenhangsstruktur ebenso abbildet wie die Besonderheiten, die durch positiv resp. negativ formulierte Items entstehen. Gleichwohl handelt es sich bei dieser Suche um keinen Prozeß mit eindeutigen Abbruchkriterien; vielmehr können verschiedene Alternativen angeboten werden. Keiner der Ansätze rechtfertigt seine Qualifikation als der einzig richtige Weg, die Vor- und Nachteile sind jeweils im Einzelfall und in Abhängigkeit der Fragestellung gegeneinander abzuwägen. Dadurch wird deutlich, daß es nicht um die Maximierung eines Kriteriums, sondern um die Optimierung der Balance zwischen hoher Modellanpassung und gleichzeitig um Sparsamkeit des Modells gehen konnte, zweier Ziele mithin, die in einem kompensatorischen Verhältnis zueinander stehen. · 308 Friedrich Funke ____________________________________________________________________________________________Diskussion Die Frage in einem Satz beantwortend wäre festzustellen, daß nicht eine, sondern mehrere theoretisch gerechtfertigte Meßmodelle in befriedigender Weise an die Daten angepaßt werden können, die sämtlich den einfaktoriellen Modellen über- legen sind. 10.4. Bedarf es einer neuen Skala? Das vorliegende Forschungsprogramm ging von dem konservativen Ansatz aus, die bestehende etablierte Skala von Altemeyer in ihren verschiedenen Revisionen beibehalten und dennoch dreidimensionale Modelle anpassen zu können. Dem lag das Rationale zugrunde, daß es aus wissenschaftstheoretischen Gründen unrealistisch wäre, ohne namhafte Kooperationspartner eine neue Skala zu etablieren. Ich möchte zwei Hauptgründe anführen, um meine anfängliche Auffassung zu re- vidieren: 1. Eine Anpassung dreidimensionaler Modelle an die RWA mit ihren double-barreled Items ist zwar möglich, der forschungspraktische Preis der hohen Komplexität, schweren Vermittelbarkeit und mangelhaften Robustheit über Zeit und Kulturen hinweg verbietet jedoch dieses Vorgehen. 2. Die Etablierung einer neuen dreidimensionalen Skala scheint heute nicht mehr aussichtslos; es wurden in dieser Arbeit weitreichende theoretische Argumente entwickelt und empirische Evidenz gefunden, die eine Eigenentwicklung rechtfertigen und ihr Erfolg verheißen.226 Als Fazit bleibt das klare Bekenntnis zur Konstruktion einer mehrdimensionalen Autoritarismusskala. Dabei sollte nicht rigide an den drei Dimensionen festgehal- ten werden. Essentiell sind die Subdimensionen Submissivität und Aggressivität, weitere Dimensionen sind jedoch nicht von vornherein auszuschließen. Besonde- res Augenmerk muß der Konstruktion invertierter Items gelten. 226 Diese Einschätzung wird mittlerweile von zahlreichen einflußreichen Kollegen geteilt (vor allem John Duckitt, Jim Sidanius, Sam McFarland, William Stone, Thomas Pettigrew, Ulrich Wagner, Bernd Six). Derzeit laufen Abstimmungen mit John Duckitt aus Neuseeland, die voraussichtlich in der gemeinsamen Publikation einer dreidimensionalen Skala münden werden. · 309 Friedrich Funke ____________________________________________________________________________________________Diskussion 10.5. Einige theoretische Konsequenzen te. 10.5.1. Dialektik von Aggression und Submission Autoritäre Aggression und autoritäre Submission sind in der Metapher des Radfahrers, der nach oben buckelt und nach unten tritt, die sinngebenden Konstruk227 Beide stehen insofern in einem dialektischen Zusammenhang, als sie einerseits miteinander einhergehen, sich aber andererseits in einem kompensatorischen Verhältnis zueinander befinden, ja sich gar in bestimmten Situationen gegenseitig ausschließen.228 10.5.1.1. Notwendige definitorische Abgrenzung von Aggression und Aggressivität Es sei – vorübergehend – absichtsvoll ignoriert, daß »Aggression« von den Autoren der tap (auch) im psychoanalytischen Sinne intendiert war, mithin eine in der Kindheit verdrängte Aggression gegen den omnipotenten Vater. Autoritäre Aggression sei – und dies dürfte sich mit dem Sprachgebrauch der modernen Sozialpsychologie, Altemeyers Ansatz sowie schließlich der Alltagssprache decken – ein Verhalten, das auf das Verletzen Anderer abzielt bzw. dies zur Folge hat. Die Intention kann dabei ohne Konsequenz bleiben, gleichwohl muß der Verletzung jedoch die Intention vorangegangen sein, um von Aggression reden zu können (zur ausführlichen Begriffsdefinition vgl. Neumann, 2001, S.89 ff.). Aggression ist nicht notwendigerweise an eine bestimmte Form gebunden: sie ist nicht auf den engeren Sinn physischer Aggression begrenzt. Auch subtile Varianten wie verbales Herabwürdigen oder ein vorwurfsvoller Kommunikationsstil sind Aggressionen. Bedeutsam für die Definition von Aggression ist der Verweis auf das Handeln. Diese Betonung dient dem ausdrücklichen Abgrenzen gegenüber Aggressivität (aggressiveness). Somit ist Aggression (wie auch Submission) in einem engen Zeitrahmen zu verstehen. Aggressivität hingegen sei eine zeitlich überdauernde Entsprechung zu Aggression. Diese mag verstanden werden die Disposition, über die Zeit und über Situationen 227 Altemeyer (1998, S. 48) lobt diese Metapher und kritisiert sie gleichzeitig scherzhaft: »… the bicycle rider who bows from the waist up and kicks from the waist down […](if you overlook the fact that one does not kick at anything when pedalling a bicycle).« 228 Die schrumpfungskorrigierte Korrelation liegt bei etwa .80 (Tabelle 98, S.289). · 310 Friedrich Funke ____________________________________________________________________________________________Diskussion hinweg wahrscheinlicher mit Aggression zu reagieren. Diese »Kausalitätsrichtung« ordnet Aggressivität als Disposition den konkreten Aggressionen vor (Abb. a). Aggressivität (aggressiveness) Aggression (aggression) Disposition Aggressivität (aggressiveness) Aggression (aggression) Habitualisierung < a | b > Abbildung 72: Zusammenhang von Aggressivität und Aggression Gleichwohl mag Aggressivität auch umgekehrt als habitualisierte Aggression verstanden werden. In diesem Sinne führen häufige Aggressionen zur Aggressivität (Abbildung 72 b, vgl. auch Selbstwahrnehmungstheorie von Bem, 1972). Beide Sichtweisen lassen sich problemlos integrieren. Aggressivität (aggressiveness) Aggression (aggression) Disposition Habitualisierung Abbildung 73: Zusammenhang von Aggressivität und Aggression (integriert) Sinngemäßes gelte für die Unterscheidung von Submissivität und Submission. Letztere wäre die zeitlich begrenzte konkrete Handlung der Unterordnung (Nachgeben, Folge leisten), während Submissivität (submissiveness) die zeitlich überdauernde Disposition beschreiben soll, wahrscheinlicher mit Submission zu (re)agieren. Auch hier bleiben (in Analogie zu Abbildung 72 und Abbildung 73 auf Seite 311) beide Richtungen von »Ursache und Wirkung« gleichberechtigt nebeneinander bestehen. 10.5.1.2. Kurzfristiger und langfristiger Zusammenhang Der tiefere Sinn dieser scheinbar unnötig silbenstecherischen Unterscheidung wird im folgenden deutlich, wenn es um den Zusammenhang von Aggression und · 311 Friedrich Funke ____________________________________________________________________________________________Diskussion Submission sowie Aggressivität und Submissivität geht. Das Problem sei an einem Beispiel illustriert. In einer konkreten Situation mögen zwei Interaktionspartner in einem flachen Statusgefälle zueinander stehen, sodaß der Aufforderungscharakter der Situation gering ist und diese daher differentialpsychologischen Variablen mehr »Gestaltungsspielraum« läßt. Hier sind Submission und Aggression durchaus als zwei disjunkte Handlungsoptionen zu sehen. Sie sind entgegengesetzte Pole eine Kontinuums entlang der Hierarchie. Die meßtheoretische Konsequenz wäre eine negative [sic!] Korrelation – diese bleibt jedoch aus. Der scheinbare Widerspruch zum robusten Befund der positiven Korrelation von Submission und Aggression ließe sich durch die Einführung der definitorischen Abgrenzung zu Submissivität und Aggressivität auflösen: In einem längerfristigen Zeitrahmen über eine Vielzahl von Situationen hinweg ist es durchaus plausibel, daß Personen, die häufig aggressiv (re)agieren, auch häufiger als andere submissiv (re)agieren. Die entgegengesetzten Pole Aggression und Submission könnten in diesem Sinne als Abweichung vom Modus, der auf Verhandeln oder Mediation abzielt, verstanden werden. Diese mittlere Option setzt eine starke Ich-Beteiligung voraus, eine relative Autonomie der Entscheidungsfindung. Abweichungen sowohl in Richtung Aggression als auch Submission ist gemein, daß hier zuungunsten der Autonomie auf Fremdbestimmung größerer Wert gelegt wird. Die meßtheoretischen Konsequenzen seien hier kurz illustriert: Unterstellt man für konkrete Situationen eine Disjunktheit der Optionen, für eine Vielzahl unterschiedlicher Situationen hingegen ein typisches Abweichen im absoluten Betrag vom Mittelpunkt dieses bipolaren Kontinuums, dann wird augenscheinlich, daß diese betragsmäßig positiv miteinander korrelieren können. Dies ist im Rahmen der Autoritarismustheorien sowohl plausibel und theoriekonform als auch durch empirische Evidenz gedeckt. Die analytisch getrennten Subdimensionen der RWA³D (Submissivität und Aggressivität) korrelieren sehr hoch miteinander. In der klassischen Sichtweise der Ununterscheidbarkeit der Subdimensionen bilden alle Items ohnehin ein eindimensionales konsistentes Maß, was implizit eine hohe Korrelation unterstellt. 10.5.1.3. Kombination von Submissivität und Aggressivität in einem Item Es wurde wiederholt das zentrale Problem der sogenannten double-barreled Items angesprochen. Angesichts des Gesagten wäre es besonders problematisch, wenn es · 312 Friedrich Funke ____________________________________________________________________________________________Diskussion eine Vielzahl von Items gäbe, die sowohl Verweise auf Unterwürfigkeit (submissiveness) als auch auf Aggressionsbereitschaft (aggressiveness) in sich tragen. Diese Items sind jedoch schwach vertreten. Das annähernde Fehlen von AS-Items bestätigt implizit die (psycho)logische Ausschließlichkeit von Aggression und Submission in einer konkreten Situation zweier Interaktionspartner. Das typisch Autoritäre ist wohl die Unterordnung um der Aggression willen. Denkt man sich einen dritten Interaktionspartner, so läßt sich diese Dialektik leicht veranschaulichen. Der oder die Autoritäre unterwirft sich bereitwillig unter eine Autorität, die (Stellvertreter-)Gewalt gegen Dritte ausübt, dazu aufruft oder auch nur außer Strafe stellt. Während in Item 7 der RWA96 die drei Subdimensionen nebeneinander (und zeitlich nacheinander) gestellt sind, illustriert Item 32 die Dynamik des funktionalen Sich-Unterordnens, um Aggressionen gegen Dritte in die (gedachte) Tat umzusetzen. p_asc_7 Unser Land stünde gut da, wenn wir die Traditionen unserer Vorväter ehren, > Konventionalismus auf die führenden Köpfe hören > Submission und uns all der »faulen Äpfel« entledigen würden, > Aggression die alles verderben. p_asc_32 Wenn unser Staat eines Tages »grünes Licht gibt«, > Sanktionierung ist es die Pflicht eines jeden patriotischen Bürgers, > Submission den Verfall ausmerzen zu helfen, > Aggression der unser Land von innen her vergiftet. 10.5.1.4. Zwei Paradoxa – aggressive Unterordnung und Unterwerfung unter Aggressive Unterordnung und Aggressivität stehen in einem dialektischen Verhältnis zueinander. Einerseits findet man sie gemeinsam auftretend in der klassischen Beschreibung der autoritären Persönlichkeit. Zum anderen scheinen sie sich gegenseitig logisch auszuschließen, scheinen in kompensatorischem Verhältnis zueinander zu stehen. Zwei weitere scheinbar paradoxe Bemerkungen mögen letztendlich die Beziehung zwischen beiden Konstrukten aufklaren: Die »submissiven« Items tangieren insofern ihren vermeintlichen Widerpart, als ihre Befürworter Unterordnung nicht nur gutheißen, sondern vor allem auch von anderen einfordern. Sobald die Gelegenheit dazu besteht, wird die Unterordnung zur unumstößlichen Norm erhoben und · 313 Friedrich Funke ____________________________________________________________________________________________Diskussion von Anderen radikal verlangt. Mithin hat die autoritäre Unterordnung eine sehr aggressive Seite. Ähnliches läßt sich von der autoritären Aggressivität sagen. Sie ist bei Altemeyer definiert als »… a general aggressiveness, directed against various persons, that is perceived to be sanctioned by established authorities.«. Hier impliziert die Aggressivität demnach eine Unterordnung unter Autoritäten. Die aggressiven Handlungen müssen gar nicht selbst vollzogen werden. Viel wahrscheinlicher ist ein schutzsuchendes Unterordnen unter die aggressiven Autoritäten, von denen erwartet wird, daß sie »Recht und Ordnung« aufrecht erhalten (Stellvertretergewalt). Diese Bemerkungen sollen veranschaulichen, welches Spannungsfeld aus psychologischer Sicht zwischen den Subdimensionen von Autoritarismus besteht. Die analytische Unterscheidbarkeit steht daher selbst bei optimaler Operationalisierung vor natürlichen Schranken. 10.5.2. Dialektik von Submission und Konventionalismus Ähnliches läßt sich auch für den Zusammenhang von Submission und Konventionalismus sagen. Der Grund für die relativ hohe Korrelation dieser Subdimensionen ist hier jedoch ein anderer.229 Konventionalismus war zur Zeit der Begriffsstiftung das rigide Festhalten and den Normen der Zeit, namentlich an den kleinbürgerlichen Werten des Wilhelminischen und Weimarer Deutschland. Mit dem Fortschreiten der Zeit wurden dieses Festhalten an ehemals zeitgenössischen Normen mit jedem Jahrzehnt mehr zu Konservatismus. Beide Konstrukte sind damit ungeachtet verschiedener Ausgangspunkte immer mehr konvergiert. Dies erklärt zum Teil die dahingehende Kritik (vgl. die von John J. Ray immer wieder entfachte Debatte: Ray, 1979b; 1984b; 1990b; 1998; Ray & Furnham, 1984; Ray & Heaven, 1984; Meloen & de Witte, 1998). Strukturell betrachtet wäre Konventionalismus, wenn er als verschieden von Konservatismus definiert werden soll, die Tendenz zu außengeleiteter Konformität. Konventionalismus ist daher eng mit Submissivität verwandt, was sofort deutlich 229 Die schrumpfungskorrigierte Korrelation liegt bei etwa .85 (Tabelle 98, S.289). · 314 Friedrich Funke ____________________________________________________________________________________________Diskussion wird, wenn man ihn als Unterordnung interpretiert, als Unterordnung unter eine soziale Norm. 10.5.3. Dialektik von Aggression und Konventionalismus Das Wesen der Beziehung zwischen Aggression und Konventionalismus liegt weniger auf der Hand als bei den Beispielen zuvor. Beide Konstrukte sind auch weniger stark miteinander assoziiert.230 Interessanterweise klingt die Nahstelle bereits in der Definition durch die Autoren der tap an (Adorno et al., 1950, S.228, vgl. auch Tabelle 1, S.34): Autoritäre Aggression ist demnach die »Tendenz, nach Menschen Ausschau zu halten, die konventionelle Werte mißachten, um sie verurteilen, ablehnen und bestrafen zu können.«. Das hervorhebenswerte ist hier der explizite Bezug auf Konventionalismus in der Definition von Aggression. Es sei schließlich ferner an eine Antwort erinnert, die auf die Frage nach Wesen und Natur des Zusammenhängens der drei Subdimensionen bereits andernorts gegeben wurde: John Duckitt (1989; 1992c) begründete die Kovariation der drei Komponenten mit der dahinterliegenden Forderung nach Gruppenzusammenhalt (cohesion). Auf diese Weise gelingt Duckitt das Umdeuten der drei Subdimensionen: Je stärker sich Personen mit ihrer Gruppe identifizieren, umsomehr betonen sie die Forderung nach Einigkeit und Einhaltung der Normen (Konventionalismus), umsomehr ordnen sie sich ihren Führern unter und fordern die Unterordnung der Einzelinteressen unter die Gruppeninteressen (Submission). Schließlich werden sie auch Abweichler von der Gruppennorm stärker bestrafen oder es gern sehen, wenn sie durch Autoritäten betraft werden. 10.5.4. Dialektik von Autoritarismus, Sozialer Dominanzorientierung und Diskriminierung In den letzten zehn Jahren hat sich das Konzept der Social Dominance Orientation als ernstzunehmendes Alternativkonzept neben der Autoritarismusforschung etab230 Die schrumpfungskorrigierte Korrelation liegt bei etwa .60 (Tabelle 98, S.289). · 315 Friedrich Funke ____________________________________________________________________________________________Diskussion liert. John Duckitt (2000, S.91 ff.) spricht gar gegenüberstellend von »Altemeyer's authoritarian« und – nun die SDO meinend – »a second authoritarian«.231 Felicia Pratto und Jim Sidanius (Pratto et al., 1994; Sidanius & Pratto, 1999; Sidanius et al., 2001) erklären in ihrem gesellschaftskritischen Ansatz, daß Gesellschaften die Gruppenkonflikte232 zu minimieren suchen, indem sie konsensuale Ideologien und Legitimationsmythen unterstützen, die Ungleichwertigkeit und Diskriminierung aufrechterhalten. Diese neomarxistische Gesellschaftsanalyse mündet jedoch in der individualisierten Persönlichkeitsdimension der SDO. Es konnte in den letzten Jahren beständig gezeigt werden, daß SDO in ähnlichen soziopolitischen Bereichen Erklärungskraft aufweist, in denen bislang Autoritarismus das Hausrecht allein ausgeübt hat. Gleichzeitig wird durch die Autoren fortwährend Verwunderung darüber zum Ausdruck gebracht, daß SDO und RWA nicht sehr hoch miteinander korrelieren (Altemeyer, 1998; McFarland & Adelson, 1996; McFarland, 1998; Six et al., 2001; Whitley & Lee, 2000; Heaven & Bucci, 2001).233 John Duckitt (2000) stellt Autoritarismus und Soziale Dominanzorientierung in einen metatheoretischen Rahmen von Kultur, Sozialisation, Persönlichkeit, Weltsicht und Motivation. Seine Idee hierarchischer Ebenen und sich überschneidender Sphären lädt zum Vergleich mit dem Jenaer sozialkonstruktionistischen Modell der Wirklichkeitskonstruktion ein (vgl. »Deuteblume« bei Frindte, 1998; 1999; Frindte & Funke, 1995). Duckitt leitet hier die sozialen Einstellungen SDO und Autoritarismus aus proximalen Erklärungsfaktoren (z.B. motivationale Ziele) bis hin zu distalen Hintergründen (Kultur) ab. Dazwischen liegen verschiedene Mediatoren. Neben der von Duckitt als kausal unterstellten vermeintlich linearen Beziehung werden auch Rück- und Wechselwirkungen eingeräumt. 231 Auf zwei mal über tausend Seiten des 1989er Handbuchs der Sozialpsychologie (Gilbert, Fiske & Lindzey, 1998) sucht man indes einen Eintrag über Social Dominance Orientation vergebens. 232 Klassengegensätze 233 Zum Zusammenhang von Sozialer Dominanzorientierung und Autoritarismus können hier keine eigenen Daten vorgelegt werden. Indes sind aber einige Arbeiten in dieser Richtung in Vorbereitung, die hier empirische Befunde liefern verwerden (Müller, 2001; Kämpfe, 2002; Zachariae, 2002). · 316 Friedrich Funke ____________________________________________________________________________________________Diskussion Autoritarismus Soziale Dominanzorientierung Soziale Einstellung Motivationales Ziel Weltsicht Persönlichkeit Sozialisation Kultur kollektivistisch vs individualistisch Hierarchie/ Machtdistanz vs Egalität/ Soziale (Für)Sorge Î Î strafsüchtig vs nachsichtig lieblos vs herzlich Î Î Konformität vs Autonomie starrsinnig vs aufgeklärt Î Î bedrohlich vs sicher kompetetiv vs kooperativ Î (Dschungel) Î (Harmonie) Macht Altruismus Kontrolle vs Autonomie vs Î Dominanz Î Selbstlosigkeit Autoritarismus vs Autonomie Social vs Egalitarismus Dominance Humanismus Î Î Tabelle 108: Psychokulturelle Dimensionen hinter SDO und RWA (adaptiert nach Duckitt, 2000) Dieses Schema bietet die Chance, Theorien »mittlerer Reichweite« und Forschungslinien der Autoritarismusforschung einzuordnen und aufeinander zu beziehen. · 317 Friedrich Funke ____________________________________________________________________________________________Diskussion Das Konzept der Sozialen Dominanzorientierung ist aus verschiedenen Gründen erfolgversprechend. Attraktiv ist vor allem der gesellschaftskritische Anspruch und die potentiell große Theoriereichweite. Demgegenüber steht die recht simple Erfassung der SDO mit eindimensional konzipierten Kurzskalen. Hier besteht die Gefahr, daß der Gesellschaftsbezug verlorengeht und das Konstrukt zum Persönlichkeitstrait verkümmert. Die große Chance besteht in der gleichzeitigen Betrachtung der Sozialen Dominanzorientierung (ggf. mit zwei Dimensionen) als Brücke zwischen der persönlichkeitstheoretischen Autoritarismusforschung und der sozialpsychologischen Selbstkategorisierungstheorie (Turner & Oakes, 1989; Reynolds et al., 2001). Die derzeit berichteten Nullkorrelationen von SDO und RWA verschleiern möglicherweise eine komplexere Zusammenhangsstruktur, wenn zur Analyse die Subdimensionen zugrundegelegt werden. Dieses Assoziationsmuster dürfte in Abhängigkeit vom Erklärungszusammenhang ebenso variieren wie auch in Abhängigkeit von der jeweils salienten Selbstkategorisierungsebene. Vor dem Hintergrund dieser Argumente wird deutlich, daß es neben der empirischen Suche in (quasi)- experimentellen Designs vor allem der theoretischen Klarheit bedarf. 10.5.5. Dialektik Situation – Person Das Gros der vorgelegten Arbeit widerspricht scheinbar ihrem eigenen theoretischen Ehrgeiz, Autoritarismus als sozialpsychologisches Phänomen zu sehen, das nicht »in« der Person residiert – etwa als Trait –, sondern zwischen Personen in ganz bestimmten Situationen zur Geltung kommt. Dieser Makel erklärt sich jedoch aus der ausdrücklichen und absichtsvoll konservativen Selbstbeschränkung auf die derzeitige Forschungspraxis. Die feinere Aufgliederung des persönlichkeitspsychologischen Konstrukts »Autoritarismus« ist nicht das angestrebte Ziel, sondern nur ein letzter für notwendig erachteter Schritt. Sobald ein mehrdimensionales Maß zur Verfügung steht, muß die Integration mit den relevanten sozialpsychologischen Ansätzen erfolgen. Die radikalen Formen sowohl der Sozialpsychologie als auch der Persönlichkeitspsychologie sind in ihrem Reduktionismus nicht in der Lage, die Dialektik zwischen Individuum, sozialen Gruppen und Situationen angemessen zu beschreiben. Hier ist ein Forschungsfeld für die noch nicht geborene differentielle Sozialpsychologie. · 318 Friedrich Funke ____________________________________________________________________________________________Diskussion 10.6. Offene Enden 10.6.1. Weitere Forschungsperspektiven aufgrund der Ergebnisse Es konnte in der vorliegenden Arbeit theoretisch gezeigt und empirisch untermauert werden, daß die dreidimensionale Operationalisierung in zwei Richtungen diskriminant valide ist. Einerseits unterscheiden sich die Dimensionen untereinander in ihrer Erklärungskraft, andererseits variiert die relative Bedeutung dieser oder jener Dimension in Abhängigkeit vom zu Erklärenden. Weitere Erkenntnis ist zu erwarten, wenn komplexere Designs zur Anwendung kommen. Besondere Bedeutung haben hier Meßwiederholungsansätze. Es wäre eine zu prüfende Hypothese, ob sich die einzelnen Dimensionen in ihrer »Stabilität« über die Zeit unterscheiden. Der theoretische und methodische Rahmen der La- tent-State-Trait-Theorie bietet hier sowohl definitorische Begrifflichkeit als auch modelltechnisches Instrumentarium (Steyer et al., 1992b; Schmitt & Steyer, 1993; Eid, Notz, Steyer & Schwenkmezger, 1994; Eid, 1995; Steyer, Schmitt & Eid, 1999). Insbesondere die Veränderungsmodelle könnten hier zur Anwendung kommen (true intraindividual change, TIC, Steyer et al., 1997). Die mehr oder weniger starke Veränderung der Autoritarismusdimensionen über die Zeit hinweg stellt dabei einen Untersuchungsgegenstand in eigenem Recht dar. Noch interessanter werden die Ergebnisse, wenn die latente Veränderung durch Drittvariablen erklärt wird. Vor diesem Hintergrund sind auch experimentelle Designs denkbar. Gerade die systematische Verknüpfung von Fragebogenmethodik mit experimentellen Ansätzen kann nähere Einsicht in die Frage nach der Bedeutsamkeit situationaler vs personaler Faktoren bringen. Solche Ansätze fehlen bislang völlig in der Forschungsliteratur zum Autoritarismus, also auch schon auf der Basis globaler, eindimensionaler Maße wie der RWA. Die dreidimensionale Operationalisierung bietet hier zusätzlichen Mehrwert. 10.6.2. Weitere Forschungsperspektiven jenseits der Ergebnisse Im Rahmen der Autoritarismusforschung gibt es eine Reihe von Fragen, die durch die vorgelegte Arbeit nicht annähernd beantwortet werden. Nach wie vor ist die Genese von Autoritarismus von großem Interesse, weil hier der Schlüssel zur »Bekämpfung« und zur Prävention vermutet wird. Dieser Denkweise · 319 Friedrich Funke ____________________________________________________________________________________________Diskussion liegt jedoch die implizite Annahme zugrunde, es handelte sich bei Autoritarismus um ein stabiles Persönlichkeitsmerkmal, einer Krankheit gleich. Ich halte eine Verschiebung des Fokus' von der Person auf die Interaktion mit situationalen Faktoren für fruchtbar; infolgedessen wird aus der Frage nach der Ursache die Frage nach der psychischen Funktion dessen, was wir als Autoritarismus bezeichnen. Eine Integration mit qualitativen Forschungsmethoden ist hier wünschenswert und meiner Ansicht nach unabdingbar. Eine zweite erfolgversprechende Forschungslinie ist in kulturvergleichenden Ansätzen zu sehen (z.B. Pentony et al., 2000; Feldman & Watts, 2000, Duckitt in Vorbereitung lt. pers. Komm.). Das besondere erkenntnisbringende Potential entfaltet diese Sichtweise, wenn über den (Mittelwerts-)Vergleich der Ausprägung hinausgegangen wird. Sorgfältige kulturvergleichende Studien beziehen per definitionem den soziokulturellen Hintergrund mit in die Analyse ein, wodurch auch die gesellschaftliche Bedingtheit scheinbar individueller Konstruktionen deutlich wird. Defizitär sind nach wie vor Studien, die auf quotierten Zufallsstichproben basieren, von denen auf die erwachsene »Normalbevölkerung« generalisiert werden könnte. Spätestens nach Etablierung einer neuen mehrdimensionalen Skala sollten hier Studien auf dieser Datenbasis folgen. Autoritarismus wird in aller Regel als unipolares Konstrukt aufgefaßt; die niedrige Ausprägung wird nicht näher hinterfragt. Hier ist theoretische Arbeit vonnöten, um den Gegenpol definitorisch klarer bestimmen zu können (Liberalismus? Autonomie? Anarchie?). Daraus folgen unter anderem methodische Konsequenzen, da bei der Skalenkonstruktion immer auch invertierte Items formuliert werden müssen. Ein zentrales Problem sei hier schließlich erwähnt, für das stetige Aufmerksamkeit dringend angemahnt ist: Die Autoritarismusforschung ist Anfang des letzten Jahrhunderts angetreten, um die Anziehungskraft rechter Parteien und autoritärer Strukturen auf potentielle Anhänger und – im wahrsten Sinne des Wortes »Gefolgsleute « – zu untersuchen und zu verstehen. Im Laufe der Entwicklung der Forschung hat letztere jedoch ein Eigenleben entwickelt, aus dem sie ihre Daseinsberechtigung ableitet. Es wäre fatal, wenn ignoriert würde, daß auch der Forschungsgegenstand selbst einer Evolution unterliegt. Es ist plausibel, aber keineswegs zwingend, daß diese implizite Grundannahme auf alle Zeit gültig ist. · 320 Friedrich Funke ____________________________________________________________________________________________Diskussion Konkret verlangt mein skeptischer Einwand das ständige Hinterfragen, welcher Natur die gefährlichsten Parteien in einer Gesellschaft sind. Diese nicht triviale Frage ist innerhalb enger Disziplingrenzen nicht beantwortbar, vielmehr bedarf es hier auch eines politikwissenschaftlichen und soziologischen Blicks. Bei klassisch rechtsextremen Parteien wie etwa der Nationaldemokratischen Partei Deutschlands NPD gibt es wenig Veranlassung, von dem gewohnten Rationale abzuweichen: Hier ist es sehr wahrscheinlich, daß Hochautoritäre zu den Anhängern gehören und daß umgekehrt unter den Anhängern die Hochautoritären überwiegen. Bei postmodernen populistischen Parteien ist die Lage wesentlich komplizierter. Dies gilt bspw. für die Freiheitliche Partei Österrreichs FPÖ, aber auch für Teile der FDP234, und als geradezu schillerndes Beispiel sei hier die niederländische Lijst Pim Fortuyn235 genannt. Der ermordete Rotterdamer Soziologieprofessor Fortuyn (»Ik zeg wat ik denk en ik doe wat ik zek!«) war auf geradezu verstörende Weise das Gegenteil der klassischen rechten Führerpersönlichkeiten. In seinem Stab versammelte er mehrere Politiker, die ihre ethnischen Wurzeln nicht in der Niederlande haben, etwa den von den Kapverden stammenden Vizechef der LPF João Varela. Diese Personalpolitik verschaffte Fortuyn die Chance, den »guten Ausländer« zu präsentieren, sich symbolisch gegen den Vorwurf des dumpfen Blut-und-Erde- Rassismus zu immunisieren. Der »eine Fremde« ist auf diese Weise gegen den »anderen Fremden« zu kontrastieren – dieses argumentatorische Muster wird in der neuen Rechten zur Ideologie bzw. zum Ideologiesubstitut. Wir haben es mit einem schwer zu durchschauenden postmodernen Ideologiemix zu tun, der klassische Ideologeme aufgreift und durch zeit(geist)gemäße Gemeinplätze rehabilitiert.236 234 »Der gemeinsame Nenner der Europaweiten Wahlergebnisse ist weder ein Rechtstrend noch ein Linkstrend, sondern die Emanzipation der Demokraten.« Jürgen W. Möllemann (FDP): Neues Deutschland, 27.05.2002. Jörg Haider erwiderte darauf, es sei »beachtlich, wenn ein langjähriger Funktionär der FDP, die zu den zähesten Verteidigern des Systems gehört hat und nur Mehrheitsbeschaffer war, nun anerkennt, dass die Emanzipation der Demokraten notwendig ist. Dafür ist ihm zu gratulieren.« (Der Tagesspiegel, 28.05.2002). 235 http://www.lijst-pimfortuyn.nl/ 236 Vor diesem Hintergrund ist auch das bayrische Junktim zwischen Laptop und Lederhose zu verstehen, das einerseits eine hemmungslose Modernisierung propagiert und andererseits aktiv durch völkische Romantisierung zurückrudert. · 321 Friedrich Funke ____________________________________________________________________________________________Diskussion Ein weiteres Zeugnis für das Neue an Pim Fortuyns Strategie war sein aktives Bekenntnis zu seiner Homosexualität.237 So konnte er das klassische rechte Vorurteil gegen Homosexuelle im Allgemeinen und Schwule im Speziellen postmodern wenden und zu einem Argument gegen Islamisten verkehren, die in ihrer Intoleranz sich gegen Homosexualität richten und damit die (niederländische) Kultur bedrohen.238 Zu den Folgen dieser Entbindung der Parteiprogrammatik von traditionellen Ideologien und der gleichzeitigen Mischung mit postmodernem Zeitgeist dürfte freilich eine Verschiebung in der Klientel derartiger Parteien gehören. Dies hätte letztlich auch Konsequenzen für die Autoritarismusforschung. Zugespitzt: die Frage nach dem Autoritarismus und dem Autoritären des 21. Jahrhundert ist wichtig und richtig; gleichwohl muß im Auge behalten werden, ob das Konstrukt Autoritarismus – in seiner jetzigen Form – in neoliberalen, hochindividualistischen Gesellschaften überhaupt seine Relevanz behält. Es ist eine Frage. Keine Antwort. 237 Er nannte sich zuweilen »Ethiker des Darkroom«. »Ethicus in een darkroom. Manifest homo en toch zoveel feminiener dan alle vrouwen in het kabinet.« (http://www.professorpim.nl/biografie.html) 238 Wesentlich weniger geschickt versucht auch der Bundesvorsitzende der Partei Rechtstaatliche Offensive, Ronald Barnabas Schill, seine Argumentation quer zu klassischen rechten Klischees zu führen. Auf einer Wahlkampfveranstaltung (Jena, 23. August 2002) nannte er »seine« Partei »sehr ausländerfreundlich «. Er habe nichts gegen Ausländer, die sich integrieren lassen. Man beachte den transitiven Gebrauch des Verbs. · 322 11. Methodenkritik »Though this be madness, yet there is method in't.« (William Shakespeare, 1601 – Hamlet) 11.1. Skalenqualität Die vorgelegte Arbeit verfolgt ein theoretisches Ziel. Das Problem wurde aus der Theorie abgeleitet, der Lösungsansatz wird schrittweise entwickelt, um die Konsequenzen für die Autoritarismustheorie zu diskutieren. Allein der empirische Weg zur Illustration der Stichhaltigkeit der Argumente fußt auf der Verwendung einer Skalenneuentwicklung. Die RWA³D soll zum derzeitigen Zeitpunkt nicht als international eingesetztes Instrument etabliert werden, obgleich hier große Nachfrage besteht (John Duckitt und Sam McFarland, persönliche Kommunikation, Juli 2002). Mit John Duckitt wurde eine dahingehende Kooperation vereinbart. Die Lehren der vorliegenden Skalenanalysen müssen hier in die Konstruktion eingehen. Besonders problematisch ist die stark asymmetrische Verteilung einiger Itemantworten (vgl. ausführlich S.346ff.). Durch die (Sub)Kultur- und Zeitgeistabhängigkeit kann dies sich auch sehr schnell ändern (Bsp. voreheliche Abstinenz Friedrich Funke ________________________________________________________________________________________Methodenkritik in den USA, gleichgeschlechtliche Lebensgemeinschaften in Deutschland). Daher bedürfen die Items der ständigen Revision, ohne daß dabei das Wesen des Kon- strukts zu verändert werden darf.239 Die an anderer Stelle beschriebenen psychometrischen Mängel einzelner Items der RWA³D beeinträchtigen jedoch nicht entscheidend die Qualität der Skala. Sie ist ein valides Instrument für die beschriebenen wissenschaftlichen Fragestellungen; zur Diagnostik ist sie weder konstruiert worden noch ist sie dafür geeignet. Das persönlichkeitsdiagostische Ziel wird in interaktionistischen Ansätzen ohnehin ob- solet. 11.2. Stichprobenproblematik Ein großer Teil der Erkenntnisse psychologischer Forschung basiert auf einer Datenbasis, die alles andere als repräsentativ für die Menschheit ist. Selbst die Einschränkung auf westliche Kulturen ist bei weitem nicht ausreichend. David O. Sears spitzte im JPSP das Problem derart zu, daß die meisten Studien auf Laboruntersuchungen mit weißen US-amerikanischen Psychologiestudenten des zweiten Studienjahres (sog. »sophomores«) basieren (Sears, 1986)240. Dies hat zur Folge, daß in den letzten vier Jahrzehnten von Spätadoleszenten abstrahiert wurde, die sich in ihrem Erwachsenwerden durch eine Reihe von Charakteristika abheben: a) ihre Identität ist labil und kaum »ausformuliert«, b) ihre sozialen und politischen Einstellungen sind wenig kristallisiert, c) sie sind egozentrischer als in anderen Lebensabschnitten, d) sie sind sehr feldabhängig von gleichaltrigen Bezugspersonen, wobei diese sozialen Netze eher instabil sind, e) sie sind überdurchschnittlich intelligent, f) sie sind sozial angepaßt, um nur einige Besonderheiten zu nennen. Es ist unwahrscheinlich, daß diese Besonderheiten der Studentenstichproben keinen Einfluß auf die Validität und Rele- vanz der Ergebnisse und Schlüsse haben. 239 Christopher Cohrs hat hier wertvolle Vorschläge zur Modifikation der Items der RWA³D unterbreitet. 240 So fußten 1980 85% der JPSP-Studien auf amerikanischen »undergraduates«, 56% auf Psychologiestu- diengängen. · 324 Friedrich Funke ________________________________________________________________________________________Methodenkritik Sinngemäßes muß über die Autoritarismusforschung gesagt werden. Meloen (1993) spricht auf der Basis eigener Metaanalysen von 69% studentischen Stichproben, was sogar noch vorsichtig geschätzt sein mag. Die Gefahr für die Verallgemeinerbarkeit der Ergebnisse ergibt sich nicht nur aus der liberalen Gesinnung vor allem der Studierenden humanistischer Wissenschaftsdisziplinen. Die Folge daraus ist lediglich ein verringerter Mittelwert. Kritischer ist die Homogenität studentischer Stichproben hinsichtlich hier relevanter Eigenschaften. Aufgrund dieses Spannweitenproblems (restriction-of-range-effect) werden die Korrelationen mit Außenkriterien vermindert. Die weit größte Mißbilligung der Qualität meiner Datenbasis erwarte ich hinsichtlich der Internetstudien. Die Hauptkritikpunkte sind 1. Internetstichproben sind nicht repräsentativ 2. Internetstichproben sind selbstselegierend 3. Die psychischen Prozesse beim Ausfüllen eines Internetfragebogens sind weitgehend ungeklärt. Der erste Punkt ist eine Fundamentalkritik, die jedoch aus meiner Sicht am einfachsten zu entkräften ist. Die Entkräftung besteht daher nicht im Abstreiten, vielmehr im qualifizierten Zustimmen zu dieser Trivialität. Wenn dieses »Argument « ins Feld geführt wird, ist das meist ein scheinrationaler Einwand, der ignoriert, daß der Verweis auf Repräsentativität immer die Bezeichnung des zu Repräsentierenden zwingend voraussetzt. Dies ist hier mühelos leistbar: die Grundgesamtheit, aus der meine Teilnehmenden stammen, ist nicht die erwachsene Gesamtbevölkerung Deutschlands, sondern sind politisch interessierte Nutzer des Internets (Selbstselektion). Damit unterscheiden sich die Probleme dieser Stichproben formal kaum von Problemen mit Studentenstichproben. Die Grundgesamtheit der Internetnutzer ist mittlerweile auch nicht mehr schlecht definiert. In den letzten Jahren hat erstens eine Normalisierung der Internetnutzung stattgefunden, die die Grenzen zwischen Nutzer und Nichtnutzer immer mehr schwinden läßt. Gleichzeitig sind die verbleibenden Spezifika mittlerweile gut untersucht und bekannt.241 241 Vgl. z.B. http://www.br-online.de/br-intern/medienforschung/md_mm/online2001_01.pdf, Verweigereratlas: http://www.emnid.tnsofres.com/presse/Verweigereratlas.pdf, Steigender Frauenanteil: http://www.wuv-studien.de/wuv/studien/032001/233/704.htm · 325 Friedrich Funke ________________________________________________________________________________________Methodenkritik Die Selbstselektion bleibt ein Problem. Sie geschieht auf mehreren Ebenen: Schon das Finden des Fragebogens setzt ein bestimmtes proaktives Nutzerverhalten und eine gewisse Medienkompetenz voraus. Die angesprochene Medienkompetenz ist auch während des Ausfüllens vonnöten (»Wo muß ich denn jetzt hier klicken?!«). Die nächste Hürde besteht in der Bereitschaft, den Fragebogen zu beginnen. Hier kann man mit Anreizen, sogenannten incentives arbeiten 242 , der beste Anreiz scheint in meinen Augen jedoch in der guten technischen Qualität (Webdesign, Speicherung, sparsame Programmierung) und vor allem in der Auswahl des Themas zu liegen. Wenn die potentiellen Untersuchungsteilnehmer den Eindruck gewinnen, daß sie die Studie interessiert, dann ist ihre intrinsische Motivation groß genug, zu beginnen und bis zum Ende dabeizubleiben. Diese nötige Motivation führt in meinen Augen möglicherweise zwar zu einer Verkleinerung der Stichprobe, jedoch sogar zu einer Erhöhung der Datenqualität (Validität) der verbleibenden Daten. Eine letzte Hürde besteht im nötigen Zeitaufwand, den die Teilnehmer als fast einseitige Leistung erbringen. Diese Zeit ist zudem häufig Online-Zeit, die dadurch in vielen Fällen auch finanzielle Kosten entstehen läßt243. Dem dritten Kritikpunkt (»Die psychischen Prozesse beim Ausfüllen eines Internetfragebogens sind ungeklärt.«) ist uneingeschränkt zuzustimmen, jedoch mache ich diese Kritik auch für klassische Formen der Befragung geltend: Wir haben es in der Sozialforschung fast nie mit einer auch nur annähernd fehlerfreien Messung zu tun. Die Erhebung findet immer in einem sozialen Raum statt und ist damit nie ein »Erfassen« eines objektiv Gegebenen. Gegeben [sic!] ist es nur in dem prozeßhaften Sinn, daß die Befragten etwas »von sich geben«, wobei sie uns das geben, was sie uns geben wollen. Selbstpräsentation, Attributionsprozesse, implizite Theorien sind dabei nur einige Stichworte für diesen aktiven Konstruktionsprozeß. Letztlich lassen sich die Befragten auf einen Dialog ein, auf ein Sprachspiel, bei dem wir nie vergessen dürfen, daß wir integraler Teil davon sind. 242 Vgl. dazu http://www.adm-ev.de/pdf/R_08D.PDF, http://www.gor.de/tband99/pdfs/a_h/frick_ad.pdf. 243 Dies läßt sich minimieren indem man den Fragebogen so gestaltet, daß er nur geladen werden muß und die Verbindung erst beim Absenden/Speichern der Daten wieder aufgebaut wird. Das verbietet dann jedoch einige Formen wie etwa die Einzeldarbietung von Fragen oder gar adaptive Varianten der Befragung. · 326 Friedrich Funke ________________________________________________________________________________________Methodenkritik Es bleibt zusammenfassend zu sagen, daß einige Einwände gegen Internetstich- proben zweifellos berechtigt sind. Die Konsequenz ist jedoch meiner Meinung nach nicht vernichtend, sondern sie birgt die Chance, mit geschärftem Blick psy- chologische Forschung im Allgemeinen – auch die klassische – kritisch zu hinter- fragen. Die Begrenztheit ist einzuräumen und deutlich auszusprechen, innerhalb dieser Grenzen jedoch ist eine durchaus hohe Datenqualität zu erreichen. Gleich- wohl ist es wünschenswert, die gefundenen Ergebnisse auch in lege artis gezogenen Verhältnisstichproben aus der Gesamtbevölkerung zu replizieren. 11.3. Politischer Anspruch und szientistische Ohnmacht Zuweilen erfüllen methoden(selbst)kritische Bemerkungen die Alibifunktion, das eigene Tun gegen ebendiese Kritik zu immunisieren. Dies ist ebenso üblich wie absurd. Einige Tatsachen gilt es daher einzugestehen und die eigene Begrenztheit als Mahnung aufzufassen. Die Autoritarismusforschung ist in ihrem Gegenstand zu wichtig, als daß man sich mit eitlen Diskussionen über Randprobleme aufhalten dürfte. Hier ist eine paradigmen- oder schulengeleitete Selbstbeschränkung in höchstem Maße hinderlich. Vielmehr geht es um inhaltsgeleitetes und mithin interdisziplinäres Herangehen von Sozial- und Politikwissenschaften, Sozialphilosophie, Politischer Ökonomie, Pädagogik und schließlich auch Psychologie. Was wir für wissenschaftliches Wissen halten, ist jedoch ein Nebenprodukt sozialer Prozesse (Mannheim, 1925; Fleck, 1935). Zu den empiristischen Konventionen gehört, daß die Wissenschaftler eine leidenschaftslose Distanz zwischen sich und dem Gegenstand aufbauen und wahren. Die Bekleidungsordnung für diese Art des Forschens ist der Deckmantel der Wertneutralität. Ich halte dies insbesondere in der kritischen Sozialpsychologie für geradezu absurd. Ken Gergen (2002) beschreibt die in der empirischen Psychologie übliche Auffassung, man könne am zuverlässigsten zu Wissen gelangen, in dem man Bedingungen manipuliert und die Reaktionen der Menschen untersucht: »Würden wir gern mit anderen Menschen zusammenleben, die so denken?« (Gergen, 2002; S. 119). Felicia Pratto (2002) nutzt für ihre Argumentation eine ganz ähnliche rhetorische Figur, die die künstliche groteske Gegenüberstellung von Wissenschaftlern und ih- ren »Untersuchungsobjekten« thematisiert: · 327 Friedrich Funke ________________________________________________________________________________________Methodenkritik Many of our theories have implicit propositions such as: Proposition 1: Human behavior is influenced by its historical context. Proposition 2: Human behavior is influenced by its political context. Proposition 3: Human behavior is influenced by the point of view of the actor. If we then accept a fourth, more general proposition: Proposition 4: Social psychologists are humans. Then we must conclude that social psychologists are influendced by historical context, political context, and their own viewpoints. What prevents some of us concluding this? (Pratto, 2002, S. 194). Es wird deutlich, daß das wissenschaftliche Tun abhängig ist vom sozialen und politischen Kontext. Das gilt jedoch nicht nur für den Prozeß des Auswertens und Interpretierens, sondern ist schon bei der Wahl des Themas bestimmend: Es sind auch biographische Gründe die einen veranlassen, »Autoritarismus« zu untersuchen. Aus dieser Erkenntnis heraus muß man sich immer dessen bewußt sein, daß diese Forschung einen Zweck verfolgt, der außerhalb der Wissenschaft liegt. Daraus leitet sich die Forderung ab, die Konsequenzen aus dem Forschungsprozeß in die Sprache potentieller Anwender zu übersetzen. Naturgemäß liegt dieses Übersetzen nicht im »Aufgabenbereich« einer Qualifikationsarbeit; ich halte dies für eine zentrale ethische Verpflichtung, die jenseits der Dissertationsschrift überdau- ert.244 »Gramsci told me what, Simmel how, and Janina what for […]« »[…] sociologizing makes sense only in as far as it helps humanity […]« (Zygmunt Bauman) 244 Eintrag aus meinem Forschungsjournal, notiert nach dem Film »La vita è bella« von Roberto Benigni: »Wenn wir vergessen, warum wir Autoritarismusforschung betreiben, lassen wir es besser sein. Es geht um Faschismus, nicht um technische Begriffe wie maximale positive Distinktheit, und es geht um Menschen, nicht um subjects oder VPn. Je näher wir mit dem Mikroskop kommen, umso mehr vergessen wir, was vor der Linse ist. Oder vor dem Zielfernrohr.« (23. Januar 1999) · 328 12. Anhang »Will you tell me anything about yourself?« – »I would prefer not to.« (Herman Melville, 1853 – Bartleby, the Scrivener) 12.1. Dokumentation der Skalen Im folgenden sind zur besseren Übersicht die Skalenbeschreibungen ausgegliedert. Im Falle der eigenen Übersetzungen verschiedener Versionen der RWA-Skala ist die Dokumentation auf die Itemtexte, Trennschärfen und Ladunsgmatrizen aus exploratorischen Faktoranalysen beschränkt. Letztere sind im laufenden Text kommentiert. Die RWA³D ist als Neuentwicklung extensiver beschrieben. Daher erklärt sich das sonst eher unübliche Vorgehen, im Anhang längere Texte wiederzugeben. Durch die getroffene Entscheidung ist es jedoch einfacher möglich, die relevanten Informationen zur Skalenqualität aufzufinden. Friedrich Funke ______________________________________________________________________________________________ Anhang 12.1.1. RWA96 12.1.1.1. Itemtexte und Trennschärfe Variable Endfassung RWA96 Trennschärfe p_ac_1 Bei bestimmten Verbrechen ist lebenslange Freiheitsstrafe gerechtfertigt. 0.343 p_asc_2 Bei der Heirat sollten Frauen ihren Ehemännern Gehorsam versprechen. 0.455 p_s_3 Unsere Regierung ist im allgemeinen intelligenter, 0.408 besser informiert und kompetenter als andere - die Menschen können sich wirklich auf sie verlassen. n_a_4 Es ist wichtig, die Rechte von Radikalen und Abweichlern 0.404 in jeder Hinsicht zu wahren. p_ac_5 Es ist höchste Zeit, daß eine machtvolle Führung 0.576 das radikale Neumodische und Sündhafte in unserem Land zerstört. n_c_6 Schwule und Lesben sind genauso unverdorben und moralisch 0.537 wie jeder andere auch. p_asc_7 Unser Land stünde gut da, wenn wir die Traditionen 0.687 unserer Vorväter ehren, auf die führenden Köpfe hören und uns all der »faulen Äpfel« entledigen würden, die alles verderben. n_sc_8 Ungläubige und andere, 0.468 die gegen die althergebrachten Religionen rebelliert haben, sind zweifelsohne ebenso gut und rechtschaffen wie regelmäßige Kirchgänger. p_sc_9 Die wahren Schlüssel zum »guten Leben« 0.629 sind Gehorsam, Disziplin und Tugend. n_c_10 Viele unserer Regeln 0.525 hinsichtlich Sittlichkeit und Geschlechtsleben sind Gewohnheitsregeln. Sie sind keinen Hauch besser oder heiliger als die anderer Menschen oder Kulturen. p_a_11 Es gibt heutzutage in unserem Land 0.606 viele radikale unmoralische Menschen, die versuchen, das Land für ihre eigenen gottlosen Zwecke zugrunde zu richten. Die Staatsgewalt sollte sie außer Gefecht setzen. p_sc_12 Man tut immer besser daran, dem Urteil der Zuständigen 0.584 in Regierung und Kirche zu trauen, als auf die lauten Unruhestifter in unserer Gesellschaft zu hören, die nur Zweifel in den Köpfen der Menschen säen wollen. n_c_13 FKK-Zeltplätze sind etwas völlig Normales. 0.452 n_c_14 Es gibt nicht »die einzig richtige Art und Weise«, sein Leben zu leben. 0.430 Jeder muß seinen eigenen Weg gestalten. Tabelle 109: Items der RWA 1996 (Teil 1) · 330 Friedrich Funke ______________________________________________________________________________________________ Anhang Variable Endfassung RWA96 Trennschärfe p_ac_15 Wenn wir nicht all die Unarten zerschlagen, die an unserer 0.652 Charakterstärke und unseren traditionellen Überzeugungen nagen, dann wird unser Land eines Tages zugrunde gehen. n_c_16 Homosexuelle und Feministinnen verdienen Anerkennung 0.606 für ihren Mut, sich den »traditionellen Familienwerten« zu widersetzen. p_a_17 In der heutigen ernsten Situation in unserem Land 0.669 wären die stärksten Methoden gerechtfertigt, wenn sie nur die Unruhestifter ausschalten und uns wieder auf unseren rechten Weg bringen würden. p_c_18 Manche mögen es altmodisch finden, 0.559 aber ein ehrenhafter Mann und vor allem eine Dame zeichnet sich noch immer durch eine anständige, korrekte Erscheinung aus. n_c_19 Ein jeder sollte seinen eigenen Lebensstil, 0.569 religiösen Glauben und sexuelle Vorlieben haben, selbst wenn er sich darin von allen anderen unterscheidet. n_sc_20 Die Zeiten, in denen sich Frauen ihren Männern 0.534 und gesellschaftlichen Regeln unterzuordnen hatten, gehören strikt der Vergangenheit an. Der »Platz einer Frau« sollte sein, wo immer sie möchte. p_a_21 Was unser Land wirklich braucht, 0.569 ist ein starker, entschlossener Kanzler, der das Übel zerschlagen und uns wieder auf unseren rechten Weg bringen wird. n_c_22 Man sollte seine eigenen Moralvorstellungen über »Gut und Böse« 0.410 entwickeln und weniger der Bibel oder anderen alten, traditionellen Glaubenssätzen Beachtung schenken. p_ac_23 Der einzige Weg, unser Land aus der Krise zu führen, 0.637 besteht darin, zu unseren traditionellen Werten umzukehren, einige entschlossene Führer an die Macht zu setzen und die Unruhestifter zum Schweigen zu bringen, die schädliche Ideen verbreiten. n_c_24 Unser Land braucht freie Denker, die die Courage haben, 0.664 sich traditionellen Sitten zu widersetzen, selbst wenn dies viele Menschen empört. n_c_25 Vorehelicher Geschlechtsverkehr ist etwas ganz Normales. 0.440 p_a_26 Im Interesse aller sollte der Staat Zeitschriften zensieren, 0.268 damit die Menschen gar nicht mit widerwärtigem Schundmaterial in Berührung kämen. n_sc_27 Es ist großartig, daß die jungen Leute heutzutage 0.457 größere Freiheiten haben, »ihr eigenes Ding zu machen” und gegen Dinge zu protestieren, die sie nicht mögen. Tabelle 110: Items der RWA 1996 (Teil 2) · 331 Friedrich Funke ______________________________________________________________________________________________ Anhang Variable Endfassung RWA96 Trennschärfe p_a_28 Was wir in unserem Land anstelle von mehr »Bürgerrechten« 0.705 wirklich brauchen, ist eine anständige Portion Recht und Ordnung. n_sc_29 Die Leute, die unsere Regierung herausfordern, 0.570 die Religion kritisieren und die »normalen Verhaltensregeln« ignorieren, gehören zu den besten in unserem Land. p_s_30 Gehorsam und Achtung vor der Autorität 0.632 sind die wichtigsten Tugenden, die Kinder lernen sollten. n_c_31 Man sollte sich von eingefahrenen Gleisen losreißen 0.542 und viele verschiedene neue Ideen und Erfahrungen ausprobieren, anstatt an überkommenen Prinzipien festzuhalten. p_asc_32 Wenn unser Staat eines Tages »grünes Licht gibt«, 0.520 ist es die Pflicht eines jeden patriotischen Bürgers, den Verfall ausmerzen zu helfen, der unser Land von innen her vergiftet. n_c_33 Neue Ideen sind das Herzblut progressiven Wandels. 0.434 Daher sollten wir Andersdenkenden und Radikalen mit offenen Armen und offenen Ohren gegenüberstehen. p_ac_34 Die Fakten über Kriminalität, sexuelle Sittenlosigkeit 0.671 und die jüngsten öffentlichen Unruhen zeigen alle, daß wir härter gegen abweichende Gruppen und Unruhestifter durchgreifen müssen, wenn wir unsere moralischen Normen sichern und Recht und Ordnung bewahren wollen. Tabelle 111: Items der RWA 1996 (Teil 3) 12.1.1.2. Ladungsmatrizen Kaiser-Meyer-Olkin Measure of Sampling Adequacy. ,949 Bartlett's Test of Sphericity Approx. Chi-Square 6609,437 df 435 Sig. ,000 Tabelle 112: Voraussetzungsprüfung der exploratorischen Faktoranalyse · 332 Friedrich Funke ______________________________________________________________________________________________ Anhang Rotated Component Matrixa Component 12345 P_A_17 .786 P_ASC_32 .757 P_A_21 .743 P_AC_23 .719 P_A_28 .700 P_ASC_7 .676 P_AC_5 .651 P_AC_34 .649 .364 P_AC_15 .649 P_A_11 .597 .372 P_S_30 .589 .403 P_SC_9 .558 .496 N_C_13 .665 N_C_10 .655 N_C_25 .647 .302 N_SC_8 .631 N_C_6 .623 N_C_22 .465 .332 N_SC_27 .682 N_C_31 .553 .337 N_C_19 .496 .522 N_C_16 .400 .506 N_C_24 .390 .479 .375 N_C_14 .383 .470 .318 N_SC_20 .405 .405 .419 N_C_33 N_SC_29 .308 P_SC_12 .409 P_C_18 .394 .308 P_A_26 .729 .678 .486 .416 .835 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a. Rotation converged in 7 iterations. Tabelle 113: KG-Kriterium und VARIMAX-Rotation · 333 Friedrich Funke ______________________________________________________________________________________________ Anhang Pattern Matrixa Component 1 2345 P_ASC_32 P_A_17 P_A_21 P_AC_23 P_A_28 P_AC_5 P_ASC_7 P_AC_15 P_AC_34 P_A_11 P_S_30 P_SC_9 N_C_13 .815 .809 .781 .736 .687 .659 .651 .628 .623 .571 .304 .550 .344 .509 .453 .693 N_C_10 .657 N_C_25 .646 N_SC_8 .636 N_C_6 .593 N_C_22 .424 N_C_33 N_SC_29 P_SC_12 .323 P_C_18 .320 N_SC_27 N_C_31 N_C_19 .392 N_C_16 N_C_14 N_C_24 N_SC_20 .356 .305 P_A_26 .735 .649 .432 .361 .715 .535 .478 .457 .451 .408 .366 .832 Extraction Method: Principal Component Analysis. Rotation Method: Oblimin with Kaiser Normalization. a. Rotation converged in 14 iterations. Tabelle 114: KG-Kriterium und OBLIMIN-Rotation · 334 Friedrich Funke ______________________________________________________________________________________________ Anhang Component1 2 3 4 5 1 1.000 .337 2 .337 1.000 3 .307 .228 4 .365 .408 5 .108 .112 .307 .365 .108 .228 .408 .112 1.000 .261 6.528E-02 .261 1.000 9.242E-02 6.528E-02 9.242E-02 1.000 Extraction Method: Principal Component Analysis. Rotation Method: Oblimin with Kaiser Normalization. Tabelle 115: Korrelationsmatrix der obliquen Komponenten · 335 Friedrich Funke ______________________________________________________________________________________________ Anhang Pattern Matrixa Component 1 2 P_A_21 .860 P_A_17 .827 P_ASC_32 .819 P_A_28 .772 P_AC_23 .732 P_AC_34 .720 P_ASC_7 .695 P_A_11 .658 P_AC_15 .653 P_S_30 .653 P_AC_5 .631 P_SC_9 .590 P_SC_12 .454 P_C_18 .430 P_A_26 N_C_22 .713 N_C_19 .710 N_C_25 .669 N_C_10 .645 N_C_24 .643 N_C_16 .628 N_C_6 .610 N_SC_8 .608 N_C_14 .603 N_C_13 .599 N_C_31 .555 N_SC_29 .545 Component Correlation Matrix N_SC_27 .490 Component 1 2 N_SC_20 .405 1 1.000 .540 N_C_33 .309 2 .540 1.000 Tabelle 116: Erzwungene Zweifaktorenlösung Tabelle 117: Korrelation der Komponenten (OBLIMIN) · 336 Friedrich Funke ______________________________________________________________________________________________ Anhang Component Matrixa Pattern Matrixa Component Component 1 1 2 N_C_24 .745 N_C_25 .792 N_C_19 .721 N_C_6 .692 N_C_16 .701 N_C_13 .692 N_C_10 .671 N_C_19 .626 N_C_6 .665 N_SC_8 .623 N_SC_29 .632 N_SC_20 .611 N_C_31 .620 N_C_10 .598 N_SC_8 .616 N_C_14 .575 N_SC_20 .592 N_C_22 .497 N_C_25 .588 N_C_16 .418 .410 N_C_13 .576 N_C_33 .846 N_C_14 .575 N_SC_29 .718 N_C_22 .574 N_C_31 .568 N_SC_27 .558 N_C_24 .366 .532 N_C_33 .448 N_SC_27 .441 Tabelle 118: Ladungsmatrix der contraits (1 Faktor) Tabelle 119: Ladungsmatrix der contraits (2 Faktoren) · 337 Friedrich Funke ______________________________________________________________________________________________ Anhang 12.1.2. RWA98 12.1.2.1. Itemtexte und Trennschärfe Die RWA98 hat mit der RWA96 eine Schnittmenge von 25 Items. Alte Items sind mit einem Asterisk gekennzeichet. Variable Endfassung RWA98 Trennschärfe RWA98_1P * Es ist höchste Zeit, daß eine machtvolle Führung 0.526 das radikale Neumodische und Sündhafte in unserem Land zerstört. RWA98_2N * Schwule und Lesben sind genauso unverdorben und moralisch 0.516 wie jeder andere auch. RWA98_3P * Man tut immer besser daran, dem Urteil der Zuständigen 0.413 in Regierung und Kirche zu trauen, als auf die lauten Unruhestifter in unserer Gesellschaft zu hören, die nur Zweifel in den Köpfen der Menschen säen wollen. RWA98_4N * Ungläubige und andere, die gegen die althergebrachten Religionen 0.360 rebelliert haben, sind zweifelsohne ebenso gut und rechtschaffen wie regelmäßige Kirchgänger. RWA98_5P * Der einzige Weg, unser Land aus der Krise zu führen, 0.637 besteht darin, zu unseren traditionellen Werten umzukehren, einige entschlossene Führer an die Macht zu setzen und die Unruhestifter zum Schweigen zu bringen, die schädliche Ideen verbreiten. RWA98_6N * FKK-Zeltplätze sind etwas völlig Normales. 0.204 RWA98_7N * Unser Land braucht freie Denker, die die Courage haben, 0.484 sich traditionellen Sitten zu widersetzen, selbst wenn dies viele Menschen empört. RWA98_8P * Wenn wir nicht all die Unarten zerschlagen, 0.496 die an unserer Charakterstärke und unseren traditionellen Überzeugungen nagen, dann wird unser Land eines Tages zugrunde gehen. RWA98_9N * Ein jeder sollte seinen eigenen Lebensstil, religiösen Glauben 0.443 und sexuelle Vorlieben haben, selbst wenn er sich darin von allen anderen unterscheidet. RWA98_10P Die ›konservativen Werte und Normen‹ 0.534 weisen nach wie vor den besten Weg zu leben. RWA98_11N Es ist anerkennenswert, wenn Leute das Gesetz 0.287 und die Ansicht der Mehrheit in Frage stellen. RWA98_12P * Was unser Land wirklich braucht, ist ein starker, 0.446 entschlossener Kanzler, der das Übel zerschlagen und uns wieder auf unseren rechten Weg bringen wird. Tabelle 120: Items der RWA 1998 (Teil 1) · 338 Friedrich Funke ______________________________________________________________________________________________ Anhang Variable Endfassung RWA98 Trennschärfe RWA98_13N * Zu den Besten in unserem Lande gehören diejenigen, 0.436 die unsere Regierung herausfordern, die Religion kritisieren und die ›normalen Verhaltensregeln‹ ignorieren. RWA98_14P ›Gottes Wort‹ über Abtreibung, Pornographie und Ehe 0.527 muß strikt befolgt und die Sünder bestraft werden, bevor es zu spät ist. RWA98_15P * Im Interesse aller sollte der Staat Zeitschriften zensieren, 0.374 damit die Menschen gar nicht mit widerwärtigem Schundmaterial in Berührung kämen. RWA98_16N * Vorehelicher Geschlechtsverkehr ist etwas ganz Normales. 0.405 RWA98_17P * Unser Land stünde gut da, wenn wir die Traditionen 0.600 unserer Vorväter ehren, auf die führenden Köpfe hören und uns all der ›faulen Äpfel‹ entledigen würden, die alles verderben. RWA98_18N * Es gibt nicht ›die einzig richtige Art und Weise‹, 0.348 sein Leben zu leben. Jeder muß seinen eigenen Weg gestalten. RWA98_19N * Homosexuelle und Feministinnen verdienen Anerkennung 0.516 für ihren Mut, sich den ›traditionellen Familienwerten‹ zu widersetzen. RWA98_20P Es ginge diesem Land weitaus besser, wenn gewisse Gruppen von 0.582 Unruhestiftern einfach mal den Mund halten und ihren angestammten Platz in der Gesellschaft akzeptieren würden. RWA98_21P * Es gibt heutzutage in unserem Land viele radikale unmoralische 0.553 Menschen, die versuchen, das Land für ihre eigenen gottlosen Zwecke zugrunde zu richten. Die Staatsgewalt sollte sie außer Gefecht setzen. RWA98_22N * Man sollte seine eigenen Moralvorstellungen über ›Gut und Böse‹ 0.406 entwickeln und weniger der Bibel oder anderen alten, traditionellen Glaubenssätzen Beachtung schenken. RWA98_23P Unser Land braucht zuallererst Disziplin von jedermann 0.454 und bedingungslose Unterstützung des Staates. RWA98_24N * Es ist besser, Schundliteratur und radikale Texte 0.415 in unserer Gesellschaft zu dulden, als der Regierung die Macht zu geben, diese zu zensieren. RWA98_25P * Die Fakten über Kriminalität, sexuelle Sittenlosigkeit 0.592 und die jüngsten öffentlichen Unruhen zeigen alle, daß wir härter gegen abweichende Gruppen und Unruhestifter durchgreifen müssen, wenn wir unsere moralischen Normen sichern und Recht und Ordnung bewahren wollen. Tabelle 121: Items der RWA 1998 (Teil 2) · 339 Friedrich Funke ______________________________________________________________________________________________ Anhang Variable Endfassung RWA98 Trennschärfe RWA98_26N * Viele unserer Regeln hinsichtlich Sittlichkeit 0.479 und Geschlechtsleben sind Gewohnheitsregeln. Sie sind keinen Hauch besser oder heiliger als die anderer Menschen oder Kulturen. RWA98_27P * In der heutigen ernsten Situation in unserem Land 0.604 wären die stärksten Methoden gerechtfertigt, wenn sie nur die Unruhestifter ausschalten und uns wieder auf unseren rechten Weg bringen würden. RWA98_28N * Die Zeiten, in denen sich Frauen ihren Männern 0.399 und gesellschaftlichen Regeln unterzuordnen hatten, gehören strikt der Vergangenheit an. Der ›Platz einer Frau‹ sollte sein, wo immer sie möchte. RWA98_29N * Es ist großartig, daß die jungen Leute 0.504 heutzutage größere Freiheiten haben, ›ihr eigenes Ding zu machen‹ und gegen Dinge zu protestieren, die sie nicht mögen. RWA98_30P * Wenn unser Staat eines Tages ›grünes Licht gibt‹, 0.457 ist es die Pflicht eines jeden patriotischen Bürgers, den Verfall ausmerzen zu helfen, der unser Land von innen her vergiftet. Tabelle 122: Items der RWA 1998 (Teil 3) 12.1.2.2. Ladungsmatrizen Component Correlation Matrix Component 1 2 3 4 5 6 7 1 1.000 .191 .154 .154 .263 .047 .424 2 .191 1.000 .258 .257 .176 .186 .101 3 .154 .258 1.000 .172 .106 .172 .165 4 .154 .257 .172 1.000 .150 .124 .064 5 .263 .176 .106 .150 1.000 .032 .203 6 .047 .186 .172 .124 .032 1.000 -.004 7 .424 .101 .165 .064 .203 -.004 1.000 Tabelle 123: Korrelationsmatrix der obliquen Komponenten · 340 Friedrich Funke ______________________________________________________________________________________________ Anhang Rotated Component Matrixa Component 1 2 3 4 5 6 7 RWA985P .735 RWA9817P .734 RWA9827P .719 .426 RWA981P .692 RWA9830P .682 RWA988P .672 RWA9812P .653 RWA9810P .570 .303 .314 RWA9821P .558 .437 RWA9820P .533 .419 .453 RWA9818N .750 RWA9828N .737 RWA989N .601 .376 RWA9826N .528 .340 RWA9829N .525 .441 RWA982N .463 .448 RWA987N .429 .370 .328 RWA984N .659 RWA9814P .315 .611 RWA9822N .560 .442 RWA9816N .550 RWA9811N .802 RWA9813N .632 RWA9819N .372 .372 .323 RWA9825P .456 .683 RWA9823P .503 .530 RWA983P .356 .436 .351 RWA9824N .721 RWA9815P .408 .711 RWA986N .625 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. Tabelle 124: KG-Kriterium und VARIMAX-Rotation · 341 Friedrich Funke ______________________________________________________________________________________________ Anhang Pattern Matrixa Component 1 2 3 4 5 6 7 RWA9810P .672 RWA985P .646 RWA981P .615 RWA988P .604 RWA9817P .598 RWA9812P .528 -.323 .325 RWA9830P .458 -.362 .321 RWA9818N .771 RWA9828N .760 RWA989N .566 RWA9826N .484 RWA9829N .456 .386 RWA982N .444 .357 RWA987N .334 .305 .326 RWA9811N .850 RWA9813N .622 RWA9819N .312 RWA984N .644 RWA9814P .596 RWA9822N .506 .401 RWA9816N .459 -.336 RWA9824N .753 RWA9815P .361 .739 RWA986N .640 RWA9825P .789 RWA9823P .655 RWA9827P .385 .555 RWA9820P .376 .538 RWA9821P .525 RWA983P .339 .489 Extraction Method: Principal Component Analysis. Rotation Method: Oblimin with Kaiser Normalization. Rotation converged in 30 iterations. a. Tabelle 125: KG-Kriterium und OBLIMIN-Rotation · 342 Friedrich Funke ______________________________________________________________________________________________ Anhang Structure Matrix Component 1 2 3 4 5 6 7 RWA985P .766 .419 .435 RWA9817P .726 .501 RWA981P .700 .315 .400 RWA988P .667 .358 RWA9810P .663 .370 RWA9812P .627 .530 RWA9830P .612 -.330 .538 RWA9818N .757 RWA9828N .748 RWA989N .667 .439 RWA9826N .605 .300 .402 RWA9829N .561 .516 .347 RWA982N .326 .559 .349 .488 RWA987N .476 .451 .406 .367 RWA9811N .798 RWA9813N .689 .321 RWA9819N .467 .484 .345 .413 RWA984N .349 .681 RWA9814P .389 .647 .414 .328 RWA9822N .382 .609 .493 RWA9816N .343 .357 .576 RWA9824N .789 .301 RWA9815P .455 .775 RWA986N .666 RWA9825P .412 .833 RWA9827P .642 .737 RWA9823P .434 .701 RWA9820P .502 .462 .698 RWA9821P .524 .345 .677 RWA983P .409 .373 .521 Extraction Method: Principal Component Analysis. Rotation Method: Oblimin with Kaiser Normalization. Tabelle 126: KG-Kriterium und OBLIMIN-Rotation (Strukturmatrix) · 343 Friedrich Funke ______________________________________________________________________________________________ Anhang Pattern Matrixa Component 1 2 RWA9827P .858 RWA9830P .761 RWA9821P .742 RWA9817P .732 RWA9825P .724 RWA9820P .723 RWA985P .697 RWA9812P .687 RWA9823P .671 RWA981P .649 RWA988P .620 RWA9815P .417 RWA9810P .410 RWA9814P .361 .329 RWA983P .357 RWA9824N .336 RWA989N .704 RWA9826N .654 RWA9819N .636 RWA9822N .634 RWA9816N .620 RWA9818N .617 RWA9828N .588 RWA982N .555 RWA987N .534 RWA984N .517 RWA9813N .514 Component Correlation Matrix RWA9829N .514 Component 1 2 RWA986N .472 1 1.000 .339 RWA9811N .340 2 .339 1.000 Tabelle 127: Tabelle 128: Erzwungene Zweifaktorenlösung (OBLIMIN) Korrelation der Komponenten · 344 Friedrich Funke ______________________________________________________________________________________________ Anhang 12.1.3. RWA82/86 Die RWA Skala aus Bob Altemeyer’s »Enemies of Freedom – Understanding Right-Wing Authoritarianism« (1988, S.22f., deutsch Funke, 1996) wurde in der vorliegenden Arbeit nicht verwendet. Es werden jedoch diejenigen Items dokumentiert, auf die sich Lauren Duncan (1997) in ihrem Versuch bezieht, die Aussagen den drei Subdimensionen zuzuordnen (vgl. S.71 in dieser Arbeit). Altemeyer (1988/1994) Funke (1996) 11 Es ist wichtig, die Rechte von Radikalen und Abweichlern voll zu wahren. A 16 Jene Leute, die unsere Fahne, unsere Führer und allgemeine Verhaltensregeln nicht A achten, gehören zu den Schlimmsten in unserem Land. 17 In diesen wirren Zeiten müssen Gesetze ohne Gnade durchgesetzt werden, A vor allem wenn es um Aufrührer und Revolutionäre geht, die alles aufwirbeln. 27 Neue Ideen sind der »Motor« oder das »Herzblut« fortschrittlichen Wandels. A Deswegen sollte man Andersdenkenden am besten mit Milde und Offenheit entgegenkommen. 3 Man tut immer besser daran, dem Urteil der Zuständigen in Regierung und Kirche S zu trauen, als auf die lauten Unruhestifter in unserer Gesellschaft zu hören, die nur Zweifel in den Köpfen der Menschen säen wollen. 15 »Freie Rede« bedeutet, daß es den Leuten auch gestattet sein sollte, S Reden zu halten und Bücher zu schreiben, die zum Sturz der Regierung aufrufen. 20 Die selbstgerechten Machtorgane des Staates gefährden die Freiheit S in unserem Lande weit mehr als die meisten Gruppen, die sie als »radikal« und »gottlos« bezeichnen. 23 Letztendlich stellt sich meist heraus, daß die rechtmäßigen Autoritäten wie Eltern S oder unsere Landesväter Recht behalten, und all die Nörgler nicht wissen, wovon sie reden. 4 Man sollte seine eigenen Moralvorstellungen über »gut und böse« entwickeln C und weniger die Bibel oder ähnliche Instanzen zu Rate ziehen. 22 Wenn ein Kind anfängt, sich nicht mehr an die Regeln zu halten C und dreist gegenüber Autoritäten zu werden, dann ist es die Pflicht der Eltern, das Kind wieder auf den rechten Weg zu bringen. 24 Viele unserer Regeln hinsichtlich Sittlichkeit und Sexualverhalten sind Gewohn-C heitsregeln. Sie sind keinen Hauch besser oder heiliger als die anderer. 26 Die wahren Schlüssel zum »guten Leben« sind Gehorsam, C Disziplin und Prinzipienfestigkeit. Tabelle 129: Ausgewählte Items der RWA 1982 · 345 Friedrich Funke ______________________________________________________________________________________________ Anhang 12.1.4. RWA³D Da neben den eigenen Übersetzungen der Skalen von Altemeyer (1996; 1998) die RWA³D neu eingeführt wurde, fällt die Darstellung etwas ausführlicher aus.245 12.1.4.1. Itemtext und Trennschärfen Variable Endfassung RWA³D Trennschärfe rwa1cn »Man sollte seine eigenen Moralvorstellungen über ›Gut und Böse‹ 0.165 entwickeln und weniger der Bibel oder anderen alten, traditionellen Glaubenssätzen Beachtung schenken.« rwa2ap »Was wir in unserem Land anstelle von mehr ›Bürgerrechten‹ wirk-0.626 lich brauchen, ist eine anständige Portion Recht und Ordnung.« rwa3sn »Die Zeiten, in denen sich Frauen ihren Männern unterzuordnen 0.291 hatten, sollten der Vergangenheit angehören. Der ›Platz einer Frau‹ in der Gesellschaft sollte sein, wo immer sie möchte.« rwa4cp »Die Abkehr von der Tradition wird sich 0.353 eines Tages als fataler Fehler herausstellen.« rwa5an »Es gibt kein Verbrechen, 0.368 das die Todesstrafe rechtfertigen würde.« rwa6sp »Gehorsam und Achtung vor der Autorität sind die wichtigsten 0.581 Tugenden, die Kinder lernen sollten.« rwa7cn »Gleichgeschlechtliche Lebensgemeinschaften 0.413 sollten der Ehe gleichgestellt werden.« rwa8ap »Was unser Land wirklich braucht, 0.514 ist ein starker, entschlossener Kanzler, der das Übel zerschlagen und uns wieder auf unseren rechten Weg bringen wird.« rwa9sn »Es ist gut, daß die jungen Leute heutzutage größere Freiheiten ha-0.404 ben, ›ihr eigenes Ding zu machen‹ und gegen Dinge zu protestieren, die sie nicht mögen.« rwa10cp »Tugendhaftigkeit und Gesetzestreue bringen uns auf lange Sicht 0.545 weiter als das ständige Infragestellen der Grundfesten unserer Gesellschaft.« rwa11an »Es ist wichtig, die Rechte von Radikalen und Abweichlern 0.319 in jeder Hinsicht zu wahren.« rwa12sp »Die wahren Schlüssel zum ›guten Leben‹ 0.597 sind Gehorsam, Disziplin und Tugend.« Tabelle 130: Items der RWA³D 245 Christopher Cohrs aus Bielefeld hat wertvolle Vorschläge zur Modifikation der Items unterbreitet. Diese gehen jedoch erst nach der Drucklegung in eine modifizierte Fassung der RWA³D ein. · 346 Friedrich Funke ______________________________________________________________________________________________ Anhang Die folgende Tabelle zeigt die geordneten Items mit abfallender Trennschärfe: Variable Endfassung RWA³D (geordnet nach Trennschärfe) Trennschärfe 1. rwa2ap »Was wir in unserem Land anstelle von mehr ›Bürgerrechten‹ wirklich brauchen, ist eine anständige Portion Recht und Ordnung.« 0.626 2. rwa12sp »Die wahren Schlüssel zum ›guten Leben‹ sind Gehorsam, Disziplin und Tugend.« 0.597 3. rwa6sp »Gehorsam und Achtung vor der Autorität sind die wichtigsten Tugenden, die Kinder lernen sollten.« 0.581 4. rwa10cp »Tugendhaftigkeit und Gesetzestreue bringen uns auf lange Sicht weiter als das ständige Infragestellen der Grundfesten unserer Gesellschaft.« 0.545 5. rwa8ap »Was unser Land wirklich braucht, ist ein starker, entschlossener Kanzler, der das Übel zerschlagen und uns wieder auf unseren rechten Weg bringen wird.« 0.514 6. rwa7cn »Gleichgeschlechtliche Lebensgemeinschaften sollten der Ehe gleichgestellt werden.« 0.413 7. rwa9sn »Es ist gut, daß die jungen Leute heutzutage größere Freiheiten haben, ›ihr eigenes Ding zu machen‹ und gegen Dinge zu protestieren, die sie nicht mögen.« 0.404 8. rwa5an »Es gibt kein Verbrechen, das die Todesstrafe rechtfertigen würde.« 0.368 9. rwa4cp »Die Abkehr von der Tradition wird sich eines Tages als fataler Fehler herausstellen.« 0.353 10. rwa11an »Es ist wichtig, die Rechte von Radikalen und Abweichlern in jeder Hinsicht zu wahren.« 0.319 11. rwa3sn »Die Zeiten, in denen sich Frauen ihren Männern unterzuordnen hatten, sollten der Vergangenheit angehören. Der ›Platz einer Frau‹ in der Gesellschaft sollte sein, wo immer sie möchte.« 0.291 12. rwa1cn »Man sollte seine eigenen Moralvorstellungen über ›Gut und Böse‹ entwickeln und weniger der Bibel oder anderen alten, traditionellen Glaubenssätzen Beachtung schenken.« 0.165 Tabelle 131: Items der RWA³D (mit absteigender Trennschärfe) 12.1.4.2.Zentrale Tendenz – erstes Moment Zunächst verdeutlichen Tabelle 132 sowie Tabelle 133 auf Seite 349 die Unterschiede der Studien hinsichtlich der zentralen Tendenz. Es läßt sich hier keine einheitliche Systematik feststellen; bei fast allen Items entstammten die höchsten Mittelwerte der Studie »NEO1«, die niedrigsten der Studie »Zukunft«. Erstere Untersuchung unterscheidet sich von den anderen durch den Erhebungsmodus (paper & · 347 Friedrich Funke ______________________________________________________________________________________________ Anhang pencil) und durch einen höheren Anteil von Schülern in der Stichprobe (vgl. 6.4.3 S.157ff.). Report Mean STUDIE KosovoNet1KosovoNet2NEO1 NEO2 Zukunft Total RWA1CN 3.0522 2.8802 2.9106 3.1685 2.7543 2.9527 RWA2AP 2.7836 2.7521 3.8729 2.8478 2.7855 3.1125 RWA3SN 1.5970 1.4669 1.4400 1.4810 1.2872 1.4390 RWA4CP 3.0299 3.2686 3.6071 3.3995 3.0069 3.3265 RWA5AN 3.4552 3.2438 4.2188 3.0815 2.8547 3.4294 RWA6SP 2.9627 2.7025 3.6635 2.8587 2.8201 3.0693 RWA7CN 2.6866 2.5083 2.9482 2.4864 2.1799 2.5823 RWA8AP 3.0821 2.7521 3.4824 2.8505 2.5017 2.9705 RWA9SN 2.2313 2.2025 2.4118 2.1522 2.0138 2.2160 RWA10CP 3.2313 3.3802 3.6706 3.3668 3.0208 3.3765 RWA11AN 3.9403 4.0083 4.4471 3.9511 3.8962 4.0933 RWA12SP 2.4552 2.2273 2.9882 2.5870 2.4014 2.5953 Tabelle 132: Verteilungsparameter RWA³D – Itemmittelwerte Robuste Alternativen zum arithmetischen Mittel sind weniger sensibel für Verletzungen der Normalverteilungsannahme. Vier solcher sog. M-Schätzer sind Tabelle 133 (protraits) und Tabelle 134 (contraits) zu entnehmen. Das hervorstechende Ergebnis auch dieser Analysen ist wiederum, daß die höchsten Itemmittelwerte der Studie NEO1 entstammen. · 348 Friedrich Funke ______________________________________________________________________________________________ Anhang M-Estimators STUDIE Huber's M-Estimatora Tukey's Biweight b Hampel's M-Estimatorc Andrews' Wave d RWA2AP KosovoNet1 2.5438 2.4325 2.5602 2.4306 KosovoNet2 2.3056 2.1742 2.4164 2.1685 NEO1 3.8431 3.8609 3.8729 3.8609 NEO2 2.5466 2.3904 2.5650 2.3884 Zukunft 2.4384 2.3292 2.5067 2.3281 RWA4CP KosovoNet1 2.7717 2.5738 2.7526 2.5689 KosovoNet2 3.1078 3.0105 3.1554 3.0065 NEO1 3.6713 3.5662 3.5825 3.5650 NEO2 3.2054 3.1430 3.2976 3.1390 Zukunft 2.8678 2.7949 2.8741 2.7923 RWA6SP KosovoNet1 2.8821 2.8802 2.9377 2.8799 KosovoNet2 2.3971 2.3396 2.4729 2.3396 NEO1 3.5935 3.6310 3.6635 3.6309 NEO2 2.5313 2.3906 2.5696 2.3885 Zukunft 2.5355 2.4416 2.5804 2.4416 RWA8AP KosovoNet1 2.7616 2.4516 2.7381 2.4554 KosovoNet2 2.3039 2.1839 2.4289 2.1810 NEO1 3.4003 3.4353 3.4701 3.4354 NEO2 2.4699 2.2936 2.5272 2.2902 Zukunft 2.1378 2.0586 2.2529 2.0555 RWA10CP KosovoNet1 3.0754 2.9737 3.1044 2.9666 KosovoNet2 3.1986 3.1322 3.2947 3.1283 NEO1 3.7203 3.6805 3.6496 3.6797 NEO2 3.1842 3.1178 3.2529 3.1144 Zukunft 2.9207 2.8622 2.9230 2.8609 RWA12SP KosovoNet1 2.1364 2.0867 2.2379 2.0856 KosovoNet2 1.9260 1.8339 1.9857 1.8304 NEO1 2.7756 2.6037 2.7319 2.5984 NEO2 2.2754 2.2304 2.3655 2.2292 Zukunft 2.2010 2.2076 2.2873 2.2075 a. The weighting constant is 1.339. b. The weighting constant is 4.685. c. The weighting constants are 1.700, 3.400, and 8.500 d. The weighting constant is 1.340*pi. Tabelle 133: Verteilungsparameter RWA³D (positive Items) – Robuste Mittelwerte · 349 Friedrich Funke ______________________________________________________________________________________________ Anhang M-Estimatorse STUDIE Huber's M-Estimatora Tukey's Biweight b Hampel's M-Estimatorc Andrews' Wave d RWA1CN KosovoNet1 2.6942 2.3956 2.6685 2.3925 KosovoNet2 2.6273 2.4327 2.5923 2.4308 NEO1 2.4628 2.2130 2.5019 2.2073 NEO2 2.9023 2.7489 2.9464 2.7392 Zukunft 2.3970 2.2805 2.4569 2.2791 RWA3SN KosovoNet1 . . KosovoNet2 . Der Bodeneffekt . NEO1 . bei dieser Variable . NEO2 . verhindert ein Berechnen . Zukunft . . RWA5AN KosovoNet1 3.2261 3.2852 3.4173 3.2849 KosovoNet2 2.2204 1.4827 2.2839 1.4758 NEO1 4.4042 4.3167 4.2188 4.3170 NEO2 2.2846 1.7732 2.3915 1.7409 Zukunft 2.1309 1.7070 2.2520 1.6830 RWA7CN KosovoNet1 2.0632 1.7432 2.1536 1.7247 KosovoNet2 2.0000 1.7854 2.0538 1.7794 NEO1 2.3305 2.0307 2.4215 2.0242 NEO2 1.9683 1.7292 2.0198 1.7196 Zukunft . . . . RWA9SN KosovoNet1 2.0134 1.9728 2.0750 1.9703 KosovoNet2 2.0262 1.9930 2.0714 1.9909 NEO1 2.1447 2.0848 2.2069 2.0823 NEO2 1.9636 1.9190 2.0022 1.9177 Zukunft 1.8788 1.8357 1.9022 1.8333 RWA11AN KosovoNet1 3.9296 3.9330 3.9403 3.9329 KosovoNet2 4.0005 4.0296 4.0311 4.0291 NEO1 4.4891 4.4675 4.4499 4.4675 NEO2 3.8999 3.9181 3.9285 3.9182 Zukunft 3.9070 3.8739 3.8657 3.8739 a. The weighting constant is 1.339. b. The weighting constant is 4.685. c. The weighting constants are 1.700, 3.400, and 8.500 d. The weighting constant is 1.340*pi. e. Some M-Estimators cannot be computed because of the highly centralized distribution around the median. Tabelle 134: Verteilungsparameter RWA³D (negative Items) – Robuste Mittelwerte · 350 Friedrich Funke ______________________________________________________________________________________________ Anhang 12.1.4.3. Varianz – zweites Moment Der Levene-Test (vgl. Church & Wike, 1976) testet gegen die Nullhypothese der Varianzhomogenität. Hohe Werte indizieren starke Abweichungen von der Gleichheit der Varianzen in den Stichproben. Bei einer Irrtumswahrscheinlichkeit von 1% muß für 9 Items diese H0 abgelehnt werden (Tabelle 135). Test of Homogeneity of Variances Levene Statistic df1 df2 Sig. RWA1CN 2.124 4 1453 .076 RWA2AP 3.914 4 1453 .004 RWA3SN 7.994 4 1453 .000 RWA4CP 4.183 4 1453 .002 RWA5AN 7.582 4 1453 .000 RWA6SP 12.917 4 1453 .000 RWA7CN 6.888 4 1453 .000 RWA8AP 7.087 4 1453 .000 RWA9SN 8.335 4 1453 .000 RWA10CP 2.122 4 1453 .076 RWA11AN .862 4 1453 .486 RWA12SP 5.675 4 1453 .000 Tabelle 135: Verteilungsparameter RWA³D – Varianzhomogenität Report Variance STUDIE KosovoNet1KosovoNet2NEO1 NEO2 Zukunft Total RWA1CN 3.403 2.969 3.577 3.051 2.797 3.186 RWA2AP 2.577 3.092 3.550 2.876 2.877 3.312 RWA3SN 1.641 .897 .851 1.150 .719 .985 RWA4CP 3.127 2.986 2.937 2.845 2.326 2.864 RWA5AN 5.618 6.127 5.752 5.023 4.569 5.652 RWA6SP 3.329 2.575 3.941 2.803 2.724 3.271 RWA7CN 4.157 3.562 4.285 3.586 2.988 3.785 RWA8AP 3.655 3.249 3.925 3.157 2.654 3.466 RWA9SN 1.833 1.507 2.111 1.633 1.312 1.722 RWA10CP 2.871 2.901 2.712 2.631 2.257 2.692 RWA11AN 3.335 2.979 3.286 3.158 3.121 3.218 RWA12SP 2.370 2.210 2.908 2.330 1.699 2.428 Tabelle 136: Verteilungsparameter RWA³D – Varianz · 351 Friedrich Funke ______________________________________________________________________________________________ Anhang 12.1.4.4. Verteilungsform – drittes und viertes Moment Die Symmetrie einer Verteilung läßt sich durch das dritte Potenzmoment a3 schätzen. Wünschenswerte Werte um 0 weisen auf Symmetrie hin, die hier vorgefundenen positiven Werte beschreiben eine linkssteile bzw. rechtsschiefe Verteilung. Report Skewness STUDIE KosovoNet1KosovoNet2NEO1 NEO2 Zukunft Total RWA1CN .856 .751 .810 .530 .954 .759 RWA2AP .736 .868 .070 .762 .727 .557 RWA3SN 2.668 2.695 2.587 2.857 4.296 2.992 RWA4CP .608 .338 .096 .353 .509 .331 RWA5AN .406 .522 -.214 .617 .715 .350 RWA6SP .531 .743 .165 .799 .603 .562 RWA7CN .899 1.229 .778 1.176 1.519 1.083 RWA8AP .530 .740 .217 .720 .914 .594 RWA9SN 1.157 1.399 1.215 1.532 1.619 1.402 RWA10CP .421 .321 .037 .418 .404 .294 RWA11AN .044 -.042 -.129 .118 .048 .007 RWA12SP .945 1.308 .638 .950 .814 .909 Tabelle 137: Verteilungsparameter RWA³D – Schiefe Mithin haben jegliche Items in allen hier dargestellten Studien das Problem einer mehr oder weniger deutlichen Verteilungsasymmetrie. Sämtliche Abweichungen von der Normalverteilung sind statistisch signifikant (Kolmogoroff-Smirnov-Test Kolmogorov, 1933; Kolmogorov, 1950; Smirnov, 1939) mit Lilliefors-Korrektur (Lilliefors, 1967) sowie Shapiro-Wilk-Test (Shapiro, Wilk & Chen, 1968), was aber bei der Teststärke aufgrund der großen Stichprobe nicht verwunderlich ist. Eine substantielle Schiefe ist bei den Items 3, 7, 9 und 12 zu verzeichnen. Besonders kritisch jedoch ist das Item RWA3SN: · 352 Friedrich Funke ______________________________________________________________________________________________ Anhang »Die Zeiten, in denen sich Frauen ihren Männern unterzuordnen hatten, sollten der Vergangenheit angehören. Der ›Platz einer Frau‹ in der Gesellschaft sollte sein, wo immer sie möchte.«246 Diese Aussage wird nur von einer verschwindenden Minderheit der Befragten unterstützt, es findet sich in allen Stichproben ein deutlicher Bodeneffekt. Weniger kritisch als die Asymmetrie der Verteilungen ist die Breit- bzw. Schmalgipfligkeit, die durch das vierte Potenzmoment (Exzeß oder Kurtosis) beschrieben wird. Wiederum sind normalverteilte Daten durch eine Kurtosis von Null gekennzeichnet. Zwei Items (3, 9) sind in allen Stichproben leptokurtisch verteilt, sieben platykurtisch (2; 4; 5; 6; 8; 10; 11). Die Items 1, 7 und 12 weisen über die Studien hinweg keine einheitliche Kurtosis auf. Dramatisch ist die Verteilungsform jedoch nur bei dem bereits angesprochenen Item RWA3SN (West et al., 1995). Report Kurtosis STUDIE KosovoNet1 KosovoNet2 NEO1 NEO2 Zukunft Total RWA1CN -.372 -.313 -.483 -.795 .056 -.455 RWA2AP -.314 -.365 -1.126 -.371 -.516 -.810 RWA3SN 7.191 8.102 6.816 8.464 21.206 9.761 RWA4CP -.684 -.918 -.971 -.872 -.558 -.882 RWA5AN -1.468 -1.498 -1.590 -1.199 -1.024 -1.530 RWA6SP -.916 -.361 -1.257 -.399 -.756 -.837 RWA7CN -.577 .390 -.702 .181 1.261 -.071 RWA8AP -.973 -.577 -1.160 -.632 -.137 -.827 RWA9SN .957 2.177 1.076 2.699 3.398 1.978 RWA10CP -.693 -.943 -.838 -.693 -.706 -.818 RWA11AN -1.109 -.956 -1.041 -1.098 -1.049 -1.058 RWA12SP .021 1.007 -.469 .124 -.121 .039 Tabelle 138: Verteilungsparameter RWA³D – Kurtosis Für die Schiefe der Verteilung läßt sich eine plausible Erklärung anführen: Die Items sind sprachlich derart konstruiert, daß sie besonders Autoritäre ansprechen. Die Mehrzahl der Befragten zeigt sich befremdet durch die drastische Formulie246 Dieses Item wird wahrscheinlich in der Zukunft geändert werden: »Die Zeiten, in denen sich Frauen ihren Männern unterzuordnen hatten, sollten der Vergangenheit angehören. Der ›Platz einer Frau‹ in der Gesellschaft sollte sein, wo immer sie möchte.« · 353 Friedrich Funke ______________________________________________________________________________________________ Anhang rung der protraits; die hohe Itemschwierigkeit ist jedoch günstig für die Identifikation von »Highscorern«. 8 8 8 7 7 7 6 6 6 RWA11AN RWA5AN RWA8AP RWA2AP 5 RWA7CN RWA1CN RWA10CP RWA4CP 5 RWA9SN RWA3SN RWA12SP RWA6SP 4 4 3 3 2 2 2 1 1 1 0 0 0 0123456 0123456 0123456 STUDIE STUDIE STUDIE 8 8 8 7 7 7 6 6 6 5 5 4 4 3 3 2 2 2 1 1 1 0 0 0 0123456 0123456 0123456 STUDIE STUDIE STUDIE 8 8 8 7 7 7 6 6 6 5 5 4 4 3 3 2 2 2 1 1 1 0 0 0 0123456 0123456 0123456 STUDIE STUDIE STUDIE 8 8 8 7 7 7 6 6 6 5 5 4 4 3 3 2 2 2 1 1 1 0 0 0 0123456 0123456 0123456 STUDIE STUDIE STUDIE Abbildung 74: Verteilungsformen der Items in den fünf Studien mit RWA³D · 354 Friedrich Funke ______________________________________________________________________________________________ Anhang 12.1.4.5. Interne Konsistenz Die Reliabilität der RWA³D unterscheidet sich in den fünf Studien nicht wesentlich. Es werden trotz der relativen Kürze der Skala und der besonderen Konstruktionsweise sehr akzeptable untere Schranken der internen Konsistenz (.76