6.6 Auswertungsmethoden

6.6.3 Deskriptive Analysen

Deskriptive Analysen wurden mit IBM SPSS Statistics 24 durchgeführt. Dabei lag der Fokus auf der Beschreibung der Stichprobe und der Überprüfung des Datensatzes.

6.6.4 Gruppenvergleiche

Zur Durchführung von Gruppenvergleichen wurde auf den t-Test für unabhängige Stichpro- ben zurückgegriffen. Eine Voraussetzung für den Mittelwertvergleich ist die Varianzhomoge- nität, die mit Hilfe des Levene-Tests überprüft wird. Ist der Levene-Test auf dem p ≥ .05 Ni- veau signifikant, liegt keine Varianzhomogenität vor und es muss der Welch-Test zum Mittel- wertvergleich verwendet werden (Field, 2016).

Liegen mehr als zwei Mittelwerte zum Vergleich vor, wird eine einfaktorielle Varianzanalyse (ANOVA) vorgenommen. Wird die Voraussetzung der Varianzhomogenität verletzt, wird ebenfalls der Welch-Test berichtet. Ferner wurde in den hier vorliegenden Analysen ein post- hoc Test zur Überprüfung möglicher Unterschiede angewendet. Aufgrund unterschiedlicher Gruppengrößen wurde auf den Games-Howell post-hoc Test zurückgegriffen, da dieser bei unterschiedlichen Stichprobengrößen sowie der Verletzung der Varianzhomogenität verläss- liche Ergebnisse liefert (Field, 2016).

6.6.5 Regressionsanalysen

Field (2016) beschreibt die Modellvoraussetzungen für die Durchführung von Regressions- analysen. Für die Regressionsanalyse sind – neben der Linearität der abhängigen Variable (AV) mit allen unabhängigen Variablen, der Überprüfung von Ausreißern sowie der Normalvertei- lungsannahme (Field, 2016) – verschiedene weitere Voraussetzungen notwendig: Die Prä- diktoren müssen entweder metrisch beziehungsweise ordinal oder kategorial (mit zwei Aus- prägungen) sein und deren Varianz darf nicht 0 betragen (Field, 2016; Wittenberg, Cramer & Vicari, 2014). Zusätzlich sollte das Modell auf Multikollinearität geprüft werden. Es sollte also kein hoher korrelativer Zusammenhang (r ≤ .90) zwischen den unabhängigen Variablen vor- liegen (Field, 2016). Multikollinearität wird außerdem mit Hilfe der Toleranz und des VIF (va- riance inflation factor) überprüft, wobei die Werte des VIF kleiner als 10 sein sollten. Die To- leranz (1 / VIF) hingegen sollte keine Werte annehmen, die größer als .20 sind (Field, 2016).

111

In einem weiteren Schritt werden die Residuen überprüft. Diese sollten varianzhomogen, un- abhängig, linear sowie normalverteilt sein. Die Homoskedastizität (Varianzhomogenität) so- wie die Linearität wurden auf Grundlage von Streudiagrammen beurteilt (Field, 2016). Die Normalverteilung der Fehler wurde mit Hilfe eines Histogramms sowie eines P-P-Diagramms interpretiert sowie die Unabhängigkeit der Fehler über den Durbin-Watson Test überprüft. Dieser sollte zwischen eins und drei liegen und sich an zwei annähern (Field, 2016).

Alle hier dargestellten Voraussetzungen wurden vor den jeweiligen Regressionsanalysen überprüft. Es wurde jeweils eine multiple hierarchische Regression mit der Methode des Ein- schlusses ausgewählt, wobei die Prädiktoren thematisch geordnet – soziodemographische, einstellungsbezogene sowie verhaltensbezogene Variablen –, blockweise dem Modell hinzu- gefügt wurden.

6.6.6 Mehrgruppenanalyse

Zur Untersuchung der Gruppenunterschiede im Gesamtmodell wurde ein Strukturgleichungs- modell in Amos 24 aufgestellt, das für beide Gruppen (Norwegen und Deutschland) gleicher- maßen gültig ist. Zunächst müssen jedoch die Voraussetzungen für den Gruppenvergleich ge- prüft werden, sodass eine Mehrgruppen-Kausalanalyse zulässig ist und die Daten miteinander verglichen werden dürfen. Orientiert wird sich dabei an dem „Prüfschema zur Messinvarianz bei reflektiven Messmodellen“ (Weiber & Mühlhaus, 2014, S. 304). Es handelt sich dabei um verschiedene Stufen der Äquivalenz der Messmodelle, die sich in ihrem Grad und den zuläs- sigen Vergleichen unterscheiden.

Die erste Voraussetzung ist das Vorliegen von konfiguraler Messinvarianz, die grundlegend für Gruppenvergleiche ist (Weiber & Mühlhaus, 2014). Dabei wird überprüft, ob dasselbe Mo- dell in beiden Gruppen einen zufriedenstellenden Modell-Fit aufweist, ob sich die Faktorla- dungen signifikant von Null unterscheiden, die Faktoren untereinander nicht zu hoch korre- lieren und ob gruppenspezifische Diskriminanzvalidität der Konstrukte vorliegt (Weiber & Mühlhaus, 2014).

Die zweite Voraussetzung, sodass ein Vergleich der Faktorladungen zulässig ist, ist die soge- nannte metrische Invarianz. Dabei wird das Modell mit den restringierten Faktorladungen mit dem unrestringierten Modell verglichen. Sind die Unterschiede zwischen den beiden Model- len gering (≤. 01), dann ist metrische Invarianz gegeben und der Vergleich von Pfadkoeffizien- ten ist zulässig (Cheung & Rensvold, 2002; Weiber & Mühlhaus, 2014).

112

Die dritte Stufe, die notwendig ist, um Konstruktmittelwerte vergleichen zu dürfen, ist die skalare Invarianz. Bei dieser Modellvariante werden zusätzlich zu den Faktorladungen auch die jeweiligen Konstanten restringiert. Da diese Form der Invarianz in der Praxis nur schwer zu erhalten ist, beschreiben Weiber und Mühlhaus (2014) das Konzept der partiellen Messin- varianz, bei der einzelne Parameter im Modell wieder freigesetzt werden, sodass ein entspre- chender Modell-Fit erreicht werden kann. Die Auswahl entsprechender Parameter erfolgt über die Modification Indices in Amos, bei dem die Identitätsrestriktionen der Variablen mit den höchsten aggregierten Modification Indizes aufgehoben werden (Weiber & Mühlhaus, 2014). Liegt mindestens metrische Invarianz im Modell vor, sind Gruppenvergleiche zulässig (Weiber & Mühlhaus, 2014).

Die Beurteilung eines signifikanten Einflusses einer Variable beruht zunächst auf der Beurtei- lung der Critical Ratios (C.R.). Beträgt der Wert der C.R. ≥ 1.96 kann die Nullhypothese ver- worfen werden und die Variable trägt mit einer Irrtumswahrscheinlichkeit von fünf Prozent signifikant (p ≤ .05) zur Modellstruktur bei (Weiber & Mühlhaus, 2014). Liegen C.R.-Werte größer als 2.57 vor, ist von einer Irrtumswahrscheinlichkeit von einem Prozent auszugehen (Weiber & Mühlhaus, 2014). Außerdem kann auf Basis der C.R. die statistische Signifikanz der Pfadkoeffizienten zwischen den Ländern geprüft werden (Weiber & Mühlhaus, 2014). Die Au- toren merken jedoch an, dass „die P-Werte keine Rückschlüsse über die Stärke eines Zusam- menhangs“ (Weiber & Mühlhaus, 2014, S. 229, Hervorh. im Original) zulassen. Aus diesem Grund werden zur Beurteilung der Stärke der statistischen Zusammenhänge zusätzlich die Werte der jeweiligen Pfadkoeffizienten hinzugezogen. Diese sollten mindestens ≥ .10, besser ≥ .20 betragen (Chin, 1998; Lohmöller, 1989; Weiber & Mühlhaus, 2014). Indirekte Effekte werden mit Hilfe des Bootstrappings auf statistische Signifikanz getestet, wobei die Anzahl der Ziehungen (Bootstrap-Stichproben B) der Stichprobengröße entsprechen sollte (Weiber & Mühlhaus, 2014).

113

7 Ergebnisse

7.1 Deskriptive Analysen

Im Folgenden werden zunächst die deskriptiven Ergebnisse der einzelnen Skalen dargestellt und erste Gruppenvergleiche zwischen Deutschland und Norwegen vorgenommen.

7.1.1 Soziodemographische Variablen

Die Ergebnisse der soziodemographischen Kovariaten wie beispielsweise das Alter der Schü- ler*innen, das Geschlecht, der sozioökonomische Status sowie der Migrationshintergrund wurden bereits bei der Beschreibung der Stichprobe in Kapitel 6.5 zusammengefasst. Der Kontakt zu Menschen mit Behinderung setzt sich aus zwei Fragen mit dichotomem Antwort- format im Fragebogen zusammen: Zum einen, ob die Schüler*innen Freunde und zum ande- ren, ob sie Verwandte mit Behinderung haben. Für die Identifizierung einer inklusiven Klasse (also einer Klasse, in die ein Kind mit Behinderung geht), gab es zwei Möglichkeiten: Die Selbstauskunft der Schüler*innen über ihre Mitschüler*innen und die Auskunft der Lehr- kräfte über die Kinder und Jugendlichen mit sonderpädagogischem Förderbedarf. Da die Aus- sage der Lehrkräfte als verlässlicher eingeschätzt wurde und Förderbedarfe, die visuell nicht erkennbar sind, gegebenenfalls von den Schüler*innen weniger wahrgenommen werden, wurde entschieden, sich auf die Aussage der Lehrkräfte zu verlassen. Die Frage im Schüler*in- nenfragebogen floss nicht in die weiteren Auswertungen ein.

7.1.2 Einstellungen zu Menschen mit Behinderung (Kurzform CATCH)

Die Einstellungen zu Menschen mit Behinderung wurden mit der Kurzform des CATCH erho- ben (Bossaert & Petry, 2013). Insgesamt zeigte sich, dass sowohl in Deutschland als auch in Norwegen insgesamt positive Einstellungen zu Menschen mit Behinderung vorlagen (Tabelle 9). Trotzdem hatten norwegische Schüler*innen signifikant positivere Einstellungen zu Men- schen mit Behinderung als deutsche Schüler*innen (t(2892) = 8.33; p ≤ .001; Tabelle 9).

114

Tabelle 9. Einstellungen zu Menschen mit Behinderung der deutschen und norwegischen Schü- ler*innen, erhoben mit der Kurzform der CATCH-Skala (Bossaert & Petry, 2013; Rosenbaum et al., 1986)

n M (SD) t

Einstellungen zu Menschen mit Behinderung (CATCH)

N 992 3.64 (.86)

8.33**

D 1902 3.34 (.91)

Anmerkung. **p ≤ .001, *p ≤ .05, Range 1-5 (1 = stimme nicht zu, 2 = stimme eher nicht zu, 3 = weder/noch, 4 = stimme

eher zu, 5 = stimme zu); N=Norwegen, D=Deutschland

Wurde die Variable des Kontakts zu Menschen mit Behinderung und den Einstellungen zu Menschen mit Behinderung mit einbezogen, zeigte sich, dass die Kontakthypothese (Allport, 1954) in dieser Erhebung sowohl für Deutschland (t(1899) = 9.61; p ≤ .001) als auch Norwegen (t(984) = -6.14; p ≤ .001) bestätigt werden konnte. Dabei zeigte der t-Test für unabhängige Stichproben, dass Kinder und Jugendliche, die bereits Kontakt zu Menschen mit Behinderung hatten, auch positivere Einstellungen zu Menschen mit Behinderung äußerten (Tabelle 10). Tabelle 10. Einstellungen zu Menschen mit Behinderung je nachdem, ob bereits Kontakt zu Menschen mit Behinderung bestand oder nicht

Einstellungen zu Menschen mit Behinderung (Kurzversion des CATCH) Kontakt zu Menschen mit Behinderung n M (SD) t Norwegen Nein 701 3.53 (.86) -6.14** Ja 285 3.90 (.81) Deutschland Nein 1173 3.19 (.90) -9.61** Ja 728 3.59 (.87)

Anmerkung. **p ≤ .001; *p ≤ .05, Range 1-5 (1 = stimme nicht zu, 2 = stimme eher nicht zu, 3 = weder/noch, 4 = stimme

eher zu, 5 = stimme zu); N=Norwegen, D=Deutschland

Im Dokument Einstellungen zu Inklusion bei Kindern und Jugendlichen – eine komparative Studie in Deutschland und Norwegen (Seite 120-124)