In diesem Abschnitt erfolgt eine umfassende Reflexion des methodischen Vorgehens, dabei werden die Schwachstellen dieser Studie benannt und Verbesserungsvorschläge eingebracht. Eine kritische Betrachtung verdienen die Umstände der Erstellung des TEKL-Tests. Der Test wurde in Ermangelung von passenden Testinstrumenten entwickelt, um die Veränderung der Kreativität im Kontext des Design Thinking-Lernsettings zu erfassen, und ist somit ein Pilotfragebogen. Wie die Faktorenanalyse zeigt, sind hier noch einige Schwächen vorhanden. Es konnten nicht alle gewünschten Faktoren dementsprechend statistisch analysiert werden. Dies liegt an der sprachlich divergierenden Variante von Pre- und Post-Test, sowie der Itemformulierung. Um sinnvoll vergleichen zu können, muss die Formulierung der Fragen identisch sein, damit es sich um den exakt selben Test handelt. Es hätte darauf geachtet werden müssen, dass der Test zeitneutral (z.B. keine Verwendung von heute) sowie personenneutral (keine Verwendung von ich Formulierungen) formuliert wird. Die Empfehlung für weitere Forschung wäre ein valides Testinstrument zu entwickeln, dass diesen Kriterien entspricht. In der dargestellten Inhalts- und Faktorenanalyse wurden lediglich die Werte des Pre-Tests analysiert. Diese Ergebnisse sind, anhand der oben aufgeführten Kriterien, jedoch als für die Studie hinreichend einzuschätzen. Dies kann auch als Grund angenommen werden warum die Items des Kreativitätsaspekts Ambiguitätstoleranz hier vollständig ausgeschlossen wurden. Daher gilt es hier einen validen und ausgereiften Fragebogen zu entwickeln. Der TEKL-Test bietet lediglich einen Ausgangspunkt für die valide Entwicklung eines solchen neuen Testinstruments.

Auch die weitere Analyse des TEKL-Tests birgt Probleme. Aus der Literatur wurden sechs Kreativitätsfaktoren identifiziert in der Faktorenanalyse ergab sich jedoch eine drei faktorielle Lösung. Grund dafür können zu wenig Items sein oder auch eine zu kleine Stichprobe. Dies müsste in einer weiteren Studie umfassend untersucht werden. Dies ist jedoch nicht der Hauptfokus der vorliegenden Arbeit. Hier ergeben sich Möglichkeiten weitere Forschungsarbeiten anzuschließen. Verbesserungspotenzial wird auch darin gesehen, mehr Items zu entwickeln und auch invertierte (negativ formulierte) Items zu nutzen.

Ein weiterer Aspekt bezieht sich ebenfalls auf den selbstentwickelten TEKL-Test. Einige Teilnehmer haben nicht das volle Antwortformat ausgenutzt. Dies kann ein Hinweis darauf sein, dass das Antwortformat zu differenziert ist oder die Items zu leicht oder zu schwer sind. Hier hätten an der Itemformulierung Verbesserungen vorgenommen werden können, so dass zumindest wenige Teilnehmer die nicht besetzten Antwortkategorien auswählen würden (Bühner 2011). Für dieses Verhalten kommen unterschiedliche Effekt in Frage, zum Beispiel die soziale Erwünschtheit oder die Tendenz zur Milde. Eine mögliche Erklärung für die Nicht- Nutzung der gesamten Skala ist die soziale Erwünschtheit, da vor allem bei den Antworten „stimme eher nicht zu“ und „stimme überhaupt nicht zu“ die Antwortmöglichkeiten nicht ausgewählt wurden. Vergleiche dazu auch Kapitel 4.7 „Potenzielle Störfaktoren der Untersuchung“. Vor allem Auskünfte über Sachverhalte, die als besonders heikel gelten, sind besonders stark von einem, durch soziale Erwünschtheit geprägten Antwortverhalten beeinflusst. Je heikler eine Frage ist, desto stärker macht sich auch der Effekt der sozialen Erwünschtheit bemerkbar. Es ist naheliegend, dass auch Angaben zur eigenen Kreativität als besonders privat und damit als heikel eingestuft werden können. Als ein weiterer Einflussfaktor für sozial erwünschtes Antwortverhalten wird in der Literatur die Anwesenheit Dritter genannt (Häder & Häder 2009). Hier gilt es das Forschungsdesign kritisch zu hinterfragen, da die Teilnehmer der Untersuchung bei der Beantwortung der Fragen in Gruppengröße nebeneinandersaßen und so genau gesehen werden konnte, wie der Sitznachbar die Fragen beantwortet. So kommt möglicherweise eine Verzerrung des Antwortverhaltens in dem positiven Bereich zustande. Als ein weiterer Einflussfaktor kann das Alter der Teilnehmer genannt werden. Da noch nicht alle Teilnehmer das mögliche Selbstbewusstsein entwickelt haben, auch Schwächen offen zuzugeben, somit wird möglicherweise positiver geantwortet. Auf der anderen Seite besteht natürlich auch die Möglichkeit, dass vor allem die Antwortkategorie „stimme überhaupt nicht zu“ tatsächlich nicht so häufig aufgetreten ist. Eine weitere mögliche Erklärung für diesen Effekt ist die sogenannte Tendenz zur Milde / Härte, im englischen auch error of extreme tendency gennant. Hierbei neigen Befragte dazu, unabhängig vom Inhalt der Frage die Extremkategorien in Ratingskalen anzugeben. Obwohl die Extrempole von Ratingskalen selten genutzt werden, kann dieses Verhalten bei Befragten unter Umständen auftreten. Dabei kam Greenleaf (1992) in seiner Studie zu dem Ergebnis, dass vor allem ältere Menschen, Menschen mit geringerer Bildung und geringerem Einkommen zu Extremantworten neigen (Bogner & Landrock 2014). Die zwei letzten genannten Aspekte könnten daher ebenfalls eine Rolle spielen. Die umfangreich dargelegten Faktoren könnten mögliche Einflüsse

auf das Antwortverhalten der Teilnehmer darstellen. Sie wurden in diese Studie jedoch nicht weitergehend untersucht.

Als ein weiter Kritikpunkt kann in dieser Studie die Aufteilung der Gruppen in Gruppe 1 und Gruppe 2 genannt werden. Die Aufteilung hätte auch nach einer anderen Methode erfolgen können, wie die Betrachtung des oberen und unteren Quartils, so dass jeweils nur die Extremfälle näher analysiert worden wäre. Für diese Studie hat es sich jedoch als nicht sinnvoll herausgestellt, da sonst eine zu kleine Fallzahl, insbesondere bei den Interviews, in die Auswertung eingeflossen wären. Für eine Studie mit einer größeren Stichprobe würde sich ein solches Vorgehen jedoch anbieten. Auch die Vergrößerung der Lücke um den Median (Ausschluss von je fünf Punkten plus und minus um den Median) hätte anders erfolgen können. Eine Option ist keine Werte aus der Studie auszuschließen. Dies hätte jedoch zur Folge, dass keine deutliche Abgrenzung zwischen Gruppe 1 und Gruppe 2 existiert. Um jedoch eine deutliche Abgrenzung zwischen Gruppe 1 und Gruppe 2 zu haben, wurde die Einteilung auf diese Art vollzogen.

Einer kritischen Betrachtung bedarf die Maßnahme an sich. Das Design Thinking-Lernsetting wurde nach dem aktuellsten Stand der Forschung sowie in einem engen Austauschprozess und in Kooperation mit Experten entwickelt. Möglicherweise wurden im Design Thinking- Lernsetting andere Aspekte gefördert, die nicht durch die genutzten Messinstrumente erfasst wurden.

Weitere Betrachtung bedarf die Teilnehmerzahl der Studie. Diese ist abhängig von der Teilnehmerzahl der Auszubildenden der kooperierenden Unternehmen. Dabei ist Anzumerken, dass die Unternehmen zum Teil kleine Gruppen zu der Teilnahme am klimAZUBI Projekt entsandten. Die Teilnehmerzahl steht somit auch im Zusammenhang mit den Ergebnissen der statistischen Auswertungen. Daher lag der Fokus vor allem auf den qualitativen Interviews, da diese auch durch eine Analyse kleiner Fallzahlen valide Ergebnisse liefern. Um mögliche statistische Effekte besser analysieren zu können, sollte die Studie mit einer größeren Teilnehmerzahl neu aufgelegt werden, die benötigte Teilnehmerzahl kann dabei den Berechnungen, die mittels GPower erfolgten, entnommen werden.

Im Dokument Design Thinking und die Veränderung von Kreativität – im Kontext betrieblicher Anpassung an den Klimawandel (Seite 131-133)