Durch

Nathan Auyeung

—

21.05.2026

Arten der Validität in der Forschung verständlich erklärt

Nathan Auyeung

Senior Accountant bei EY

Abschluss mit einem Bachelor in Rechnungswesen, abgeschlossenes Postgraduate-Diplom in Rechnungswesen

Forschungsergebnisse sind nur dann nützlich, wenn sie auch tatsächlich das messen, was die Forscher vorgeben. Ohne diese Validität können die Schlussfolgerungen einer Studie irreführend oder schlichtweg falsch sein.

Dieser Leitfaden erklärt die wichtigsten Arten von Validität, auf die Sie stoßen werden – wie interne, externe und Konstruktvalidität – anhand klarer Beispiele aus der Psychologie und klinischen Studien.

Wir zeigen Ihnen, wie Sie diese erkennen und warum sie für Ihre eigene Arbeit wichtig sind. Sind Sie bereit, Ihre Forschung robuster zu machen? Lassen Sie uns direkt einsteigen.

Die verschiedenen Validitätsarten in der Forschung verstehen

Die Validität einer Forschungsarbeit ist keine einzelne Zahl. Sie ist das gesamte Fundament einer Studie. Wenn Ihre Methode nicht das Konzept misst, das Sie anstreben, stehen Ihre Ergebnisse auf sandigem Boden.

Die American Psychological Association betrachtet sie als zwingenden Standard für glaubwürdige Arbeiten in der Psychologie und verwandten Disziplinen. Ohne dieses Fundament verliert selbst die anspruchsvollste Statistik ihre Aussagekraft.

Forscher kategorisieren die Validität, um verschiedene Aspekte der Genauigkeit einer Studie zu untersuchen. Jede Art hat ihre eigene Funktion. Sie helfen dabei zu überprüfen, ob Ihre Instrumente geeignet sind und ob Ihre Ergebnisse auch im echten Leben Bestand hätten.

Wichtig ist, sie als zusammenhängendes System und nicht als bloße Checkliste zu betrachten.

Wenn Sie besser verstehen möchten, wie Forschungsansätze die Entscheidungen zur Validität beeinflussen, können Sie sich mit Forschungsparadigmen befassen, die die philosophischen Grundlagen hinter den verschiedenen Studiendesigns erklären.

Warum ist das so wichtig? Die Validität beeinflusst jede einzelne Entscheidung, die Sie treffen – von der Formulierung einer Umfragefrage bis hin zur Interpretation der endgültigen Daten.

Sie entscheidet darüber, ob Ihre Schlussfolgerungen vertrauenswürdig sind und ob sie über Ihre spezifische Stichprobe hinaus angewendet werden können.

In der Praxis minimiert eine hohe Validität Verzerrungen, führt zu robusteren wissenschaftlichen Aussagen und ist absolut entscheidend, um Ihre Arbeit erfolgreich durch das Peer-Review-Verfahren zu bringen. Sie macht den Unterschied zwischen einer bloßen Vermutung und einer wissenschaftlichen Tatsache.

Arten der Messvalidität

Bei der Messvalidität geht es um Ihre Instrumente. Sie stellt die Frage: Erfasst Ihre Umfrage, Ihr Test oder Ihr Instrument tatsächlich das Konzept, das Sie untersuchen? Wenn Ihr Thermometer Optimismus statt der Temperatur messen würde, wären Ihre Daten nutzlos.

Bei der Planung Ihrer Studie – insbesondere beim Vergleich von Methoden, wie sie im Artikel über qualitative versus quantitative Forschung besprochen werden – haben Ihre Messentscheidungen direkten Einfluss auf die Validitätsergebnisse.

Forscher bewerten dies in der Regel anhand von drei Haupttypen: Konstrukt-, Inhalts- und Augenscheinvalidität. Für einen ergänzenden Blick auf die Zuverlässigkeit (und wie sie sich von der Validität unterscheidet), lesen Sie unseren Leitfaden zu den Arten der Reliabilität in der Forschung.

Konstruktvalidität ist die tiefgehendste Überprüfung. Sie prüft, ob Ihr Instrument wirklich das misst, was Sie beabsichtigen – wie etwa „Resilienz“ oder „Kundenloyalität“ – und nicht etwas anderes.
Inhaltsvalidität betrifft die Vollständigkeit. Sie stellt sicher, dass Ihre Messung alle wichtigen Aspekte des Konzepts abdeckt. Eine gute Umfrage zur Arbeitszufriedenheit sollte Gehalt, Arbeitsumfeld und Karriereentwicklung berücksichtigen, nicht nur einen dieser Aspekte.
Augenscheinvalidität (Face Validity) ist die einfachste Form. Es handelt sich um eine oberflächliche Bewertung: Sieht das Instrument danach aus, als würde es das messen, was es soll? Auch wenn dies subjektiv ist, kann eine mangelnde Augenscheinvalidität das Vertrauen der Teilnehmer untergraben.

Ein guter Depressionstest sollte beispielsweise viele verschiedene Symptome untersuchen, sowohl emotionale als auch körperliche, und nicht nur reine Traurigkeit.

Kriteriumsvalidität: Der Praxistest

Diese Art schlägt die Brücke von der Theorie zur Praxis. Die Kriteriumsvalidität vergleicht Ihre Messung mit einem externen, realen Maßstab. Sie tritt in zwei Hauptformen auf:

Prädiktive Validität fragt, ob Ihr Instrument ein zukünftiges Ereignis vorhersagen kann. Ein aussagekräftiger Studieneignungstest sollte die Noten des ersten Studienjahres erfolgreich prognostizieren können.
Konkurrente Validität (Übereinstimmungsvalidität) prüft, ob Ihr Werkzeug mit einer bekannten, zum gleichen Zeitpunkt durchgeführten Messung übereinstimmt. Ein neuer, schneller Angst-Screening-Test sollte mit den Ergebnissen eines etablierten, längeren klinischen Interviews korrelieren.

Validitätsart	Was geprüft wird	Beispiel	Aussagekraft
Konstruktvalidität	Theoretische Genauigkeit	Misst dieser Test tatsächlich Intelligenz?	Hoch
Inhaltsvalidität	Vollständigkeit der Abdeckung	Umfasst unsere Umfrage alle Schlüsselaspekte der Arbeitszufriedenheit?	Mittel
Augenscheinvalidität	Oberflächlicher Eindruck	Wirkt dieser Fragebogen für das Thema relevant?	Gering
Kriteriumsvalidität	Externer Vergleich	Stimmt unser neuer Risikoscore mit den tatsächlichen Patientenergebnissen überein?	Hoch

Die Tabelle zeigt, wie Validität bei einer einfachen Augenscheinvalidität ansetzt und sich hin zu einer stärkeren, evidenzbasierten Überprüfung entwickelt.

Experimentelle und Design-Validität

Wenn eine Studie beweisen will, dass A die Ursache für B ist, steht ihre experimentelle Validität auf dem Spiel. Wenn Sie Zusammenhänge analysieren, ohne Variablen aktiv zu verändern, erklärt unsere Übersicht zur Korrelationsforschung, welche Schlussfolgerungen Sie ziehen können und welche nicht. Dies ist der grundlegende Weg, um Ursache und Wirkung aufzuzeigen, was in Bereichen wie klinischen Studien und der Bildungsforschung von zentraler Bedeutung ist.

Laut den Centers for Disease Control and Prevention (CDC) können Sie bei einer schlecht geplanten Studie nicht feststellen, ob Ihre Ergebnisse das Resultat Ihrer Arbeit oder nur ein Zufall waren. Kurz gesagt: Eine schwache Studie macht es unmöglich zu beweisen, dass Ihre Intervention wirklich den Unterschied ausgemacht hat.

Interne Validität: Die Ursache isolieren

Dies ist der Kern der experimentellen Logik. Die interne Validität fragt: Hat die von Ihnen vorgenommene Änderung tatsächlich das beobachtete Ergebnis bewirkt, oder könnte es eine andere Erklärung dafür geben? Forscher arbeiten daran, Störfaktoren zu kontrollieren, die diese Verbindung verfälschen könnten.

Noch bevor man diese prüft, ist es wichtig, einen klaren Forschungsschwerpunkt zu definieren. Wenn Sie sich unsicher sind, wie Sie Ihre Studie richtig aufbauen, kann dieser Leitfaden zum Thema Formulierung einer Forschungsfrage Ihnen dabei helfen, dass Ihre Bemühungen um Validität auf einem soliden Fundament stehen.

Häufige Bedrohungen für die interne Validität sind:

Selektionsbias (Auswahlverzerrung), bei dem die Gruppen zu Beginn nicht vergleichbar sind.
Zwischenzeitliche Einflüsse (History Effects), bei denen ein äußeres Ereignis die Ergebnisse beeinflusst.
Veränderungen der Messinstrumente (Instrumentation), wie der Wechsel von Messwerkzeugen mitten in der Studie.
Teilnehmerschwund (Attrition), bei dem ungleiche Ausfallquoten die finale Stichprobe verzerren.

In einer Medikamentenstudie müssen Forscher sicherstellen, dass tatsächlich die Medizin den Patienten geholfen hat. Wenn die Patienten zur gleichen Zeit auch angefangen haben, sich gesünder zu ernähren, lässt sich schwer sagen, ob sie wegen der Tablette oder wegen ihrer neuen Ernährung gesund wurden.

Sie können eine tiefergehende Erklärung der Validität in der Forschung und ihrer verschiedenen Typen lesen, um besser zu verstehen, wie sich diese Störfaktoren auf die Genauigkeit einer Studie auswirken.

Externe Validität: Über das Labor hinaus

Wenn die interne Validität fragt „Hat es hier funktioniert?“, dann fragt die externe Validität „Wird es auch da draußen funktionieren?“. Sie bewertet, wie breit sich Ihre Ergebnisse auf andere Menschen, an anderen Orten oder zu anderen Zeiten übertragen lassen.

Hier gibt es oft ein Spannungsverhältnis. Ein Experiment funktioniert im Labor vielleicht perfekt. Wenn die Situation jedoch zu „künstlich“ ist, lassen sich die Ergebnisse im echten Leben möglicherweise nicht auf dieselbe Weise reproduzieren.

Eine breit angelegte nationale Umfrage hingegen weist in der Regel eine stärkere externe Validität auf, steht jedoch vor größeren Herausforderungen, wenn es darum geht, jede einzelne Störvariable zu kontrollieren.

Ökologische Validität: Der Praxistest

Dies ist ein spezifischer Aspekt der externen Validität. Die ökologische Validität konzentriert sich darauf, wie natürlich die Studienumgebung und die Aufgaben den realen Kontext widerspiegeln, den Sie verstehen möchten. Sie ist in der Psychologie, der Pädagogik und der User-Experience-Forschung von entscheidender Bedeutung.

Die Untersuchung, wie Kinder Probleme in ihrem tatsächlichen Klassenzimmer lösen, besitzt eine höhere ökologische Validität, als wenn man sie für dieselbe Aufgabe in ein steriles, ruhiges Labor bringt. Erstere erfasst den Lärm, die Ablenkungen und die soziale Dynamik, die Teil des realen Phänomens sind.

Fortgeschrittene Validitätsnachweise

Sobald Sie die grundlegenden Typen etabliert haben, können Sie Ihre Messung durch fortgeschrittene Validitätsnachweise weiter untermauern. Diese Methoden stärken die Konstruktvalidität durch konvergierende Beweise aus verschiedenen Richtungen.

Konvergente und diskriminante Validität

Betrachten Sie dies als Gegenprüfung für Ihre theoretischen Konzepte.

Konvergente Validität liefert den Nachweis, dass Ihre Messung stark mit anderen Instrumenten korreliert, die dasselbe oder ein sehr ähnliches Konstrukt erfassen sollen. Wenn Ihre neue „Resilienz-Skala“ nicht mit bereits existierenden, bewährten Resilienz-Fragebögen korreliert, ist das ein Problem.
Diskriminante Validität (Divergente Validität) liefert den Nachweis, dass Ihre Messung nicht stark mit Instrumenten korreliert, die theoretisch andere Konzepte messen sollen. Ihre Resilienz-Skala sollte keine Ergebnisse liefern, die identisch mit denen einer allgemeinen Umfrage zur Lebenszufriedenheit sind.

Beispielsweise sollten die Werte einer gut konzipierten Angst-Skala eine sinnvolle Beziehung zu einem Stress-Inventar aufweisen (konvergente Validität).

Gleichzeitig sollten diese Angstwerte jedoch nicht stark mit den Ergebnissen einer Mathematikklausur zusammenhängen (diskriminante Validität). Dieses Muster bestätigt, dass „Angst“ in Ihrer Studie ein eigenständiges und klar abgegrenztes Konzept ist.

Statistische Validität

Bei dieser Art geht es weniger darum, was Sie messen, sondern vielmehr darum, wie Sie die Daten analysieren. Die statistische Validität hinterfragt, ob Ihre statistischen Tests richtig konzipiert sind, um eine tatsächliche Beziehung oder einen Effekt zu erkennen, sofern dieser existiert.

Sie konzentriert sich darauf, zwei wesentliche Fehler zu vermeiden: Einen Effekt fälschlicherweise anzunehmen, der nicht existiert (Fehler 1. Art), und einen tatsächlich vorhandenen Effekt zu übersehen (Fehler 2. Art).

Eine praxisnahe Aufschlüsselung finden Sie in diesem Leitfaden über Validitätsarten und Beispiele, der statistisches Denken mit realem Studiendesign verknüpft.

Forscher in quantitativen Bereichen wie der Epidemiologie oder den Wirtschaftswissenschaften achten hierauf besonders genau. Dazu gehört das Überprüfen von Voraussetzungen für Tests wie Regression oder Korrelation, die Sicherstellung einer ausreichenden Stichprobengröße (Power) sowie die korrekte Interpretation von p-Werten und Konfidenzintervallen.

Eine schwache statistische Validität bedeutet, dass Sie den grundlegenden numerischen Ergebnissen Ihrer Analyse nicht vertrauen können, ganz gleich, wie gut Ihre Messinstrumente auch sein mögen.

Interne vs. externe Validität in der Forschung

Bei der Durchführung einer Studie versuchen Forscher zwei Dinge gleichzeitig zu erreichen: Ursache-Wirkungs-Beziehungen aufzuzeigen und sicherzustellen, dass die Ergebnisse auch im echten Leben Sinn ergeben. Dies ist das grundlegende Spannungsfeld zwischen interner und externer Validität.

Interne Validität dreht sich um Kontrolle und Präzision. Sie fragt: „Kann ich darauf vertrauen, dass meine Intervention die Veränderung bewirkt hat, die ich in diesem spezifischen Experiment beobachtet habe?“ Sie erfordert streng kontrollierte Bedingungen, um alternative Erklärungen auszuschließen.
Externe Validität dreht sich um Generalisierbarkeit und Anwendung. Sie fragt: „Würde dieses Ergebnis auch für andere Menschen, an anderen Orten oder zu anderen Zeiten gelten?“ Sie strebt nach Alltagsrelevanz.

Es gibt hierbei einen unweigerlichen Kompromiss. Ein perfekt kontrolliertes Laborexperiment, bei dem jede Variable kontrolliert wird, maximiert die interne Validität. Seine künstliche Umgebung kann jedoch die externe Validität schwächen, sodass sich schwer sagen lässt, ob die Ergebnisse auch außerhalb des Labors Bestand haben.

Eine Studie, die an einem realen Ort wie einem Klassenzimmer oder einer Gemeinde durchgeführt wird, wirkt natürlicher und spiegelt das echte Leben besser wider. Allerdings bietet sie weniger Kontrolle, weshalb Ursache-Wirkungs-Beziehungen schwerer nachzuweisen sind.

Das richtige Gleichgewicht hängt ganz von Ihrer Forschungsfrage ab. Ein Pharmakologe, der die Wirkungsweise eines neuen Medikaments testet, priorisiert die interne Validität. Ein Vertreter des öffentlichen Gesundheitswesens, der ein kommunales Wellnessprogramm entwirft, benötigt dagegen eine stärkere externe Validität.

Faktor	Interne Validität	Externe Validität
Hauptfokus	Nachweisen von Ursache und Wirkung	Generalisierung von Ergebnissen
Typisches Umfeld	Kontrolliertes Labor	Reale Umgebung
Größte Stärke	Hohe Präzision und Kontrolle	Hohe Anwendbarkeit im Alltag

Eine gut konzipierte Studie erreicht nicht in beiden Spalten Höchstwerte. Stattdessen wählt sie die Validitätsart, die für ihr Ziel am wichtigsten ist, richtet das Forschungsdesign danach aus und akzeptiert die damit einhergehenden Grenzen.

Validität in akademischen Diskussionen und Missverständnisse in der Praxis

Die Theorie der Validität ist theoretisch klar strukturiert. Ihre Anwendung in der Praxis ist oft kompliziert. Selbst Forscher sind sich über die genauen Definitionen nicht immer einig, und die Konzepte überschneiden sich häufig. Aus diesem Grund stimmt das, was man in Lehrbüchern lernt, nicht immer mit der tatsächlichen Anwendung in der Forschung überein.

Studierende und Berufseinsteiger in der Forschung stehen oft vor den gleichen Hürden. Auf Foren wie r/statistics auf Reddit ist die Verwechslung von Konstrukt- und Kriteriumsvalidität ein Dauerthema.

Meist stößt man auf dieselben Probleme: Verschiedene Validitätsarten werden verwechselt, abstrakte Ideen bereiten Schwierigkeiten, und es wird versucht, komplexe Daten in starre Raster zu pressen. Ohne konkrete Beispiele wirkt die Theorie oft realitätsfern.

Plattformen wie Quora zeigen einen anderen Ansatz. Experten dort versuchen häufig, diese Lücke zu schließen, indem sie strukturierte Schritt-für-Schritt-Anleitungen anbieten.

Sie konzentrieren sich auf mathematische Werkzeuge wie die Faktorenanalyse oder Regressionen, mit denen Forscher die Validität ihrer Ergebnisse nachweisen. Dieser Wechsel von „Was es ist“ zu „Wie man es beweist“ ist entscheidend für den Übergang von der Theorie zur Praxis.

In den sozialen Medien, insbesondere auf X (Twitter), wird die Diskussion stark vereinfacht. Validität wird dort oft auf kurze, einprägsame Ratschläge reduziert: „Messen Sie das, was Sie zu messen beabsichtigen.“

Das ist zwar nicht falsch, lässt aber die notwendige Komplexität völlig vermissen. Es hilft niemandem bei der Entscheidung, ob eine Studie eine bessere interne Kontrolle oder eine breitere Stichprobe benötigt.

Auch YouTube-Tutorials bringen Herausforderungen mit sich. Um das Thema in ein kurzes Video zu packen, vereinfachen die Ersteller es oft so stark, dass wichtige Details verloren gehen.

Die Kommentare unter diesen Videos sprechen Bände. Viele Nutzer bitten um klarere, detailliertere Erklärungen. Andere äußern Frustration darüber, dass das vereinfachte Modell nicht funktioniert, wenn sie versuchen, es auf ihre eigenen Arbeiten oder Aufgaben anzuwenden.

Es besteht kein Bedarf an noch mehr Theorie, sondern vielmehr an einer Übersetzung in die praktische Sprache des Forschungsdesigns und der wissenschaftlichen Kritik.

Validitäts-Checkliste für Forschende

Hier ist ein praktischer Leitfaden, um sicherzustellen, dass Sie bei der Planung Ihrer Studie alle verschiedenen Validitätsaspekte berücksichtigen.

So gehen Sie vor

Formulieren Sie präzise, was genau Sie messen möchten.
Stellen Sie sicher, dass Ihre Instrumente dieses Konzept auch tatsächlich erfassen.
Suchen Sie nach Störfaktoren innerhalb Ihrer Studie, die die Ergebnisse verzerren könnten.
Bestimmen Sie, inwiefern sich Ihre Ergebnisse auf andere Bereiche übertragen lassen.
Führen Sie statistische Berechnungen durch, um zu prüfen, ob Ihre Messungen konsistent sind.
Prüfen Sie, ob Ihre Ergebnisse tatsächlich mit der Theorie übereinstimmen, von der Sie ausgegangen sind.

Um Ihre Studie an formale Standards anzupassen, lesen Sie die offiziellen Berichtsstandards der APA für die Forschung (JARS), die Best Practices für eine transparente und valide Berichterstattung beschreiben.

Wozu das Ganze dient: Stellen Sie sich vor, Sie bauen eine Brücke. Jeder Punkt in dieser Liste ist wie ein zusätzlicher Stützpfeiler. Wenn Sie einen weglassen, wird die gesamte Konstruktion instabiler.

Dieser Ansatz hilft dabei, Verzerrungen zu reduzieren und Ihre Forschung zuverlässiger zu machen. Er lässt sich auf verschiedene Fachbereiche wie Psychologie, Wirtschaftswissenschaften und weitere anwenden, wodurch Ihre Ergebnisse an Glaubwürdigkeit gewinnen.

Validität in klare, verlässliche Forschung verwandeln

Wahrscheinlich haben Sie schon versucht, die verschiedenen Validitätsarten zu verstehen, und waren sich dennoch unsicher, ob Ihre Studie wirklich standhält. Es wird schnell unübersichtlich, und es kommen Zweifel auf.

Inhaltsverzeichnis