Ineferenzstatistik

Inhaltsübersicht
Statistik bezeichnet grundsätzlich die Erfassung, Aufbereitung und Analyse von Daten und wird in drei Teilbereiche gegliedert:
- Deskriptive Statistik
- Inferenzstatistik
- Wahrscheinlichkeitsrechnung
Deskriptive Statistik
Die deskriptive Statistik – auch beschreibende Statistik genannt – legt den Fokus auf die Beschreibung von Daten – meist Daten aus Stichproben. Mithilfe dieser Stichprobenbeschreibungen trifft die Inferenzstatistik nun Aussagen über die Grundgesamtheit.
Inferenzstatistik
Die Inferenzstatistik – auch schließende, inferentielle oder induktive Statistik genannt – nutzt bestimmte statistische Instrumente, um auf Basis einer Stichprobe allgemeingültige Gesetzmäßigkeiten für eine Grundgesamtheit abzuleiten. Eine Stichprobe entspricht einem Teil der Grundgesamtheit. Wurde dieser Teil zufällig ausgewählt, handelt es sich um eine repräsentative Stichprobe – auch Zufallsstichprobe genannt. Diese Rückschlüsse auf die Grundgesamtheit sind allerdings nur mit einer gewissen Wahrscheinlichkeit zutreffend, weshalb die Wahrscheinlichkeitsrechnung in der Inferenzstatistik von großer Bedeutung ist. Die Verfahren der Stochastik zu beherrschen, ist beispielsweise die Grundvoraussetzung für die Durchführung von Hypothesentests.
Mithilfe der Inferenzstatistik soll also auf Basis einer Stichprobe auf bestimmte Eigenschaften der Grundgesamtheit geschlossen werden. Ziel ist es, von den bekannten Parametern der Stichprobe auf die unbekannten Parameter der Grundgesamtheit zu schließen.
Unterscheidung
Die Verfahren unterscheiden sich hinsichtlich ihrer Anwendbarkeit bei unterschiedlich skalierten Daten. So eignen sich manche Verfahren besser für nominalskalierte bzw. ordinalskalierte Daten, andere für intervallskalierte Merkmale.
Hyposthesentests
Die wichtigsten Methoden der Inferenzstatistik sind Hypothesentests, wie zum Beispiel der t-Test, der Chi-Quadrat Test und die Varianzanalyse. Grundsätzlich werden mit Hypothesentests – auch Signifikanztests genannt – Unterschiede zwischen Gruppen überprüft. Ziel eines solchen Tests ist es, die Gültigkeit bestimmter Hypothesen zu prüfen. Es ist allerdings statistisch quasi unmöglich, die Gültigkeit einer Hypothese vollständig zu beweisen. Deshalb beweist man, dass die Gegenhypothese unwahrscheinlich ist, wodurch man auf die Richtigkeit der sogenannten Nullhypothese schließen kann.
Anwendungssituationen
Liegt nur eine Stichprobe vor eignet sich für intervallskalierte Daten der t-Test für eine Stichprobe. Voraussetzung hierfür ist, dass die zu betrachtenden Daten mittels einer Zufallsstichprobe erhoben wurden und normalverteilt sind. Angewendet wird er dann, wenn man testen will, ob sich ein Wert der Grundgesamtheit von einem festgelegten Wert unterscheidet. Eine exemplarische Fragestellung für den t-Test für eine Stichprobe wäre die Frage, ob die Schraubenmuttern einer Firma wirklich wie angegeben einen Durchmesser von 5 Zentimetern haben. Es wird eine Stichprobe, zum Beispiel 50 Schraubenmuttern, abgemessen und anhand des t-Tests mit dem Durchmesser verglichen, den sie aufweisen sollten. Ein weiteres Beispiel wäre die Frage, ob Basketballspieler/-spielerinnen sich in ihrer Größe von dem Mittelwert der Normalbevölkerung unterscheiden.
T-Test für unabhängige Stichproben
Bei zwei unabhängigen Stichproben mit intervallskalierten Daten eignen sich – je nach Stichprobe – der t-Test für unabhängige Stichproben. Voraussetzungen hierfür sind, dass die beiden Stichproben unabhängig sind, die abhängige Variable intervallskaliert ist und die Variablen beide normalverteilt sind. Außerdem sollte die Varianz innerhalb der Stichproben relativ ähnlich sein, um einen unabhängigen t-Test durchführen zu können.
Dieser könnte zum Beispiel bei der folgenden Fragestellung angewendet werden: Wir möchten herausfinden, ob ein bestimmtes Medikament den Gewichtsverlust erleichtert. Eine Stichprobe bekommt das Medikament, die andere ein Placebo. Dann werden von den beiden Gruppen jeweils die Mittelwerte ausgerechnet und diese miteinander verglichen. So kann ein eventueller Mittelwertsunterschied zwischen den Stichproben festgestellt werden. Bei der Berechnung wird zusätzlich noch danach unterschieden, ob die Varianz der Stichproben homogen oder heterogen ist. Dies hängt von dem p-Wert des Levene-Tests ab. Je nach Art der Varianz wird dann bei der Durchführung des t-Tests eine andere Formel verwendet.
T-Test für abhängige Stichproben
Geht es um zwei voneinander abhängige Stichproben mit intervallskalierten Merkmalen, kann der t-Test für abhängige Stichproben angewendet werden. Ziel ist es, herauszufinden, ob sich die Mittelwerte von zwei abhängigen Stichproben signifikant voneinander unterscheiden. „Abhängig bedeutet in diesem Fall, dass jeweils ein Messwert aus der einen Stichprobe von einem Messwert aus der anderen Stichprobe abhängig ist, also, dass die Werte jeweils in Paaren vorliegen. Dies ist beispielsweise bei Längsschnittstudien der Fall, wo Merkmale der gleichen Person an verschiedenen Messzeitpunkten erfasst werden.
Für die Anwendung dieses t-Tests müssen drei Voraussetzungen erfüllt sein:
- Die Differenzen der jeweils gepaarten Merkmale muss normalverteilt sein.
- Außerdem müssen die Variablen intervallskaliert und die beiden Gruppen voneinander abhängig sein.
- Im Gegensatz zum t-Test für unabhängige Stichproben wird hier nicht nach homogenen oder heterogenen Varianzen unterschieden.
Chi Quadrat Test
Liegen zwei voneinander unabhängige Stichproben vor, kann für nominal- oder ordinalskalierte Merkmale der Chi-Quadrat Test angewendet werden. Dieser Test macht Aussagen über den Zusammenhang von nominalen und ordinalen – also kategorischen – Variablen in Bezug auf die stochastische Unabhängigkeit. Es wird geprüft, ob die in der Stichprobe beobachteten Häufigkeiten sich signifikant von den erwarteten Häufigkeiten unterscheiden. Voraussetzung hierfür ist zunächst das Skalenniveau der Merkmale. Außerdem sollte die Größe der Stichproben über 50 liegen. Zum Beispiel könnte durch eine Befragung von Mittelstufenschülern untersucht werden, ob es einen Zusammenhang zwischen den beiden Merkmalen „Geschlecht“ und „Sportliche Aktivität“ gibt. Das Ergebnis ist zunächst eine Häufigkeitstabelle. Wie aber bei allen gängigen Hypothesentests muss auch bei dem vermeintlich simpleren Chi-Quadrat Test anhand des Signifikanzniveaus und den Freiheitsgrad ein kritischer Wert abgelesen werden. Es ist mit dem Chi-Quadrat Test nicht möglich, die Stärke oder Richtung eines Zusammenhangs zu bestimmen, weshalb oft im weiteren Verlauf beispielsweise der Kontingenzkoeffizient von Pearson berechnet wird.
Varianzanalyse
Liegen komplexere Testsituationen mit mehr als zwei unabhängigen Stichproben mit intervallskalierten Daten vor, so wird die Varianzanalyse angewendet. Während der Analyse werden die Mittelwerte und Varianzen der Stichproben miteinander verglichen. Ziel ist es, zu prüfen, ob statistisch signifikante Unterschiede zwischen den verschiedenen Stichproben vorhanden sind. Im Gegensatz zum t-Test handelt es sich hierbei aber um mehr als zwei unterschiedliche Stichproben.
Eine Varianzanalyse kann einfaktoriell oder zweifaktoriell durchgeführt werden. Bei der einfaktoriellen Analyse wird der Einfluss einer unabhängigen Variablen auf eine abhängige Variable überprüft, während bei der zweifaktoriellen Analyse der Einfluss von zwei unabhängigen Variablen auf die abhängige Variable getestet wird. Das unabhängige Merkmal wird demnach als Faktor betrachtet, der eine Wirkung auf ein anderes (abhängiges) Merkmal hat.
Sind die Stichproben voneinander abhängig, ändert sich nur, dass die ein- oder zweifaktorielle Varianzanalyse jeweils mit Messwiederholungen durchgeführt werden muss. Dies ist – wie auch beim t-Test für abhängige Variablen – vor allem bei Längsschnittstudien mit mehreren Messzeitpunkten der Fall.
Ein Beispiel für eine einfaktorielle Varianzanalyse wäre die Fragestellung, ob es bei Studierenden aus 10 verschiedenen Studienfächern signifikante Unterschiede hinsichtlich des Zeitaufwandes gibt.
Intervallschätzung
Ein weiteres Verfahren der Inferenzstatistik ist die Intervallschätzung, bei der die Bestimmung eines Intervalls im Fokus steht. In diesem soll eine zu schätzende Variable der Grundgesamtheit mit einer angegebenen Wahrscheinlichkeit liegen. Das bedeutendste Verfahren der Intervallschätzung ist die Konfidenzschätzung.
Studydrive - Dein Begleiter im Studium
Mit Studydrive bist du im Studium immer bestens gewappnet! Tausche dich mit anderen Studierenden aus, bekomme Hilfe auf Augenhöhe für offene Fragen, verpasse nichts, was zwischen deinen Kommilitonen in den Kursen ausgetauscht wird und finde hilfreiches Lernmaterial.