Lücken in der Tabelle

Wie mit fehlenden Daten unter Verwendung mehrerer Anrechnungs beschäftigen.

Modernes fehlende Daten Verfahren, wie zum Beispiel mehreren Anrechnungs und vollständigen Informationen Maximum-Likelihood-Schätzung, bietet eine viel bessere Art und Weise mit der Frage der fehlenden Daten zu befassen. Diese Verfahren beruhen auf weniger strengen Annahmen darüber, warum die Daten fehlen, und unvoreingenommene Parameterschätzungen erzeugen. Sie tun auch nicht negativ auf die statistische Aussagekraft auswirken. Mit den jüngsten Fortschritten in der Software, nun moderne fehlenden Daten Verfahren können in vielen statistischen Softwarepakete durchgeführt werden (zum Beispiel SPSS, SAS und R).







Addressing Fehlende Daten: Eine kurze How-To Guide

In einem ersten Schritt sollten Sie die fehlenden Datenmuster innerhalb Ihres Datensatzes prüfen und festzustellen, welche Variablen fehlenden Daten haben. Dann eine bessere Vorstellung davon zu bekommen, warum die Werte fehlen, ist es wichtig, die drei wichtigsten Mechanismen für die fehlenden Daten zu berücksichtigen:

Hier ist ein praktisches Beispiel eines MCAR und nicht-MCAR Fall unter Verwendung desselben Datensatzes zeigt. Sagen Sie Daten für 50 Teilnehmer auf Größe und Gewicht haben. Sie haben Gewichtsdaten für alle 50 Teilnehmer, aber nur Höhendaten für 25 haben, um festzustellen, ob „Höhe“ MCAR ist, würden Sie zunächst getrennte Teilnehmer auf der Grundlage, ob sie ihre Höhe angegeben. Daher würde man eine Gruppe von Teilnehmern hat, die ihre Höhe und eine andere Gruppe von Teilnehmern berichteten, die nicht ihre Höhe berichten. Als nächstes würden Sie einen t-Test durchzuführen, wenn diese beiden Teilnehmergruppen in Bezug auf ihr Mittelgewicht unterscheiden zu untersuchen.







Fall 1: Die Daten sind MCAR: Teilnehmer, die nicht ihre Höhe gemeldet haben ein vergleichbares mittleres Gewicht im Vergleich zu Teilnehmern, die ihre Höhe berichten haben. Mit anderen Worten, hat Gewicht in keinen Zusammenhang, ob die Teilnehmer ihre Höhe angegeben. Die t-Test-Statistik ist nicht signifikant, und Sie schließen daraus, dass „Höhe“ MCAR ist.

Fall 2: Die Daten sind nicht MCAR: Aus Gründen, die unklar sind, Teilnehmer, die nicht ihre Höhe Gewicht hat gemeldet haben ein niedrigeres bedeuten im Vergleich zu Teilnehmern, die ihre Höhe taten berichten. Mit anderen Worten, ist das Gewicht bezogen auf, ob die Teilnehmer ihre Höhe angegeben. Die t-Test-Statistik ist signifikant, und Sie schließen daraus, dass „Höhe“ ist nicht MCAR.

In der Analysephase werden Sie die statistische Analyse der Wahl durchzuführen (z logistische Regression) und das Programm wird jedes der m kalkulatorischen Datensätze analysieren. Deshalb, wenn Sie 20 kalkulatorische Datensätze haben, wird das Programm 20 Parameterschätzungen und Standardfehler erzeugen.

Anstelle die Ergebnisse aus einem einzelnen kalkulatorischen Datensatz unter Verwendung einer Mehrfachanalyse imputation pools oder Mittelwert, der m-Parameterwert zu einer einzigen Punktschätzung. Sie berichten dann die gepoolten Ergebnisse bei Ihrer Recherche Präsentation oder Manuskript.

Software-Optionen

Software-Pakete, wie SPSS, SAS und R, sind in der Lage mehr imputation durchführt. Die fehlenden Werte Add-on in SPSS die Reihe von unabhängigen t -Tests durchführt. Darüber hinaus automatisiert SPSS die Analyse und Pooling-Phasen. Die SPSS Anrechnungsverfahren stellen die imputations in einer einzigen Datei, mit einer Identifizierungsvariable zu jedem Datensatz angehängt. Obwohl die Pooling-Funktion nicht mit allen statistischen Verfahren in SPSS arbeitet, ist es für viele gängigen Analysen arbeitet (zum Beispiel multiple Regression).

SAS hat auch ein mehr Anrechnungsverfahren (PROC MI). Ähnlich wie SPSS, enthält die SAS imputations in einer einzigen Datei und weist eine Identifikationsnummer zu jedem Datensatz. Das MIANALYZE Verfahren ist in der Lage, die Schätzungen und Standardfehler aus den Datensatz zu bündeln.

Berichterstattung über die Ergebnisse

Moving Forward

Referenzen

Über den Autor

Die in diesem Artikel sind die der Autoren und spiegeln nicht die Meinungen oder Richtlinien der APA.