Genaue Formel Yates - Korrektur in R - Cross Validated

Wenn ich ein Chi-Quadrat in R mit der Korrektur Yates laufe, bekomme ich leicht unterschiedliche Ergebnisse von ihn mit der Hand zu tun. Was ist die genaue Formel R ist für die Korrektur Yates mit? Ich verwende den einfachen Code:







(Für eine 2x2-Tabelle, so df = 1 und R hat Yates Korrektur automatisch)

Von Hand (gut, in Excel), ich bin Subtrahieren 0,5 von jedem Observed-Erwartungswert (die ich dann Platz und anschließend durch die erwarteten Dividieren): die Summe aller = ((O-E) -0.5) ^ 2 / E.

Dies ist eindeutig nicht die Formel R wird mit dem Chi-Quadrat mit der Yates-Korrektur zu bekommen, aber ich kann nicht scheinen zu finden, was sie verwenden. Weiß jemand?

Hinzufügen von Daten aus SO Post: Einige Beispieldaten (in der Tabelle gespeichert als .csv):

Mit R und Yates' Korrektur Chi-Quadrat = 4,4 und p = 0,035

Mit meiner eigenen Formel subtrahiert 0,5 Chi-Quadrat = 5,78 und p = 0,0209

Yates Korrektur modifiziert die $ \ chi ^ 2 $-Statistik für einen $ 2 \ times 2 $ Kontingenztabelle in dem Bemühen, die Fehler durch die Verwendung eines (kontinuierlich) $ \ chi ^ 2 $ Verteilung zu korrigieren, die (diskrete) Stichprobenverteilung zu approximieren die Statistik.

Es sei daran erinnert, dass die $ \ chi ^ 2 $ Statistik basiert auf den Residuen in einer Kontingenz-Tabelle basiert: die Unterschiede zwischen den beobachteten Häufigkeiten $ O $ und der Erwartungen $ E $ in jeder Zelle. (Die Erwartungen müssen ganze Zahlen nicht sein). In der Tat, egal, nur die Größen der Residuen wirklich, weil die Residuen immer quadriert. Yates' Korrektur subtrahiert 1 $ / 2 $ von der Größe des einzelnen Restes. Somit wird die ursprüngliche Formel







Der R-Code für chisq.test erscheint ein wenig subtiler zu sein. Hier ist der relevante Abschnitt. (Es wird in einigen verschachtelt conditionals begraben, die hier nicht relevant sind.)

In diesem Code x speichert die Zellzahlen (also die Rolle von $ O $ spielen) und E ist eine parallele Anordnung von erwarteten Werten. Die äußere bedingte (if) gewährleistet die Korrektur wird nur angewendet, wenn (a) sie angefordert wird, wie durch den logischen Wert korrekt angegeben. und (b) diese zählt, sind für eine $ 2 \ times 2 $ table.

Die Verwendung von min ersetzt $ 1 / $ 2 in der Korrektur durch die kleinste der absolute Residuen (sollte jeder von ihnen kleiner als $ 1 / $ 2). Dies stellt sicher, dass keiner der absoluten Residuen korrigiert wird nicht weniger als Null gemacht. Diese kleine Nettigkeit ist in dem Wikipedia-Artikel nicht zur Kenntnis genommen. Obwohl es nicht das gleiche wie Yates' ursprüngliche Vorschlag, kann es als eine Variation davon ausgelegt werden, in denen kein korrigierten Wert jemals negativ gemacht wird:

Das Angebot ist auf p. 222

Yates, F (1934). „Kreuztabelle mit kleinen Zahlen und den χ2-Test“. Beilage der Zeitschrift der Royal Statistical Society 1 (2): 217-235.

R Chi-Quadrat verwendet:

Wo YATES könnte 0 sein (zum Beispiel, wenn keine Korrektur angewandt wird) oder

die standardmäßig in dem 2x2-Fall verwendet; das heißt, wenn $ | O_i-E_i |<\frac12$ (as it will be if $O_i=E_i$), then the correction will be smaller than $\frac12$ (0 if they're equal).

Diese Einstellung (manchmal) auf das „$ \ frac12 $“ üblich ist es gleichwertig

das entspricht die endgültige 2x2 Form in Wikipedia-Artikel gegeben:

die als besser „in einigen Fällen“ beschrieben. [Yates' eigentliche Beratung in seinem 1934 Artikel war komplizierter als jede Formel.]

beantwortet 3. Juli '15 um 12:59







In Verbindung stehende Artikel