Statistik für Biologen Chi-Quadrat-Test und seine Verwendung in der Biologie - Bitesize Bio

Statistik ist eine der am meisten gehasste Themen von Biologen der ganzen Welt. Trotz seiner täglichen Dosis von Missbrauch, Kenntnis von Statistiken kann ein Lebensretter sein.







Chi-Quadrat-Verteilung und Test ist eine der wichtigsten und am häufigsten verwendeten Wahrscheinlichkeitsverteilung in Inferenzstatistiken für Biologie und Life-Science-Studenten. Es wird im Allgemeinen anhand von Anteilen von Variablen, die in dem experimentellen Zustand.

Der Chi-Quadrat-Test ist sehr beliebt wegen seiner vielen Stärken, einschließlich:

  • Einfach zu berechnen
  • Kann auch für die Daten auf der nominalen (kategorische) Skala gesammelt werden
  • Kann verwendet werden, den Unterschied zwischen den verschiedenen Variablen in Betracht zu studieren
  • Nicht Annahmen über die Verteilung der Daten machen (z Normalität)
  • Kann für große Datenmengen verwendet werden,

Wegen ihrer Popularität, ich dachte, dass ich es hier für Sie überprüfen würde.

Wie wird der Chi-Quadrat-Test?

Der Chi-Quadrat-Test kann auf zwei Arten verwendet werden:

1. Güte FitTest

Anpassungsgüte-Test wird verwendet, wenn Sie eine weithin akzeptierte Theorie haben und überprüfen möchten, ob Ihre beobachteten Werte sind synchron mit der Theorie oder nicht.

  • Die Güte der Anpassung Test wird in der Regel in der Genetik verwendet, wo die genotypischen Verhältnisse haben sich bereits für einen bestimmten Test und Bevölkerung etabliert.
  • Sie können diesen Test auch für den Fall verwenden, wenn das erwartete Ergebnis bereits festgestellt worden ist. Zum Beispiel: Sie möchten das Ergebnis eines Experiments verstehen, dass Sie in Ihrem Feld basierend auf dem Test Kreuz von Mendel gegeben. Sie beobachten, dass die Ergebnisse nicht auf die akzeptierte Theorie nach. In diesem Fall können Sie den p-Wert des Chi-Quadrat-Tests für die Güte der Anpassung Tests überprüfen, um festzustellen, ob die beobachteten Werte in Übereinstimmung mit dem Test sind oder nicht [ähnliches Beispiel wird später erklärt]. Wenn p-Wert <0.05, your experiment is a success. If not, better luck next time!
  • In den Fällen, auf das Hardy-Weinberg Prinzip zusammen.

2. Test für die Unabhängigkeit von Attributen

Unabhängigkeit von Attributen oder χ 2 -Test der Assoziation von Attributen, wird verwendet, um zu verstehen, wie die beiden Attribute miteinander verbunden sind. Es wird verwendet, um zu studieren, wenn Anteile an einer Variablen aus den Werten der anderen Variablen unterschiedlich sind.

  • Vergleich der Parameter / Attribute unter Kontrolle und Testpopulationen
  • Bewertung der Korrelation von Krankheitssymptomen mit der Krankheit im Fall von klinischen Daten,

Schritte für die korrekte Berechnung und das Verständnis des Chi-Quadrat-Test

Die folgenden Schritte sind verallgemeinerte Schritte, die sowohl für Anpassungsgüte-Test sowie für Test der Unabhängigkeit von Attributen verwendet werden könnten.

Es gibt drei einfache Schritte für jeden Chi-Quadrat-Test:

1. Entwickeln Sie Ihre Hypothesen

Formulieren der Nullhypothese

Die Nullhypothese (H0), die auch als die Hypothese keine Differenz bekannt ist, heißt es, dass es keinen Unterschied in den Ergebnissen, bevor oder nachdem der Test durchgeführt wird. Zum Beispiel, sagen sie, Sie die Wirkung von Sonnenlicht auf dem Pflanzenwachstum verstehen wollen. In diesem Fall wird Ihre Nullhypothese erklären, dass das Sonnenlicht keine Auswirkungen auf das Pflanzenwachstum hat.

Formulieren die alternative Hypothese

2. Führen Sie Ihre Berechnungen

Sobald Sie wissen, was Sie testen, können Sie die Berechnungen anwenden. Es gibt viele verschiedene Software-Pakete, die Sie verwenden können, aber die Formel für die Prüfung ist:

Bestimmen Freiheitsgrade (df)

Hinweis: Jeder Chi kann quadratisch Berechnung als Matrix dargestellt werden, wie es später in 4 Beispiel erläutert.

Mithilfe der Chi-Quadrat-Tabellen (ein Beispiel zu diesem Post angebracht ist), um den p-Wert bestimmen. Sie sollten nur den p-Wert überprüfen, um den Freiheitsgrad in Schritt 3 berechnet entspricht.

Nun lassen Sie uns einen Blick auf diese Tests mit einigen Beispielen durchführen

Beispiel der Güte von FitTest

Es sei angenommen, dass man reine Zuchtpflanzen des Genotyps A / A durchquert haben, B / B, A / A, B / B und erhaltene Di-Hybrid-A / A, B / b. Sie dann gekreuzt Test dies zu einem / a, b / b. Die sich ergebende F1 Erzeugungsmatrix der Nachkommen war:







Statistik für Biologen Chi-Quadrat-Test und seine Verwendung in der Biologie - Bitesize Bio

Schritt 1: Entwickeln Sie Ihre Hypothesen

H0 = die resultierende F1-Generation ist in Übereinstimmung mit der etablierten Theorie (1: 1: 1: 1).

H1 = die resultierende F1-Generation ist nicht in Übereinstimmung mit der etablierten Theorie.

Schritt 2: Führen Sie Ihre Berechnungen

Statistik für Biologen Chi-Quadrat-Test und seine Verwendung in der Biologie - Bitesize Bio

df = 3 [. in diesem Fall r = Typ von Genotypen in Studie d.h. A / B, A / B, A / B und A / B und C = No. von Bedingungen, in denen Genotypen werden Studien (viz. beobachteten Werten und erwarteten Werten.)

Schritt 3: Finden p

Finden Sie den χ 2 -Wert von Chi-Quadrat-Tabelle bei df = 3

Ergebnis. Sie können H0 akzeptieren, weil die Ergebnisse in Übereinstimmung mit der etablierten Theorie sind. χ 2 = 5,2 und liegt zwischen -7,81< 5.2 <+7.81 at α=0.05 ; α is called the confidence interval. An α = 0.05 is acceptable when the sample size is >30. Wenn jedoch die Proben Größe <30, then 99% of curve is accepted at α=0.01.

Beispiel für die Unabhängigkeit von Attributen

Angenommen, Sie haben zwei Gruppen von Patienten in einem Szenario: eine erkrankten und die anderen nicht erkrankten. 37/54 Glück (oder eher Pech !!) erkrankte und 13/66 nicht erkrankte Personen wurden für die Verabreichung des Arzneimittels 1 gewählt.

Schritt 1: Entwickeln Sie Ihre Hypothesen

H0 = Drug 1 nicht den Krankheitszustand verbessern

H1 = Drug 1 verbessert den Krankheitszustand

Schritt 2: Führen Sie Ihre Berechnungen

Statistik für Biologen Chi-Quadrat-Test und seine Verwendung in der Biologie - Bitesize Bio

Statistik für Biologen Chi-Quadrat-Test und seine Verwendung in der Biologie - Bitesize Bio

Statistik für Biologen Chi-Quadrat-Test und seine Verwendung in der Biologie - Bitesize Bio

df = (r-1) x (c-1), in diesem Fall r = 2 (Anzahl der Bedingungen, unter Beobachtung d.h. erkrankten nicht erkrankte) und c = 2 (für die behandelten und unbehandelte Gruppen)

Schritt 3: Finden p

Finden x2-Wert von Chi-Quadrat-Tabelle bei df = 1

Ergebnis. Sie können die Ho akzeptieren, da die Ergebnisse in Übereinstimmung mit der etablierten Theorie sind. χ 2 = 2,89 und liegt zwischen -3,841< 2.89 <+3.841 at α=0.05

Wenn nicht Sie Chi-Quadrat-Test verwenden?

Obwohl Chi-Quadrat ein leistungsfähiger statistischer Test ist, kann es nicht in allen Situationen verwendet werden. Insbesondere ist es nicht gültig:

Hoffentlich haben Sie geholfen, zu verstehen, was ein Chi-Quadrat-Test ist und wann und wie es zu benutzen.

Statistik für Biologen Chi-Quadrat-Test und seine Verwendung in der Biologie - Bitesize Bio

Ich zuckte zusammen vor Schmerz und hielt weiter, nachdem er zu lesen: „Wenn p-Wert <0.05, your experiment is a success. If not, better luck next time!" Oh, my goodness - no, no, no. 🙂 The magnitude of the p-value has NOTHING to do with the "success" of an experiment. If the experiment is properly designed and properly carried out (i.e. no experimental error and no measurement error), then the experiment is a success, regardless of the result. A p-value is useful only for making an *inference* about the statistical *population* represented by the *observed sample*. If "sum[(observed — expected)^2/expected]" is bigger than zero, then the *observed* frequencies are different from the expected frequencies. A p-value isn't needed for the investigator to see if chi-square (which is a difference) is bigger than zero for her sample. What is the probability of detecting a difference as big or bigger than the one observed *if* the difference doesn't exist in the population from which the samples were taken? Ah, that's the question answered by the p-value.

Schöner Artikel, obwohl ich in läuten müssen und nur ein einziger zu beheben. „Leistet Annahmen nicht über die Verteilung der Daten (z Normalität)“. Das ist falsch. Wo die p-Werte kommen aus? Im Grunde, was Sie von einem mathematischen Standpunkt aus tun, ist Sie die gepoolte Werte als die „wahre“ Modell (dh Null-Hypothese), dass es keine Wirkung, und dann berechnen Sie die mittlere quadratische Fehler (Varianz) für die Werte gefunden jede Wirkung. Sie fragen dann die Frage stellen diese Abweichungen sinnvoll? Wenn es vollständig deterministisch und Ihre (null) ist Hypothese richtig war, die Werte für die gepoolten Daten würden die Faktoren im richtigen Abschnitt entsprechen und alle wären Dandy und die Teststatistik Null lesen würde.

Allerdings ist das, was Sie stattdessen, dass das Material, das Sie hinzugefügt sind alle Quadrate etwas mit dem Mittelwert Null Varianz 1 (da Sie den Mittelwert subtrahiert und teilen sich die Varianz Begriff weg, das ist, warum die Subtraktion und Division in der Gleichung sind), und Sie müssen wahrscheinlich fragen, wie ist das? Nun, das ist nicht genug Informationen, ohne die Verteilung zu kennen (den Mittelwert und die Varianz bestimmt nicht die Verteilung für alle Wahrscheinlichkeitsverteilungen, nur für sehr einfache, wie Poisson und Normalverteilungen). Allerdings machen Sie die Annahme, dass diese jeweils im Mittel null Varianz 1 (Standard) normalerweise Zufallsvariablen verteilt (wenn Sie unendlich Daten haben, diese Annahme ist immer korrekt). So definieren Sie mathematisch die Chi-Quadrat-Verteilung vom Grad k die Summe von k Standardnormalzufallsvariablen zu sein. Von hier aus wird sichergestellt, einige Mathematik, um herauszufinden, was diese Verteilung ist (der einfachste Weg, über charakteristische Funktionen sind) und so finden Sie die Wahrscheinlichkeit, dass diese Summe von Quadraten größer als oder gleich einem bestimmten Wert.

Aber beachten Sie, was Sie zu tun haben: Sie haben die Normalitätsannahme machen musste auf jedem Glied der Summe, um die Teststatistik des sehr mathematisches Objekt zu verknüpfen (das Chi-Quadrat-Verteilung), um das zu verwenden, um eine Wahrscheinlichkeit des Sehens zu berechnen ein Wert dieses groß oder größer.

Allerdings gibt es eine Möglichkeit, (in gewissem Sinne) eine „exakte“ Wahrscheinlichkeit für diese Art von Problemen zu berechnen, und das würde die Fisher-Test. Eine schnelle Google-Suche wird den Test bringen und wie es zu tun. Allerdings nur dann wirklich kommen, es ist nicht wirklich so verschieden von einem Chi-Quadrat-Test, die Unterschiede in der Praxis, wenn Sie die Standard-Fragen, die Tests plagen, die auf Normalität verlassen (das heißt eine große Ausreißer).







In Verbindung stehende Artikel