Beschreibende Statistik

Beschreibende Statistik wird in der Regel von Inferenzstatistiken aus. Mit deskriptiven Statistiken beschreiben Sie einfach, was ist oder was die Daten zeigen. Mit Inferenzstatistiken, versuchen Sie, Schlüsse zu ziehen, die allein über die unmittelbaren Daten erweitern. Zum Beispiel verwenden wir Inferenzstatistiken zu versuchen, aus den Beispieldaten zu schließen, was die Bevölkerung vielleicht denken. Oder verwenden wir Inferenzstatistiken Urteile der Wahrscheinlichkeit zu machen, die eine beobachtete Unterschied zwischen den Gruppen ist ein zuverlässiger einer oder eine, die in dieser Studie zufällig geschehen sein könnte. So verwenden wir Inferenzstatistiken Schlüsse aus unseren Daten zu allgemeineren Bedingungen zu machen; wir verwenden einfach deskriptiven Statistiken zu beschreiben, was in unseren Daten geht.







Univariat

Univariate Analyse beinhaltet die Prüfung über Fälle einer Variablen zu einem Zeitpunkt. Es gibt drei wichtige Merkmale einer einzelnen Variablen, die wir betrachten neigen:

  • der Vertrieb
  • die zentrale Tendenz
  • die Dispersion

In den meisten Fällen würden wir alle drei dieser Eigenschaften für jede der Variablen in unserer Studie beschreiben.


Tabelle 1. Frequenzverteilungstabelle.


Abbildung 1. Häufigkeitsverteilung Balkendiagramm.

  • Prozentsatz der Menschen in unterschiedlichen Einkommensniveaus
  • Prozentsatz von Menschen in verschiedenen Altersstufen
  • Prozentsatz der Menschen in verschiedenen Bereichen der standardisierten Tests

Zentrale Tendenz. Die zentrale Tendenz einer Verteilung ist eine Schätzung der „Mitte“ eine Verteilung von Werten. Es gibt drei Haupttypen von Schätzungen der zentralen Tendenz:

Der Mittelwert oder Durchschnitt ist wahrscheinlich die am häufigsten verwendete Methode zentrale Tendenz der Beschreibung. Um den Mittelwert zu berechnen alles, was Sie tun, ist, addieren Sie alle Werte und Dividieren durch die Anzahl der Werte. Zum Beispiel wird der Mittelwert oder Durchschnitt Quiz Punktzahl durch Summieren aller Werte und dividiert durch die Anzahl der Studenten, die die Prüfung bestimmt. die Testscorewerte Betrachten Sie zum Beispiel:

Die Summe dieser Werte 8 beträgt 167, so ist der Mittelwert 167/8 = 20,875.

Der Median ist die Punktzahl an der exakten Mitte des Satzes von Werten gefunden. Eine Möglichkeit, den Median zu berechnen ist alle Noten zur Liste in numerischer Reihenfolge, und suchen Sie die Kerbe in der Mitte der Probe. Zum Beispiel, wenn es 500 Partituren in der Liste enthalten sind, Score # 250 wäre der Median sein. Wenn wir die 8 Partituren oben gezeigt bestellen, würden wir erhalten:







Es gibt 8 Partituren und Ergebnis # 4 und # 5 repräsentiert die Halbzeit. Da diese beiden Partituren 20 sind, ist der Median 20. Wenn die beiden mittleren Werte verschiedene Werte hätten, würden Sie den Median zu bestimmen, zu interpolieren haben.

Der Modus ist das am häufigsten in der Gruppe von Partituren auftretenden Wert. Um den Modus zu bestimmen, können Sie wieder die Noten bestellen, wie oben gezeigt, und dann jeden zählen. Der am häufigsten auftretenden Wert ist der Modus. In unserem Beispiel wird der Wert 15 tritt dreimal und ist das Modell. In einigen Distributionen gibt es mehr als ein modaler Wert. Zum Beispiel in einer bimodalen Verteilung gibt es zwei Werte, die am häufigsten auftreten.

Beachten Sie, dass für den gleichen Satz von 8 Noten bekamen wir drei verschiedene Werte - 20,875, 20 und 15 - für den Mittelwert, Median und Modus sind. Wenn die Verteilung wirklich normal ist (das heißt glockenförmig), der Mittelwert, Median und Modus sind alle einander gleich.

Dispersion. Dispersion bezieht sich auf die Streuung der Werte um die zentrale Tendenz. Es gibt zwei gängige Maßnahmen der Dispersion, die Reichweite und die Standardabweichung. Der Bereich ist einfach der höchste Wert minus der niedrigste Wert. In unserem Beispiel Verteilung ist der hohe Wert 36 und die niedrig ist 15, so dass der Bereich von 36 bis 15 = 21.

Die Standardabweichung eine genauere und detailliertere Schätzung der Dispersion ist so, weil ein Ausreißer stark den Bereich übertreiben können (wie in diesem Beispiel wahr war, wo der einzelne Ausreißer-Wert von 36 hebt sich von der übrigen Werte. Die Standardabweichung zeigt die Beziehung, dass Satz von Noten hat auf den Mittelwert der Probe wieder läßt den Satz von Partituren nehmen.:

die Standardabweichung zu berechnen, finden wir zunächst den Abstand zwischen jedem Wert und dem Mittelwert. Wir wissen, von oben, dass der Mittelwert ist 20,875. So sind die Unterschiede aus dem Mittelwert:

15-20,875 = -5,875
20-20,875 = -0,875
21-20,875 = 0,125
20-20,875 = -0,875
36 bis 20,875 = 15,125
15-20,875 = -5,875
25-20,875 = 4,125
15-20,875 = -5,875

Beachten Sie, dass Werte, die unter dem Mittelwert sind negative Abweichungen und Werte darüber positive haben. Als nächstes Quadrat wir jede Diskrepanz:

-5,875 * -5,875 = 34,515625
-0.875 * -0,875 = 0,765625
+0,125 * 0,125 = 0,015625
-0.875 * -0,875 = 0,765625
15,125 * 15,125 = 228,765625
-5,875 * -5,875 = 34,515625
+4,125 * 4,125 = 17,015625
-5,875 * -5,875 = 34,515625

Nun, nehmen wir diese „Quadrate“ und summieren sie die Summe der Quadrate (SS) Wert zu erhalten. Hier ist die Summe 350,875. Als nächst wir diese Summe durch die Anzahl der Werte minus 1 dividieren Hier ist das Ergebnis 350,875 / 7 = 50,125. Dieser Wert wird als die Varianz bekannt. Um die Standardabweichung zu erhalten, nehmen wir die Quadratwurzel der Varianz (denken Sie daran, dass wir die Abweichungen im Quadrat früher). Dies wäre SQRT (50,125) = 7,079901129253.

Im oberen Teil des Verhältnisses, der Zähler, sehen wir, dass jede Wertung der den Mittelwert davon subtrahiert hat, wird die Differenz quadriert, und die Quadrate summiert werden. Im unteren Teil, nehmen wir die Anzahl der Noten minus 1. Das Verhältnis ist die Varianz und die Quadratwurzel ist die Standardabweichung. In Englisch können wir die Standardabweichung beschreiben als:

die Quadratwurzel der Summe der quadrierten Abweichungen vom Mittelwert durch die Anzahl der Noten minus eins geteilt

Obwohl wir diese univariate Statistiken von Hand berechnen kann, wird es ziemlich langweilig, wenn Sie mehr als ein paar Werte und Variablen haben. Jedes Statistik-Programm ist in der Lage sich für Sie leicht zu berechnen. Zum Beispiel habe ich die acht Noten in SPSS und bekam die folgende Tabelle als Ergebnis:







In Verbindung stehende Artikel