Multicollinearität Statistik, Statistik-Software für Excel

Was ist multicollinearity

Variablen werden gesagt, dass multicollinear wenn es eine lineare Beziehung zwischen ihnen. Dies ist eine Erweiterung des einfachen Fall von Kollinearität zwischen zwei Variablen. Zum Beispiel für drei Variablen X1, X2 und X3, sagen wir, dass sie multicollinear sind, wenn wir schreiben können:







wobei a und b reelle Zahlen sind.

Wie zu erkennen, multicollinearity

Um die multicolinearities zu erkennen und identifizieren die beteiligten Variablen müssen lineare Regressionen auf jede der Variablen in Abhängigkeit von den anderen durchgeführt werden. Wir berechnen dann:







  • Die R² jedes der Modelle, wenn der R² gleich 1 ist, dann gibt es eine lineare Beziehung zwischen den abhängigen Variablen des Modells (der Y) und den erklärenden Variablen (xs).
  • Die Toleranz für jedes der Modelle. Die Toleranz ist (1-R²). Es wird in mehreren Verfahren (lineare Regression, logistische Regression, Diskriminanzanalyse faktoriellen Analyse) als Kriterium für die Filterung verwendeten Variablen. Wenn eine Variable eine Toleranz von weniger als eine festen Schwelle hat (die Toleranz unter Berücksichtigung Variablen bereits im Modell berechnet wird), ist es nicht erlaubt, das Modell geben als Beitrag vernachlässigbar ist und es Risiken verursacht numerische Probleme.
  • Die VIF (Variance Inflationsfaktor), um die VIF ist dem Kehrwert der Toleranz gleich sind.

Die Verwendung von multicollinearity Statistiken

multicollinearities innerhalb einer Gruppe von Variablen Erkennen kann insbesondere in den folgenden Fällen nützlich sein:

eingeschlossen in







In Verbindung stehende Artikel