Oferty statystyczne Jak działa SZTOS Start Tutoriale FAQ Opinie Kontakt

Współczynnik Współliniowości

W statystyce współczynnik współliniowości jest miarą, która ocenia, na ile dwie zmienne są skorelowane w kontekście ich liniowości. Wysoki współczynnik współliniowości może wskazywać na potencjalne problemy w analizie regresji, ponieważ zmienne są silnie zależne od siebie.

Współczynnik Współliniowości VIF (Variance Inflation Factor)

Współczynnik VIF (Variance Inflation Factor) to miara używana w analizie regresji wielorakiej, aby ocenić poziom współliniowości między zmiennymi objaśniającymi (predyktorami) w modelu. Współliniowość odnosi się do sytuacji, w której jedna zmienna objaśniająca jest silnie skorelowana z innymi zmiennymi w modelu. Wysoka współliniowość może prowadzić do problemów z interpretacją wyników regresji, ponieważ zmienne mogą dostarczać podobnych informacji, co utrudnia określenie, która z nich jest istotna.

Kiedy używa się VIF?

Współczynnik VIF stosuje się, gdy chcemy sprawdzić, czy w naszym modelu regresji wielorakiej występuje współliniowość. Jest to kluczowe, ponieważ silna współliniowość może zaburzyć estymacje parametrów modelu i zwiększać ryzyko uzyskania niepewnych oszacowań. Wartości VIF pomagają wykryć ten problem.

Interpretacja współczynnika VIF

VIF jest liczony dla każdej zmiennej objaśniającej w modelu. Ogólne zasady interpretacji:

  • VIF = 1: brak współliniowości
  • VIF > 5: umiarkowana współliniowość (często stosowana granica ostrzegawcza)
  • VIF > 10: wysoka współliniowość, zaleca się rozważenie usunięcia lub przekształcenia zmiennych

W jakich działaniach badawczych używa się VIF?

VIF jest szeroko stosowany w naukach, które opierają się na analizie regresji wielorakiej. Przykłady obejmują:

  • Ekonomię: Analiza wpływu różnych zmiennych makroekonomicznych na wyniki gospodarcze.
  • Nauki społeczne: Badanie zależności między cechami demograficznymi a zachowaniami społecznymi.
  • Naukę o zdrowiu: Modelowanie ryzyka chorób na podstawie różnych czynników ryzyka.
  • Marketing: Analiza wpływu kampanii reklamowych na wyniki sprzedażowe.

Wzór na Współczynnik Współliniowości

Wzór na współczynnik współliniowości jest następujący:

\[ VIF_i = \frac{1}{1 - R_i^2} \]

gdzie:

  • \( VIF_i \) – współczynnik współliniowości dla i-tej zmiennej,
  • \( R_i^2 \) – współczynnik determinacji uzyskany z regresji i-tej zmiennej na pozostałe zmienne.

Interpretacja Współczynnika

Współczynnik determinacji \( R_i^2 \) mierzy, jak dobrze zmienna i jest wyjaśniana przez inne zmienne w modelu. Jeśli \( R_i^2 \) jest bliskie 1, oznacza to wysoką współliniowość i prowadzi do wysokiego \( VIF_i \).

Przeliczanie Współczynnika Współliniowości

  1. Przeprowadź regresję zmiennej i-tej na pozostałe zmienne i oblicz współczynnik determinacji \( R_i^2 \).
  2. Podstaw wartość \( R_i^2 \) do wzoru na \( VIF_i \).
  3. Oblicz wartość \( VIF_i \).

Przykład Obliczenia na Owockach i Warzywkach

Załóżmy, że badamy dwa zestawy danych: ilość owoców (\( x_1 \)) i ilość warzyw (\( x_2 \)) w różnych dniach. Oto dane:

DzieńOwocki (\( x_1 \))Warzywka (\( x_2 \))
1105
2157
3106
4208
52510

Krok 1: Przeprowadź regresję \( x_1 \) na \( x_2 \).

Po standardowych obliczeniach regresji znajdujemy, że \( R_i^2 = 0.9 \).

Krok 2: Podstaw tę wartość do wzoru.

\[ VIF_1 = \frac{1}{1 - 0.9} = \frac{1}{0.1} = 10 \]

Zatem współczynnik współliniowości dla zmiennej (ilości owocków) wynosi 10, co wskazuje na bardzo wysoką współliniowość względem ilości warzyw.

Wnioski

Współczynnik współliniowości jest istotnym narzędziem w analizie regresji, gdyż pomaga zidentyfikować potencjalne problemy związane z kolinearnością między zmiennymi. Wartości \( VIF \) powyżej 10 sugerują istotny problem z kolinearnością, który warto bliżej zbadać lub uwzględnić w dalszych analizach.


Bibliografia:


Akinwande, M. , Dikko, H. and Samson, A. (2015) Variance Inflation Factor: As a Condition for the Inclusion of Suppressor Variable(s) in Regression Analysis. Open Journal of Statistics, 5, 754-767. doi: 10.4236/ojs.2015.57075.


Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Słownik pojęć statystycznych]. https://sztos-it.com/