Analiza Poprawki Welcha na Nierówność Wariancji
Czym jest poprawka Welcha?
Poprawka Welcha to metoda statystyczna, która służy do analizy danych z dwóch grup, gdy istnieje podejrzenie, że wariancje tych grup są nierówne. W standardowej analizie wariancji (ANOVA) zakłada się, że wariancje są równe (homogeniczność wariancji). Kiedy to założenie jest naruszone, wyniki mogą być nieprawidłowe. Poprawka Welcha dostosowuje stopnie swobody w analizie, co umożliwia uzyskanie bardziej wiarygodnych wyników.
Kiedy stosuje się poprawkę Welcha?
- Nierówność wariancji: Gdy różnice w wariancjach pomiędzy grupami są znaczne.
- Porównanie średnich: Kiedy porównujemy średnie dwóch lub więcej grup.
- Małe próbki: W przypadku, gdy liczby obserwacji w grupach są niewielkie i nierówne.
W jakich działaniach badawczych jest używana?
- Badania psychologiczne (np. porównanie wyników testów w różnych grupach wiekowych).
- Badania medyczne (np. ocena skuteczności różnych terapii).
- Badania społeczne (np. analiza różnic w zachowaniach grup społecznych).
W jakich naukach?
- Psychologia
- Medycyna
- Socjologia
- Ekonomia
Wzór na poprawkę Welcha
Wzór na poprawkę Welcha można zapisać następująco:
\[ t = \frac{\bar{X_1} - \bar{X_2}}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}} \]
gdzie:
- \(\bar{X_1}\) - średnia pierwszej grupy
- \(\bar{X_2}\) - średnia drugiej grupy
- \(s_1^2\) - wariancja pierwszej grupy
- \(s_2^2\) - wariancja drugiej grupy
- \(n_1\) - liczba obserwacji w pierwszej grupie
- \(n_2\) - liczba obserwacji w drugiej grupie
Stopnie swobody dla testu Welcha określone są następującym wzorem:
\[ df = \frac{\left( \frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}\right) ^2}{\frac{\left( \frac{s_1^2}{n_1}\right) ^2}{n_1 - 1} + \frac{\left( \frac{s_2^2}{n_2}\right) ^2}{n_2 - 1}} \]
Sens wzoru
Wzór ten umożliwia obliczenie statystyki testowej \(t\) biorąc pod uwagę różne wariancje grup. Poprawione stopnie swobody \(df\) są bardziej skomplikowane do obliczenia, ale pozwalają na bardziej miarodajne wyniki testu t, gdy założenie homogeniczności wariancji jest naruszone.
Przykład z owocami i warzywami
Rozważmy przykład porównania średniej wagi jabłek (grupa 1) i marchewek (grupa 2) w kilogramach:
- Grupa 1 (jabłka): \(\bar{X_1} = 0.2\ kg\), \(s_1^2 = 0.01\ kg^2\), \(n_1 = 10\)
- Grupa 2 (marchewki): \(\bar{X_2} = 0.1\ kg\), \(s_2^2 = 0.005\ kg^2\), \(n_2 = 8\)
Obliczenia
Najpierw obliczamy statystykę testową \(t\):
\[ t = \frac{0.2 - 0.1}{\sqrt{\frac{0.01}{10} + \frac{0.005}{8}}} \]
\[ t = \frac{0.1}{\sqrt{0.001 + 0.000625}} = \frac{0.1}{\sqrt{0.001625}} ≈ \frac{0.1}{0.04025} ≈ 2.48 \]
Następnie obliczamy stopnie swobody \(df\):
\[ df = \frac{\left(\frac{0.01}{10} + \frac{0.005}{8}\right)^2}{\frac{\left(\frac{0.01}{10}\right)^2}{10-1} + \frac{\left(\frac{0.005}{8}\right)^2}{8-1}} \]
\[ df = \frac{(0.001 + 0.000625)^2}{\frac{(0.001)^2}{9} + \frac{(0.000625)^2}{7}} \]
\[ df = \frac{0.001625^2}{\frac{0.000001}{9} + \frac{0.000000390625}{7}} = \frac{0.000002640625}{0.000000111111 + 0.000000055804} ≈ \frac{0.000002640625}{0.000000166915} ≈ 15.82 \]
Wynik
Otrzymana wartość statystyki testowej wynosi \(t ≈ 2.48\) z około \(df ≈ 15.82\) stopniami swobody. Dzięki zastosowaniu poprawki Welcha na nierówność wariancji uwzględniliśmy różnice w wariancjach między grupami, co pozwala na bardziej wiarygodne wnioski.
Poprawka Welcha na nierówność wariancji jest niezwykle użytecznym narzędziem w analizie statystycznej, zwłaszcza gdy mamy do czynienia z grupami o różnej zmienności. Dzięki temu możemy dokładniej ocenić, czy obserwowane różnice są statystycznie istotne.
Bibliografia:
Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Słownik pojęć statystycznych]. https://sztos-it.com/
WELCH, B. L., THE GENERALIZATION OF ‘STUDENT'S’ PROBLEM WHEN SEVERAL DIFFERENT POPULATION VARLANCES ARE INVOLVED, Biometrika, Volume 34, Issue 1-2, January 1947, Pages 28–35, https://doi.org/10.1093/biomet/34.1-2.28