Test normalności Shapiro-Wilka
Test normalności Shapiro-Wilka jest statystyczną metodą stosowaną do sprawdzenia, czy dana próbka pochodzi z populacji o rozkładzie normalnym. Test ten jest szczególnie skuteczny dla małych i średnich próbek.
Czym jest test Shapiro-Wilka?
Test Shapiro-Wilka jest statystycznym narzędziem używanym do oceny normalności rozkładu danych. Został opracowany przez Samuela Shapiro i Martinę Wilka w 1965 roku. Jest to jeden z najczęściej stosowanych testów do weryfikacji, czy próbki pochodzą z rozkładu normalnego.
Kiedy stosujemy test Shapiro-Wilka?
Test Shapiro-Wilka stosuje się, gdy chcemy sprawdzić, czy dane, które zebraliśmy, mają rozkład normalny. Jest to kluczowe w wielu analizach statystycznych, które zakładają normalność rozkładu, takich jak:
- analiza wariancji (ANOVA),
- test t-Studenta,
- regresja liniowa.
Jakie działania badawcze wykorzystują test Shapiro-Wilka?
Test ten jest szeroko stosowany w różnych dziedzinach naukowych, takich jak:
- psychologia - do analizy wyników testów psychometrycznych,
- medycyna - do analizy wyników badań klinicznych,
- nauki przyrodnicze - do analizy danych eksperymentalnych.
Wzór na test normalności Shapiro-Wilka
Wzór na test normalności Shapiro-Wilka wygląda następująco:
$$ W = \frac{\left( \sum_{i=1}^n a_i x_{(i)} \right)^2}{\sum_{i=1}^n (x_i - \bar{x})^2} $$
Gdzie:
- \( W \) - statystyka testu Shapiro-Wilka.
- \( n \) - liczba obserwacji w próbce.
- \( x_{(i)} \) - i-ta najmniejsza wartość w próbce (tzw. rankowanie).
- \( x_i \) - wartość i-tej obserwacji w próbce.
- \( \bar{x} \) - średnia arytmetyczna próby.
- \( a_i \) - współczynniki uzyskane na podstawie tablic wartości dla testu Shapiro-Wilka.
Sens wzoru
Sens wzoru opiera się na porównaniu wartości danych próbki ze spodziewanymi wartościami pod rozkładem normalnym. Mianownik wzoru jest sumą kwadratów różnic między każdą wartością a średnią próby, co stanowi miarę różnorodności w danych. Licznik natomiast przedstawia sumę iloczynów standaryzowanych pozycji i wartości próbki, co stanowi miarę porządku i symetrii względem rozkładu normalnego.
Przeliczanie testu normalności Shapiro-Wilka
Aby przeliczyć test normalności Shapiro-Wilka, należy postępować według poniższych etapów:
- Posortować dane.
- Obliczyć średnią arytmetyczną próby.
- Uzyskać współczynniki \( a_i \) z tabel wartości dla testu Shapiro-Wilka.
- Obliczyć wartość licznika wzoru.
- Obliczyć wartość mianownika wzoru.
- Podzielić wartość licznika przez wartość mianownika, aby uzyskać statystykę \( W \).
Przykład obliczenia testu normalności Shapiro-Wilka na owockach i warzywkach
Załóżmy, że mamy próbkę 5 owoców i warzyw z poniższymi wartościami wagowymi (w gramach):
- 60, 70, 80, 90, 100
Kroki przeliczeń:
- Posortowane dane: 60, 70, 80, 90, 100
- Średnia arytmetyczna próby (\( \bar{x} \)): \( \bar{x} = \frac{60 + 70 + 80 + 90 + 100}{5} = 80 \)
- Uzyskujemy współczynniki \( a_i \) z tablic (dla uproszczenia: \( a_1 = a_5 = 0.5, a_2 = a_4 = 0.25, a_3 = 0 \))
- Obliczamy licznik: $$ \sum_{i=1}^n a_i x_{(i)} = 0.5 \cdot 60 + 0.25 \cdot 70 + 0 \cdot 80 + 0.25 \cdot 90 + 0.5 \cdot 100 = 80 $$ Licznik wynosi \( 80 \).
- Obliczamy mianownik: $$ \sum_{i=1}^n (x_i - \bar{x})^2 = (60-80)^2 + (70-80)^2 + (80-80)^2 + (90-80)^2 + (100-80)^2 = 400 + 100 + 0 + 100 + 400 = 1000 $$
- Obliczamy wzór: $$ W = \frac{\left( 80 \right)^2}{1000} = \frac{6400}{1000} = 6.4 $$
Uzyskana statystyka \( W \) jest porównywana z wartościami krytycznymi, aby zdecydować, czy odrzucić hipotezę o normalności danych.
Powyższy wynik jest przykładem dla danych czysto hipotetycznych i uproszczonych. W rzeczywistości proces uzyskiwania współczynników \( a_i \) jest bardziej złożony.
Bibliografia:
Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Słownik pojęć statystycznych]. https://sztos-it.com/
Shapiro, S. S., & Wilk, M. B. (1965). An Analysis of Variance Test for Normality (Complete Samples). Biometrika, 52(3/4), 591–611. https://doi.org/10.2307/2333709