Oferty statystyczne Jak działa SZTOS Start Tutoriale FAQ Opinie Kontakt

Test normalności Shapiro-Wilka

Test normalności Shapiro-Wilka jest statystyczną metodą stosowaną do sprawdzenia, czy dana próbka pochodzi z populacji o rozkładzie normalnym. Test ten jest szczególnie skuteczny dla małych i średnich próbek.

Czym jest test Shapiro-Wilka?

Test Shapiro-Wilka jest statystycznym narzędziem używanym do oceny normalności rozkładu danych. Został opracowany przez Samuela Shapiro i Martinę Wilka w 1965 roku. Jest to jeden z najczęściej stosowanych testów do weryfikacji, czy próbki pochodzą z rozkładu normalnego.

Kiedy stosujemy test Shapiro-Wilka?

Test Shapiro-Wilka stosuje się, gdy chcemy sprawdzić, czy dane, które zebraliśmy, mają rozkład normalny. Jest to kluczowe w wielu analizach statystycznych, które zakładają normalność rozkładu, takich jak:

  • analiza wariancji (ANOVA),
  • test t-Studenta,
  • regresja liniowa.

Jakie działania badawcze wykorzystują test Shapiro-Wilka?

Test ten jest szeroko stosowany w różnych dziedzinach naukowych, takich jak:

  • psychologia - do analizy wyników testów psychometrycznych,
  • medycyna - do analizy wyników badań klinicznych,
  • nauki przyrodnicze - do analizy danych eksperymentalnych.

Wzór na test normalności Shapiro-Wilka

Wzór na test normalności Shapiro-Wilka wygląda następująco:

$$ W = \frac{\left( \sum_{i=1}^n a_i x_{(i)} \right)^2}{\sum_{i=1}^n (x_i - \bar{x})^2} $$

Gdzie:

  • \( W \) - statystyka testu Shapiro-Wilka.
  • \( n \) - liczba obserwacji w próbce.
  • \( x_{(i)} \) - i-ta najmniejsza wartość w próbce (tzw. rankowanie).
  • \( x_i \) - wartość i-tej obserwacji w próbce.
  • \( \bar{x} \) - średnia arytmetyczna próby.
  • \( a_i \) - współczynniki uzyskane na podstawie tablic wartości dla testu Shapiro-Wilka.

Sens wzoru

Sens wzoru opiera się na porównaniu wartości danych próbki ze spodziewanymi wartościami pod rozkładem normalnym. Mianownik wzoru jest sumą kwadratów różnic między każdą wartością a średnią próby, co stanowi miarę różnorodności w danych. Licznik natomiast przedstawia sumę iloczynów standaryzowanych pozycji i wartości próbki, co stanowi miarę porządku i symetrii względem rozkładu normalnego.

Przeliczanie testu normalności Shapiro-Wilka

Aby przeliczyć test normalności Shapiro-Wilka, należy postępować według poniższych etapów:

  1. Posortować dane.
  2. Obliczyć średnią arytmetyczną próby.
  3. Uzyskać współczynniki \( a_i \) z tabel wartości dla testu Shapiro-Wilka.
  4. Obliczyć wartość licznika wzoru.
  5. Obliczyć wartość mianownika wzoru.
  6. Podzielić wartość licznika przez wartość mianownika, aby uzyskać statystykę \( W \).

Przykład obliczenia testu normalności Shapiro-Wilka na owockach i warzywkach

Załóżmy, że mamy próbkę 5 owoców i warzyw z poniższymi wartościami wagowymi (w gramach):

  • 60, 70, 80, 90, 100

Kroki przeliczeń:

  1. Posortowane dane: 60, 70, 80, 90, 100
  2. Średnia arytmetyczna próby (\( \bar{x} \)): \( \bar{x} = \frac{60 + 70 + 80 + 90 + 100}{5} = 80 \)
  3. Uzyskujemy współczynniki \( a_i \) z tablic (dla uproszczenia: \( a_1 = a_5 = 0.5, a_2 = a_4 = 0.25, a_3 = 0 \))
  4. Obliczamy licznik: $$ \sum_{i=1}^n a_i x_{(i)} = 0.5 \cdot 60 + 0.25 \cdot 70 + 0 \cdot 80 + 0.25 \cdot 90 + 0.5 \cdot 100 = 80 $$ Licznik wynosi \( 80 \).
  5. Obliczamy mianownik: $$ \sum_{i=1}^n (x_i - \bar{x})^2 = (60-80)^2 + (70-80)^2 + (80-80)^2 + (90-80)^2 + (100-80)^2 = 400 + 100 + 0 + 100 + 400 = 1000 $$
  6. Obliczamy wzór: $$ W = \frac{\left( 80 \right)^2}{1000} = \frac{6400}{1000} = 6.4 $$

Uzyskana statystyka \( W \) jest porównywana z wartościami krytycznymi, aby zdecydować, czy odrzucić hipotezę o normalności danych.

Powyższy wynik jest przykładem dla danych czysto hipotetycznych i uproszczonych. W rzeczywistości proces uzyskiwania współczynników \( a_i \) jest bardziej złożony.


Bibliografia:


Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Słownik pojęć statystycznych]. https://sztos-it.com/


Shapiro, S. S., & Wilk, M. B. (1965). An Analysis of Variance Test for Normality (Complete Samples). Biometrika, 52(3/4), 591–611. https://doi.org/10.2307/2333709