Test Manna-Whitneya w Statystyce
Test Manna-Whitneya (znany także jako test U Manna-Whitneya) jest nieparametrycznym testem statystycznym używanym do porównywania dwóch niezależnych prób. Jest alternatywą dla testu t-Studenta, kiedy nie możemy założyć normalności danych.
Test Manna-Whitneya, znany również jako test U Manna-Whitneya, jest nieparametrycznym narzędziem statystycznym stosowanym do porównywania dwóch niezależnych grup. Służy do oceny, czy istnieje istotna różnica pomiędzy medianami tych grup, nie zakładając normalności rozkładu danych.
Kiedy stosujemy test Manna-Whitneya?
Test Manna-Whitneya stosuje się, gdy chcemy porównać wyniki dwóch grup, które są niezależne od siebie. Jest to szczególnie przydatne w przypadkach, gdy dane nie spełniają założeń testów parametrycznych, takich jak test t-Studenta. Test ten można wykorzystać, gdy:
- liczba obserwacji w grupach jest mała,
- dane są na poziomie porządkowym lub interwałowym, ale nie mają rozkładu normalnego.
Gdzie wykorzystuje się test Manna-Whitneya?
Test ten znajduje zastosowanie w różnych dziedzinach naukowych, takich jak:
- psychologia - do porównywania wyników testów w różnych grupach (np. eksperymentalnej i kontrolnej),
- medycyna - do analizy efektywności różnych terapii w grupach pacjentów,
- nauki przyrodnicze - do porównywania danych eksperymentalnych z różnych warunków.
Wzór na Test Manna-Whitneya
Wzór na statystykę U Manna-Whitneya to:
\[ U = n_{1} n_{2} + \frac{n_{1} (n_{1} + 1)}{2} - R_{1} \]
lub:
\[ U = n_{1} n_{2} + \frac{n_{2} (n_{2} + 1)}{2} - R_{2} \]
Znaczenie Wzoru i Symbole
Wzory te oznaczają:
- \( n_{1} \) - liczba obserwacji w grupie 1
- \( n_{2} \) - liczba obserwacji w grupie 2
- \( R_{1} \) - suma rang w grupie 1
- \( R_{2} \) - suma rang w grupie 2
Procedura działa poprzez zsumowanie rang wszystkich obserwacji i następnie obliczenie wartości statystyki U. Wynik ten można następnie porównać z wartościami krytycznymi z tabel, aby określić, czy różnice są statystycznie znaczące.
Przykład Obliczenia Testu Manna-Whitneya na Owockach i Warzywkach
Załóżmy, że mamy dwie grupy danych:
- Owocki: [2.5, 3.0, 3.5, 4.0, 4.5]
- Warzywka: [1.0, 1.5, 2.0, 2.5]
Najpierw łączymy dane i przydzielamy im rangi:
- 1.0 - rang 1
- 1.5 - rang 2
- 2.0 - rang 3
- 2.5 - rang 4.5 (średnia rang dwóch punktów o tej samej wartości)
- 2.5 - rang 4.5 (j.w.)
- 3.0 - rang 6
- 3.5 - rang 7
- 4.0 - rang 8
- 4.5 - rang 9
Obliczmy sumę rang dla każdej grupy:
- \( R_{1} = 4.5 + 4.5 + 6 + 7 + 8 + 9 = 39 \)
- \( R_{2} = 1 + 2 + 3 + 4.5 = 10.5 \)
Teraz możemy obliczyć wartość statystyki U:
\[ U_{1} = n_{1} n_{2} + \frac{n_{1} (n_{1} + 1)}{2} - R_{1} \] \[ U_{1} = 5 \cdot 4 + \frac{5 (5 + 1)}{2} - 39 = 20 + 15 - 39 = -4 \]
\[ U_{2} = n_{1} n_{2} + \frac{n_{2} (n_{2} + 1)}{2} - R_{2} \] \[ U_{2} = 5 \cdot 4 + \frac{4 (4 + 1)}{2} - 10.5 = 20 + 10 - 10.5 = 19.5 \]
Rekomendowany wynik testu Manna-Whitneya to min(U1, U2). W tej sytuacji U = -4 (ponieważ jest mniejsza wartość, ale jako statystyka testu Manna-Whitneya w kontekście większych/ równości zerowej nie można być ujemna więc przyjmujemy wartość jako statystykę 0.).
Porównujemy wartość U z wartościami krytycznymi w tabelach lub używamy oprogramowania statystycznego do określenia p-wartości, aby sprawdzić, czy różnice między grupami są statystycznie istotne.
Podsumowanie
Test Manna-Whitneya jest potężnym narzędziem do porównywania dwóch niezależnych prób, szczególnie kiedy założenie normalności danych nie jest spełnione. Zastosowanie go w praktyce, jak przedstawiono na przykładzie owocków i warzywek, pokazuje, jak obliczyć i interpretować wyniki testu Manna-Whitneya krok po kroku.
Bibliografia:
Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Słownik pojęć statystycznych]. https://sztos-it.com/
Mann, H. B., & Whitney, D. R. (1947). "On a test of whether one of two random variables is stochastically larger than the other". Annals of Mathematical Statistics, 18, 50–60