Test Friedmana
Test Friedmana jest nieparametrycznym odpowiednikiem jednokierunkowej analizy wariancji (ANOVA) dla danych ułożonych w blokach, gdzie zmienne są mierzone wielokrotnie. Wzór na statystykę testu Friedmana jest następujący:
Test Friedmana jest nieparametrycznym narzędziem statystycznym stosowanym do porównywania trzech lub więcej powiązanych grup. Opracowany przez Williama Friedmana, test ten służy do oceny, czy istnieją istotne różnice w medianach między grupami, które są powiązane ze sobą, np. w badaniach przed i po interwencji.
Kiedy stosujemy test Friedmana?
Test Friedmana stosuje się, gdy chcemy porównać wyniki trzech lub więcej powiązanych grup. Jest to szczególnie przydatne w sytuacjach, gdy dane są na poziomie porządkowym lub interwałowym, ale nie mają rozkładu normalnego. Test ten można wykorzystać, gdy:
- mamy dane z powtórzonych pomiarów w różnych warunkach,
- liczba obserwacji w grupach jest mała,
- dane nie spełniają założeń testów parametrycznych.
Gdzie wykorzystuje się test Friedmana?
Test ten znajduje zastosowanie w różnych dziedzinach naukowych, takich jak:
- psychologia - do analizy wyników testów przed i po terapii,
- medycyna - do porównywania wyników różnych metod leczenia w tej samej grupie pacjentów,
- nauki przyrodnicze - do analizy wyników eksperymentów w różnych warunkach.
\[ Q = \frac{12}{n k (k+1)} \sum_{j=1}^{k} R_j^2 - 3n(k+1) \]
Gdzie:
- \(n\) to liczba bloków (czyli liczba obserwacji)
- \(k\) to liczba warunków (czyli liczba grup)
- \(R_j\) to suma rang dla \(j\)-tej grupy
Etapy przeliczania testu Friedmana
1. Rangi: Dla każdego bloku (obserwacji), rangi przypisuje się wartościom w każdym warunku.
2. Suma rang: Suma przypisanych rang dla każdej grupy (warunku).
3. Obliczenie statystyki Q: Użyj powyższego wzoru, aby obliczyć wartość Q.
4. Porównanie z wartością krytyczną: Na podstawie tabeli rozkładu Chi-kwadrat, porównaj wartość obliczoną z wartością krytyczną.
Przykład obliczenia testu Friedmana na owocach i warzywach
Rozważmy poniższe dane dotyczące preferencji trzech rodzajów produktów (jabłka, banany, marchewki) ocenianych przez czterech konsumentów:
Konsument | Jabłka | Banany | Marchewki |
---|---|---|---|
1 | 3 | 2 | 1 |
2 | 2 | 3 | 1 |
3 | 1 | 2 | 3 |
4 | 1 | 3 | 2 |
1. Przydzielanie rang
Dla każdego konsumenta przypisujemy rangi wartościom w każdym warunku:
Konsument | Jabłka (Rangi) | Banany (Rangi) | Marchewki (Rangi) |
---|---|---|---|
1 | 3 | 2 | 1 |
2 | 2 | 3 | 1 |
3 | 1 | 2 | 3 |
4 | 1 | 3 | 2 |
2. Suma rang dla każdej grupy (warunku)
Obliczamy sumę rang dla każdego rodzaju produktów:
- Jabłka: 3 + 2 + 1 + 1 = 7
- Banany: 2 + 3 + 2 + 3 = 10
- Marchewki: 1 + 1 + 3 + 2 = 7
3. Obliczenie statystyki Q
Podstawiamy wartości do wzoru:
\[ Q = \frac{12}{n k (k+1)} \sum_{j=1}^{k} R_j^2 - 3n(k+1) \]
Gdzie, \(n = 4\) (liczba konsumentów), \(k = 3\) (liczba rodzajów produktów), oraz \(\sum_{j=1}^{k} R_j^2 = 7^2 + 10^2 + 7^2 = 49 + 100 + 49 = 198\).
\[ Q = \frac{12}{4 \cdot 3 \cdot 4} \cdot 198 - 3 \cdot 4 \cdot 4 \] \[ Q = \frac{12}{48} \cdot 198 - 48 \] \[ Q = 4.9583 \]
4. Porównanie z wartością krytyczną
Na poziomie istotności \( \alpha = 0.05 \), wartość krytyczna \(\chi^2 \) dla 2 stopni swobody (k-1 = 3-1 = 2) wynosi około 5.991. Ponieważ \( Q = 4.9583 \) jest mniejsze niż 5.991, nie mamy podstaw do odrzucenia hipotezy zerowej. Oznacza to, że nie ma istotnych różnic pomiędzy preferencjami dla tych trzech rodzajów produktów.
Bibliografia:
Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Słownik pojęć statystycznych]. https://sztos-it.com/
Friedman, M. (1937), "The Use of Ranks to Avoid the Assumption of Normality Implicit in the Analysis of Variance," Journal of the American Statistical Association, 32, 675-70