Dwuczynnikowa analiza wariancji dla powtarzanych pomiarów
Dwuczynnikowa analiza wariancji dla powtarzanych pomiarów (ANOVA) to statystyczna metoda wykorzystywana do analizy danych, w której badane są dwa czynniki niezależne (np. płeć i rodzaj terapii), a pomiary są powtarzane na tych samych jednostkach (np. ta sama grupa uczestników badania).
Kiedy się jej używa?
Używamy tej analizy, gdy chcemy zbadać wpływ dwóch czynników na zmienną zależną oraz uwzględnić różnice między powtarzanymi pomiarami na tej samej grupie uczestników. Na przykład, może to być badanie wpływu różnych terapii na poziom stresu u tej samej grupy pacjentów w różnych momentach czasu.
W jakich działaniach badawczych?
Dwuczynnikowa analiza wariancji dla powtarzanych pomiarów znajduje zastosowanie w badaniach, w których chcemy porównać efekty różnych warunków eksperymentalnych na tych samych uczestnikach. Przykłady obejmują:
- Badania psychologiczne, np. wpływ różnych metod nauczania na wyniki uczniów.
- Badania medyczne, np. efekty leczenia na poziom objawów w różnych punktach czasowych.
- Badania w naukach społecznych, np. wpływ różnych polityk na postawy obywateli w różnych okresach.
W jakich naukach?
Dwuczynnikowa analiza wariancji dla powtarzanych pomiarów jest wykorzystywana w wielu dziedzinach, takich jak:
- Psychologia
- Medycyna
- Edukacja
- Nauki społeczne
- Ekonomia
Metoda ta pozwala na bardziej złożoną analizę danych niż standardowa ANOVA, uwzględniając interakcje między czynnikami oraz różnice w czasie.
Dwuczynnikowa analiza wariancji dla powtarzanych pomiarów to technika statystyczna, którą stosuje się do badania efektów dwóch czynników na zmienną zależną, przy jednoczesnym uwzględnieniu powtarzalności pomiarów. Jest to rozszerzenie jednokierunkowej analizy wariancji (ANOVA), która pozwala na analizowanie więcej niż jednego czynnika oraz kontrole danych pochodzących z powtarzanych pomiarów.
Wzór na dwuczynnikową analizę wariancji dla prób zależnych
Wzór ogólny dla dwuczynnikowej analizy wariancji dla prób zależnych można zapisać jako:
$$ S_{total}^2 = S_{A}^2 + S_{B}^2 + S_{AB}^2 + S_{E}^2 $$Etapy obliczeń
1. Zbiór danych
Rozważmy dane dotyczące wyników testów dla dwóch różnych metod nauczania, zmierzonych przed i po zastosowaniu każdej z metod:
- Metoda 1 (Przed): 60, 65, 70
- Metoda 1 (Po): 75, 80, 85
- Metoda 2 (Przed): 55, 60, 65
- Metoda 2 (Po): 70, 75, 80
2. Obliczanie średnich grupowych
Obliczamy średnie dla każdej grupy oraz całkowitą średnią:
- Średnia dla metody 1 przed: $$ \bar{X}_{M1_{przed}} = \frac{60 + 65 + 70}{3} = \frac{195}{3} = 65 \text{ pkt} $$
- Średnia dla metody 1 po: $$ \bar{X}_{M1_{po}} = \frac{75 + 80 + 85}{3} = \frac{240}{3} = 80 \text{ pkt} $$
- Średnia dla metody 2 przed: $$ \bar{X}_{M2_{przed}} = \frac{55 + 60 + 65}{3} = \frac{180}{3} = 60 \text{ pkt} $$
- Średnia dla metody 2 po: $$ \bar{X}_{M2_{po}} = \frac{70 + 75 + 80}{3} = \frac{225}{3} = 75 \text{ pkt} $$
Całkowita średnia:
$$ \bar{X}_{total} = \frac{60 + 65 + 70 + 75 + 80 + 85 + 55 + 60 + 65 + 70 + 75 + 80}{12} = \frac{ 795}{12} \approx 66.25 \text{ pkt} $$3. Obliczanie wariancji dla czynników
Czynnik A (metoda nauczania)
Wariancja dla czynnika A obliczamy na podstawie różnicy średnich:
$$ S_{A}^2 = \frac{n \cdot \sum (\bar{X}_A - \bar{X}_{total})^2}{k_A - 1} $$ gdzie: - $n = 3$ (liczba pomiarów w każdej grupie), - $k_A = 2$ (liczba grup w czynniku A, metoda 1 i metoda 2). Obliczamy sumę kwadratów: $$ S_{A}^2 = \frac{3 \cdot ((80 - 66.25)^2 + (75 - 66.25)^2)}{2 - 1} $$ $$ = \frac{3 \cdot ((13.75)^2 + (8.75)^2)}{1} $$ $$ = 3 \cdot (189.06 + 76.56) $$ $$ = 3 \cdot 265.62 = 796.86 $$Czynnik B (pomiar przed i po)
$$ S_{B}^2 = \frac{n \cdot \sum (\bar{X}_B - \bar{X}_{total})^2}{k_B - 1} $$ gdzie: - $n = 3$ (liczba pomiarów w każdej grupie), - $k_B = 2$ (liczba grup w czynniku B, przed i po). Obliczamy sumę kwadratów: $$ S_{B}^2 = \frac{3 \cdot ((65 - 66.25)^2 + (80 - 66.25)^2)}{2 - 1} $$ $$ = \frac{3 \cdot ((-1.25)^2 + (13.75)^2)}{1} $$ $$ = 3 \cdot (1.56 + 189.06) $$ $$ = 3 \cdot 190.62 = 571.86 $$Interakcja między czynnikami A i B
$$ S_{AB}^2 = \sum_{i=1}^{k_A} \sum_{j=1}^{k_B} \frac{n \cdot (\bar{X}_{ij} - \bar{X}_A - \bar{X}_B + \bar{X}_{total})^2}{(k_A - 1)(k_B - 1)} $$ Dla każdej kombinacji metody 1 i przed, metody 1 i po, metody 2 i przed, metody 2 i po obliczamy średnie: - Metoda 1 przed: $$ \bar{X}_{M1_{przed}} = 65 $$ - Metoda 1 po: $$ \bar{X}_{M1_{po}} = 80 $$ - Metoda 2 przed: $$ \bar{X}_{M2_{przed}} = 60 $$ - Metoda 2 po: $$ \bar{X}_{M2_{po}} = 75 $$ Obliczamy wartości: $$ S_{AB}^2 = \frac{3 \cdot \left[(65 - 66.25)^2 + (80 - 66.25)^2 + (60 - 66.25)^2 + (75 - 66.25)^2\right]}{(2 - 1)(2 - 1)} $$ $$ = 3 \cdot \left[(-1.25)^2 + (13.75)^2 + (-6.25)^2 + (8.75)^2\right] $$ $$ = 3 \cdot \left[1.56 + 189.06 + 39.06 + 76.56\right] $$ $$ = 3 \cdot 306.25 = 918.75 $$4. Obliczanie wariancji błędu
Wariancja błędu obliczamy poprzez zsumowanie kwadratów różnic dla poszczególnych pomiarów od ich średnich:
$$ S_{E}^2 = \frac{SS_E}{N - k_A \cdot k_B} $$ Liczmy $SS_E$ jako sumę kwadratów różnic dla pomiarów:- Metoda 1 przed: $$ (60 - 65)^2 + (65 - 65)^2 + (70 - 65)^2 = 25 $$
- Metoda 1 po: $$ (75 - 80)^2 + (80 - 80)^2 + (85 - 80)^2 = 25 $$
- Metoda 2 przed: $$ (55 - 60)^2 + (60 - 60)^2 + (65 - 60)^2 = 25 $$
- Metoda 2 po: $$ (70 - 75)^2 + (75 - 75)^2 + (80 - 75)^2 = 25 $$
5. Obliczanie statystyk F
Dla czynnika A
$$ F_A = \frac{MS_A}{MS_E} = \frac{796.86}{12.5} \approx 63.75 $$Dla czynnika B
$$ F_B = \frac{MS_B}{MS_E} = \frac{571.86}{12.5} \approx 45.75 $$Dla interakcji
$$ F_{AB} = \frac{MS_{AB}}{MS_E} = \frac{918.75}{12.5} \approx 73.50 $$Wyniki końcowe
Ostateczne wyniki statystyk F dla każdego z efektów:
- Statystyka F dla czynnika A (metoda nauczania): $$ F_A \approx 63.75 $$
- Statystyka F dla czynnika B (pomiar przed i po): $$ F_B \approx 45.75 $$
- Statystyka F dla interakcji AB: $$ F_{AB} \approx 73.50 $$
Wnioski
Dwuczynnikowa analiza wariancji dla prób zależnych pozwala na zbadanie, jak dwa różne czynniki wpływają na zmienną zależną w warunkach, gdy pomiary są powiązane. Analizując wyniki, możemy zrozumieć, czy różnice w średnich są statystycznie istotne oraz czy istnieje interakcja między czynnikami.
Bibliografia:
Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Słownik pojęć statystycznych]. https://sztos-it.com/