Eta kwadrat w statystyce
W statystyce eta kwadrat (\(\eta^2\)) jest miarą wielkości efektu, która pozwala określić, jaka część wariancji zmiennej zależnej jest wyjaśniana przez zmienną niezależną. Eta kwadrat jest jedną z najczęściej stosowanych miar efektywności i jest szczególnie przydatna w analizach wariancji (ANOVA).
Eta-kwadrat (η²) to miara wielkości efektu, która jest często stosowana w analizie wariancji (ANOVA). Określa, jaką część całkowitej wariancji w danych można wyjaśnić przez zmienną niezależną. Innymi słowy, eta-kwadrat informuje nas o tym, jak duży wpływ ma dany czynnik na zmienną zależną w badaniu.
Kiedy używać eta-kwadrat?
Miary eta-kwadrat używa się, gdy chcemy ocenić siłę związku między zmienną niezależną a zależną po przeprowadzeniu testów statystycznych, takich jak ANOVA. Jest to szczególnie przydatne, gdy chcemy określić, czy zaobserwowana różnica między grupami jest istotna pod względem praktycznym, a nie tylko statystycznym.
W jakich działaniach badawczych stosuje się eta-kwadrat?
Eta-kwadrat znajduje zastosowanie w różnych dziedzinach nauki, takich jak:
- Psychologia: Ocenianie efektu różnych interwencji terapeutycznych na wyniki pacjentów.
- Socjologia: Badanie wpływu czynników społecznych na zmienne, takie jak dochód lub poziom edukacji.
- Edukacja: Porównywanie efektów różnych metod nauczania na wyniki uczniów.
Jak interpretować eta-kwadrat?
Eta-kwadrat jest wyrażony w postaci wartości od 0 do 1, gdzie:
- 0 oznacza brak związku między zmiennymi.
- Wartości bliskie 1 oznaczają, że większość wariancji zmiennej zależnej można wyjaśnić przez zmienną niezależną.
Ogólne zasady interpretacji wielkości efektu (choć różnią się one w zależności od dziedziny) mogą być następujące:
- 0,01: Mały efekt.
- 0,06: Średni efekt.
- 0,14 i wyżej: Duży efekt.
Jakie są ograniczenia eta-kwadrat?
Choć eta-kwadrat jest popularną miarą, może mieć tendencję do przeceniania wielkości efektu, szczególnie w małych próbach. Alternatywną, bardziej konserwatywną miarą jest częściowy eta-kwadrat (partial eta squared), który bierze pod uwagę większą liczbę zmiennych.
Wzór na eta kwadrat jest następujący:
\[ \eta^2 = \frac{SS_{\text{between}}}{SS_{\text{total}}} \]
Symbole we wzorze oznaczają:
- \(SS_{\text{between}}\) - suma kwadratów różnic między grupami (sum of squares between groups)
- \(SS_{\text{total}}\) - całkowita suma kwadratów (total sum of squares)
Aby obliczyć eta kwadrat, wykonujemy następujące kroki:
- Obliczamy \(SS_{\text{total}}\), czyli sumę kwadratów różnic wszystkich obserwacji od średniej ogólnej.
- Obliczamy \(SS_{\text{between}}\), czyli sumę kwadratów różnic średnich grup od średniej ogólnej, pomnożoną przez liczebność grup.
- Dzielimy \(SS_{\text{between}}\) przez \(SS_{\text{total}}\).
Przykład obliczenia eta kwadrat na danych dotyczących owoców i warzyw:
Przypuśćmy, że mamy trzy grupy: jabłka, banany i marchewki, a ich wykładniki to odpowiednio 4, 6, 5 oraz 3, 7, 6 oraz 5, 4, 3. Naszym celem jest obliczenie, jaka część wariancji w wielkości owocków i warzywek jest wyjaśniana przez grupy.
Krok 1: Obliczamy średnią całkowitą:
\[ \bar{X}_{\text{total}} = \frac{4 + 6 + 5 + 3 + 7 + 6 + 5 + 4 + 3}{9} = \frac{43}{9} \approx 4.78 \]
Krok 2: Obliczamy \(SS_{\text{total}}\):
\[ SS_{\text{total}} = (4 - 4.78)^2 + (6 - 4.78)^2 + (5 - 4.78)^2 + (3 - 4.78)^2 + (7 - 4.78)^2 + (6 - 4.78)^2 + (5 - 4.78)^2 + (4 - 4.78)^2 + (3 - 4.78)^2 \]
Po podstawieniu i wyliczeniu wartości uzyskujemy:
\[ SS_{\text{total}} \approx 16.44 \]
Krok 3: Obliczamy średnie dla każdej grupy:
- \(\bar{X}_{\text{jabłka}} = \frac{4 + 6 + 5}{3} = 5.0\)
- \(\bar{X}_{\text{banany}} = \frac{3 + 7 + 6}{3} = 5.33\)
- \(\bar{X}_{\text{marchewki}} = \frac{5 + 4 + 3}{3} = 4.0\)
Krok 4: Obliczamy \(SS_{\text{between}}\):
\[ SS_{\text{between}} = 3 \times ((5.0 - 4.78)^2 + (5.33 - 4.78)^2 + (4.0 - 4.78)^2) \]
Po podstawieniu i wyliczeniu wartości uzyskujemy:
\[ SS_{\text{between}} \approx 1.29 \]
Krok 5: Obliczamy eta kwadrat:
\[ \eta^2 = \frac{SS_{\text{between}}}{SS_{\text{total}}} = \frac{1.29}{16.44} \approx 0.078 \]
Wynik \( \eta^2 \approx 0.078 \) oznacza, że około 7.8% wariancji wielkości owocków i warzywek jest wyjaśniane przez podział na grupy (jabłka, banany, marchewki).
Bibliografia:
Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Słownik pojęć statystycznych]. https://sztos-it.com/
Cohen, J. (1973). Eta-squared and partial eta-squared in fixed factor ANOVA designs. Educational and Psychological Measurement, 33(1), 107–112. https://doi.org/10.1177/001316447303300111