Statystyka Chi Kwadrat
Statystyka chi kwadrat jest jedną z metod stosowanych w statystyce do badania, czy istnieje istotna różnica między oczekiwanymi i obserwowanymi częstościami w jednej lub więcej kategoriach. Jest szeroko stosowana w analizie danych, a jej głównym celem jest testowanie hipotez dotyczących niezależności zmiennych jakościowych.
Czym jest statystyka chi kwadrat?
Statystyka chi kwadrat (χ²) jest narzędziem statystycznym, które służy do oceny różnic pomiędzy oczekiwanymi a obserwowanymi częstościami w danych. Umożliwia analizę, czy istnieje istotna zależność pomiędzy dwiema zmiennymi jakościowymi lub czy rozkład danych różni się od oczekiwanego rozkładu.
Kiedy stosujemy statystykę chi kwadrat?
Test chi kwadrat stosuje się w sytuacjach, gdy chcemy zbadać zależności pomiędzy zmiennymi nominalnymi. Przykłady zastosowania obejmują:
- analiza zależności pomiędzy płcią a preferencjami zakupowymi,
- badanie, czy występują różnice w zachowaniach ludzi w różnych grupach wiekowych.
Jakie działania badawcze wykorzystują statystykę chi kwadrat?
Test chi kwadrat znajduje zastosowanie w wielu dziedzinach, takich jak:
- socjologia - do badania zależności między różnymi cechami demograficznymi,
- medycyna - do analizy danych epidemiologicznych (np. zależności między chorobami a czynnikami ryzyka),
- marketing - do badania preferencji konsumentów w różnych segmentach rynku.
Interpretacja wyników
Wzór na Statystykę Chi Kwadrat
Wzór na statystykę chi kwadrat jest następujący:
\[ \chi^2 = \sum_{i=1}^n \frac{(O_i - E_i)^2}{E_i} \]
Gdzie:
- \(\chi^2\) - statystyka chi kwadrat
- \(O_i\) - obserwowana częstość w \(i\)-tej kategorii
- \(E_i\) - oczekiwana częstość w \(i\)-tej kategorii
- \(n\) - liczba kategorii
Sens Wzoru
Wzór na statystykę chi kwadrat porównuje różnice między obserwowanymi a oczekiwanymi wartościami w każdej kategorii, skalując je przez oczekiwane wartości. Im większa różnica między obserwowanymi a oczekiwanymi wartościami, tym większa wartość statystyki chi kwadrat, co może wskazywać na niezgodność z hipotezą zerową.
Kroki Obliczania Statystyki Chi Kwadrat
- Ustal hipotezę zerową i alternatywną.
- Zbierz dane i oblicz obserwowane częstości (\(O_i\)).
- Oblicz oczekiwane częstości (\(E_i\)) na podstawie hipotezy zerowej.
- Podstaw obserwowane i oczekiwane wartości do wzoru na statystykę chi kwadrat.
- Wyciągnij wnioski na podstawie wartości statystyki chi kwadrat i tablic wartości krytycznych.
Przykład Obliczenia Statystyki Chi Kwadrat
Załóżmy, że chcemy sprawdzić, czy rodzaj produktu (owoc lub warzywo) wpływa na jego popularność w sklepie. Obserwowane częstości sprzedaży są następujące:
- Jabłka: 50
- Banany: 30
- Marchewki: 40
- Pomidor: 20
Oczekiwane częstości, zakładając, że wszystkie produkty powinny być równie popularne, to:
- Jabłka: 35
- Banany: 35
- Marchewki: 35
- Pomidor: 35
Zastosujmy wzór na statystykę chi kwadrat:
\[ \chi^2 = \frac{(50 - 35)^2}{35} + \frac{(30 - 35)^2}{35} + \frac{(40 - 35)^2}{35} + \frac{(20 - 35)^2}{35} \]
Obliczmy wartości poszczególnych elementów:
\[ \chi^2 = \frac{225}{35} + \frac{25}{35} + \frac{25}{35} + \frac{225}{35} \]
\[ \chi^2 = 6.43 + 0.71 + 0.71 + 6.43 \]
\[ \chi^2 = 14.28 \]
Po obliczeniu statystyki chi kwadrat, możemy porównać ją z odpowiednią wartością krytyczną w tabeli chi kwadrat, aby ocenić, czy różnica jest istotna statystycznie.
Bibliografia:
Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Słownik pojęć statystycznych]. https://sztos-it.com/
Pearson, K. (1900). X. On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling . The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science, 50(302), 157–175. https://doi.org/10.1080/14786440009463897