Oferty statystyczne Jak działa SZTOS Start Tutoriale FAQ Opinie Kontakt

Statystyka Chi Kwadrat

Statystyka chi kwadrat jest jedną z metod stosowanych w statystyce do badania, czy istnieje istotna różnica między oczekiwanymi i obserwowanymi częstościami w jednej lub więcej kategoriach. Jest szeroko stosowana w analizie danych, a jej głównym celem jest testowanie hipotez dotyczących niezależności zmiennych jakościowych.

Czym jest statystyka chi kwadrat?

Statystyka chi kwadrat (χ²) jest narzędziem statystycznym, które służy do oceny różnic pomiędzy oczekiwanymi a obserwowanymi częstościami w danych. Umożliwia analizę, czy istnieje istotna zależność pomiędzy dwiema zmiennymi jakościowymi lub czy rozkład danych różni się od oczekiwanego rozkładu.

Kiedy stosujemy statystykę chi kwadrat?

Test chi kwadrat stosuje się w sytuacjach, gdy chcemy zbadać zależności pomiędzy zmiennymi nominalnymi. Przykłady zastosowania obejmują:

  • analiza zależności pomiędzy płcią a preferencjami zakupowymi,
  • badanie, czy występują różnice w zachowaniach ludzi w różnych grupach wiekowych.

Jakie działania badawcze wykorzystują statystykę chi kwadrat?

Test chi kwadrat znajduje zastosowanie w wielu dziedzinach, takich jak:

  • socjologia - do badania zależności między różnymi cechami demograficznymi,
  • medycyna - do analizy danych epidemiologicznych (np. zależności między chorobami a czynnikami ryzyka),
  • marketing - do badania preferencji konsumentów w różnych segmentach rynku.

Interpretacja wyników

Wzór na Statystykę Chi Kwadrat

Wzór na statystykę chi kwadrat jest następujący:

\[ \chi^2 = \sum_{i=1}^n \frac{(O_i - E_i)^2}{E_i} \]

Gdzie:

  • \(\chi^2\) - statystyka chi kwadrat
  • \(O_i\) - obserwowana częstość w \(i\)-tej kategorii
  • \(E_i\) - oczekiwana częstość w \(i\)-tej kategorii
  • \(n\) - liczba kategorii

Sens Wzoru

Wzór na statystykę chi kwadrat porównuje różnice między obserwowanymi a oczekiwanymi wartościami w każdej kategorii, skalując je przez oczekiwane wartości. Im większa różnica między obserwowanymi a oczekiwanymi wartościami, tym większa wartość statystyki chi kwadrat, co może wskazywać na niezgodność z hipotezą zerową.

Kroki Obliczania Statystyki Chi Kwadrat

  1. Ustal hipotezę zerową i alternatywną.
  2. Zbierz dane i oblicz obserwowane częstości (\(O_i\)).
  3. Oblicz oczekiwane częstości (\(E_i\)) na podstawie hipotezy zerowej.
  4. Podstaw obserwowane i oczekiwane wartości do wzoru na statystykę chi kwadrat.
  5. Wyciągnij wnioski na podstawie wartości statystyki chi kwadrat i tablic wartości krytycznych.

Przykład Obliczenia Statystyki Chi Kwadrat

Załóżmy, że chcemy sprawdzić, czy rodzaj produktu (owoc lub warzywo) wpływa na jego popularność w sklepie. Obserwowane częstości sprzedaży są następujące:

  • Jabłka: 50
  • Banany: 30
  • Marchewki: 40
  • Pomidor: 20

Oczekiwane częstości, zakładając, że wszystkie produkty powinny być równie popularne, to:

  • Jabłka: 35
  • Banany: 35
  • Marchewki: 35
  • Pomidor: 35

Zastosujmy wzór na statystykę chi kwadrat:

\[ \chi^2 = \frac{(50 - 35)^2}{35} + \frac{(30 - 35)^2}{35} + \frac{(40 - 35)^2}{35} + \frac{(20 - 35)^2}{35} \]

Obliczmy wartości poszczególnych elementów:

\[ \chi^2 = \frac{225}{35} + \frac{25}{35} + \frac{25}{35} + \frac{225}{35} \]

\[ \chi^2 = 6.43 + 0.71 + 0.71 + 6.43 \]

\[ \chi^2 = 14.28 \]

Po obliczeniu statystyki chi kwadrat, możemy porównać ją z odpowiednią wartością krytyczną w tabeli chi kwadrat, aby ocenić, czy różnica jest istotna statystycznie.


Bibliografia:


Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Słownik pojęć statystycznych]. https://sztos-it.com/


Pearson, K. (1900). X. On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling . The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science, 50(302), 157–175. https://doi.org/10.1080/14786440009463897