Kurtoza w Statystyce
Kurtoza jest miarą rozkładu danych, która pozwala określić stopień spłaszczenia lub wydłużenia rozkładu w porównaniu do rozkładu normalnego. Ogólnie rzecz biorąc, kurtoza mierzy, jak bardzo ostrość szczytu rozkładu różni się od ostrości rozkładu normalnego.
Wzór na kurtozę
Wzór na kurtozę dla próbki jest następujący:
\[ K = \frac{n(n+1)}{(n-1)(n-2)(n-3)} \sum_{i=1}^{n} \left( \frac{X_i - \overline{X}}{s} \right)^4 - \frac{3(n-1)^2}{(n-2)(n-3)} \]
Gdzie:
- \( n \) = liczba obserwacji w próbce
- \( X_i \) = i-ta wartość próbki
- \( \overline{X} \) = średnia arytmetyczna próbki
- \( s \) = odchylenie standardowe próbki
Sens wzoru na kurtozę
Wzór na kurtozę pozwala obliczyć, jak duże są ogony rozkładu oraz jak ostry jest szczyt rozkładu w porównaniu do rozkładu normalnego. Wysoka kurtoza wskazuje na długie ogony i ostry szczyt, natomiast niska kurtoza oznacza krótkie ogony i płaski szczyt.
Przykład obliczenia kurtozy na owocach i warzywach
Załóżmy, że mamy następujące wagi owoców i warzyw (w gramach):
Jabłko: 150g, Banan: 120g, Marchewka: 100g, Papryka: 130g, Pomidor: 160g
Kroki obliczeń:
- Obliczamy średnią wagę (\( \overline{X} \)): \[ \overline{X} = \frac{150 + 120 + 100 + 130 + 160}{5} = \frac{660}{5} = 132 \text{ g} \]
- Obliczamy odchylenie standardowe (\( s \)): \[ s = \sqrt{\frac{(150-132)^2 + (120-132)^2 + (100-132)^2 + (130-132)^2 + (160-132)^2}{5-1}} \] \[ = \sqrt{\frac{324 + 144 + 1024 + 4 + 784}{4}} = \sqrt{570} \approx 23.83 \text{ g} \]
- Obliczamy wartość kurtozy (\( K \)): \[ K = \frac{5(5+1)}{(5-1)(5-2)(5-3)} \sum_{i=1}^{5} \left( \frac{X_i - 132}{23.83} \right)^4 - \frac{3(5-1)^2}{(5-2)(5-3)} \] \[ K = \frac{30}{24} \left[ \left( \frac{150 - 132}{23.83} \right)^4 + \left( \frac{120 - 132}{23.83} \right)^4 + \left( \frac{100 - 132}{23.83} \right)^4 + \left( \frac{130 - 132}{23.83} \right)^4 + \left( \frac{160 - 132}{23.83} \right)^4 \right] - \frac{48}{6} \] \[ K = \frac{5}{4} [(0.7561)^4 + (-0.5042)^4 + (-1.3432)^4 + (-0.0840)^4 + (1.1744)^4] - 8 \] \[ K \approx \frac{5}{4} [0.3240 + 0.0652 + 3.2548 + 0.0005 + 1.8983] - 8 \approx \frac{5}{4} \times 5.5428 - 8 \approx 6.9285 - 8 \approx -1.0715 \]
Wartość kurtozy wynosi \(-1.0715\), co oznacza, że rozkład wag tych owoców i warzyw ma krótsze ogony i jest bardziej spłaszczony niż rozkład normalny.
Bibliografia:
Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Słownik pojęć statystycznych]. https://sztos-it.com/