Mediana w statystyce
Mediana to miara statystyczna, która wskazuje środkową wartość w uporządkowanym zbiorze danych. Jest to jedna z podstawowych miar tendencji centralnej, obok średniej i modu. Mediana oddziela połowę danych o wartościach mniejszych od połowy danych o wartościach większych.
Wzór na medianę
W przypadku niezbyt dużej liczby obserwacji, aby obliczyć medianę musimy:
- Uporządkować dane w kolejności rosnącej.
- Znaleźć środkową wartość (lub średnią z dwóch środkowych wartości, jeśli liczba danych jest parzysta).
Matematycznie wzór na medianę wyraża się następująco:
\[ \mathrm{Mediana} = \left\{ \begin{array}{ll} x_{\left(\frac{n+1}{2}\right)} & \text{jeśli n jest nieparzysta} \\ \frac{x_{\left(\frac{n}{2}\right)} + x_{\left(\frac{n}{2}+1\right)}}{2} & \text{jeśli n jest parzysta} \end{array} \right. \]
Gdzie:
- \(x\) - uporządkowane wartości danych
- \(n\) - liczba obserwacji w zbiorze danych
Przykład obliczenia mediany na owocach i warzywach
Załóżmy, że mamy następujący zbiór danych reprezentujący wagę (w gramach) niektórych owoców i warzyw:
Jabłko: 150g, Banan: 120g, Marchewka: 80g, Ogórek: 200g, Pomidor: 90g.
Aby obliczyć medianę, przeprowadzamy następujące kroki:
- Uporządkowanie danych w kolejności rosnącej: 80g, 90g, 120g, 150g, 200g.
- Podział na pół: Ponieważ liczba danych \(n = 5\) (jest nieparzysta), mediana to środkowa wartość.
- Środkowa wartość to trzecia wartość w uporządkowanym zbiorze: 120g.
Dlatego mediana wagi owoców i warzyw wynosi 120g.
Inny przykład z parzystą liczbą danych:
Dodajmy Cebulę o wadze 110g do naszego zbioru. Teraz mamy:
Jabłko: 150g, Banan: 120g, Marchewka: 80g, Ogórek: 200g, Pomidor: 90g, Cebula: 110g.
- Uporządkowanie danych: 80g, 90g, 110g, 120g, 150g, 200g.
- Podział na pół: \(n = 6\) (jest parzysta), mediana to średnia z dwóch środkowych wartości (trzeciej i czwartej): \(\frac{110 + 120}{2}\).
- Obliczenie średniej: \(\frac{110 + 120}{2} = 115\).
Dlatego mediana wagi owoców i warzyw wynosi 115g.
Mediana jest przydatnym wskaźnikiem, gdyż nie jest podatna na skrajne wartości (outliery), dzięki czemu lepiej oddaje centralną tendencję w przypadku zbiorów danych z dużą zmiennością wartości.
Bibliografia:
Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Słownik pojęć statystycznych]. https://sztos-it.com/