Rozkład Normalny
Rozkład normalny, zwany również rozkładem Gaussa, jest jednym z najważniejszych rozkładów w statystyce i probabilistyce. Jest używany do opisywania ciągłych zmiennych losowych, które są symetrycznie rozłożone wokół średniej.
Wzór na Rozkład Normalny
Funkcja gęstości prawdopodobieństwa rozkładu normalnego jest dana wzorem:
Symbolika i sens wzoru
- \(f(x)\) - wartość funkcji gęstości prawdopodobieństwa dla zmiennej losowej \(x\)
- \(\mu\) - średnia (i również mediana oraz modalna dla rozkładu normalnego)
- \(\sigma\) - odchylenie standardowe
- \(\sigma^2\) - wariancja, czyli kwadrat odchylenia standardowego
- \(e\) - stała Eulera (około 2.71828)
- \(\pi\) - liczba pi (około 3.14159)
Rozkład normalny dla wagi jabłka
Załóżmy, że chcemy obliczyć prawdopodobieństwo, że jabłko w koszu waży dokładnie 160 gramów. Średnia waga jabłka wynosi 150 gramów, a odchylenie standardowe to 15 gramów. Aby obliczyć to prawdopodobieństwo, korzystamy z funkcji gęstości rozkładu normalnego.
Wzór na gęstość prawdopodobieństwa w rozkładzie normalnym
Funkcja gęstości rozkładu normalnego dla wartości \(x\) wyrażona jest wzorem:
\[ f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} \]
Gdzie:
- \(x\) – wartość, dla której obliczamy prawdopodobieństwo (w naszym przypadku 160 g)
- \(\mu\) – średnia waga (150 g)
- \(\sigma\) – odchylenie standardowe (15 g)
- \(\pi\) – liczba Pi (\(\approx 3.14159\))
- \(e\) – podstawa logarytmu naturalnego
Obliczanie z-score
Aby uprościć obliczenia, zamiast używać wzoru na gęstość, często przekształcamy wartość \(x\) na tzw. z-score. Z-score mówi nam, ile odchyleń standardowych dana wartość jest oddalona od średniej. Wzór na z-score wygląda tak:
\[ z = \frac{x - \mu}{\sigma} \]
Wstawiając nasze wartości:
\[ z = \frac{160 - 150}{15} = \frac{10}{15} = 0.67 \]
Interpretacja z-score
Otrzymaliśmy \(z = 0.67\), co oznacza, że wartość 160 gramów znajduje się 0.67 odchylenia standardowego powyżej średniej. Teraz możemy użyć tablic rozkładu normalnego lub funkcji statystycznych (np. w Excelu lub R), aby obliczyć prawdopodobieństwo.
Obliczanie prawdopodobieństwa
Aby obliczyć prawdopodobieństwo, że waga jabłka wynosi 160 gramów lub mniej, korzystamy z funkcji dystrybuanty rozkładu normalnego. Można to zrobić za pomocą funkcji:
- W R:
pnorm(0.67)
- W Excelu:
NORM.DIST(160, 150, 15, TRUE)
Wynik wynosi około:
\[ P(X \leq 160) \approx 0.7486 \]
Oznacza to, że istnieje około 74.86% szans, że waga jabłka będzie równa lub mniejsza niż 160 gramów.
Prawdopodobieństwo, że jabłko waży więcej niż 160 gramów
Aby obliczyć prawdopodobieństwo, że waga jabłka będzie większa niż 160 gramów, możemy odjąć wynik od 1:
\[ P(X > 160) = 1 - P(X \leq 160) = 1 - 0.7486 = 0.2514 \]
Oznacza to, że istnieje około 25.14% szans, że jabłko waży więcej niż 160 gramów.
Podsumowanie
Przy założeniu rozkładu normalnego, obliczając prawdopodobieństwo dla wagi jabłka o wartości 160 gramów, otrzymujemy, że około 74.86% jabłek waży 160 gramów lub mniej, a około 25.14% waży więcej.
Bibliografia:
Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Słownik pojęć statystycznych]. https://sztos-it.com/
Gauss, C. F., & Davis, C. H. (1857). Theory of the motion of the heavenly bodies moving about the sun in conic sections a translation of Gauss’s “Theoria motus.” With an appendix. Little, Brown and company. https://doi.org/10.5962/bhl.title.19023