Analiza Korelacji Pearsona Wzór
Analiza korelacji Pearsona to metoda statystycznej analizy zależności pomiędzy dwiema zmiennymi ilościowymi. Wskaźnik korelacji Pearsona jest oznaczany jako r i przyjmuje wartość w przedziale od -1 do 1. Wartość r wynosząca 1 oznacza idealną dodatnią korelację, wartość r wynosząca -1 oznacza idealną ujemną korelację, a wartość 0 oznacza brak jakiejkolwiek korelacji.
Wzór na Analizę Korelacji Pearsona
Wzór na współczynnik korelacji Pearsona można zapisać jako:
$$ r = \frac{ \sum (X_i - \bar{X})(Y_i - \bar{Y}) }{ \sqrt{ \sum (X_i - \bar{X})^2 \sum (Y_i - \bar{Y})^2 } } $$
Gdzie:
- \( r \) - współczynnik korelacji Pearsona
- \( X_i \) - i-ta obserwacja zmiennej \( X \)
- \( Y_i \) - i-ta obserwacja zmiennej \( Y \)
- \( \bar{X} \) - średnia arytmetyczna zmiennej \( X \)
- \( \bar{Y} \) - średnia arytmetyczna zmiennej \( Y \)
Przykład Obliczenia Analizy Korelacji Pearsona
Załóżmy, że mamy dane na temat liczby jabłek i marchewek sprzedanych przez sklepy w ciągu tygodnia:
- Sklep A: 10 jabłek, 20 marchewek
- Sklep B: 20 jabłek, 25 marchewek
- Sklep C: 30 jabłek, 30 marchewek
Na podstawie tych danych obliczymy współczynnik korelacji Pearsona.
- Obliczamy średnie wartości dla jabłek i marchewek:
- Średnia liczba jabłek: \( \bar{X} = \frac{10 + 20 + 30}{3} = 20 \)
- Średnia liczba marchewek: \( \bar{Y} = \frac{20 + 25 + 30}{3} = 25 \)
- Obliczamy sumy:
- $$ \sum (X_i - \bar{X})(Y_i - \bar{Y}) = (10-20)(20-25) + (20-20)(25-25) + (30-20)(30-25) = 75 $$
- $$ \sum (X_i - \bar{X})^2 = (10-20)^2 + (20-20)^2 + (30-20)^2 = 200 $$
- $$ \sum (Y_i - \bar{Y})^2 = (20-25)^2 + (25-25)^2 + (30-25)^2 = 50 $$
- Obliczamy współczynnik korelacji Pearsona:
- $$ r = \frac{ 75 }{ \sqrt{ 200 \cdot 50 } } = \frac{ 75 }{ \sqrt{ 10000 } } = \frac{ 75 }{ 100 } = 0.75 $$
Z obliczeń wynika, że współczynnik korelacji Pearsona wynosi 0.75, co oznacza silną dodatnią korelację pomiędzy liczbą sprzedanych jabłek a marchewek.
Bibliografia:
Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Słownik pojęć statystycznych]. https://sztos-it.com/
Pearson, K. (1895) Notes on Regression and Inheritance in the Case of Two Parents Proceedings of the Royal Society of London, 58, 240-242. https://doi.org/10.1098/rspl.1895.0041