Oferty statystyczne Jak działa SZTOS Start Tutoriale FAQ Opinie Kontakt

Analiza Korelacji Pearsona Wzór

Analiza korelacji Pearsona to metoda statystycznej analizy zależności pomiędzy dwiema zmiennymi ilościowymi. Wskaźnik korelacji Pearsona jest oznaczany jako r i przyjmuje wartość w przedziale od -1 do 1. Wartość r wynosząca 1 oznacza idealną dodatnią korelację, wartość r wynosząca -1 oznacza idealną ujemną korelację, a wartość 0 oznacza brak jakiejkolwiek korelacji.

Wzór na Analizę Korelacji Pearsona

Wzór na współczynnik korelacji Pearsona można zapisać jako:

$$ r = \frac{ \sum (X_i - \bar{X})(Y_i - \bar{Y}) }{ \sqrt{ \sum (X_i - \bar{X})^2 \sum (Y_i - \bar{Y})^2 } } $$

Gdzie:

  • \( r \) - współczynnik korelacji Pearsona
  • \( X_i \) - i-ta obserwacja zmiennej \( X \)
  • \( Y_i \) - i-ta obserwacja zmiennej \( Y \)
  • \( \bar{X} \) - średnia arytmetyczna zmiennej \( X \)
  • \( \bar{Y} \) - średnia arytmetyczna zmiennej \( Y \)

Przykład Obliczenia Analizy Korelacji Pearsona

Załóżmy, że mamy dane na temat liczby jabłek i marchewek sprzedanych przez sklepy w ciągu tygodnia:

  • Sklep A: 10 jabłek, 20 marchewek
  • Sklep B: 20 jabłek, 25 marchewek
  • Sklep C: 30 jabłek, 30 marchewek

Na podstawie tych danych obliczymy współczynnik korelacji Pearsona.

  1. Obliczamy średnie wartości dla jabłek i marchewek:
    • Średnia liczba jabłek: \( \bar{X} = \frac{10 + 20 + 30}{3} = 20 \)
    • Średnia liczba marchewek: \( \bar{Y} = \frac{20 + 25 + 30}{3} = 25 \)
  2. Obliczamy sumy:
    • $$ \sum (X_i - \bar{X})(Y_i - \bar{Y}) = (10-20)(20-25) + (20-20)(25-25) + (30-20)(30-25) = 75 $$
    • $$ \sum (X_i - \bar{X})^2 = (10-20)^2 + (20-20)^2 + (30-20)^2 = 200 $$
    • $$ \sum (Y_i - \bar{Y})^2 = (20-25)^2 + (25-25)^2 + (30-25)^2 = 50 $$
  3. Obliczamy współczynnik korelacji Pearsona:
    • $$ r = \frac{ 75 }{ \sqrt{ 200 \cdot 50 } } = \frac{ 75 }{ \sqrt{ 10000 } } = \frac{ 75 }{ 100 } = 0.75 $$

Z obliczeń wynika, że współczynnik korelacji Pearsona wynosi 0.75, co oznacza silną dodatnią korelację pomiędzy liczbą sprzedanych jabłek a marchewek.


Bibliografia:


Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Słownik pojęć statystycznych]. https://sztos-it.com/


Pearson, K. (1895) Notes on Regression and Inheritance in the Case of Two Parents Proceedings of the Royal Society of London, 58, 240-242. https://doi.org/10.1098/rspl.1895.0041