Niniejszą analizę wykonano w Systemie Zautomatyzowanego Tworzenia Opisu Statystycznego - SZTOS (Hryniewicz, Milewska, 2023). Wizualizację wyników przeprowadzono z wykorzystaniem pakietu graficznego “ggplot2” (Wickham, 2016). W załączniku A jest przedstawiona tabela podsumowująca wyniki.
W niniejszej analizie wzięło udział N = 303 obserwacji. Analiza częstości wystąpień wartości w zmiennej wierszowej Edukacja wykazała, że liczebność jej poszczególnych poziomów (Podstawowe, Średnie, Wyższe) wynosiła odpowienio 2, 130, 171 (odsetek wynosił odpowiednio 0.66, 42.90, 56.44), co stanowiło sumę 303 wystąpień (100%). Różnice w liczebnościach poziomów tej zmiennej były istotne statystycznie χ²(3) = 153.88; p < 0.001 (najczęściej występowała wartość Wyższe n = 171, a najrzadziej wartość Podstawowe n = 2). Natomiast, analiza częstości wystąpień wartości w zmiennej kolumnowej Płeć wykazała, że liczebność jej poszczególnych poziomów (Kobieta, Mężczyzna) wynosiła odpowienio 173, 130 (odsetek wynosił odpowiednio 0.57, 0.43), co stanowiło sumę również 303 wystąpień (100%). Różnice w liczebnościach poziomów tej zmiennej były istotne statystycznie χ²(1) = 6.10; p = 0.014 (najczęściej występowała wartość Kobieta n = 173, a najrzadziej wartość Mężczyzna n = 130).
W celu weryfikacji zaleności między zmienną Edukacja a zmienną Płeć przeprowadzono analizę testem Chi kwadrat (Pearson, 1900). Ze względu na występowanie wartości oczekiwanych mniejszych niż 5, zastosowano korektę istotności statystycznej metodą dokładnego testu Fishera (Agresti, 1990; Bower i Keith, 2003). Analiza testem Chi Kwadrat wykazała brak istotnej zależności między zmienną Edukacja a zmienną Płeć, χ²(2) = 1.59; p = 0.433. Wystąpienia wartości zmiennej Edukacja były podobne w poszczególnych poziomach zmiennej Płeć. Wartość współczynnika siły zależności V Cramera (Cramer i Harald, 1946) była równa 0.07.
W celu analizy dokładnych różnic wartości zmiennej Edukacja występujących w wierszach tabeli (Podstawowe, Średnie, Wyższe) między wartościami zmiennej Płeć w kolumnach tabeli (Kobieta, Mężczyzna) przeprowadzono serię testów proporcji wartości kolumnowych (w ilości porównań N = 1). Analiza ta testuje różnice pod względem obserwowanej proporcji wartości wierszowych między dwiemia kolumnami.
Porównanie 1
Porównanie kolumn Kobieta Vs Mężczyzna zmiennej Płeć pod względem wartości wierszowych Podstawowe, Średnie, Wyższe zmiennej Edukacja , wykazała następujące wyniki:
• Częstość występowania wartości ‘Podstawowe’ była podobna w przypadku wartości ‘Kobieta’ 0.58% i ‘Mężczyzna’ 0.77%, χ²(1) = 0.00; p = 1.000. W wyliczeniu istotności statystycznej zastosowano poprawkę na ciągłość (Yates, 1934).
• Częstość występowania wartości ‘Średnie’ była podobna w przypadku wartości ‘Kobieta’ 39.88% i ‘Mężczyzna’ 46.92%, χ²(1) = 1.23; p = 0.268. W wyliczeniu istotności statystycznej zastosowano poprawkę na ciągłość (Yates, 1934).
• Częstość występowania wartości ‘Wyższe’ była podobna w przypadku wartości ‘Kobieta’ 59.54% i ‘Mężczyzna’ 52.31%, χ²(1) = 1.30; p = 0.255. W wyliczeniu istotności statystycznej zastosowano poprawkę na ciągłość (Yates, 1934).
Tabelę krzyżową z wynikami liczebności przedstawia tabela nr 1 . Wyniki statystyk częstości i odsetki oszacowań przedstawia rysunek nr 1 .
Tabela nr 1
Oszacowania kolumnowe dla relacji między zmienną Edukacja a Płeć
Nota: Wynik testu dla badanej zależności między zmiennymi = χ²(2) = 1.59; p = 0.433.
Rysunek nr 1
Występowanie wartości zmiennej Edukacja w podgrupach zmiennej
Płeć
Nota: Wynik testu dla badanej zależności między zmiennymi = χ²(2) = 1.59; p = 0.433.
W niniejszej analizie wzięło udział N = 303 obserwacji. Analiza częstości wystąpień wartości w zmiennej wierszowej Grupa badana wykazała, że liczebność jej poszczególnych poziomów (Bandziorki, Papugi, Policjanci) wynosiła odpowienio 101, 101, 101 (odsetek wynosił odpowiednio 33.33, 33.33, 33.33), co stanowiło sumę 303 wystąpień (100%). Różnice w liczebnościach poziomów tej zmiennej były do siebie statystycznie podobne χ²(2) = 0.00; p = 1.000. Natomiast, analiza częstości wystąpień wartości w zmiennej kolumnowej Płeć wykazała, że liczebność jej poszczególnych poziomów (Kobieta, Mężczyzna) wynosiła odpowienio 173, 130 (odsetek wynosił odpowiednio 0.57, 0.43), co stanowiło sumę również 303 wystąpień (100%). Różnice w liczebnościach poziomów tej zmiennej były istotne statystycznie χ²(1) = 6.10; p = 0.014 (najczęściej występowała wartość Kobieta n = 173, a najrzadziej wartość Mężczyzna n = 130).
W celu weryfikacji zaleności między zmienną Grupa badana a zmienną Płeć przeprowadzono analizę testem Chi kwadrat (Pearson, 1900). Analiza testem Chi Kwadrat wykazała brak istotnej zależności między zmienną Grupa badana a zmienną Płeć, χ²(2) = 1.64; p = 0.440. Wystąpienia wartości zmiennej Grupa badana były podobne w poszczególnych poziomach zmiennej Płeć. Wartość współczynnika siły zależności V Cramera (Cramer i Harald, 1946) była równa 0.07.
W celu analizy dokładnych różnic wartości zmiennej Grupa badana występujących w wierszach tabeli (Bandziorki, Papugi, Policjanci) między wartościami zmiennej Płeć w kolumnach tabeli (Kobieta, Mężczyzna) przeprowadzono serię testów proporcji wartości kolumnowych (w ilości porównań N = 1). Analiza ta testuje różnice pod względem obserwowanej proporcji wartości wierszowych między dwiemia kolumnami.
Porównanie 1
Porównanie kolumn Kobieta Vs Mężczyzna zmiennej Płeć pod względem wartości wierszowych Bandziorki, Papugi, Policjanci zmiennej Grupa badana , wykazała następujące wyniki:
• Częstość występowania wartości ‘Bandziorki’ była podobna w przypadku wartości ‘Kobieta’ 30.64% i ‘Mężczyzna’ 36.92%, χ²(1) = 1.05; p = 0.305. W wyliczeniu istotności statystycznej zastosowano poprawkę na ciągłość (Yates, 1934).
• Częstość występowania wartości ‘Papugi’ była podobna w przypadku wartości ‘Kobieta’ 35.84% i ‘Mężczyzna’ 30.00%, χ²(1) = 0.89; p = 0.345. W wyliczeniu istotności statystycznej zastosowano poprawkę na ciągłość (Yates, 1934).
• Częstość występowania wartości ‘Policjanci’ była podobna w przypadku wartości ‘Kobieta’ 33.53% i ‘Mężczyzna’ 33.08%, χ²(1) = 0.00; p = 1.000. W wyliczeniu istotności statystycznej zastosowano poprawkę na ciągłość (Yates, 1934).
Tabelę krzyżową z wynikami liczebności przedstawia tabela nr 2 . Wyniki statystyk częstości i odsetki oszacowań przedstawia rysunek nr 2 .
Tabela nr 2
Oszacowania kolumnowe dla relacji między zmienną Grupa badana a Płeć
Nota: Wynik testu dla badanej zależności między zmiennymi = χ²(2) = 1.64; p = 0.440.
Rysunek nr 2
Występowanie wartości zmiennej Grupa badana w podgrupach zmiennej
Płeć
Nota: Wynik testu dla badanej zależności między zmiennymi = χ²(2) = 1.64; p = 0.440.
W niniejszej analizie wzięło udział N = 303 obserwacji. Analiza częstości wystąpień wartości w zmiennej wierszowej Czy jeździł autem wykazała, że liczebność jej poszczególnych poziomów (Nie, Tak) wynosiła odpowienio 14, 289 (odsetek wynosił odpowiednio 4.62, 95.38), co stanowiło sumę 303 wystąpień (100%). Różnice w liczebnościach poziomów tej zmiennej były istotne statystycznie χ²(2) = 249.59; p < 0.001 (najczęściej występowała wartość Tak n = 289, a najrzadziej wartość Nie n = 14). Natomiast, analiza częstości wystąpień wartości w zmiennej kolumnowej Płeć wykazała, że liczebność jej poszczególnych poziomów (Kobieta, Mężczyzna) wynosiła odpowienio 173, 130 (odsetek wynosił odpowiednio 0.57, 0.43), co stanowiło sumę również 303 wystąpień (100%). Różnice w liczebnościach poziomów tej zmiennej były istotne statystycznie χ²(1) = 6.10; p = 0.014 (najczęściej występowała wartość Kobieta n = 173, a najrzadziej wartość Mężczyzna n = 130).
W celu weryfikacji zależności między zmienną Czy jeździł autem a zmienną Płeć przeprowadzono analizę testem Chi kwadrat (Pearson, 1900). Analiza testem Chi Kwadrat wykazała istotną zależność między zmienną Czy jeździł autem a zmienną Płeć, χ²(1) = 4.91; p = 0.027. Wystąpienia wartości zmiennej Czy jeździł autem były różne w poszczególnych poziomach zmiennej Płeć. Wartość współczynnika siły zależności V Cramera (Cramer i Harald, 1946) była równa 0.13 co wskazuje, że siła relacji pomiędzy zestawianymi zmiennymi była statystycznie słaba.
W celu analizy dokładnych różnic wartości zmiennej Czy jeździł autem występujących w wierszach tabeli (Nie, Tak) między wartościami zmiennej Płeć w kolumnach tabeli (Kobieta, Mężczyzna) przeprowadzono serię testów proporcji wartości kolumnowych (w ilości porównań N = 1). Analiza ta testuje różnice pod względem obserwowanej proporcji wartości wierszowych między dwiemia kolumnami.
Porównanie 1
Porównanie kolumn Kobieta Vs Mężczyzna zmiennej Płeć pod względem wartości wierszowych Nie, Tak zmiennej Czy jeździł autem , wykazała następujące wyniki:
• Częstość występowania wartości ‘Nie’ była podobna w przypadku wartości ‘Kobieta’ 6.94% i ‘Mężczyzna’ 1.54%, χ²(1) = 3.76; p = 0.053. W wyliczeniu istotności statystycznej zastosowano poprawkę na ciągłość (Yates, 1934).
• Częstość występowania wartości ‘Tak’ była podobna w przypadku wartości ‘Kobieta’ 93.06% i ‘Mężczyzna’ 98.46%, χ²(1) = 3.76; p = 0.053. W wyliczeniu istotności statystycznej zastosowano poprawkę na ciągłość (Yates, 1934).
Tabelę krzyżową z wynikami liczebności przedstawia tabela nr 3 . Wyniki statystyk częstości i odsetki oszacowań przedstawia rysunek nr 3 .
Tabela nr 3
Oszacowania kolumnowe dla relacji między zmienną Czy jeździł autem a Płeć
Nota: Wynik testu dla badanej zależności między zmiennymi = χ²(1) = 4.91; p = 0.027.
Rysunek nr 3
Występowanie wartości zmiennej Czy jeździł autem w podgrupach
zmiennej
Płeć
Nota: Wynik testu dla badanej zależności między zmiennymi = χ²(1) = 4.91; p = 0.027.
Podsumowanie analiz
| Analizowana zmienna | Wynik |
|---|---|
| Relacja między zmienną Edukacja a zmienną Płeć | Brak wyraźnej współzależności |
| Relacja między zmienną Grupa badana a zmienną Płeć | Brak wyraźnej współzależności |
| Relacja między zmienną Czy jeździł autem a zmienną Płeć | Istotna wspólzależność zmiennych |
Cramer, Harald. 1946. Mathematical Methods of Statistics. Princeton: Princeton University Press, page 282 (Chapter 21. The two-dimensional case)
Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Oprogramowanie]. https://sztos-it.com/
Karl Pearson F.R.S. (1900) X. On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling, The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science, 50:302, 157-175, https://doi.org/10.1080/14786440009463897
Wickham, H. (2016). ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York. ISBN 978-3-319-24277-4
Yates, F. (1934). Contingency Tables Involving Small Numbers and the χ2 Test. Supplement to the Journal of the Royal Statistical Society, 1(2), 217–235. https://doi.org/10.2307/2983604
[1] “”