Niniejszą analizę wykonano w Systemie Zautomatyzowanego Tworzenia Opisu Statystycznego - SZTOS (Hryniewicz, Milewska, 2023). Wizualizację wyników przeprowadzono z wykorzystaniem pakietu graficznego “ggplot2” (Wickham, 2016). W załączniku A jest przedstawiona tabela podsumowująca wyniki.
W niniejszej analizie wzięło udział N = 303 obserwacji. Analiza częstości wystąpień wartości w zmiennej wierszowej Edukacja wykazała, że liczebność jej poszczególnych poziomów (Podstawowe, Średnie, Wyższe) wynosiła odpowienio 2, 130, 171 (odsetek wynosił odpowiednio 0.66, 42.90, 56.44), co stanowiło sumę 303 wystąpień (100%). Różnice w liczebnościach poziomów tej zmiennej były istotne statystycznie χ²(3) = 153.88; p < 0.001 (najczęściej występowała wartość Wyższe n = 171, a najrzadziej wartość Podstawowe n = 2). Natomiast, analiza częstości wystąpień wartości w zmiennej kolumnowej Płeć wykazała, że liczebność jej poszczególnych poziomów (Kobieta, Mężczyzna) wynosiła odpowienio 173, 130 (odsetek wynosił odpowiednio 0.57, 0.43), co stanowiło sumę również 303 wystąpień (100%). Różnice w liczebnościach poziomów tej zmiennej były istotne statystycznie χ²(1) = 6.10; p = 0.014 (najczęściej występowała wartość Kobieta n = 173, a najrzadziej wartość Mężczyzna n = 130).
W celu weryfikacji zaleności między zmienną Edukacja a zmienną Płeć przeprowadzono analizę testem Chi kwadrat (Pearson, 1900). Ze względu na występowanie wartości oczekiwanych mniejszych niż 5, zastosowano korektę istotności statystycznej metodą dokładnego testu Fishera (Agresti, 1990; Bower i Keith, 2003). Analiza testem Chi Kwadrat wykazała brak istotnej zależności między zmienną Edukacja a zmienną Płeć, χ²(2) = 1.59; p = 0.446. Wystąpienia wartości zmiennej Edukacja były podobne w poszczególnych poziomach zmiennej Płeć. Wartość współczynnika siły zależności V Cramera (Cramer i Harald, 1946) była równa 0.07.
Tabelę krzyżową z wynikami liczebności przedstawia tabela nr 1 . Wyniki statystyk częstości i odsetki oszacowań przedstawia rysunek nr 1 .
Tabela nr 1
Oszacowania kolumnowe dla relacji między zmienną Edukacja a Płeć
Edukacja | Kobieta | Mężczyzna | Total |
---|---|---|---|
Podstawowe | 0.58% (1) | 0.77% (1) | 0.66% (2) |
Średnie | 39.88% (69) | 46.92% (61) | 42.90% (130) |
Wyższe | 59.54% (103) | 52.31% (68) | 56.44% (171) |
Total | 100.00% (173) | 100.00% (130) | 100.00% (303) |
Nota: Wynik testu Chi kwadrat nie wykazał istotnej zależności pomiędzy analizowanymi zmiennymi w tabeli = χ²(2) = 1.59; p = 0.446.
Rysunek nr 1
Występowanie wartości zmiennej Edukacja w podgrupach zmiennej
Płeć
Nota: n (%); n = liczebność w podzbiorze; Wynik testu Chi kwadrat nie wykazał istotnej zależności pomiędzy analizowanymi zmiennymi w tabeli = χ²(2) = 1.59; p = 0.446.
Analiza związku między zmiennymi Edukacja i Płeć nie wykazała istotnej zależności. Występowanie poziomów edukacji było podobne wśród różnych płci, a siła tego związku była bardzo słaba.
W niniejszej analizie wzięło udział N = 303 obserwacji. Analiza częstości wystąpień wartości w zmiennej wierszowej Licencja wykazała, że liczebność jej poszczególnych poziomów (Nie, Tak) wynosiła odpowienio 26, 277 (odsetek wynosił odpowiednio 8.58, 91.42), co stanowiło sumę 303 wystąpień (100%). Różnice w liczebnościach poziomów tej zmiennej były istotne statystycznie χ²(2) = 207.92; p < 0.001 (najczęściej występowała wartość Tak n = 277, a najrzadziej wartość Nie n = 26). Natomiast, analiza częstości wystąpień wartości w zmiennej kolumnowej Płeć wykazała, że liczebność jej poszczególnych poziomów (Kobieta, Mężczyzna) wynosiła odpowienio 173, 130 (odsetek wynosił odpowiednio 0.57, 0.43), co stanowiło sumę również 303 wystąpień (100%). Różnice w liczebnościach poziomów tej zmiennej były istotne statystycznie χ²(1) = 6.10; p = 0.014 (najczęściej występowała wartość Kobieta n = 173, a najrzadziej wartość Mężczyzna n = 130).
W celu weryfikacji zaleności między zmienną Licencja a zmienną Płeć przeprowadzono analizę testem Chi kwadrat (Pearson, 1900). Analiza testem Chi Kwadrat wykazała brak istotnej zależności między zmienną Licencja a zmienną Płeć, χ²(1) = 2.97; p = 0.085. Wystąpienia wartości zmiennej Licencja były podobne w poszczególnych poziomach zmiennej Płeć. Wartość współczynnika siły zależności V Cramera (Cramer i Harald, 1946) była równa 0.10.
Tabelę krzyżową z wynikami liczebności przedstawia tabela nr 2 . Wyniki statystyk częstości i odsetki oszacowań przedstawia rysunek nr 2 .
Tabela nr 2
Oszacowania kolumnowe dla relacji między zmienną Licencja a Płeć
Licencja | Kobieta | Mężczyzna | Total |
---|---|---|---|
Nie | 10.98% (19) | 5.38% (7) | 8.58% (26) |
Tak | 89.02% (154) | 94.62% (123) | 91.42% (277) |
Total | 100.00% (173) | 100.00% (130) | 100.00% (303) |
Nota: Wynik testu Chi kwadrat nie wykazał istotnej zależności pomiędzy analizowanymi zmiennymi w tabeli = χ²(1) = 2.97; p = 0.085.
Rysunek nr 2
Występowanie wartości zmiennej Licencja w podgrupach zmiennej
Płeć
Nota: n (%); n = liczebność w podzbiorze; Wynik testu Chi kwadrat nie wykazał istotnej zależności pomiędzy analizowanymi zmiennymi w tabeli = χ²(1) = 2.97; p = 0.085.
Analiza wykazała, że nie występowała istotna zależność między zmiennymi Licencja a Płeć. Siła związku była słaba, współczynnik V Cramera wyniósł 0,10. Wartości zmiennej Licencja pojawiały się podobnie w poszczególnych kategoriach zmiennej Płeć.
W niniejszej analizie wzięło udział N = 303 obserwacji. Analiza częstości wystąpień wartości w zmiennej wierszowej Czy jeździł autem wykazała, że liczebność jej poszczególnych poziomów (Nie, Tak) wynosiła odpowienio 14, 289 (odsetek wynosił odpowiednio 4.62, 95.38), co stanowiło sumę 303 wystąpień (100%). Różnice w liczebnościach poziomów tej zmiennej były istotne statystycznie χ²(2) = 249.59; p < 0.001 (najczęściej występowała wartość Tak n = 289, a najrzadziej wartość Nie n = 14). Natomiast, analiza częstości wystąpień wartości w zmiennej kolumnowej Płeć wykazała, że liczebność jej poszczególnych poziomów (Kobieta, Mężczyzna) wynosiła odpowienio 173, 130 (odsetek wynosił odpowiednio 0.57, 0.43), co stanowiło sumę również 303 wystąpień (100%). Różnice w liczebnościach poziomów tej zmiennej były istotne statystycznie χ²(1) = 6.10; p = 0.014 (najczęściej występowała wartość Kobieta n = 173, a najrzadziej wartość Mężczyzna n = 130).
W celu weryfikacji zależności między zmienną Czy jeździł autem a zmienną Płeć przeprowadzono analizę testem Chi kwadrat (Pearson, 1900). Analiza testem Chi Kwadrat wykazała istotną zależność między zmienną Czy jeździł autem a zmienną Płeć, χ²(1) = 4.91; p = 0.027. Wystąpienia wartości zmiennej Czy jeździł autem były różne w poszczególnych poziomach zmiennej Płeć. Wartość współczynnika siły zależności V Cramera (Cramer i Harald, 1946) była równa 0.13 co wskazuje, że siła relacji pomiędzy zestawianymi zmiennymi była statystycznie słaba.
W celu analizy dokładnych różnic wartości zmiennej Czy jeździł autem występujących w wierszach tabeli (Nie, Tak) między wartościami zmiennej Płeć w kolumnach tabeli (Kobieta, Mężczyzna) przeprowadzono serię testów proporcji wartości kolumnowych (w ilości porównań N = 1). Analiza ta testuje różnice pod względem obserwowanej proporcji wartości wierszowych między dwiemia kolumnami.
Porównanie 1
Porównanie kolumn Kobieta Vs Mężczyzna zmiennej Płeć pod względem wartości wierszowych Nie, Tak zmiennej Czy jeździł autem , wykazała następujące wyniki:
• Częstość występowania wartości ‘Nie’ była podobna w przypadku wartości ‘Kobieta’ 6.94% i ‘Mężczyzna’ 1.54%, χ²(1) = 3.76; p = 0.053. W wyliczeniu istotności statystycznej zastosowano poprawkę na ciągłość (Yates, 1934).
• Częstość występowania wartości ‘Tak’ była podobna w przypadku wartości ‘Kobieta’ 93.06% i ‘Mężczyzna’ 98.46%, χ²(1) = 3.76; p = 0.053. W wyliczeniu istotności statystycznej zastosowano poprawkę na ciągłość (Yates, 1934).
Tabelę krzyżową z wynikami liczebności przedstawia tabela nr 3 . Wyniki statystyk częstości i odsetki oszacowań przedstawia rysunek nr 3 .
Tabela nr 3
Oszacowania kolumnowe dla relacji między zmienną Czy jeździł autem a Płeć
Czy jeździł autem | Kobieta | Mężczyzna | Total |
---|---|---|---|
Nie | 6.94% (12) | 1.54% (2) | 4.62% (14) |
Tak | 93.06% (161) | 98.46% (128) | 95.38% (289) |
Total | 100.00% (173) | 100.00% (130) | 100.00% (303) |
Nota: Wynik testu Chi kwadrat wykazał istotną zależność pomiędzy analizowanymi zmiennymi w tabeli = χ²(1) = 4.91; p = 0.027.
Rysunek nr 3
Występowanie wartości zmiennej Czy jeździł autem w podgrupach
zmiennej
Płeć
Nota: n (%); n = liczebność w podzbiorze; Wynik testu Chi kwadrat wykazał istotną zależność pomiędzy analizowanymi zmiennymi w tabeli = χ²(1) = 4.91; p = 0.027.
Analiza wykazała istotną zależność między zmiennymi Czy jeździł autem a Płeć. Siła tej zależności była słaba. Wzorzec wyników pokazał, że występowanie wartości zmiennej Czy jeździł autem różniło się między płciami, jednak porównania poszczególnych kategorii Nie i Tak dla Kobieta versus Mężczyzna były podobne i nie wykazały istotnych różnic.
Podsumowanie analiz
Analizowana zmienna | Wynik |
---|---|
Relacja między zmienną Edukacja a zmienną Płeć | Brak wyraźnej współzależności |
Relacja między zmienną Licencja a zmienną Płeć | Brak wyraźnej współzależności |
Relacja między zmienną Czy jeździł autem a zmienną Płeć | Istotna wspólzależność zmiennych |
Cramer, Harald. 1946. Mathematical Methods of Statistics. Princeton: Princeton University Press, page 282 (Chapter 21. The two-dimensional case)
Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Oprogramowanie]. https://sztos-it.com/
Karl Pearson F.R.S. (1900) X. On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling, The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science, 50:302, 157-175, https://doi.org/10.1080/14786440009463897
Wickham, H. (2016). ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York. ISBN 978-3-319-24277-4
Yates, F. (1934). Contingency Tables Involving Small Numbers and the χ2 Test. Supplement to the Journal of the Royal Statistical Society, 1(2), 217–235. https://doi.org/10.2307/2983604
Masz pytania do raportu🔮⁉️
Kliknij i porozmawiaj z naszą statystyczną asystentką Danką💁♀✅