Niniejszą analizę wykonano w Systemie Zautomatyzowanego Tworzenia Opisu Statystycznego - SZTOS (Hryniewicz, Milewska, 2023). Wizualizację wyników przeprowadzono z wykorzystaniem pakietu graficznego “ggplot2” (Wickham, 2016). W załączniku A jest przedstawiona tabela podsumowująca wyniki.
W niniejszej analizie wzięło udział N = 303 obserwacji. Analiza częstości wystąpień wartości w zmiennej wierszowej Czy jeździł autem wykazała, że liczebność jej poszczególnych poziomów (Nie, Tak) wynosiła odpowienio 14, 289 (odsetek wynosił odpowiednio 4.62, 95.38), co stanowiło sumę 303 wystąpień (100%). Różnice w liczebnościach poziomów tej zmiennej były istotne statystycznie χ²(2) = 249.59; p < 0.001 (najczęściej występowała wartość Tak n = 289, a najrzadziej wartość Nie n = 14). Natomiast, analiza częstości wystąpień wartości w zmiennej kolumnowej Licencja wykazała, że liczebność jej poszczególnych poziomów (Brak prawa jazdy, Prawo jazdy) wynosiła odpowienio 26, 277 (odsetek wynosił odpowiednio 0.09, 0.91), co stanowiło sumę również 303 wystąpień (100%). Różnice w liczebnościach poziomów tej zmiennej były istotne statystycznie χ²(1) = 207.92; p < 0.001 (najczęściej występowała wartość Prawo jazdy n = 277, a najrzadziej wartość Brak prawa jazdy n = 26).
W celu weryfikacji zależności między zmienną Czy jeździł autem a zmienną Licencja przeprowadzono analizę testem Chi kwadrat (Pearson, 1900). Ze względu na występowanie wartości oczekiwanych mniejszych niż 5, zastosowano korektę istotności statystycznej metodą dokładnego testu Fishera (Agresti, 1990; Bower i Keith, 2003). Analiza testem Chi Kwadrat wykazała istotną zależność między zmienną Czy jeździł autem a zmienną Licencja, χ²(1) = 132.90; p < 0.001. Wystąpienia wartości zmiennej Czy jeździł autem były różne w poszczególnych poziomach zmiennej Licencja. Wartość współczynnika siły zależności V Cramera (Cramer i Harald, 1946) była równa 0.66 co wskazuje, że siła relacji pomiędzy zestawianymi zmiennymi była statystycznie umiarkowana.
W celu analizy dokładnych różnic wartości zmiennej Czy jeździł autem występujących w wierszach tabeli (Nie, Tak) między wartościami zmiennej Licencja w kolumnach tabeli (Brak prawa jazdy, Prawo jazdy) przeprowadzono serię testów proporcji wartości kolumnowych (w ilości porównań N = 1). Analiza ta testuje różnice pod względem obserwowanej proporcji wartości wierszowych między dwiemia kolumnami.
Porównanie 1
Porównanie kolumn Brak prawa jazdy Vs Prawo jazdy zmiennej Licencja pod względem wartości wierszowych Nie, Tak zmiennej Czy jeździł autem , wykazała następujące wyniki:
• Częstość występowania wartości ‘Nie’ była znacznie większa w przypadku wartości ‘Brak prawa jazdy’ 50.00% niż w przypadku wartości ‘Prawo jazdy’ 0.36%, χ²(1) = 121.87; p < 0.001. W wyliczeniu istotności statystycznej zastosowano poprawkę na ciągłość (Yates, 1934).
• Częstość występowania wartości ‘Tak’ była znacznie mniejsza w przypadku wartości ‘Brak prawa jazdy’ 50.00% niż w przypadku wartości ‘Prawo jazdy’ 99.64%, χ²(1) = 121.87; p < 0.001. W wyliczeniu istotności statystycznej zastosowano poprawkę na ciągłość (Yates, 1934).
Tabelę krzyżową z wynikami liczebności przedstawia tabela nr 1 . Wyniki statystyk częstości i odsetki oszacowań przedstawia rysunek nr 1 .
Tabela nr 1
Oszacowania kolumnowe dla relacji między zmienną Czy jeździł autem a Licencja
Brak prawa jazdy | Prawo jazdy | Total | |
---|---|---|---|
Czy_jeździł_autem | |||
Nie | 13 (50%) | 1 (0.4%) | 14 (4.6%) |
Tak | 13 (50%) | 276 (100%) | 289 (95%) |
Total | 26 (100%) | 277 (100%) | 303 (100%) |
Nota: Wynik testu dla badanej zależności między zmiennymi = χ²(1) = 132.90; p < 0.001.
Rysunek nr 1
Występowanie wartości zmiennej Czy jeździł autem w podgrupach zmiennej Licencja
Nota: Wynik testu dla badanej zależności między zmiennymi = χ²(1) = 132.90; p < 0.001.
Analiza zależności pomiędzy posiadaniem prawa jazdy a jeżdżeniem zamochodem wyakzała istotną zależność. Za wyjątkiem 1 osoby, wszystkie osoby z prawem jazdy prowadziły w swoim życiu pojazd. Natomiast osoby które nie miały prawa jazdy dzieliły się po równo na 13 osób które jeździły pojazdem i 13 osób które nie jeździły.
Analizowana zmienna | Wynik |
---|---|
Relacja między zmienną Czy jeździł autem a zmienną Licencja | Istotna wspólzależność zmiennych |
Agresti, A. (1990). Categorical data analysis. New York: Wiley. Pages 59–66.
Bower, Keith M. 2003. “When to Use Fisher’s Exact Test.” In American Society for Quality, Six Sigma Forum Magazine, 2:35–37. 4.
Cramer, Harald. 1946. Mathematical Methods of Statistics. Princeton: Princeton University Press, page 282 (Chapter 21. The two-dimensional case)
Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Oprogramowanie]. https://sztos-it.com/
Karl Pearson F.R.S. (1900) X. On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling, The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science, 50:302, 157-175, https://doi.org/10.1080/14786440009463897
Wickham, H. (2016). ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York. ISBN 978-3-319-24277-4
Yates, F. (1934). Contingency Tables Involving Small Numbers and the χ2 Test. Supplement to the Journal of the Royal Statistical Society, 1(2), 217–235. https://doi.org/10.2307/2983604
[1] “”