Analiza tabel krzyżowych

Niniejszą analizę wykonano w Systemie Zautomatyzowanego Tworzenia Opisu Statystycznego - SZTOS (Hryniewicz, Milewska, 2023). Wizualizację wyników przeprowadzono z wykorzystaniem pakietu graficznego “ggplot2” (Wickham, 2016). W załączniku A jest przedstawiona tabela podsumowująca wyniki.

Analiza relacji między współwystępowaniem wartości zmiennych Czy jeździł autem i Licencja

W niniejszej analizie wzięło udział N = 303 obserwacji. Analiza częstości wystąpień wartości w zmiennej wierszowej Czy jeździł autem wykazała, że liczebność jej poszczególnych poziomów (Nie, Tak) wynosiła odpowienio 14, 289 (odsetek wynosił odpowiednio 4.62, 95.38), co stanowiło sumę 303 wystąpień (100%). Różnice w liczebnościach poziomów tej zmiennej były istotne statystycznie χ²(2) = 249.59; p < 0.001 (najczęściej występowała wartość Tak n = 289, a najrzadziej wartość Nie n = 14). Natomiast, analiza częstości wystąpień wartości w zmiennej kolumnowej Licencja wykazała, że liczebność jej poszczególnych poziomów (Brak prawa jazdy, Prawo jazdy) wynosiła odpowienio 26, 277 (odsetek wynosił odpowiednio 0.09, 0.91), co stanowiło sumę również 303 wystąpień (100%). Różnice w liczebnościach poziomów tej zmiennej były istotne statystycznie χ²(1) = 207.92; p < 0.001 (najczęściej występowała wartość Prawo jazdy n = 277, a najrzadziej wartość Brak prawa jazdy n = 26).

Analiza istotności i siły relacji pomiędzy zmienną Czy jeździł autem a zmienną Licencja

W celu weryfikacji zależności między zmienną Czy jeździł autem a zmienną Licencja przeprowadzono analizę testem Chi kwadrat (Pearson, 1900). Ze względu na występowanie wartości oczekiwanych mniejszych niż 5, zastosowano korektę istotności statystycznej metodą dokładnego testu Fishera (Agresti, 1990; Bower i Keith, 2003). Analiza testem Chi Kwadrat wykazała istotną zależność między zmienną Czy jeździł autem a zmienną Licencja, χ²(1) = 132.90; p < 0.001. Wystąpienia wartości zmiennej Czy jeździł autem były różne w poszczególnych poziomach zmiennej Licencja. Wartość współczynnika siły zależności V Cramera (Cramer i Harald, 1946) była równa 0.66 co wskazuje, że siła relacji pomiędzy zestawianymi zmiennymi była statystycznie umiarkowana.

Test proporcji występowania wartości kolumnowych zmiennej Licencja

W celu analizy dokładnych różnic wartości zmiennej Czy jeździł autem występujących w wierszach tabeli (Nie, Tak) między wartościami zmiennej Licencja w kolumnach tabeli (Brak prawa jazdy, Prawo jazdy) przeprowadzono serię testów proporcji wartości kolumnowych (w ilości porównań N = 1). Analiza ta testuje różnice pod względem obserwowanej proporcji wartości wierszowych między dwiemia kolumnami.

Porównanie 1

Porównanie kolumn Brak prawa jazdy Vs Prawo jazdy zmiennej Licencja pod względem wartości wierszowych Nie, Tak zmiennej Czy jeździł autem , wykazała następujące wyniki:

• Częstość występowania wartości ‘Nie’ była znacznie większa w przypadku wartości ‘Brak prawa jazdy’ 50.00% niż w przypadku wartości ‘Prawo jazdy’ 0.36%, χ²(1) = 121.87; p < 0.001. W wyliczeniu istotności statystycznej zastosowano poprawkę na ciągłość (Yates, 1934).

• Częstość występowania wartości ‘Tak’ była znacznie mniejsza w przypadku wartości ‘Brak prawa jazdy’ 50.00% niż w przypadku wartości ‘Prawo jazdy’ 99.64%, χ²(1) = 121.87; p < 0.001. W wyliczeniu istotności statystycznej zastosowano poprawkę na ciągłość (Yates, 1934).

Tabelę krzyżową z wynikami liczebności przedstawia tabela nr 1 . Wyniki statystyk częstości i odsetki oszacowań przedstawia rysunek nr 1 .

Tabela nr 1

Oszacowania kolumnowe dla relacji między zmienną Czy jeździł autem a Licencja

Licencja
Brak prawa jazdy Prawo jazdy Total
Czy_jeździł_autem
Nie 13 (50%) 1 (0.4%) 14 (4.6%)
Tak 13 (50%) 276 (100%) 289 (95%)
Total 26 (100%) 277 (100%) 303 (100%)

Nota: Wynik testu dla badanej zależności między zmiennymi = χ²(1) = 132.90; p < 0.001.

Rysunek nr 1

Występowanie wartości zmiennej Czy jeździł autem w podgrupach zmiennej Licencja

Nota: Wynik testu dla badanej zależności między zmiennymi = χ²(1) = 132.90; p < 0.001.

Wnioski

Analiza zależności pomiędzy posiadaniem prawa jazdy a jeżdżeniem zamochodem wyakzała istotną zależność. Za wyjątkiem 1 osoby, wszystkie osoby z prawem jazdy prowadziły w swoim życiu pojazd. Natomiast osoby które nie miały prawa jazdy dzieliły się po równo na 13 osób które jeździły pojazdem i 13 osób które nie jeździły.

Załącznik A

Podsumowanie analiz
Analizowana zmienna Wynik
Relacja między zmienną Czy jeździł autem a zmienną Licencja Istotna wspólzależność zmiennych

Bibliografia

Agresti, A. (1990). Categorical data analysis. New York: Wiley. Pages 59–66.

Bower, Keith M. 2003. “When to Use Fisher’s Exact Test.” In American Society for Quality, Six Sigma Forum Magazine, 2:35–37. 4.

Cramer, Harald. 1946. Mathematical Methods of Statistics. Princeton: Princeton University Press, page 282 (Chapter 21. The two-dimensional case)

Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Oprogramowanie]. https://sztos-it.com/

Karl Pearson F.R.S. (1900) X. On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling, The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science, 50:302, 157-175, https://doi.org/10.1080/14786440009463897

Wickham, H. (2016). ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York. ISBN 978-3-319-24277-4

Yates, F. (1934). Contingency Tables Involving Small Numbers and the χ2 Test. Supplement to the Journal of the Royal Statistical Society, 1(2), 217–235. https://doi.org/10.2307/2983604

[1] “”