• W pierwszej części raportu została umieszczona informacja o liczbie
obserwacji oraz liczbie zmiennych we wprowadzonej bazie danych.
•
Aby usunąć z bazy danych a) obserwacje które nie zawierają żadnych
danych, b) zmienne których liczba obserwacji jest mniejsza lub równa 1,
zidentyfikowano takie przypadki. Jeśli takowe wystąpiły, zostały
usunięte wraz z podaniem informacji o ich współrzędnych.
• Tej
samej procedurze zostały poddane zmienne, które posiadały identyczne
wartości.
Liczba obserwacji: 303
Liczba zmiennych: 36
W bazie danych nie wystąpują OBSERWACJE,
które zawierają wyłącznie braki danych.
Obserwacje, które
zawierały wyłącznie braki danych to: brak.
W bazie danych nie wystąpiły ZMIENNE, które
zawierają wyłącznie braki danych lub 1 obserwację.
Zmienne, które
zawierały wyłącznie braki danych lub 1 obserwację to: brak.
W bazie danych nie wystąpiły zmienne, które miały
STAŁĄ WARIANCJĘ.
Zmienne, które posiadały identyczne wartości to:
brak.
• W tak przygotowanej bazie danych zidentyfikowano zmienne, które
posiadają odsetek braków danych większy niż ten wyznaczony przez
użytkownika, a informację podano do raportu.
W bazie danych nie wystąpiły ZMIENNE, które
zawierają ponad lub równo: 5% braków danych.
Zmienne, które
zawierają równo lub ponad 5% braków danych, to: brak.
Dokładne wyniki przedstawia Tabela nr 1.
Zmienna | % braków danych | n/N braków danych |
---|---|---|
Płeć | 0.00% | 0/303 |
Edukacja | 0.00% | 0/303 |
Grupa badana | 0.00% | 0/303 |
Licencja | 0.00% | 0/303 |
Czy jeździł autem | 0.00% | 0/303 |
Grupa2 | 0.00% | 0/303 |
Wiek | 0.00% | 0/303 |
Obawy | 0.00% | 0/303 |
Cele | 0.00% | 0/303 |
Łatwość | 0.00% | 0/303 |
Użyteczność | 0.00% | 0/303 |
Intencja zakupu | 0.00% | 0/303 |
• Następnie zidentyfikowano obserwacje, które zawierają ponad połowę
braków danych i podano ich współrzędne. Taki stan rzeczy może wynikać
np. z porzucenia badania w trakcie jego trwania. Może to powodować
ograniczoną przydatność takich obserwacji w analizach.
W bazie danych nie wystąpiły OBSERWACJE, które
zawierają ponad połowę braków danych.
Numery wierszy, które
zawierają ponad połowę braków danych: brak.
Wizualną prezentację braków danych stanowi Rysunek nr 1.
Rysunek nr 1
Graficzna prezentacja braków
danych występujących w zakresie zmiennych; Płeć, Edukacja, Grupa badana,
Licencja, Czy jeździł autem, Grupa2, Wiek, Obawy, Cele, Łatwość,
Użyteczność, Intencja zakupu .
Nota:
Wykres przedstawia następujące zmienne: Zm1 - Płeć, Zm2 - Edukacja, Zm3
- Grupa badana, Zm4 - Licencja, Zm5 - Czy jeździł autem, Zm6 - Grupa2,
Zm7 - Wiek, Zm8 - Obawy, Zm9 - Cele, Zm10 - Łatwość, Zm11 - Użyteczność,
Zm12 - Intencja zakupu.
[1] “”
• Analiza dla zmiennej Płeć wykazała, że liczebność jej poszczególnych poziomów Kobieta, Mężczyzna wynosiła odpowiednio 173, 130 (ich odsetek wynosił odpowiednio 57.10, 42.90), co stanowiło sumę 303 na 303 wystąpień (100.00% ogółu obserwacji). A zatem liczebność braków danych to: 0, a odsetek to: 0.00%.
• Analiza dla zmiennej Edukacja wykazała, że liczebność jej poszczególnych poziomów Wyższe, Średnie, Podstawowe wynosiła odpowiednio 171, 130, 2 (ich odsetek wynosił odpowiednio 56.44, 42.90, 0.66), co stanowiło sumę 303 na 303 wystąpień (100.00% ogółu obserwacji). A zatem liczebność braków danych to: 0, a odsetek to: 0.00%.
• Analiza dla zmiennej Grupa badana wykazała, że liczebność jej poszczególnych poziomów Bandziorki, Papugi, Policjanci wynosiła odpowiednio 101, 101, 101 (ich odsetek wynosił odpowiednio 33.33, 33.33, 33.33), co stanowiło sumę 303 na 303 wystąpień (100.00% ogółu obserwacji). A zatem liczebność braków danych to: 0, a odsetek to: 0.00%.
• Analiza dla zmiennej Licencja wykazała, że liczebność jej poszczególnych poziomów Tak, Nie wynosiła odpowiednio 277, 26 (ich odsetek wynosił odpowiednio 91.42, 8.58), co stanowiło sumę 303 na 303 wystąpień (100.00% ogółu obserwacji). A zatem liczebność braków danych to: 0, a odsetek to: 0.00%.
• Analiza dla zmiennej Czy jeździł autem wykazała, że liczebność jej poszczególnych poziomów Tak, Nie wynosiła odpowiednio 289, 14 (ich odsetek wynosił odpowiednio 95.38, 4.62), co stanowiło sumę 303 na 303 wystąpień (100.00% ogółu obserwacji). A zatem liczebność braków danych to: 0, a odsetek to: 0.00%.
• Analiza dla zmiennej Grupa2 wykazała, że liczebność jej poszczególnych poziomów Reklama A, Reklama B wynosiła odpowiednio 159, 144 (ich odsetek wynosił odpowiednio 52.48, 47.52), co stanowiło sumę 303 na 303 wystąpień (100.00% ogółu obserwacji). A zatem liczebność braków danych to: 0, a odsetek to: 0.00%.
Otrzymane wyniki przedstawiają Rysunki 1-6.
Rysunek nr 1
Częstość występowania
wartości zmiennej Płeć (z uwzględnieniem braków danych)
Rysunek nr 2
Częstość występowania
wartości zmiennej Edukacja (z uwzględnieniem braków danych)
Rysunek nr 3
Częstość występowania
wartości zmiennej Grupa badana (z uwzględnieniem braków danych)
Rysunek nr 4
Częstość występowania
wartości zmiennej Licencja (z uwzględnieniem braków danych)
Rysunek nr 5
Częstość występowania
wartości zmiennej Czy jeździł autem (z uwzględnieniem braków danych)
Rysunek nr 6
Częstość występowania
wartości zmiennej Grupa2 (z uwzględnieniem braków danych)
Analiza normalności rozkładu zmiennych: Wiek, Obawy, Cele, Łatwość, Użyteczność, Intencja zakupu.
W celu weryfikacji założeń dotyczacych normalności rozkładów wyników analizowanych zmiennych przeprowadzono dwa testy statystyczne, był to test Shapiro - Wilka (stosowany dla małoliczebnych próbek badawczych N < 50 lub N < 100) (Royston, 1982) oraz test Kolmogorova Smirnova z poprawką Lilieforce’a (stosowany dla dużych prób N > 50 lub N > 100) (Dallal i Wilkinson, 1986). Zdecydowano się na taką analizę ze względu na brak jednoznacznych wytycznych dotyczących stosowania obu testów przy danej liczebności badanych obserwacji.
W celu weryfikacji normalności rozkładów zmiennych: Wiek, Obawy, Cele, Łatwość, Użyteczność, Intencja zakupu, przeprowadzono serię analiz weryfikujących podobieństwo rozkładu z próby do teoretycznego rozkładu normalnego testem Shapiro-Wilka (Royston, 1982). Analiza wykazała, że:
• Rozkład wyników zmiennej Wiek był istotnie różny od rozkładu normalnego SW = 0.85; p < 0.001
• Rozkład wyników zmiennej Obawy był istotnie różny od rozkładu normalnego SW = 0.97; p < 0.001
• Rozkład wyników zmiennej Cele był istotnie różny od rozkładu normalnego SW = 0.96; p < 0.001
• Rozkład wyników zmiennej Łatwość był istotnie różny od rozkładu normalnego SW = 0.95; p < 0.001
• Rozkład wyników zmiennej Użyteczność był istotnie różny od rozkładu normalnego SW = 0.98; p < 0.001
• Rozkład wyników zmiennej Intencja zakupu był istotnie różny od rozkładu normalnego SW = 0.97; p < 0.001
W celu dodatkowej weryfikacji normalności rozkładów zmiennych: Wiek, Obawy, Cele, Łatwość, Użyteczność, Intencja zakupu, przeprowadzono serię analiz weryfikujących podobieństwo rozkładu z próby do teoretycznego rozkładu normalnego testem Kolmogorova-Smirnova z poprawką Lilieforce’a (Dallal i Wilkinson, 1986). Analiza wykazała, że:
• Rozkład wyników zmiennej Wiek był istotnie różny od rozkładu normalnego KS = 0.22; p < 0.001
• Rozkład wyników zmiennej Obawy był istotnie różny od rozkładu normalnego KS = 0.12; p < 0.001
• Rozkład wyników zmiennej Cele był istotnie różny od rozkładu normalnego KS = 0.13; p < 0.001
• Rozkład wyników zmiennej Łatwość był istotnie różny od rozkładu normalnego KS = 0.17; p < 0.001
• Rozkład wyników zmiennej Użyteczność był istotnie różny od rozkładu normalnego KS = 0.10; p < 0.001
• Rozkład wyników zmiennej Intencja zakupu był istotnie różny od rozkładu normalnego KS = 0.08; p < 0.001
Wyniki analiz przedstawia Tabela nr 1.
Zmienna | N | Min | Max | M | SD | SE | Me | Skośność | Kurtoza | KS | p | SW | p |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Wiek | 303 | 20.00 | 51.00 | 27.52 | 5.87 | 0.34 | 26.00 | 1.47 | 1.86 | 0.22 | < 0.001 | 0.85 | < 0.001 |
Obawy | 303 | 1.00 | 4.00 | 2.79 | 0.71 | 0.04 | 2.80 | -0.31 | -0.57 | 0.12 | < 0.001 | 0.97 | < 0.001 |
Cele | 303 | 1.00 | 4.00 | 2.15 | 0.74 | 0.04 | 2.00 | 0.45 | -0.21 | 0.13 | < 0.001 | 0.96 | < 0.001 |
Łatwość | 303 | 1.00 | 5.00 | 3.61 | 0.79 | 0.05 | 3.75 | -0.52 | 0.51 | 0.17 | < 0.001 | 0.95 | < 0.001 |
Użyteczność | 303 | 1.00 | 5.00 | 3.24 | 0.89 | 0.05 | 3.25 | -0.32 | -0.05 | 0.10 | < 0.001 | 0.98 | < 0.001 |
Intencja zakupu | 303 | 1.00 | 5.00 | 2.76 | 1.03 | 0.06 | 2.75 | 0.03 | -0.68 | 0.08 | < 0.001 | 0.97 | < 0.001 |
Nota: N = Liczebność; Min = Wartość minimalna; Max = Wartość maksymalna; M = Średnia arytmetyczna; SD = Odchylenie standardowe; SE = Błąd standardowy średniej; Me = Mediana; p = Istotność statystyczna. Wyniki testu KS (Kołmogorov - Smirnov) i SW (Shapiro - Wilk), których p < 0.05 dla danej zmiennej, wskazują na istotną różnicę między rozkładem wyników w próbie a teoretycznym rozkładem normalnym.
Dallal, G.E. and Wilkinson, L. (1986) An analytic approximation to the distribution of Lilliefors’ test for normality. The American Statistician, 40, 294–296.
Royston, J. P. (1982). An Extension of Shapiro and Wilk’s W Test for Normality to Large Samples. Journal of the Royal Statistical Society. Series C (Applied Statistics), 31(2), 115–124. https://doi.org/10.2307/2347973
Aby dokonać wizualnej oceny rozkładu zmiennych wykonano histogramy
przedstawione na Rysunkach 1-6.
Rysunek nr 1
Rozkład wartości zmiennej Wiek
Nota:
Kolor różowy przedstawia Średnią.
Kolor zielony przedstawia Medianę.
Rysunek nr 2
Rozkład wartości
zmiennej Obawy
Nota:
Kolor różowy przedstawia Średnią.
Kolor zielony przedstawia Medianę.
Rysunek nr 3
Rozkład wartości
zmiennej Cele
Nota:
Kolor różowy przedstawia Średnią.
Kolor zielony przedstawia Medianę.
Rysunek nr 4
Rozkład wartości
zmiennej Łatwość
Nota:
Kolor różowy przedstawia Średnią.
Kolor zielony przedstawia Medianę.
Rysunek nr 5
Rozkład wartości
zmiennej Użyteczność
Nota:
Kolor różowy przedstawia Średnią.
Kolor zielony przedstawia Medianę.
Rysunek nr 6
Rozkład wartości
zmiennej Intencja zakupu
Nota:
Kolor różowy przedstawia Średnią.
Kolor zielony przedstawia Medianę.
Aby dokonać wizualnej oceny rozkładu zmiennych wykonano box-ploty
przedstawione na Rysunkach 1-6.
Rysunek nr 1
Rozkład wartości zmiennej Wiek
Rysunek
nr 2
Rozkład wartości zmiennej Obawy
Rysunek
nr 3
Rozkład wartości zmiennej Cele
Rysunek
nr 4
Rozkład wartości zmiennej Łatwość
Rysunek
nr 5
Rozkład wartości zmiennej Użyteczność
Rysunek
nr 6
Rozkład wartości zmiennej Intencja zakupu