Niniejszą analizę i raport opisowy wykonano w Systemie Zautomatyzowanego Tworzenia Opisu Statystycznego - SZTOS (Hryniewicz, Milewska, 2023). Wizualizacje wyników przeprowadzono z wykorzystaniem pakietu graficznego “ggplot2” (Wickham, 2016).
Model wpływu Obawy, Cele, Płeć Mężczyzna na wyniki zmiennej Łatwość.
W celu wyjaśnienia zmiennej Łatwość przeprowadzono wielozmiennową analizę regresji liniowej (Fisher, 1922). W analizie wzięło udział N = 303 badanych obserwacji. Jakościowy charakter zmiennej Płeć wymagał przekształcenia jej kategorii na wartości liczbowe 0 i 1. Dlatego do dalszej analizy wykorzystano jej przekształcone kategorie. W analizie przyjęto dla zmiennej Płeć grupę referencyjną Kobieta. Wyniki przedstawione w analizie odnosiły się do wyszczególnionej grupy odniesienia.
Ze względu na odbieganie testowanego modelu dla wyników Łatwość od założeń modelu regresji, poddano tę zmienną procedurze normalizacji. W celu wyboru najlepszej metody normalizującej zmienną Łatwość wykonano serię przekształceń tej zmiennej szeregiem metod normalizujących. Wykorzystano w tym celu pakiet języka R bestNormalize (Peterson, 2021). Analiza wykazała, że najlepsze właściwości normalizacyjne zwracała technika boxcox. W porównaniu do innych popularnych przekształceń, metoda ta zwróciła najniższą wartość statystyki dopasowania, P/df = 31.37. Zmienną tą wyrażono w postaci znormalizowanej (względem średniej wynoszącej 0 i odchylenia standardowego równego 1). Procedurze normalizacji poddano również zmienne wyjaśniające. Do testowanego modelu została przeliczona wizualna diagnostyka w pakiecie performance (Lüdecke et al., 2021), jest ona umieszczona w załączniku A do niniejszej analizy. Analiza regresji wykazała istotne przewidywanie F(3, 299) = 12.98; p < 0.001. Analiza wartości współczynnika R² wykazała, że model regresyjny uwzględnionych zmiennych niezależnych Obawy, Cele, Płeć Mężczyzna, wyjaśniał około 12% (11% po skorygowaniu) zmienności wyników zmiennej Łatwość. Współczynnik nieskorygowany i skorygowany wyjaśnionej wariancji wynosił odpowiednio: R² = 0.12, adj.R² = 0.11. Ilość istotnych predyktorów w modelu wynosiła: 2. Analiza wykazała, że przewidywany przez model regresji średni poziom zmiennej Łatwość wynosił M = 0.00. Natomiast analiza statystyk poszczególnych predyktorów w modelu wykazała następujące rezultaty:
• Wzrost wyników zmiennej Obawy wiązał się ze spadkiem wyników Łatwość, uzyskany wynik był istotny statystycznie, B = -0.22; t = -3.56; p < 0.001; β = -0.22, 95%PU = [-0.35; -0.10]
• Wzrost wyników zmiennej Cele wiązał się ze wzrostem wyników Łatwość, uzyskany wynik był istotny statystycznie, B = 0.15; t = 2.58; p = 0.010; β = 0.15, 95%PU = [ 0.04; 0.27]
• Wzrost wyników zmiennej Płeć Mężczyzna wiązał się ze wzrostem wyników Łatwość, uzyskany wynik nie był istotny statystycznie, B = 0.08; t = 1.37; p = 0.172; β = 0.08, 95%PU = [-0.03; 0.19]
Rezultaty oszacowań testowanego modelu przedstawia tabela nr 1. Wizualizacje wyników bazujących na oszacowaniach testowanego modelu przedstawia seria wykresów od nr 1 do nr 4
Tabela nr 1
Wpływ zmiennych Obawy, Cele, Płeć Mężczyzna na poziom wyników zmiennej Łatwość
| Zmienne w modelu | B | s.e. | t | DPU1 | GPU1 | p | β | DPU2 | GPU2 |
|---|---|---|---|---|---|---|---|---|---|
| Stała | 0.00 | 0.05 | 0.00 | -0.11 | 0.11 | 1.000 | NA | NA | NA |
| Obawy | -0.22 | 0.06 | -3.56 | -0.35 | -0.10 | < 0.001 | -0.22 | -0.35 | -0.10 |
| Cele | 0.15 | 0.06 | 2.58 | 0.04 | 0.27 | 0.010 | 0.15 | 0.04 | 0.27 |
| Płeć Mężczyzna | 0.08 | 0.06 | 1.37 | -0.03 | 0.19 | 0.172 | 0.08 | -0.03 | 0.19 |
Nota: B = Niestandaryzowany współczynnik regresji; s.e. = błąd standardowy dla B; t = Statystyka t studenta; DPU = Dolny przedział ufności; GPU = Górny przedział ufności; DPU1 / GPU1 = 95% przedziały ufności dla B; p = Istotność statystyczna; β = Standaryzowany współczynnik regresji; DPU2 / GPU2 = 95% przedziały ufności dla β; NA = Brak oszacowań standaryzowanych dla współczynnika stałej modelu regresji.
Rysunek nr 1
Wpływ zmiennej Obawy na zmienną Łatwość
Nota: Ciągła linia - oznacza istotny wpływ predyktora.
Rysunek nr 2
Wpływ zmiennej Cele na zmienną Łatwość
Nota: Ciągła linia - oznacza istotny wpływ predyktora.
Rysunek nr 3
Wpływ zmiennej Płeć Mężczyzna na zmienną Łatwość
Nota: Przerywana linia - - - - oznacza nieistotny wpływ predyktora.
Rysunek nr 4
Wpływ zmiennych Obawy, Cele, Płeć Mężczyzna na poziom wyników zmiennej Łatwość
Nota: Wąsy błędów przedstawiają 95% przedziały ufności dla
oszacowania B. Linie zachodzące na siebie przedstawiają w przybliżeniu
brak różnic między predyktorami we wpływie na poziom Łatwość. Natomiast,
linie nie zachodzące na siebie przedstawiają w przybliżeniu istotne
różnice we wpływie predyktorów na poziom zmiennej
Łatwość.
Model wpływu Obawy, Cele, Płeć Mężczyzna na wyniki zmiennej Użyteczność.
W celu wyjaśnienia zmiennej Użyteczność przeprowadzono wielozmiennową analizę regresji liniowej (Fisher, 1922). W analizie wzięło udział N = 303 badanych obserwacji. Jakościowy charakter zmiennej Płeć wymagał przekształcenia jej kategorii na wartości liczbowe 0 i 1. Dlatego do dalszej analizy wykorzystano jej przekształcone kategorie. W analizie przyjęto dla zmiennej Płeć grupę referencyjną Kobieta. Wyniki przedstawione w analizie odnosiły się do wyszczególnionej grupy odniesienia.
Ze względu na odbieganie testowanego modelu dla wyników Użyteczność od założeń modelu regresji, poddano tę zmienną procedurze normalizacji. W celu wyboru najlepszej metody normalizującej zmienną Użyteczność wykonano serię przekształceń tej zmiennej szeregiem metod normalizujących. Wykorzystano w tym celu pakiet języka R bestNormalize (Peterson, 2021). Analiza wykazała, że najlepsze właściwości normalizacyjne zwracała technika boxcox. W porównaniu do innych popularnych przekształceń, metoda ta zwróciła najniższą wartość statystyki dopasowania, P/df = 14.53. Zmienną tą wyrażono w postaci znormalizowanej (względem średniej wynoszącej 0 i odchylenia standardowego równego 1). Procedurze normalizacji poddano również zmienne wyjaśniające. Do testowanego modelu została przeliczona wizualna diagnostyka w pakiecie performance (Lüdecke et al., 2021), jest ona umieszczona w załączniku A do niniejszej analizy. Analiza regresji wykazała istotne przewidywanie F(3, 299) = 72.22; p < 0.001. Analiza wartości współczynnika R² wykazała, że model regresyjny uwzględnionych zmiennych niezależnych Obawy, Cele, Płeć Mężczyzna, wyjaśniał około 42% (41% po skorygowaniu) zmienności wyników zmiennej Użyteczność. Współczynnik nieskorygowany i skorygowany wyjaśnionej wariancji wynosił odpowiednio: R² = 0.42, adj.R² = 0.41. Ilość istotnych predyktorów w modelu wynosiła: 2. Analiza wykazała, że przewidywany przez model regresji średni poziom zmiennej Użyteczność wynosił M = 0.00. Natomiast analiza statystyk poszczególnych predyktorów w modelu wykazała następujące rezultaty:
• Wzrost wyników zmiennej Obawy wiązał się ze spadkiem wyników Użyteczność, uzyskany wynik był istotny statystycznie, B = -0.25; t = -5.04; p < 0.001; β = -0.25, 95%PU = [-0.35; -0.16]
• Wzrost wyników zmiennej Cele wiązał się ze wzrostem wyników Użyteczność, uzyskany wynik był istotny statystycznie, B = 0.50; t = 10.45; p < 0.001; β = 0.50, 95%PU = [ 0.41; 0.60]
• Wzrost wyników zmiennej Płeć Mężczyzna wiązał się ze wzrostem wyników Użyteczność, uzyskany wynik nie był istotny statystycznie, B = 0.03; t = 0.67; p = 0.502; β = 0.03, 95%PU = [-0.06; 0.12]
Rezultaty oszacowań testowanego modelu przedstawia tabela nr 1. Wizualizacje wyników bazujących na oszacowaniach testowanego modelu przedstawia seria wykresów od nr 1 do nr 4
Tabela nr 1
Wpływ zmiennych Obawy, Cele, Płeć Mężczyzna na poziom wyników zmiennej Użyteczność
| Zmienne w modelu | B | s.e. | t | DPU1 | GPU1 | p | β | DPU2 | GPU2 |
|---|---|---|---|---|---|---|---|---|---|
| Stała | 0.00 | 0.04 | 0.00 | -0.09 | 0.09 | 1.000 | NA | NA | NA |
| Obawy | -0.25 | 0.05 | -5.04 | -0.35 | -0.16 | < 0.001 | -0.25 | -0.35 | -0.16 |
| Cele | 0.50 | 0.05 | 10.45 | 0.41 | 0.60 | < 0.001 | 0.50 | 0.41 | 0.60 |
| Płeć Mężczyzna | 0.03 | 0.05 | 0.67 | -0.06 | 0.12 | 0.502 | 0.03 | -0.06 | 0.12 |
Nota: B = Niestandaryzowany współczynnik regresji; s.e. = błąd standardowy dla B; t = Statystyka t studenta; DPU = Dolny przedział ufności; GPU = Górny przedział ufności; DPU1 / GPU1 = 95% przedziały ufności dla B; p = Istotność statystyczna; β = Standaryzowany współczynnik regresji; DPU2 / GPU2 = 95% przedziały ufności dla β; NA = Brak oszacowań standaryzowanych dla współczynnika stałej modelu regresji.
Rysunek nr 1
Wpływ zmiennej Obawy na zmienną Użyteczność
Nota: Ciągła linia - oznacza istotny wpływ predyktora.
Rysunek nr 2
Wpływ zmiennej Cele na zmienną Użyteczność
Nota: Ciągła linia - oznacza istotny wpływ predyktora.
Rysunek nr 3
Wpływ zmiennej Płeć Mężczyzna na zmienną Użyteczność
Nota: Przerywana linia - - - - oznacza nieistotny wpływ predyktora.
Rysunek nr 4
Wpływ zmiennych Obawy, Cele, Płeć Mężczyzna na poziom wyników zmiennej Użyteczność
Nota: Wąsy błędów przedstawiają 95% przedziały ufności dla
oszacowania B. Linie zachodzące na siebie przedstawiają w przybliżeniu
brak różnic między predyktorami we wpływie na poziom Użyteczność.
Natomiast, linie nie zachodzące na siebie przedstawiają w przybliżeniu
istotne różnice we wpływie predyktorów na poziom zmiennej
Użyteczność.
Model wpływu Obawy, Cele, Płeć Mężczyzna na wyniki zmiennej Intencja zakupu.
W celu wyjaśnienia zmiennej Intencja zakupu przeprowadzono wielozmiennową analizę regresji liniowej (Fisher, 1922). W analizie wzięło udział N = 303 badanych obserwacji. Jakościowy charakter zmiennej Płeć wymagał przekształcenia jej kategorii na wartości liczbowe 0 i 1. Dlatego do dalszej analizy wykorzystano jej przekształcone kategorie. W analizie przyjęto dla zmiennej Płeć grupę referencyjną Kobieta. Wyniki przedstawione w analizie odnosiły się do wyszczególnionej grupy odniesienia.
Ze względu na odbieganie testowanego modelu dla wyników Intencja zakupu od założeń modelu regresji, poddano tę zmienną procedurze normalizacji. W celu wyboru najlepszej metody normalizującej zmienną Intencja zakupu wykonano serię przekształceń tej zmiennej szeregiem metod normalizujących. Wykorzystano w tym celu pakiet języka R bestNormalize (Peterson, 2021). Analiza wykazała, że najlepsze właściwości normalizacyjne zwracała technika boxcox. W porównaniu do innych popularnych przekształceń, metoda ta zwróciła najniższą wartość statystyki dopasowania, P/df = 8.31. Zmienną tą wyrażono w postaci znormalizowanej (względem średniej wynoszącej 0 i odchylenia standardowego równego 1). Procedurze normalizacji poddano również zmienne wyjaśniające. Do testowanego modelu została przeliczona wizualna diagnostyka w pakiecie performance (Lüdecke et al., 2021), jest ona umieszczona w załączniku A do niniejszej analizy. Analiza regresji wykazała istotne przewidywanie F(3, 299) = 79.78; p < 0.001. Analiza wartości współczynnika R² wykazała, że model regresyjny uwzględnionych zmiennych niezależnych Obawy, Cele, Płeć Mężczyzna, wyjaśniał około 44% (44% po skorygowaniu) zmienności wyników zmiennej Intencja zakupu. Współczynnik nieskorygowany i skorygowany wyjaśnionej wariancji wynosił odpowiednio: R² = 0.44, adj.R² = 0.44. Ilość istotnych predyktorów w modelu wynosiła: 2. Analiza wykazała, że przewidywany przez model regresji średni poziom zmiennej Intencja zakupu wynosił M = 0.00. Natomiast analiza statystyk poszczególnych predyktorów w modelu wykazała następujące rezultaty:
• Wzrost wyników zmiennej Obawy wiązał się ze spadkiem wyników Intencja zakupu, uzyskany wynik był istotny statystycznie, B = -0.20; t = -3.96; p < 0.001; β = -0.20, 95%PU = [-0.29; -0.10]
• Wzrost wyników zmiennej Cele wiązał się ze wzrostem wyników Intencja zakupu, uzyskany wynik był istotny statystycznie, B = 0.57; t = 12.05; p < 0.001; β = 0.57, 95%PU = [ 0.48; 0.66]
• Wzrost wyników zmiennej Płeć Mężczyzna wiązał się ze spadkiem wyników Intencja zakupu, uzyskany wynik nie był istotny statystycznie, B = -0.01; t = -0.25; p = 0.802; β = -0.01, 95%PU = [-0.10; 0.08]
Rezultaty oszacowań testowanego modelu przedstawia tabela nr 1. Wizualizacje wyników bazujących na oszacowaniach testowanego modelu przedstawia seria wykresów od nr 1 do nr 4
Tabela nr 1
Wpływ zmiennych Obawy, Cele, Płeć Mężczyzna na poziom wyników zmiennej Intencja zakupu
| Zmienne w modelu | B | s.e. | t | DPU1 | GPU1 | p | β | DPU2 | GPU2 |
|---|---|---|---|---|---|---|---|---|---|
| Stała | 0.00 | 0.04 | 0.00 | -0.08 | 0.08 | 1.000 | NA | NA | NA |
| Obawy | -0.20 | 0.05 | -3.96 | -0.29 | -0.10 | < 0.001 | -0.20 | -0.29 | -0.10 |
| Cele | 0.57 | 0.05 | 12.05 | 0.48 | 0.66 | < 0.001 | 0.57 | 0.48 | 0.66 |
| Płeć Mężczyzna | -0.01 | 0.05 | -0.25 | -0.10 | 0.08 | 0.802 | -0.01 | -0.10 | 0.08 |
Nota: B = Niestandaryzowany współczynnik regresji; s.e. = błąd standardowy dla B; t = Statystyka t studenta; DPU = Dolny przedział ufności; GPU = Górny przedział ufności; DPU1 / GPU1 = 95% przedziały ufności dla B; p = Istotność statystyczna; β = Standaryzowany współczynnik regresji; DPU2 / GPU2 = 95% przedziały ufności dla β; NA = Brak oszacowań standaryzowanych dla współczynnika stałej modelu regresji.
Rysunek nr 1
Wpływ zmiennej Obawy na zmienną Intencja zakupu
Nota: Ciągła linia - oznacza istotny wpływ predyktora.
Rysunek nr 2
Wpływ zmiennej Cele na zmienną Intencja zakupu
Nota: Ciągła linia - oznacza istotny wpływ predyktora.
Rysunek nr 3
Wpływ zmiennej Płeć Mężczyzna na zmienną Intencja zakupu
Nota: Przerywana linia - - - - oznacza nieistotny wpływ predyktora.
Rysunek nr 4
Wpływ zmiennych Obawy, Cele, Płeć Mężczyzna na poziom wyników zmiennej Intencja zakupu
Nota: Wąsy błędów przedstawiają 95% przedziały ufności dla
oszacowania B. Linie zachodzące na siebie przedstawiają w przybliżeniu
brak różnic między predyktorami we wpływie na poziom Intencja zakupu.
Natomiast, linie nie zachodzące na siebie przedstawiają w przybliżeniu
istotne różnice we wpływie predyktorów na poziom zmiennej Intencja
zakupu.
Rysunek diagnostyczny
Porównanie testowanych modeli
Nota: Wąsy błędów przedstawiają 95% przedziały ufności dla oszacowania B. Linie zachodzące na siebie przedstawiają w przybliżeniu brak różnic między predyktorami we wpływie na poziom zmiennych zależnych. Natomiast, linie nie zachodzące na siebie przedstawiają w przybliżeniu istotne różnice we wpływie predyktorów na poziom zmiennych zależnych.
Kategoria Płeć była przekształcona na wartości 0 i 1 z grupą referencyjną Kobieta, więc raportowane efekty dla Płeć Mężczyzna odnosiły się do porównania z kobietami.
Dla zmiennej Łatwość wzrost Obaw wiązał się ze spadkiem ocen Łatwości i ten wpływ był istotny; wpływ ten był umiarkowany (współczynnik standaryzowany około -0,22, przedział ufności wyraźnie poniżej zera). Wzrost Celów wiązał się ze wzrostem Łatwości i ten efekt był istotny, ale słabszy niż wpływ Obaw (współczynnik około 0,15, przedział ufności powyżej zera). Z kolei wpływ Płeć Mężczyzna na Łatwość był dodatni, lecz nieistotny i przedział ufności obejmował zero, więc nie można było stwierdzić pewnego efektu płci.
Dla zmiennej Użyteczność wzrost Obaw także wiązał się ze spadkiem Użyteczności i ten efekt był istotny oraz umiarkowany (współczynnik około -0,25, przedział ufności poniżej zera). Wzrost Celów mocno podnosił Użyteczność i ten wpływ był znacznie silniejszy niż wpływ Obaw (współczynnik około 0,50, przedział ufności wyraźnie powyżej zera). Efekt Płeć Mężczyzna wobec Użyteczności był mały i nieistotny, przedział ufności obejmował zero.
Dla zmiennej Intencja zakupu wzrost Obaw wiązał się z obniżeniem Intencji i ten efekt był istotny i umiarkowany (współczynnik około -0,20, przedział ufności poniżej zera). Wzrost Celów wiązał się ze znacznym wzrostem Intencji i był to najsilniejszy obserwowany efekt w analizach (współczynnik około 0,57, przedział ufności daleko powyżej zera). Płeć Mężczyzna nie wykazywała istotnego wpływu na Intencję, przedział ufności obejmował zero.
Hipoteza Płeć, Obawy i Cele mają wpływ na Łatwość, Użyteczność i Intencję zakupu została potwierdzona częściowo: Obawy i Cele miały istotny wpływ na wszystkie trzy zmienne zależne, natomiast Płeć nie wykazywała istotnego wpływu w żadnym z modeli. Na podstawie przedziałów ufności można stwierdzić, że Cele wpływały znacznie silniej na Użyteczność i Intencję zakupu niż na Łatwość, podczas gdy Obawy miały względnie podobny, umiarkowany negatywny wpływ na wszystkie trzy zmienne. Płeć nie dawała pewnego efektu w żadnym przypadku, bo jej przedziały ufności obejmowały zero.
Wizualna diagnostyka testowanych modeli regresji
Rysunek nr 1
Wizualna diagnoza modelu regresji dla zmiennej Łatwość
Rysunek nr 2
Wizualna diagnoza modelu regresji dla zmiennej Użyteczność
Rysunek nr 3
Wizualna diagnoza modelu regresji dla zmiennej Intencja zakupu
Tabela uogólniająca przeprowadzoną diagnozę modeli
Ocena modeli regresji dla zmiennych Łatwość, Użyteczność, Intencja zakupu
| Model | R² | adj.R² | RMSE | Sigma | AIC wt | AICc wt | BIC wt | Performance Score |
|---|---|---|---|---|---|---|---|---|
| Intencja zakupu | 0.44 | 0.44 | 0.74 | 0.75 | 1 | 1 | 1 | 1.00 |
| Użyteczność | 0.42 | 0.41 | 0.76 | 0.77 | 0 | 0 | 0 | 0.53 |
| Łatwość | 0.12 | 0.11 | 0.94 | 0.95 | 0 | 0 | 0 | 0.00 |
Nota: Uszeregowanie modeli w tabeli = Przedstawione modele w tabeli są uszeregowane (z góry na dół) słabnąco pod względem jakości. Objaśnienia wskaźników dopasowania modeli; Model = Nazwa zmiennej zależnej analizowanego modelu; R² = Współczynnik determinacji, czyli proporcja wariancji zmiennej zależnej wyjaśniona przez model. Wartości bliższe 1 oznaczają lepsze dopasowanie; adj.R² = Skorygowany współczynnik determinacji; uwzględnia liczbę predyktorów i wielkość próby. Chroni przed sztucznym zawyżaniem R² przy dodawaniu kolejnych zmiennych; RMSE (Root Mean Squared Error) = Średni błąd kwadratowy; informuje, jak bardzo średnio przewidywania modelu różnią się od wartości obserwowanych. Niższe wartości oznaczają lepsze dopasowanie; Sigma = Estymowana wartość odchylenia standardowego składnika resztowego (σ). Mniejsza sigma oznacza mniejszy rozrzut reszt; AIC wt (Akaike Information Criterion weight) = waga modelu obliczona na podstawie kryterium informacyjnego AIC. Wyższa wartość oznacza lepszy model w porównaniu z innymi; AICc wt = Jak wyżej, ale skorygowane dla małych prób (AICc); BIC wt (Bayesian Information Criterion weight) = Waga modelu obliczona na podstawie kryterium informacyjnego BIC; Performance Score = Ogólny wskaźnik jakości modelu wyliczony na podstawie wielu miar; wartości bliższe 1 sugerują lepsze dopasowanie.
Fisher, R. A. 1922. The goodness of fit of regression formulae, and the distribution of regression coefficients. Journal of the Royal Statistical Society. 85 (4), pp. 597-612. https://doi.org/10.2307/2341124
Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Oprogramowanie]. https://sztos-it.com/
Lüdecke et al., (2021). performance: An R Package for Assessment, Comparison and Testing of Statistical Models. Journal of Open Source Software, 6(60), 3139. https://doi.org/10.21105/joss.03139
Peterson, R. A. (2021). Finding Optimal Normalizing Transformations via bestNormalize. The R Journal, 13:1, 310-329. DOI:10.32614/RJ-2021-041
Wickham, H. (2016). ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York. ISBN 978-3-319-24277-4
Masz pytania do raportu🔮⁉️
Kliknij i porozmawiaj z naszą statystyczną asystentką Danką💁♀✅