Raport analizy regresji

Niniejszą analizę i raport opisowy wykonano w Systemie Zautomatyzowanego Tworzenia Opisu Statystycznego - SZTOS (Hryniewicz, Milewska, 2023). Wizualizacje wyników przeprowadzono z wykorzystaniem pakietu graficznego “ggplot2” (Wickham, 2016).

Model regresji dla zmiennej Łatwość

Model wpływu Obawy, Cele, Płeć Mężczyzna na wyniki zmiennej Łatwość.

W celu wyjaśnienia zmiennej Łatwość przeprowadzono wielozmiennową analizę regresji liniowej (Fisher, 1922). W analizie wzięło udział N = 303 badanych obserwacji. Jakościowy charakter zmiennej Płeć wymagał przekształcenia jej kategorii na wartości liczbowe 0 i 1. Dlatego do dalszej analizy wykorzystano jej przekształcone kategorie. W analizie przyjęto dla zmiennej Płeć grupę referencyjną Kobieta. Wyniki przedstawione w analizie odnosiły się do wyszczególnionej grupy odniesienia.

Ze względu na odbieganie testowanego modelu dla wyników Łatwość od założeń modelu regresji, poddano tę zmienną procedurze normalizacji. W celu wyboru najlepszej metody normalizującej zmienną Łatwość wykonano serię przekształceń tej zmiennej szeregiem metod normalizujących. Wykorzystano w tym celu pakiet języka R bestNormalize (Peterson, 2021). Analiza wykazała, że najlepsze właściwości normalizacyjne zwracała technika boxcox. W porównaniu do innych popularnych przekształceń, metoda ta zwróciła najniższą wartość statystyki dopasowania, P/df = 31.37. Zmienną tą wyrażono w postaci znormalizowanej (względem średniej wynoszącej 0 i odchylenia standardowego równego 1). Procedurze normalizacji poddano również zmienne wyjaśniające. Do testowanego modelu została przeliczona wizualna diagnostyka w pakiecie performance (Lüdecke et al., 2021), jest ona umieszczona w załączniku A do niniejszej analizy. Analiza regresji wykazała istotne przewidywanie F(3, 299) = 12.98; p < 0.001. Analiza wartości współczynnika R² wykazała, że model regresyjny uwzględnionych zmiennych niezależnych Obawy, Cele, Płeć Mężczyzna, wyjaśniał około 12% (11% po skorygowaniu) zmienności wyników zmiennej Łatwość. Współczynnik nieskorygowany i skorygowany wyjaśnionej wariancji wynosił odpowiednio: R² = 0.12, adj.R² = 0.11. Ilość istotnych predyktorów w modelu wynosiła: 2. Analiza wykazała, że przewidywany przez model regresji średni poziom zmiennej Łatwość wynosił M = 0.00. Natomiast analiza statystyk poszczególnych predyktorów w modelu wykazała następujące rezultaty:

• Wzrost wyników zmiennej Obawy wiązał się ze spadkiem wyników Łatwość, uzyskany wynik był istotny statystycznie, B = -0.22; t = -3.56; p < 0.001; β = -0.22, 95%PU = [-0.35; -0.10]

• Wzrost wyników zmiennej Cele wiązał się ze wzrostem wyników Łatwość, uzyskany wynik był istotny statystycznie, B = 0.15; t = 2.58; p = 0.010; β = 0.15, 95%PU = [ 0.04; 0.27]

• Wzrost wyników zmiennej Płeć Mężczyzna wiązał się ze wzrostem wyników Łatwość, uzyskany wynik nie był istotny statystycznie, B = 0.08; t = 1.37; p = 0.172; β = 0.08, 95%PU = [-0.03; 0.19]

Rezultaty oszacowań testowanego modelu przedstawia tabela nr 1. Wizualizacje wyników bazujących na oszacowaniach testowanego modelu przedstawia seria wykresów od nr 1 do nr 4

Tabela nr 1

Wpływ zmiennych Obawy, Cele, Płeć Mężczyzna na poziom wyników zmiennej Łatwość

Zmienne w modelu B s.e. t DPU1 GPU1 p β DPU2 GPU2
Stała 0.00 0.05 0.00 -0.11 0.11 1.000 NA NA NA
Obawy -0.22 0.06 -3.56 -0.35 -0.10 < 0.001 -0.22 -0.35 -0.10
Cele 0.15 0.06 2.58 0.04 0.27 0.010 0.15 0.04 0.27
Płeć Mężczyzna 0.08 0.06 1.37 -0.03 0.19 0.172 0.08 -0.03 0.19

Nota: B = Niestandaryzowany współczynnik regresji; s.e. = błąd standardowy dla B; t = Statystyka t studenta; DPU = Dolny przedział ufności; GPU = Górny przedział ufności; DPU1 / GPU1 = 95% przedziały ufności dla B; p = Istotność statystyczna; β = Standaryzowany współczynnik regresji; DPU2 / GPU2 = 95% przedziały ufności dla β; NA = Brak oszacowań standaryzowanych dla współczynnika stałej modelu regresji.

Rysunek nr 1

Wpływ zmiennej Obawy na zmienną Łatwość

Nota: Ciągła linia - oznacza istotny wpływ predyktora.

Rysunek nr 2

Wpływ zmiennej Cele na zmienną Łatwość

Nota: Ciągła linia - oznacza istotny wpływ predyktora.

Rysunek nr 3

Wpływ zmiennej Płeć Mężczyzna na zmienną Łatwość

Nota: Przerywana linia - - - - oznacza nieistotny wpływ predyktora.

Rysunek nr 4

Wpływ zmiennych Obawy, Cele, Płeć Mężczyzna na poziom wyników zmiennej Łatwość

Nota: Wąsy błędów przedstawiają 95% przedziały ufności dla oszacowania B. Linie zachodzące na siebie przedstawiają w przybliżeniu brak różnic między predyktorami we wpływie na poziom Łatwość. Natomiast, linie nie zachodzące na siebie przedstawiają w przybliżeniu istotne różnice we wpływie predyktorów na poziom zmiennej Łatwość.

Model regresji dla zmiennej Użyteczność

Model wpływu Obawy, Cele, Płeć Mężczyzna na wyniki zmiennej Użyteczność.

W celu wyjaśnienia zmiennej Użyteczność przeprowadzono wielozmiennową analizę regresji liniowej (Fisher, 1922). W analizie wzięło udział N = 303 badanych obserwacji. Jakościowy charakter zmiennej Płeć wymagał przekształcenia jej kategorii na wartości liczbowe 0 i 1. Dlatego do dalszej analizy wykorzystano jej przekształcone kategorie. W analizie przyjęto dla zmiennej Płeć grupę referencyjną Kobieta. Wyniki przedstawione w analizie odnosiły się do wyszczególnionej grupy odniesienia.

Ze względu na odbieganie testowanego modelu dla wyników Użyteczność od założeń modelu regresji, poddano tę zmienną procedurze normalizacji. W celu wyboru najlepszej metody normalizującej zmienną Użyteczność wykonano serię przekształceń tej zmiennej szeregiem metod normalizujących. Wykorzystano w tym celu pakiet języka R bestNormalize (Peterson, 2021). Analiza wykazała, że najlepsze właściwości normalizacyjne zwracała technika boxcox. W porównaniu do innych popularnych przekształceń, metoda ta zwróciła najniższą wartość statystyki dopasowania, P/df = 14.53. Zmienną tą wyrażono w postaci znormalizowanej (względem średniej wynoszącej 0 i odchylenia standardowego równego 1). Procedurze normalizacji poddano również zmienne wyjaśniające. Do testowanego modelu została przeliczona wizualna diagnostyka w pakiecie performance (Lüdecke et al., 2021), jest ona umieszczona w załączniku A do niniejszej analizy. Analiza regresji wykazała istotne przewidywanie F(3, 299) = 72.22; p < 0.001. Analiza wartości współczynnika R² wykazała, że model regresyjny uwzględnionych zmiennych niezależnych Obawy, Cele, Płeć Mężczyzna, wyjaśniał około 42% (41% po skorygowaniu) zmienności wyników zmiennej Użyteczność. Współczynnik nieskorygowany i skorygowany wyjaśnionej wariancji wynosił odpowiednio: R² = 0.42, adj.R² = 0.41. Ilość istotnych predyktorów w modelu wynosiła: 2. Analiza wykazała, że przewidywany przez model regresji średni poziom zmiennej Użyteczność wynosił M = 0.00. Natomiast analiza statystyk poszczególnych predyktorów w modelu wykazała następujące rezultaty:

• Wzrost wyników zmiennej Obawy wiązał się ze spadkiem wyników Użyteczność, uzyskany wynik był istotny statystycznie, B = -0.25; t = -5.04; p < 0.001; β = -0.25, 95%PU = [-0.35; -0.16]

• Wzrost wyników zmiennej Cele wiązał się ze wzrostem wyników Użyteczność, uzyskany wynik był istotny statystycznie, B = 0.50; t = 10.45; p < 0.001; β = 0.50, 95%PU = [ 0.41; 0.60]

• Wzrost wyników zmiennej Płeć Mężczyzna wiązał się ze wzrostem wyników Użyteczność, uzyskany wynik nie był istotny statystycznie, B = 0.03; t = 0.67; p = 0.502; β = 0.03, 95%PU = [-0.06; 0.12]

Rezultaty oszacowań testowanego modelu przedstawia tabela nr 1. Wizualizacje wyników bazujących na oszacowaniach testowanego modelu przedstawia seria wykresów od nr 1 do nr 4

Tabela nr 1

Wpływ zmiennych Obawy, Cele, Płeć Mężczyzna na poziom wyników zmiennej Użyteczność

Zmienne w modelu B s.e. t DPU1 GPU1 p β DPU2 GPU2
Stała 0.00 0.04 0.00 -0.09 0.09 1.000 NA NA NA
Obawy -0.25 0.05 -5.04 -0.35 -0.16 < 0.001 -0.25 -0.35 -0.16
Cele 0.50 0.05 10.45 0.41 0.60 < 0.001 0.50 0.41 0.60
Płeć Mężczyzna 0.03 0.05 0.67 -0.06 0.12 0.502 0.03 -0.06 0.12

Nota: B = Niestandaryzowany współczynnik regresji; s.e. = błąd standardowy dla B; t = Statystyka t studenta; DPU = Dolny przedział ufności; GPU = Górny przedział ufności; DPU1 / GPU1 = 95% przedziały ufności dla B; p = Istotność statystyczna; β = Standaryzowany współczynnik regresji; DPU2 / GPU2 = 95% przedziały ufności dla β; NA = Brak oszacowań standaryzowanych dla współczynnika stałej modelu regresji.

Rysunek nr 1

Wpływ zmiennej Obawy na zmienną Użyteczność

Nota: Ciągła linia - oznacza istotny wpływ predyktora.

Rysunek nr 2

Wpływ zmiennej Cele na zmienną Użyteczność

Nota: Ciągła linia - oznacza istotny wpływ predyktora.

Rysunek nr 3

Wpływ zmiennej Płeć Mężczyzna na zmienną Użyteczność

Nota: Przerywana linia - - - - oznacza nieistotny wpływ predyktora.

Rysunek nr 4

Wpływ zmiennych Obawy, Cele, Płeć Mężczyzna na poziom wyników zmiennej Użyteczność

Nota: Wąsy błędów przedstawiają 95% przedziały ufności dla oszacowania B. Linie zachodzące na siebie przedstawiają w przybliżeniu brak różnic między predyktorami we wpływie na poziom Użyteczność. Natomiast, linie nie zachodzące na siebie przedstawiają w przybliżeniu istotne różnice we wpływie predyktorów na poziom zmiennej Użyteczność.

Model regresji dla zmiennej Intencja zakupu

Model wpływu Obawy, Cele, Płeć Mężczyzna na wyniki zmiennej Intencja zakupu.

W celu wyjaśnienia zmiennej Intencja zakupu przeprowadzono wielozmiennową analizę regresji liniowej (Fisher, 1922). W analizie wzięło udział N = 303 badanych obserwacji. Jakościowy charakter zmiennej Płeć wymagał przekształcenia jej kategorii na wartości liczbowe 0 i 1. Dlatego do dalszej analizy wykorzystano jej przekształcone kategorie. W analizie przyjęto dla zmiennej Płeć grupę referencyjną Kobieta. Wyniki przedstawione w analizie odnosiły się do wyszczególnionej grupy odniesienia.

Ze względu na odbieganie testowanego modelu dla wyników Intencja zakupu od założeń modelu regresji, poddano tę zmienną procedurze normalizacji. W celu wyboru najlepszej metody normalizującej zmienną Intencja zakupu wykonano serię przekształceń tej zmiennej szeregiem metod normalizujących. Wykorzystano w tym celu pakiet języka R bestNormalize (Peterson, 2021). Analiza wykazała, że najlepsze właściwości normalizacyjne zwracała technika boxcox. W porównaniu do innych popularnych przekształceń, metoda ta zwróciła najniższą wartość statystyki dopasowania, P/df = 8.31. Zmienną tą wyrażono w postaci znormalizowanej (względem średniej wynoszącej 0 i odchylenia standardowego równego 1). Procedurze normalizacji poddano również zmienne wyjaśniające. Do testowanego modelu została przeliczona wizualna diagnostyka w pakiecie performance (Lüdecke et al., 2021), jest ona umieszczona w załączniku A do niniejszej analizy. Analiza regresji wykazała istotne przewidywanie F(3, 299) = 79.78; p < 0.001. Analiza wartości współczynnika R² wykazała, że model regresyjny uwzględnionych zmiennych niezależnych Obawy, Cele, Płeć Mężczyzna, wyjaśniał około 44% (44% po skorygowaniu) zmienności wyników zmiennej Intencja zakupu. Współczynnik nieskorygowany i skorygowany wyjaśnionej wariancji wynosił odpowiednio: R² = 0.44, adj.R² = 0.44. Ilość istotnych predyktorów w modelu wynosiła: 2. Analiza wykazała, że przewidywany przez model regresji średni poziom zmiennej Intencja zakupu wynosił M = 0.00. Natomiast analiza statystyk poszczególnych predyktorów w modelu wykazała następujące rezultaty:

• Wzrost wyników zmiennej Obawy wiązał się ze spadkiem wyników Intencja zakupu, uzyskany wynik był istotny statystycznie, B = -0.20; t = -3.96; p < 0.001; β = -0.20, 95%PU = [-0.29; -0.10]

• Wzrost wyników zmiennej Cele wiązał się ze wzrostem wyników Intencja zakupu, uzyskany wynik był istotny statystycznie, B = 0.57; t = 12.05; p < 0.001; β = 0.57, 95%PU = [ 0.48; 0.66]

• Wzrost wyników zmiennej Płeć Mężczyzna wiązał się ze spadkiem wyników Intencja zakupu, uzyskany wynik nie był istotny statystycznie, B = -0.01; t = -0.25; p = 0.802; β = -0.01, 95%PU = [-0.10; 0.08]

Rezultaty oszacowań testowanego modelu przedstawia tabela nr 1. Wizualizacje wyników bazujących na oszacowaniach testowanego modelu przedstawia seria wykresów od nr 1 do nr 4

Tabela nr 1

Wpływ zmiennych Obawy, Cele, Płeć Mężczyzna na poziom wyników zmiennej Intencja zakupu

Zmienne w modelu B s.e. t DPU1 GPU1 p β DPU2 GPU2
Stała 0.00 0.04 0.00 -0.08 0.08 1.000 NA NA NA
Obawy -0.20 0.05 -3.96 -0.29 -0.10 < 0.001 -0.20 -0.29 -0.10
Cele 0.57 0.05 12.05 0.48 0.66 < 0.001 0.57 0.48 0.66
Płeć Mężczyzna -0.01 0.05 -0.25 -0.10 0.08 0.802 -0.01 -0.10 0.08

Nota: B = Niestandaryzowany współczynnik regresji; s.e. = błąd standardowy dla B; t = Statystyka t studenta; DPU = Dolny przedział ufności; GPU = Górny przedział ufności; DPU1 / GPU1 = 95% przedziały ufności dla B; p = Istotność statystyczna; β = Standaryzowany współczynnik regresji; DPU2 / GPU2 = 95% przedziały ufności dla β; NA = Brak oszacowań standaryzowanych dla współczynnika stałej modelu regresji.

Rysunek nr 1

Wpływ zmiennej Obawy na zmienną Intencja zakupu

Nota: Ciągła linia - oznacza istotny wpływ predyktora.

Rysunek nr 2

Wpływ zmiennej Cele na zmienną Intencja zakupu

Nota: Ciągła linia - oznacza istotny wpływ predyktora.

Rysunek nr 3

Wpływ zmiennej Płeć Mężczyzna na zmienną Intencja zakupu

Nota: Przerywana linia - - - - oznacza nieistotny wpływ predyktora.

Rysunek nr 4

Wpływ zmiennych Obawy, Cele, Płeć Mężczyzna na poziom wyników zmiennej Intencja zakupu

Nota: Wąsy błędów przedstawiają 95% przedziały ufności dla oszacowania B. Linie zachodzące na siebie przedstawiają w przybliżeniu brak różnic między predyktorami we wpływie na poziom Intencja zakupu. Natomiast, linie nie zachodzące na siebie przedstawiają w przybliżeniu istotne różnice we wpływie predyktorów na poziom zmiennej Intencja zakupu.

Rysunek podsumowujący testowane modele

Rysunek diagnostyczny

Porównanie testowanych modeli

Nota: Wąsy błędów przedstawiają 95% przedziały ufności dla oszacowania B. Linie zachodzące na siebie przedstawiają w przybliżeniu brak różnic między predyktorami we wpływie na poziom zmiennych zależnych. Natomiast, linie nie zachodzące na siebie przedstawiają w przybliżeniu istotne różnice we wpływie predyktorów na poziom zmiennych zależnych.

Podsumowanie wyników

Kategoria Płeć była przekształcona na wartości 0 i 1 z grupą referencyjną Kobieta, więc raportowane efekty dla Płeć Mężczyzna odnosiły się do porównania z kobietami.

Dla zmiennej Łatwość wzrost Obaw wiązał się ze spadkiem ocen Łatwości i ten wpływ był istotny; wpływ ten był umiarkowany (współczynnik standaryzowany około -0,22, przedział ufności wyraźnie poniżej zera). Wzrost Celów wiązał się ze wzrostem Łatwości i ten efekt był istotny, ale słabszy niż wpływ Obaw (współczynnik około 0,15, przedział ufności powyżej zera). Z kolei wpływ Płeć Mężczyzna na Łatwość był dodatni, lecz nieistotny i przedział ufności obejmował zero, więc nie można było stwierdzić pewnego efektu płci.

Dla zmiennej Użyteczność wzrost Obaw także wiązał się ze spadkiem Użyteczności i ten efekt był istotny oraz umiarkowany (współczynnik około -0,25, przedział ufności poniżej zera). Wzrost Celów mocno podnosił Użyteczność i ten wpływ był znacznie silniejszy niż wpływ Obaw (współczynnik około 0,50, przedział ufności wyraźnie powyżej zera). Efekt Płeć Mężczyzna wobec Użyteczności był mały i nieistotny, przedział ufności obejmował zero.

Dla zmiennej Intencja zakupu wzrost Obaw wiązał się z obniżeniem Intencji i ten efekt był istotny i umiarkowany (współczynnik około -0,20, przedział ufności poniżej zera). Wzrost Celów wiązał się ze znacznym wzrostem Intencji i był to najsilniejszy obserwowany efekt w analizach (współczynnik około 0,57, przedział ufności daleko powyżej zera). Płeć Mężczyzna nie wykazywała istotnego wpływu na Intencję, przedział ufności obejmował zero.

Hipoteza Płeć, Obawy i Cele mają wpływ na Łatwość, Użyteczność i Intencję zakupu została potwierdzona częściowo: Obawy i Cele miały istotny wpływ na wszystkie trzy zmienne zależne, natomiast Płeć nie wykazywała istotnego wpływu w żadnym z modeli. Na podstawie przedziałów ufności można stwierdzić, że Cele wpływały znacznie silniej na Użyteczność i Intencję zakupu niż na Łatwość, podczas gdy Obawy miały względnie podobny, umiarkowany negatywny wpływ na wszystkie trzy zmienne. Płeć nie dawała pewnego efektu w żadnym przypadku, bo jej przedziały ufności obejmowały zero.

Załącznik A

Wizualna diagnostyka testowanych modeli regresji

Rysunek nr 1

Wizualna diagnoza modelu regresji dla zmiennej Łatwość

Rysunek nr 2

Wizualna diagnoza modelu regresji dla zmiennej Użyteczność

Rysunek nr 3

Wizualna diagnoza modelu regresji dla zmiennej Intencja zakupu

Tabela uogólniająca przeprowadzoną diagnozę modeli

Ocena modeli regresji dla zmiennych Łatwość, Użyteczność, Intencja zakupu

Model adj.R² RMSE Sigma AIC wt AICc wt BIC wt Performance Score
Intencja zakupu 0.44 0.44 0.74 0.75 1 1 1 1.00
Użyteczność 0.42 0.41 0.76 0.77 0 0 0 0.53
Łatwość 0.12 0.11 0.94 0.95 0 0 0 0.00

Nota: Uszeregowanie modeli w tabeli = Przedstawione modele w tabeli są uszeregowane (z góry na dół) słabnąco pod względem jakości. Objaśnienia wskaźników dopasowania modeli; Model = Nazwa zmiennej zależnej analizowanego modelu; R² = Współczynnik determinacji, czyli proporcja wariancji zmiennej zależnej wyjaśniona przez model. Wartości bliższe 1 oznaczają lepsze dopasowanie; adj.R² = Skorygowany współczynnik determinacji; uwzględnia liczbę predyktorów i wielkość próby. Chroni przed sztucznym zawyżaniem R² przy dodawaniu kolejnych zmiennych; RMSE (Root Mean Squared Error) = Średni błąd kwadratowy; informuje, jak bardzo średnio przewidywania modelu różnią się od wartości obserwowanych. Niższe wartości oznaczają lepsze dopasowanie; Sigma = Estymowana wartość odchylenia standardowego składnika resztowego (σ). Mniejsza sigma oznacza mniejszy rozrzut reszt; AIC wt (Akaike Information Criterion weight) = waga modelu obliczona na podstawie kryterium informacyjnego AIC. Wyższa wartość oznacza lepszy model w porównaniu z innymi; AICc wt = Jak wyżej, ale skorygowane dla małych prób (AICc); BIC wt (Bayesian Information Criterion weight) = Waga modelu obliczona na podstawie kryterium informacyjnego BIC; Performance Score = Ogólny wskaźnik jakości modelu wyliczony na podstawie wielu miar; wartości bliższe 1 sugerują lepsze dopasowanie.

Bibliografia

Fisher, R. A. 1922. The goodness of fit of regression formulae, and the distribution of regression coefficients. Journal of the Royal Statistical Society. 85 (4), pp. 597-612. https://doi.org/10.2307/2341124

Hryniewicz, K., Milewska, A. (2023). SZTOS: System Zautomatyzowanego Tworzenia Opisu Statystycznego (Wersja SZTOS) [Oprogramowanie]. https://sztos-it.com/

Lüdecke et al., (2021). performance: An R Package for Assessment, Comparison and Testing of Statistical Models. Journal of Open Source Software, 6(60), 3139. https://doi.org/10.21105/joss.03139

Peterson, R. A. (2021). Finding Optimal Normalizing Transformations via bestNormalize. The R Journal, 13:1, 310-329. DOI:10.32614/RJ-2021-041

Wickham, H. (2016). ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York. ISBN 978-3-319-24277-4

Masz pytania do raportu🔮⁉️
Kliknij i porozmawiaj z naszą statystyczną asystentką Danką💁‍♀✅

💬
Danka💁‍♀️ - Asystentka AI

Cześć, nazywam się Danka👩 Jestem algorytmem, ale moi Twórcy wierzą, że pomogę Ci zrozumieć ten raport👩‍💻