Oversigt over Two Way ANOVA i R
Tovejs ANOVA (analyse af variation) hjælper os med at forstå forholdet mellem en kontinuerlig afhængig variabel og to kategoriske uafhængige variabler. I dette emne skal vi lære om Two Way ANOVA i R.
Nedenfor er hypotesen om interesse under tovejs ANOVA
- H₀: Kald det som hovedeffekten, som er den første faktor, der er afhængig af den kontinuerlige variabel
- H₀: Hovedeffekten handler også om virkningen på den anden variabel på den afhængige kontinuerlige variabel.
- H₀: Interaktion er den kombinerede virkning af både den første, den anden faktor-variabel på den afhængige variabel
Nedenfor er de normer, som en tovejs ANOVA skal opfylde.
- Observationer skal være uafhængige
- Observationer skal normalt distribueres.
- Der bør være lige stor variation i observationer
- Ingen outliers i design
- Fejlene skal være uafhængige.
Bemærk
Vi er nødt til at transformere vores data, hvis normalitet og lige afvigelse krænkes.
Eksempel på tovejs ANOVA i R
Lad os udføre en måde ANOVA-test på datasæt for kræftniveauer, der indeholder 48 rækker og 3 datavariabler:
Tid taget: Overlevelsestid for et dyr
Forskellige niveauer af kræft 1 - 3
Behandling: Behandlinger anvendt fra 1-3
Inden vi tester, har vi brug for følgende data i hånden.
- Importerer dataene
- Fjern unødvendig variabel
- Konverter variabler (kræftniveauer) som bestilt niveau.
Nedenfor er datasættet.
Observationer: 48
Variabler: 3
tid til overlevelse 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0 …
kræftniveauer 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2 …
Behandling A, A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …
mål
- H₀: ingen ændring i gennemsnitlig overlevelsestid mellem gruppen
- H₀: overlevelsestid er forskellig for mindst én gruppe.
Steps
- Kontroller kræftniveauerne. Vi kan se tre karakterværdier, fordi vi konverterer dem til faktorer med et mutatverb.
levels(df$cancerlevels)
output: (1) "1" "2" "3"
- Beregn både middel- og standardafvigelse
df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)
Produktion:
En tibble: 3 x 4
kræftlevelser count_cancerlevels mean_time sd_time
1 1 16 0, 617500 0, 20942779
2 2 16 0, 544375 0, 28936641
3 3 16 0, 276250 0, 06227627
- I trin tre kan du grafisk kontrollere, om der er en forskel mellem distributionerne. Bemærk, at du inkluderer den jitterede prik.
- Kør test med kommandoen AOV.
aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used
Syntaks:
y ~ X1 + X2 +… + Xn (X1 + X2 +… henviser til de uafhængige variabler)
y ~. Brug alle de resterende variabler som uafhængige variabler
Sørg for at gemme modellen og udskrive resumeet.
Kode
- aov (tid ~ kræftniveauer, data = df): Kør ANOVA-testen med følgende formel
- resume (anova_one_way): Udskriv resumeet af testen
Df Sum Sq Middel Sq F-værdi Pr (> F)
Cancerlevels 2 1.033 0.5165 11.79 7.66e-05 ***
Residualer 45 1.972 0, 0438
-
Signif. koder: 0 '***' 0, 001 '**' 0, 01 '*' 0, 05 '.' 0, 1 '' 1
P-værdien er lavere end tærsklen 0, 05. Den statistiske forskel er angivet med '*' i ovenstående tilfælde.
One Way Test til Two Way Anova i R
Lad os se, hvordan envejstesten kan udvides til tovejs ANOVA. Testen svarer til envejs ANOVA, men formlen adskiller sig og tilføjer en anden gruppevariabel til formlen.
y = x1 + x2
- H0 : Midlerne er ens for begge variabler (faktorvariabler)
- H3 : Midlerne er forskellige for begge variabler
Du tilføjer behandlingsvariabler til vores model. Denne variabel angiver behandlingen, der gives til patienten. Du er interesseret i at se, om der er en statistisk afhængighed mellem kræftniveauer og behandling, der gives patienten.
Vi justerer vores kode ved at tilføje en behandling med den anden uafhængige variabel.
Df Sum Sq Middel Sq F-værdi Pr (> F)
Kræftniveauer 2 1.0330 0.5165 20.64 5.7e-07 ***
Behandl 3 0, 9212 0, 3071 12, 27 6, 7e-06 ***
Residualer 42 1.0509 0, 0250
Både kræftniveauer og behandling er statistisk forskellig fra 0. På dette punkt kan vi afvise NULL-hypotesen. Bekræft også, at ændring af behandling eller kræftform påvirker overlevelsestidspunktet.
Prøve
Envejs ANOVA: H3- Gennemsnittet er forskelligt for mindst en gruppe
To-vejs ANOVA: H3- Gennemsnittet er forskelligt for begge grupper.
Forskellen mellem en måde og tovejs ANOVA
Forskelle mellem envejs ANOVA og tovejs ANOVA
Envejs ANOVA | To-vejs ANOVA |
Designet til at muliggøre ligestillingstest mellem 3 eller flere midler | Udviklet til at vurdere sammenhængen mellem to uafhængige variabler på en afhængig variabel. |
Involverer en uafhængig variabel | Indbefatter to uafhængige variabler |
Analyseret i 3 eller flere kategoriske grupper. | Sammenligner flere grupper med to faktorer |
Skal tilfredsstille to principper - replikering og randomisering | Skal tilfredsstille tre principper, som er replikering, randomisering og lokal kontrol. |
Fordele ved tovejs ANOVA
- I ovenstående eksempel hjælper alder og køn i vores eksempel - med at reducere fejlvariation og gøre designet mere effektivt.
- To-vejs ANOVA gør det muligt for os at teste effekten af to faktorer på samme tid.
Ansøgninger fra ANOVA
- Sammenligning af kilometertal for forskellige køretøjer, brændstof og vejtyper.
- Læring af påvirkningen af temperatur, tryk eller kemisk koncentration på en eller anden kemisk reaktion (kraftreaktorer, kemiske anlæg osv.)
- Virkning af forskellige katalysatorer på kemiske reaktionshastigheder
- Forståelse af virkningen af reklamer og forskellige antal kundesvar.
- Effekt af ydeevne, kvalitet og hastighedsproduktion i biologi (proces baseret på antallet af celler, de får opdelt i)
Anbefalede artikler
Dette er en vejledning til Two Way ANOVA i R. Her diskuterer vi eksempler, mål, trin og forskellen mellem Envejs og tovejs ANOVA. Du kan også se på de følgende artikler for at lære mere -
- ANOVA i R
- Sådan tolkes resultater ved hjælp af ANOVA-test
- Regression vs ANOVA
- GLM i R