To-vejs ANOVA i R - Tovejs ANOVA-test i R Easy Guide - eksempler

Indholdsfortegnelse:

Anonim

Oversigt over Two Way ANOVA i R

Tovejs ANOVA (analyse af variation) hjælper os med at forstå forholdet mellem en kontinuerlig afhængig variabel og to kategoriske uafhængige variabler. I dette emne skal vi lære om Two Way ANOVA i R.

Nedenfor er hypotesen om interesse under tovejs ANOVA

  1. H₀: Kald det som hovedeffekten, som er den første faktor, der er afhængig af den kontinuerlige variabel
  2. H₀: Hovedeffekten handler også om virkningen på den anden variabel på den afhængige kontinuerlige variabel.
  3. H₀: Interaktion er den kombinerede virkning af både den første, den anden faktor-variabel på den afhængige variabel

Nedenfor er de normer, som en tovejs ANOVA skal opfylde.

  1. Observationer skal være uafhængige
  2. Observationer skal normalt distribueres.
  3. Der bør være lige stor variation i observationer
  4. Ingen outliers i design
  5. Fejlene skal være uafhængige.

Bemærk

Vi er nødt til at transformere vores data, hvis normalitet og lige afvigelse krænkes.

Eksempel på tovejs ANOVA i R

Lad os udføre en måde ANOVA-test på datasæt for kræftniveauer, der indeholder 48 rækker og 3 datavariabler:

Tid taget: Overlevelsestid for et dyr

Forskellige niveauer af kræft 1 - 3

Behandling: Behandlinger anvendt fra 1-3

Inden vi tester, har vi brug for følgende data i hånden.

  • Importerer dataene
  • Fjern unødvendig variabel
  • Konverter variabler (kræftniveauer) som bestilt niveau.

Nedenfor er datasættet.

Observationer: 48

Variabler: 3

tid til overlevelse 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0 …

kræftniveauer 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2 …

Behandling A, A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …

mål

  1. H₀: ingen ændring i gennemsnitlig overlevelsestid mellem gruppen
  2. H₀: overlevelsestid er forskellig for mindst én gruppe.

Steps

  • Kontroller kræftniveauerne. Vi kan se tre karakterværdier, fordi vi konverterer dem til faktorer med et mutatverb.

levels(df$cancerlevels)
output: (1) "1" "2" "3"

  • Beregn både middel- og standardafvigelse

df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)

Produktion:

En tibble: 3 x 4

kræftlevelser count_cancerlevels mean_time sd_time

1 1 16 0, 617500 0, 20942779

2 2 16 0, 544375 0, 28936641

3 3 16 0, 276250 0, 06227627

  • I trin tre kan du grafisk kontrollere, om der er en forskel mellem distributionerne. Bemærk, at du inkluderer den jitterede prik.
  • Kør test med kommandoen AOV.

aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used

Syntaks:

y ~ X1 + X2 +… + Xn (X1 + X2 +… henviser til de uafhængige variabler)

y ~. Brug alle de resterende variabler som uafhængige variabler

Sørg for at gemme modellen og udskrive resumeet.

Kode

  • aov (tid ~ kræftniveauer, data = df): Kør ANOVA-testen med følgende formel
  • resume (anova_one_way): Udskriv resumeet af testen

Df Sum Sq Middel Sq F-værdi Pr (> F)

Cancerlevels 2 1.033 0.5165 11.79 7.66e-05 ***

Residualer 45 1.972 0, 0438

-

Signif. koder: 0 '***' 0, 001 '**' 0, 01 '*' 0, 05 '.' 0, 1 '' 1

P-værdien er lavere end tærsklen 0, 05. Den statistiske forskel er angivet med '*' i ovenstående tilfælde.

One Way Test til Two Way Anova i R

Lad os se, hvordan envejstesten kan udvides til tovejs ANOVA. Testen svarer til envejs ANOVA, men formlen adskiller sig og tilføjer en anden gruppevariabel til formlen.

y = x1 + x2

  • H0 : Midlerne er ens for begge variabler (faktorvariabler)
  • H3 : Midlerne er forskellige for begge variabler

Du tilføjer behandlingsvariabler til vores model. Denne variabel angiver behandlingen, der gives til patienten. Du er interesseret i at se, om der er en statistisk afhængighed mellem kræftniveauer og behandling, der gives patienten.

Vi justerer vores kode ved at tilføje en behandling med den anden uafhængige variabel.

Df Sum Sq Middel Sq F-værdi Pr (> F)

Kræftniveauer 2 1.0330 0.5165 20.64 5.7e-07 ***

Behandl 3 0, 9212 0, 3071 12, 27 6, 7e-06 ***

Residualer 42 1.0509 0, 0250

Både kræftniveauer og behandling er statistisk forskellig fra 0. På dette punkt kan vi afvise NULL-hypotesen. Bekræft også, at ændring af behandling eller kræftform påvirker overlevelsestidspunktet.

Prøve

Envejs ANOVA: H3- Gennemsnittet er forskelligt for mindst en gruppe

To-vejs ANOVA: H3- Gennemsnittet er forskelligt for begge grupper.

Forskellen mellem en måde og tovejs ANOVA

Forskelle mellem envejs ANOVA og tovejs ANOVA

Envejs ANOVATo-vejs ANOVA
Designet til at muliggøre ligestillingstest mellem 3 eller flere midlerUdviklet til at vurdere sammenhængen mellem to uafhængige variabler på en afhængig variabel.
Involverer en uafhængig variabelIndbefatter to uafhængige variabler
Analyseret i 3 eller flere kategoriske grupper.Sammenligner flere grupper med to faktorer
Skal tilfredsstille to principper - replikering og randomiseringSkal tilfredsstille tre principper, som er replikering, randomisering og lokal kontrol.

Fordele ved tovejs ANOVA

  • I ovenstående eksempel hjælper alder og køn i vores eksempel - med at reducere fejlvariation og gøre designet mere effektivt.
  • To-vejs ANOVA gør det muligt for os at teste effekten af ​​to faktorer på samme tid.

Ansøgninger fra ANOVA

  1. Sammenligning af kilometertal for forskellige køretøjer, brændstof og vejtyper.
  2. Læring af påvirkningen af ​​temperatur, tryk eller kemisk koncentration på en eller anden kemisk reaktion (kraftreaktorer, kemiske anlæg osv.)
  3. Virkning af forskellige katalysatorer på kemiske reaktionshastigheder
  4. Forståelse af virkningen af ​​reklamer og forskellige antal kundesvar.
  5. Effekt af ydeevne, kvalitet og hastighedsproduktion i biologi (proces baseret på antallet af celler, de får opdelt i)

Anbefalede artikler

Dette er en vejledning til Two Way ANOVA i R. Her diskuterer vi eksempler, mål, trin og forskellen mellem Envejs og tovejs ANOVA. Du kan også se på de følgende artikler for at lære mere -

  1. ANOVA i R
  2. Sådan tolkes resultater ved hjælp af ANOVA-test
  3. Regression vs ANOVA
  4. GLM i R