ANOVA (analyse af variation)
ANOVA står for analyse af variation. ANOVA blev grundlagt af Ronald Fisher i år 1918. Navnet Analysis Of Variance blev afledt på baggrund af den metode, hvor metoden bruger variansen til at bestemme midlerne, om de er forskellige eller lige.
Det er en statistisk metode, der bruges til at teste forskellene mellem to eller flere midler. Det bruges til at teste generelle forskelle snarere end specifikke forskelle mellem midler. Den vurderer betydningen af en eller flere faktorer ved at sammenligne svarsvariablen på forskellige faktorniveauer.
Nul hypotese angiver, at alle befolkningsværdier er ens. Den alternative hypotese beviser, at mindst en populationens gennemsnit er forskellig
Det giver en måde at teste forskellige nulhypoteser på samme tid.
Generelle formål med ANOVA
Årsagen til at udføre ANOVA er at se, om der er nogen forskel mellem grupperne på en eller anden variabel. I dag bruger forskere ANOVA på mange måder. Brugen af ANOVA afhænger helt af forskningsdesignet.
Du kan bruge t-test til at sammenligne middel til to prøver, men når der er mere end to prøver, der skal sammenlignes, er ANOVA den bedste metode, der skal bruges.
Antagelser om ANOVA
Der er fire hovedantagelser
- De forventede værdier for fejlene er nul
- Afvigelserne på alle fejlene er ens
- Fejlene er uafhængige
- De er normalt fordelt
ANOVA-typer
-
En måde mellem grupper
En måde ANOVA bruges til at kontrollere, om der er nogen signifikant forskel mellem midlerne fra tre eller flere uafhængige grupper. Den tester hovedsageligt nulhypotesen.
H₀: µ₁ = µ₂ = µ₃ =… .. = µₓ
Hvor µ betyder gruppemiddel og x betyder antal grupper. En måde ANOVA giver et markant resultat. Én måde ANOVA er en omnibusteststatistik, og det vil ikke lade dig vide, hvilke specifikke grupper der var forskellige fra hinanden. For at kende den eller de specifikke grupper, der adskiller sig fra andre, skal du udføre en post hoc-test.
Eksempel på en måde ANOVA
20 personer er valgt til at teste effekten af fem forskellige øvelser. 20 personer er opdelt i 4 grupper med 5 medlemmer hver. Deres vægt registreres efter et par dage. Effekten af øvelserne på den 5 gruppe af mænd sammenlignes. Her er vægt den eneste faktor.
Forudsætninger
Den afhængige variabel fordeles normalt i hver gruppe
Der er homogenitet i afvigelser
Observations uafhængighed
-
En måde ANOVA gentagne mål
Gentagne mål ANOVA er mere eller mindre lig med en måde ANOVA men bruges til komplekse grupperinger. Gentagne mål undersøger de 1. ændringer i gennemsnitskarakterer over tre eller flere tidspunkter
2. forskelle i gennemsnitstal under forskellige forhold.
Eksempel på gentagne mål
Du kan undersøge effekten af et 6 måneders træningsprogram på vægttab på nogle individer. Du beregner vægten på tre forskellige tidspunkter i træningsperioden for at udvikle et tidskursus for enhver træningseffekt.
Du kan forkæle den samme person med at spise forskellige typer vægtreducerende mad og bedømme dem efter smagen.
I dette eksempel måles det samme sæt mennesker mere end én gang på den samme afhængige variabel.
-
To veje mellem grupper
Den tovejs ANOVA sammenligner middelforskellen mellem grupper, der er delt på to faktorer. Hovedmålet med en tovejs ANOVA er at finde ud af, om der er nogen interaktion mellem de to uafhængige variabler på de afhængige variabler. Det lader dig også vide, om effekten af en af dine uafhængige variabler på den afhængige variabel er den samme for alle værdierne for din anden uafhængige variabel.
Eksempel
Undersøgelsen af gødningseffekten på udbyttet af ris. Du anvender fem gødning af forskellig kvalitet på fem grunde, der hver dyrker ris. Udbyttet fra hver jordgrund registreres, og forskellen mellem hvert plot er observeret. Her kan også effekten af plotternes frugtbarhed undersøges. Der er således to faktorer, gødning og fertilitet.
Forudsætninger
Inden du starter med din tovejs ANOVA, skal dine data gennemgå seks antagelser for at sikre dig, at de data, du har, er tilstrækkelige til at udføre tovejs ANOVA. De seks antagelser er anført nedenfor
- Din afhængige variabel skal måles på det kontinuerlige niveau
- Din to uafhængige variabel skal indeholde to eller flere kategoriske uafhængige grupper for hver
- Du skal have observationer uafhængighed
- Undgå eventuelle outliers
- Din afhængige variabel skal normalt fordeles for hver kombination af grupperne i de to uafhængige variabler
- Afvigelseres homogenitet
-
To-vejs gentagne mål
Gentagen tovej måler gennemsnitlige forskelle mellem de grupper, der er opdelt i to inden for de uafhængige variabler. En gentagen to-måling anvendes ofte til forskning, hvor en afhængig variabel måles mere end to gange under to eller flere forhold.
Eksempel
En sundhedsforsker ønsker at finde den bedste måde at reducere den kroniske ledsmerten, som mennesker lider. Forskeren vælger to forskellige typer behandlinger for at reducere smerteniveauet. De to typer behandlinger er kendt som 'tilstande'. Behandling A er et massageprogram, og Behandling B er et akupunkturprogram. Begge behandlinger gives til alle patienter i 8 uger.
Patienterne testes på tre tidspunkter - i begyndelsen af programmet, i midten af programmet og ved afslutningen af programmet.
Forskeren vælger 30 patienter til at deltage i forskningen. Men når de første 15 patienter gennemgår behandling A, gennemgår de andre 15 patienter behandling B og vice versa.
Efter udgangen af 8 uger bruger forskeren to-vejs gentagne målinger ANOVA for at finde ud af, om der er nogen ændring i smerten som et resultat af samspillet mellem behandlingstypen og på hvilket tidspunkt.
Forudsætninger
Dine data skal bestå fem antagelser, der er nødvendige for en gentagne to-vejs mål ANOVA for at give det nøjagtige resultat.
- Din afhængige variabel skal måles på det kontinuerlige niveau
- Dine to inden for emnefaktorer skal bestå af mindst to kategorisk relaterede grupper
- Der bør ikke være nogen outliers
- Den afhængige variabel skal normalt fordeles mellem hver kombination af de relaterede grupper
- Afvigelserne mellem forskellene mellem alle kombinationer af beslægtede grupper skal være ens
Parametrisk og ikke-parametrisk ANOVA-test
Hvis informationen om populationen er fuldstændig kendt ved hjælp af dens parametre, kaldes den udførte statistiske test Parametrisk test.
Hvis informationen om populationen eller parametrene ikke er kendt, men den stadig kræves for at teste hypotesen, kaldes den ikke-parametrisk test.
Når du har kategoriske data, kan du ikke bruge ANOVA-metoden, du skal bruge Chi square-test, der omhandler ANOVA-interaktion.
Fremgangsmåde til test af hypotese - En måde ANOVA
- Kontroller enhver nødvendig antagelse, og skriv nul og alternativ hypotese
For at udføre en måde ANOVA bør visse antagelser være der. Antagelserne er som følger
- Hver prøve er en uafhængig tilfældig prøve
- Fordelingen af responsvariablen følger en normal fordeling
- Befolkningsafvigelserne er ens på tværs af svarene for gruppeniveauer. Det kan findes ved at dele den største prøvestandardafvigelse med den mindste prøvestandard, og den er ikke større end to, så antag at befolkningsvariationerne er ens.
- Beregn en passende teststatistik
Én måde ANOVA bruger F-teststatistikker. Håndberegninger kræver mange trin for at beregne F-forholdet, men statistisk software som SPSS beregner F-forholdet for dig og producerer ANOVA-kildetabellen.
ANOVA-tabel giver dig information om variationen mellem grupper og inden for grupper. Tabellen giver dig alle formlerne. Nedenfor er eksemplet på en envejs ANOVA-tabel
Kilde | SS | DF | FRK | F |
Behandlinger | SST | k-1 | SST / (k-1) | MST / MSE |
Fejl | SSE | Nk | SSE / (Nk) | |
I alt (korrigeret) | SS | N-1 |
SST betyder Sum af kvadrater af behandlinger, SSE betyder Sum af kvadrater af fejl
DFT, som er k-1, betyder grader af frihed til behandling, DFE, der er Nk, betyder grader af frihed for fejl.
- Bestem ap-værdien, der er knyttet til teststatistikken
- Bestem mellem nul og alternativ hypotese
Hvis nulhypotesen er falsk, skal MST være større end MSE
- Giv en konklusion
Baseret på dit resultat, skriv en konklusion pr. Anova-forskningsspørgsmål.
Flere sammenligningstest
Hvis du finder ud af, at der er en signifikant forskel mellem de grupper, der ikke er relateret til samplingfejl, er det nødvendigt at køre flere t-test for at teste middelet mellem grupperne. Der er adskillige test udført for at kontrollere type en fejlhastighed.
- Scheffes test
- Ændret Bonferroni-test
- Dunnettes test
- Tukey's test
Beregninger
ANOVA-beregninger kan udføres på tre måder - Håndberegninger, Excel-ark og SPSS-software. Lad os lære om alle beregninger i detaljer nedenfor
-
ANOVA-håndberegninger
- Trin 1
Beregn CM
CM = (I alt af alle observationer) 2 / N I alt
- Trin 2
Beregn det samlede SS
Samlet SS = Summen af kvadrater af alle observationer - CM
- Trin 3
Beregn SST (Summen af kvadrater til behandling)
SST = ∑ 3 i = 1 T2i / n i - CM
- Trin 4
Beregn SSE (Sum af kvadrater for fejl)
SSE = SS (i alt) - SST
- Trin 5
Beregn MST, MSE og deres forhold F
MST = SST / k-1
MSE = SSE / Nk
F = MST / MSE
-
ANOVA ved hjælp af Excel
Følg disse enkle trin for at udføre en enkelt faktor ANOVA i Excel
- Gå til fanen Data
- Klik på Dataanalyse
- Vælg Anova: Enkeltfaktor, og klik på Ok (der er også andre muligheder som Anova: to faktor med replikation og Anova: to faktor uden replikation)
- Klik på feltet Input Range, og vælg området
- Klik på feltet Output rækkevidde, og vælg outputområdet, og klik på Ok
- Resultatet vises på excelarket
- Hvis F er større end F crit, afvises nulhypotesen
-
ANOVA ved hjælp af SPSS
Download først SPSS-softwaren til at udføre ANOVA. Her kan vi se, hvordan man udfører en envejs ANOVA ved hjælp af SPSS
SPSS antager altid, at den uafhængige variabel er repræsenteret numerisk. I prøvedatasættet er MAJOR en streng. Så konverter først strengvariablen til en numerisk variabel. Når din konvertering er forbi, er du klar til at gøre ANOVA
- Åbn SPSS-softwaren
- Klik på Analyser à Sammenlign midler à en måde ANOVA
- En måde ANOVA-dialogboksen vises på skærmen
- På venstre side af dialogboksen ser du en liste over alle de afhængige variabler, der blev målt af dig. Flyt den ind på listen over afhængige i højre side ved hjælp af den øverste pileknap
- På samme måde flyttes den uafhængige variabel i venstre sideliste til Faktor-boksen på højre side.
- Klik på knappen Post Hoc for at vælge den type sammenligning, du vil foretage.
- Vælg en post hoc-test, der passer til din forskning ved at klikke på afkrydsningsfeltet ved siden af testen
- Klik på Fortsæt, og det fører dig til dialogboksen ANOVA på én måde
- Vælg statistik, og klik på afkrydsningsfelterne til venstre for indstillingen for at vælge den
- Klik på Means plot for at få en anova-graf over betingelserne
- Klik på Fortsæt og klik på Ok
SPSS outputvindue vises med seks hovedafsnit
- Beskrivende afsnit
- Test af homogenitet af variationer
- ANOVA
- Flere sammenligninger
- Karakter gennemsnit
- Kurve
Ting, der skal overvejes, når du kører en ANOVA
Dataniveau og antagelser spiller en afgørende rolle i ANOVA.
Forskeren skal finde ud af, om dataene er krydset eller nestet. Hvis dataene krydses, modtager alle grupper alle aspekter.
Hvis dataene er indlejret, modtager hver gruppe en anden ANOVA-metode.
Det er mere vigtigt at beregne anova-effektstørrelsen. Effektstørrelsen kan fortælle dig, i hvilken grad nulhypotesen er falsk. En medium effektstørrelse foretrækkes altid
Håber, at denne artikel gav dig en kort oversigt over ANOVA og fortolkning af resultater ved hjælp af den.
Relaterede kurser: -
- ANOVA Brug af Minitab
- R Studio Anova Techniques Course