Outliers formel (indholdsfortegnelse)
- Outliers formel
- Eksempler på Outliers-formlen (med Excel-skabelon)
Outliers formel
I statistikker er Outliers de to ekstreme distancerede usædvanlige punkter i de givne datasæt. Den ekstremt høje værdi og ekstremt lave værdier er outlier-værdierne i et datasæt. Dette er meget nyttigt til at finde enhver fejl eller fejl, der opstod. Ligesom navnet siger, er Outliers værdier, der løj uden for resten af værdierne i datasættet. Eksempel, overvej ingeniørstuderende og forestil dig, at de havde dværge i deres klasse. Så dværge er de mennesker, der er ekstremt lav i højden sammenlignet med andre normale højde. Så dette er outlier-værdien i denne klasse. Ældre værdier kan beregnes ved hjælp af Tukey-metoden.
Formlen for Outliers -
Lower Outlier = Q1 – (1.5 * IQR)
Higher Outlier= Q3 + (1.5 * IQR)
Eksempler på Outliers-formlen (med Excel-skabelon)
Lad os tage et eksempel for at forstå beregningen af Outliers-formlen på en bedre måde.
Du kan downloade denne Outliers-skabelon her - Outliers TemplateOutliers formel - eksempel # 1
Overvej følgende datasæt, og bereg udliggere for datasættet.
Datasæt = 5, 2, 7, 98, 309, 45, 34, 6, 56, 89, 23
Stigende rækkefølge af datasæt:
Median for stigende ordredatasæt beregnes som:
I dette datasæt er det samlede antal data 11. Så n = 11. Median = 11 + 1/2 = 12/2 = 6. Derfor er værdien, der er i 6. position i dette datasæt, medianen.
Så medianværdi = 34.
Opdel datasættet i 2 halvdele ved hjælp af medianen.
Median for datasæt i nedre halvdel og øvre halvdel beregnes som:
- I den nedre halvdel 2, 5, 6, 7, 23, hvis vi finder medianen som hvordan vi fandt i trin 2, ville medianværdien være 6. Så Q1 = 6.
- I den øverste halvdel 45, 56, 89, 98, 309, hvis vi finder medianen som hvordan vi fandt i trin 2, ville medianværdien være 89. Så Q3 = 89.
IQR beregnes ved hjælp af nedenstående formel
IQR = Q3 - Q1
- IQR = 89-6
- IQR = 83
Lavere Outlier beregnes ved hjælp af nedenstående formel
Lavere Outlier = Q1 - (1, 5 * IQR)
- Lavere Outlier = 6 - (1, 5 * 83)
- Lavere Outlier = -118, 5
Højere Outlier beregnes ved hjælp af nedenstående formel
Højere Outlier = Q3 + (1, 5 * IQR)
- Højere Outlier = 89 + (1, 5 * 83)
- Højere Outlier = 213, 5
Hent nu disse værdier i datasættet -118, 5, 2, 5, 6, 7, 23, 34, 45, 56, 89, 98, 213.5, 309. Værdier, der falder under i den nedre sideværdi og derover på den højere side er outlier-værdien. For dette datasæt er 309 outlier.
Outliers formel - eksempel # 2
Overvej følgende datasæt, og bereg udliggere for datasættet.
Datasæt = 45, 21, 34, 90, 109.
Stigende rækkefølge af datasæt:
Median for stigende ordredatasæt beregnes som:
I dette datasæt er det samlede antal data 5. Så n = 5. Median = 5 + 1/2 = 6/2 = 3. Derfor er værdien, der er i 3. position i dette datasæt, medianen.
Så medianværdi = 45.
Opdel datasættet i 2 halvdele ved hjælp af medianen.
Median for datasæt i nedre halvdel og øvre halvdel beregnes som:
- Q1 = 27, 5
- Q3 = 89
IQR beregnes ved hjælp af nedenstående formel
IQR = Q3 - Q1
- IQR = 99, 5 - 27, 5
- IQR = 72
Lavere Outlier beregnes ved hjælp af nedenstående formel
Lavere Outlier = Q1 - (1, 5 * IQR)
- Lavere Outlier = 27, 5 - (1, 5 * 72)
- Lavere Outlier = -80, 5
Højere Outlier beregnes ved hjælp af nedenstående formel
Højere Outlier = Q3 + (1, 5 * IQR)
- Højere Outlier = 99, 5 + (1, 5 * 72)
- Højere Outlier = 207, 5
Forklaring
Trin 1: Arranger alle værdier i det givne datasæt i stigende rækkefølge.
Trin 2: Find medianværdien for de data, der er sorteret. Median kan findes ved hjælp af følgende formel. Følgende beregning giver dig simpelthen placeringen af medianværdien, der ligger i det indstillede dato.
Median = (n + 1) / 2
Hvor n er det samlede antal tilgængelige data i datasættet.
Trin 3: Find den lavere kvartilværdi Q1 fra datasættet. For at finde dette, ved hjælp af medianværdien, deles datasættet i to halvdele. Fra det nederste halve sæt af værdier, find medianen for det lavere sæt, der er Q1-værdien.
Trin 4: Find den øverste kvartilværdi Q3 fra datasættet. Det er nøjagtigt som ovenstående trin. I stedet for den nedre halvdel, er vi nødt til at følge den samme procedure, det øvre halvdel af værdier.
Trin 5: Find IQR-værdien for Interquartile Range. For at finde fradrag Q1-værdien fra Q3.
IQR = Q3-Q1
Trin 6: Find den indre ekstreme værdi. En ende, der falder uden for den nedre side, som også kan kaldes en mindre outlier. Multiplicer IQR-værdien med 1, 5, og træk denne værdi fra Q1 giver dig den indre nedre ekstreme.
Lavere Outlier = Q1 - (1, 5 * IQR)
Trin 7: Find den ydre ekstreme værdi. En ende, der falder uden for den højere side, som også kan kaldes en større outlier. Multiplicer IQR-værdien med 1, 5, og summer denne værdi med Q3 giver dig den ydre højere ekstrem.
Højere Outlier = Q3 + (1, 5 * IQR)
Trin 8: Værdier, der falder uden for disse indre og ydre ytterpunkter, er outlier-værdierne for det givne datasæt.
Relevans og anvendelser af Outliers-formlen
Outliers er meget vigtige i ethvert dataanalyseproblem. Outlier viser inkonsekvens i ethvert datasæt, da det er defineret som de usædvanlige fjerne værdier i datasættet fra det ene til det andet. Dette er meget nyttigt til at finde eventuelle fejl, der opstod i datasættet. For når du placerer en fejl i datasættet, påvirker det middelværdien, og medianen kan derfor få store afvigelser i resultatet, hvis Outliers er i datasættet. Derfor er det vigtigt at finde ud af Outliers fra datasættet for at undgå alvorlige problemer i den statistiske analyse.
Anbefalede artikler
Dette har været en guide til Outliers-formlen. Her diskuterer vi, hvordan man beregner Outliers sammen med praktiske eksempler og downloadbar excel-skabelon. Du kan også se på de følgende artikler for at lære mere -
- Vejledning til mellemformulering
- Eksempler på lønnsformler
- Lommeregner til DPMO-formel
- Hvordan beregnes T-distribution?
- Kvartilafvigelsesformel | eksempler