Outliers formel (indholdsfortegnelse)

  • Outliers formel
  • Eksempler på Outliers-formlen (med Excel-skabelon)

Outliers formel

I statistikker er Outliers de to ekstreme distancerede usædvanlige punkter i de givne datasæt. Den ekstremt høje værdi og ekstremt lave værdier er outlier-værdierne i et datasæt. Dette er meget nyttigt til at finde enhver fejl eller fejl, der opstod. Ligesom navnet siger, er Outliers værdier, der løj uden for resten af ​​værdierne i datasættet. Eksempel, overvej ingeniørstuderende og forestil dig, at de havde dværge i deres klasse. Så dværge er de mennesker, der er ekstremt lav i højden sammenlignet med andre normale højde. Så dette er outlier-værdien i denne klasse. Ældre værdier kan beregnes ved hjælp af Tukey-metoden.

Formlen for Outliers -

Lower Outlier = Q1 – (1.5 * IQR)
Higher Outlier= Q3 + (1.5 * IQR)

Eksempler på Outliers-formlen (med Excel-skabelon)

Lad os tage et eksempel for at forstå beregningen af ​​Outliers-formlen på en bedre måde.

Du kan downloade denne Outliers-skabelon her - Outliers Template

Outliers formel - eksempel # 1

Overvej følgende datasæt, og bereg udliggere for datasættet.

Datasæt = 5, 2, 7, 98, 309, 45, 34, 6, 56, 89, 23

Stigende rækkefølge af datasæt:

Median for stigende ordredatasæt beregnes som:

I dette datasæt er det samlede antal data 11. Så n = 11. Median = 11 + 1/2 = 12/2 = 6. Derfor er værdien, der er i 6. position i dette datasæt, medianen.

Så medianværdi = 34.

Opdel datasættet i 2 halvdele ved hjælp af medianen.

Median for datasæt i nedre halvdel og øvre halvdel beregnes som:

  • I den nedre halvdel 2, 5, 6, 7, 23, hvis vi finder medianen som hvordan vi fandt i trin 2, ville medianværdien være 6. Så Q1 = 6.
  • I den øverste halvdel 45, 56, 89, 98, 309, hvis vi finder medianen som hvordan vi fandt i trin 2, ville medianværdien være 89. Så Q3 = 89.

IQR beregnes ved hjælp af nedenstående formel

IQR = Q3 - Q1

  • IQR = 89-6
  • IQR = 83

Lavere Outlier beregnes ved hjælp af nedenstående formel

Lavere Outlier = Q1 - (1, 5 * IQR)

  • Lavere Outlier = 6 - (1, 5 * 83)
  • Lavere Outlier = -118, 5

Højere Outlier beregnes ved hjælp af nedenstående formel

Højere Outlier = Q3 + (1, 5 * IQR)

  • Højere Outlier = 89 + (1, 5 * 83)
  • Højere Outlier = 213, 5

Hent nu disse værdier i datasættet -118, 5, 2, 5, 6, 7, 23, 34, 45, 56, 89, 98, 213.5, 309. Værdier, der falder under i den nedre sideværdi og derover på den højere side er outlier-værdien. For dette datasæt er 309 outlier.

Outliers formel - eksempel # 2

Overvej følgende datasæt, og bereg udliggere for datasættet.

Datasæt = 45, 21, 34, 90, 109.

Stigende rækkefølge af datasæt:

Median for stigende ordredatasæt beregnes som:

I dette datasæt er det samlede antal data 5. Så n = 5. Median = 5 + 1/2 = 6/2 = 3. Derfor er værdien, der er i 3. position i dette datasæt, medianen.

Så medianværdi = 45.

Opdel datasættet i 2 halvdele ved hjælp af medianen.

Median for datasæt i nedre halvdel og øvre halvdel beregnes som:

  • Q1 = 27, 5
  • Q3 = 89

IQR beregnes ved hjælp af nedenstående formel

IQR = Q3 - Q1

  • IQR = 99, 5 - 27, 5
  • IQR = 72

Lavere Outlier beregnes ved hjælp af nedenstående formel

Lavere Outlier = Q1 - (1, 5 * IQR)

  • Lavere Outlier = 27, 5 - (1, 5 * 72)
  • Lavere Outlier = -80, 5

Højere Outlier beregnes ved hjælp af nedenstående formel

Højere Outlier = Q3 + (1, 5 * IQR)

  • Højere Outlier = 99, 5 + (1, 5 * 72)
  • Højere Outlier = 207, 5

Forklaring

Trin 1: Arranger alle værdier i det givne datasæt i stigende rækkefølge.

Trin 2: Find medianværdien for de data, der er sorteret. Median kan findes ved hjælp af følgende formel. Følgende beregning giver dig simpelthen placeringen af ​​medianværdien, der ligger i det indstillede dato.

Median = (n + 1) / 2

Hvor n er det samlede antal tilgængelige data i datasættet.

Trin 3: Find den lavere kvartilværdi Q1 fra datasættet. For at finde dette, ved hjælp af medianværdien, deles datasættet i to halvdele. Fra det nederste halve sæt af værdier, find medianen for det lavere sæt, der er Q1-værdien.

Trin 4: Find den øverste kvartilværdi Q3 fra datasættet. Det er nøjagtigt som ovenstående trin. I stedet for den nedre halvdel, er vi nødt til at følge den samme procedure, det øvre halvdel af værdier.

Trin 5: Find IQR-værdien for Interquartile Range. For at finde fradrag Q1-værdien fra Q3.

IQR = Q3-Q1

Trin 6: Find den indre ekstreme værdi. En ende, der falder uden for den nedre side, som også kan kaldes en mindre outlier. Multiplicer IQR-værdien med 1, 5, og træk denne værdi fra Q1 giver dig den indre nedre ekstreme.

Lavere Outlier = Q1 - (1, 5 * IQR)

Trin 7: Find den ydre ekstreme værdi. En ende, der falder uden for den højere side, som også kan kaldes en større outlier. Multiplicer IQR-værdien med 1, 5, og summer denne værdi med Q3 giver dig den ydre højere ekstrem.

Højere Outlier = Q3 + (1, 5 * IQR)

Trin 8: Værdier, der falder uden for disse indre og ydre ytterpunkter, er outlier-værdierne for det givne datasæt.

Relevans og anvendelser af Outliers-formlen

Outliers er meget vigtige i ethvert dataanalyseproblem. Outlier viser inkonsekvens i ethvert datasæt, da det er defineret som de usædvanlige fjerne værdier i datasættet fra det ene til det andet. Dette er meget nyttigt til at finde eventuelle fejl, der opstod i datasættet. For når du placerer en fejl i datasættet, påvirker det middelværdien, og medianen kan derfor få store afvigelser i resultatet, hvis Outliers er i datasættet. Derfor er det vigtigt at finde ud af Outliers fra datasættet for at undgå alvorlige problemer i den statistiske analyse.

Anbefalede artikler

Dette har været en guide til Outliers-formlen. Her diskuterer vi, hvordan man beregner Outliers sammen med praktiske eksempler og downloadbar excel-skabelon. Du kan også se på de følgende artikler for at lære mere -

  1. Vejledning til mellemformulering
  2. Eksempler på lønnsformler
  3. Lommeregner til DPMO-formel
  4. Hvordan beregnes T-distribution?
  5. Kvartilafvigelsesformel | eksempler