Introduktion til Boxplot-etiketter i R

Boxplot-etiketter hjælper med at visualisere distribuerede data i R. Grafen repræsenterer middelværdien, medianen og variansen. Værdierne er angivet som input til funktionsboksdiagrammet (). Boxplot () -funktionen opretter boxplot ved hjælp af givne inputdata. Boxplot kan oprettes til individuelle variabler eller for en gruppe.

Plotter boksplotgrafen

  • Vi har brug for fem værdsatte input som middelværdi, varians, median, første og tredje kvartil.
  • Identificering af, om der er nogen outliers i dataene.
  • Design modellen til at plotte dataene.

Parametre under funktionen boxplot ()

  1. formel: Denne parameter gør det muligt at spildt numeriske værdier i flere grupper.
  2. Data :: Inputdata, der enten indeholder en dataramme eller en liste.
  3. Delmængde: Valgfri vektorparameter til at specificere en delmængde til plotning.
  4. xlab: x-akses annotation
  5. ylab: annotation af y-aksen.
  6. rækkevidde: række angiver plotudvidelser.
  7. handling: angiv, hvad der sker, når der er en nullværdi. Enten ignorerer svaret eller værdien.

Oprettelse af tilfældige data

Vi kan oprette tilfældige eksempeldata gennem rnorm () -funktionen.

Lad os nu bruge rnorm () til at oprette tilfældige eksempeldata på 10 værdier.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2))

Ovenstående kommando genererer 10 tilfældige værdier med middelværdi 3 og standardafvigelse = 2 og gemmer det i datarammen.

Når vi udskriver dataene, får vi nedenstående output.

Stat1

1 2.662022

2 2.184315

3 5, 974787

4 4, 536203

5 4, 808296

6 3, 817232

7 1.135339

8 1, 583991

9 3.308994

10 4.649170

Vi kan konvertere den samme input (data) til boxplot-funktionen, der genererer plot.

Vi tilføjer flere værdier til dataene og ser, hvordan plot ændres.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data)

Tilføje flere tilfældige værdier og bruge det til at repræsentere en graf.

Nedenfor er værdier, der er gemt i datavariablen.

STAT 1STAT 2STAT 3STAT 4
3.7954654, 218645.8275852.157315
0.9117264, 091196.2608112, 26594
3.7078283, 359875, 889453.714557
0.1157724, 51235.9348582, 40645
0.6975562, 159456, 811472.571304
5.1292313, 26986.2500683.025175
5.4041014, 389395.6700612, 9901
1.4550663, 130595.6923232, 69693
0.8686365, 423115.4154352.674768
2, 141133, 907286.2060592.806656

Nedenfor er kartplotgrafen med 40 værdier. Vi har 1-7 tal på y-aksen og stat1 til stat4 på x-aksen.

Vi kan ændre tekstjusteringen på x-aksen ved hjælp af en anden parameter kaldet las = 2.

Analyse af grafen over R Boxplot-etiketter

Vi har angivet input i datarammen, og vi ser ovenstående plot.

For at forstå dataene, lad os se på stat1-værdierne.

Plottet repræsenterer alle de 5 værdier. Start med minimumsværdien fra bunden og derefter den tredje kvartil, middelværdi, første kvartil og minimumværdi.

Ovenstående plot har tekstjustering vandret på x-aksen.

Ændring af farve

I alle ovenstående eksempler har vi set plotet i sort og hvidt. Lad os se, hvordan vi ændrer farven på plottet.

Vi kan tilføje parameteren col = colour i funktionen boxplot ().

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col="red")
data

Nedenfor kan vi se plotudgangen i rødt.

Ved hjælp af den samme kode ovenfor kan vi tilføje flere farver til plottet.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col=c("red", "blue", "green", "yellow")
data

Tilføjelse af etiketter

Vi kan tilføje etiketter ved hjælp af xlab-, ylab-parametre i boxplot-funktionen.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", col=c("red", "blue", "green", "yellow"))
data

Ved at bruge hovedparameteren kan vi tilføje overskrift til plottet.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", main="Random relation", notch=TRUE, col=c("red", "blue", "green", "yellow"))
data

Notch-parameter bruges til at gøre plot mere forståeligt. Da medianer af stat1 til stat4 ikke stemmer overens med ovenstående plot.

Fordele og ulemper ved boksplottet

Fordele

  • Det er nemt at opsummere store mængder data med boxplot-etiketter.
  • Viser rækkevidde og datadistribution på aksen.
  • Det angiver symmetri og skævhed
  • Hjælper med at identificere outliers i dataene.

Ulemper

  • Kan kun bruges til numeriske data.
  • Hvis der er uoverensstemmelser i dataene, kan boksplottet ikke være nøjagtigt.

Bemærkninger:

  1. Grafer skal mærkes korrekt.
  2. Skalaer er vigtige; ændring af skalaer kan give data en anden visning.
  3. Sammenligning af data med korrekte skalaer skal være ensartet

Konklusion - R Boxplot-etiketter

Datagrupperingen gøres let ved hjælp af boxplots. Box plot understøtter flere variabler såvel som forskellige optimeringer. Vi kan også variere skalaerne i henhold til data.

Boxplots kan bruges til at sammenligne forskellige datavariabler eller sæt.

Brugervenligheden af ​​boxplot er let og praktisk. Vi har brug for konsistente data og korrekte etiketter. Boxplots bruges ofte i datavidenskab og endda af salgshold til at gruppere og sammenligne data. Boxplot giver indsigt i potentialet i de data og optimeringer, der kan gøres for at øge salget.

Boxplot er en interessant måde at teste dataene på, som giver indsigt i datapåvirkningen og potentialet.

Anbefalede artikler

Dette er en vejledning til R Boxplot-etiketter. Her diskuterer vi parametrene under funktionen boxplot (), hvordan man opretter tilfældige data, ændrer farve- og grafanalyse sammen med fordele og ulemper. Du kan også se på den følgende artikel for at lære mere -

  1. Typer af datavisualisering
  2. Implementering af datavarehus
  3. Datavidenskabsteknikker
  4. Hvad er datakube?

Kategori: