Introduktion til typer af datavisualisering

I den moderne arena for big data, der har over 2, 5 quintillion bytes (1 quintillion byte = 10 18 bytes!) Af data, der oprettes hver dag (ifølge socialmediatoday.com), er der et døende behov for at gemme dataene. Dette er unødvendigt at sige, at disse data er tætte og derfor ikke så brugervenlige og er konstant ikke fokuseret. For at ændre paradigmet for let at forstå omfanget af dataene og at få nyttige fordele i virksomheden, skal dataene præsenteres på en mere intuitiv måde og vil derfor kræve passende diagrammer for at visualisere dem. Der er værktøjer og metoder, der er bygget til effektivt at skildre dataene, men effektiviteten afhænger hovedsageligt af datatypen og kravet, der kræves for at blive skåret ud af dataene.

Hvad er datavisualisering?

Datavisualisering er en metode, hvorpå dataene i rå format skildres for at bringe betydningen af ​​det ud. Med fremkomsten af ​​big data er det blevet bydende at opbygge en meningsfuld måde at fremvise dataene på, så mængden af ​​data ikke bliver overvældende. Den del af portrætteringen af ​​dataene kan bruges til forskellige formål, for eksempel til at finde tendenser / fælles / mønstre i data, bygge modeller til maskinlæring eller kan bruges til en simpel operation som aggregering.

Forskellige typer datavisualisering

Datavisualiseringen er stort set klassificeret i 6 forskellige typer. Selvom området med datavisualisering vokser stadig, vil det ikke være en overraskelse, hvis antallet af kategorier stiger.

Temporal: Data for disse typer visualisering skal tilfredsstille begge betingelser: De repræsenterede data skal være lineære og skal være en dimensionelle. Disse typer visualisering er repræsenteret gennem linjer, der muligvis overlapper hinanden og også har et fælles start- og slutdatapunkt.
SpredepladserBruger prikker til at repræsentere et datapunkt. Det mest almindelige i nutidens verden inden for maskinlæring under sonderende dataanalyse.
LagkagediagramDenne type visualisering inkluderer cirkulær grafik, hvor buelængden angiver størrelsen.
Polar area diagramLigesom cirkeldiagram er polarområdediagrammet et cirkulært plot, bortset fra sektorvinklerne, er ens i længden, og afstanden for at strække sig fra midten betyder størrelsen.
LinjediagrammerLigesom scatter-plot er dataene repræsenteret af punkter, undtagen forbundet med linjer for at opretholde kontinuitet.
tidslinjerPå denne måde viser vi en liste over datapunkter i kronologisk tidsrækkefølge.
TidsserierekvenserI tidsserier repræsenterer vi størrelsen af ​​data i en 2-D graf i kronologisk rækkefølge af tidsstempel i data.
Hierarkisk: Disse typer visualiseringer skildrer bestilte grupper i en større gruppe. På simpelt sprog er den vigtigste intuition bag disse visualiseringer klyngerne kan vises, hvis strømmen af ​​klynger starter fra et enkelt punkt.
TrædiagramI et trædiagram er den hierarkiske strøm repræsenteret i form af et træ, som navnet antyder. Få terminologier for denne repræsentation er:

- rodknudepunkt: oprindelsessted.

- Børneknude: Har en forælder ovenfor

- Bladknudepunkt: Ikke mere barneknudepunkt.

Ringdiagrammer / Sunburst DiagramTrærepræsentationen i trædiagrammet konverteres til radial basis. Denne type hjælper med at præsentere træet i en kort størrelse. Den inderste cirkel er rodnoden. Og området med barneknudepunktet angiver% af data.
TreeMapTræet er repræsenteret i form af rektangler tæt pakket. Området angiver den indeholdte mængde.
CirkelpakningLigesom et treemap bruger det cirkulær pakning i stedet for rektangler.
Netværk: Visualiseringen af ​​denne type forbinder datasæt til datasæt. Disse visualiseringer viser, hvordan disse datasæt forholder sig til hinanden i et netværk.
MatrixdiagrammerDenne type visualisering er vidt brugt til at finde forbindelsen mellem forskellige variabler i sig selv. For eksempel korrelationsdiagram
Alluviale diagrammerDette er en type flowdiagram, hvor ændringerne i strømmen af ​​netværket er repræsenteret over intervaller som ønsket af brugeren.

Word skyDette bruges typisk til at repræsentere tekstdata. Ordene er tæt pakket, og tekstens størrelse angiver ordets hyppighed.

KnudepunktdiagrammerHer er knudepunkterne repræsenteret som prikker, og forbindelsen mellem knudepunkter præsenteres.
Multidimensionel: I modsætning til den tidsmæssige visualiseringstype kan disse typer have flere dimensioner. I dette kan vi bruge 2 eller flere funktioner til at skabe en 3D-visualisering gennem samtidige lag. Disse gør det muligt for brugeren at præsentere vigtige takeaways ved at bryde en masse ikke-nyttige data.
Spredning af plotI multidimensionelle data vælger vi alle to funktioner og plot dem derefter i et 2-D scatter plot. Ved at gøre dette ville vi have n C 2 = n (n-1) / 2 grafer.
Stablede søjlediagrammerRepræsentationssegmentet linjer oven på hinanden. Det kan enten være 100% stablet søjlediagram, hvor adskillelsen er repræsenteret i% eller simpel stablet søjlediagram, der angiver den faktiske størrelse
Parallel koordinat plotI denne repræsentation tegnes et baggrund, og der trækkes n parallelle linjer (for n-dimensionelle data).
Geospatial: Disse visualiseringer vedrører den aktuelle fysiske placering i det virkelige liv ved at krydse den over med kort (Det kan være et geospatialt eller rumligt kort). Intuitionen bag disse visualiseringer er at skabe et holistisk syn på performance.
Flow mapBevægelse af information eller objekter fra et sted til et andet præsenteres, hvor pilens størrelse angiver størrelsen.
Choropleth-kortDet geospatiale kort er farvet på basis af en bestemt datavariabel.
cartogramDenne type repræsentation bruger den tematiske variabel til kortlægning. Disse kort forvrænger virkeligheden til at præsentere information. Dette betyder, at kortene er overdrevne på en bestemt variabel. For eksempel er billedet til venstre et rumligt kort forvrænget til en bi-bikube.

VarmekortDisse ligner meget Choropleth i geospatialgenren, men kan også bruges i områder bortset fra geospatial.
Diverse: Disse visualiseringer kan ikke generaliseres i en særlig stor gruppe. Så i stedet for at danne mindre grupper til den enkelte type, grupperer vi det i diverse. Få eksempler er nedenfor:
Åbent-højt-lavt-tæt diagramDenne type grafer bruges typisk til aktiekursrepræsentation. Den stigende tendens kaldes Bullish og faldende som Bearish.
Kagi-figurTypisk er efterspørgslen efter et aktiv repræsenteret ved hjælp af dette diagram.

Konklusion

Fra de ovennævnte typer visualisering ser vi, at der stort set er 6 typer grupper. Listen ovenfor er ikke en udtømmende liste, men få, der er vidt brugt. I de kommende tider, når og når nye typer tilføjes på listen, kan grupperne muligvis stige. Det er det til typer visualisering. Vi fortsætter med, hvilke parametre vi skal se på under fastlæggelse af typen af ​​visualisering.

Anbefalede artikler

Dette er en vejledning til typen af ​​datavisualisering. Her diskuterer vi introduktion og forskellige typer datavisualisering. Du kan også gennemgå vores andre foreslåede artikler for at lære mere–

  1. Typer af dataanalyseteknikker
  2. Talend Data Integration
  3. Dataanalyseværktøjer
  4. Data Science værktøjer
  5. Talend-værktøjer
  6. Hvad er dataintegration?
  7. Spredepladser i Matlab
  8. Sådan bruges søjlediagrammet i Matlab (eksempler)

Kategori: