Hvad er datavisualisering?

Og hvorfor vi ikke holder af cirkeldiagrammer længere,

Datavisualisering er ikke kun en ren oversættelse af datapunkter til uklare søjlediagrammer og linjediagrammer. Det er som et dykke ned i et hav, der skjuler skatte på hvert niveau. Helt fra begyndelsen har vi den direkte afgrænsning af data i lærebogsfigurer, nemlig. sprede diagrammer, linjediagrammer, cirkeldiagrammer og søjlediagrammer. Linjediagrammer bruges generelt til at skildre en tendens med data over tid. I dette emne, hvad der er datavisualisering, har vi ryddet hele konceptet forude med de givne grafer og cirkeldiagrammer.

Lagkagediagrammer

Et af de mest allestedsnærværende diagrammer, der er i brug, er pizzakortet eller cirkeldiagrammet.

Andel af gasser i en blanding.

Kilde : plotly

Almindeligvis brugt under valg til at vise hvilket parti, der har fået løverne til at dele stemmerne, har dette diagram, selvom det er ekstremt populært, nogle gensidige ulemper. Statistikere som Edward Tufte, Leland Wilkinson og Gerald van Belle har udtrykt deres tilbøjelighed overfor brugen af ​​cirkeldiagrammer. Det mest afgørende bevis mod cirkeldiagrammer er sandsynligvis leveret af Stephen Few, grundlæggeren af ​​Perceptual Edge. I sin artikel, "Save the Pie for the Dessert", der er offentliggjort i Visual Business Intelligence Newsletter, forklarer Stephen hvorfor han til overraskelse for sine kolleger og studerende føler, at cirkeldiagrammer er et ineffektivt middel til at visualisere data.

Se på cirkeldiagrammet herunder.

I denne graf, der viser andelen af ​​fødevarer, der er bestilt efter kl. 21, er det let at estimere den procentdel, der tilhører Ice Cream - 25%. Efter mindre ændringer er det imidlertid ikke længere muligt let at konstatere, hvor stor en procentdel af ordrer der er på is.

Selvom procentdelen af ​​is er stadig den samme på 25%. Det er vanskeligt at forstå fra diagrammet ovenfor. I det forrige diagram var det let at gætte procentdelen, fordi skyggen for is begyndte ved 6 o 'urets position og strækkede sig indtil 9 o' urets position. Da vores øjne er trænet til at se urene på 12, 3, 6 og 9 - er et cirkeldiagram også lettere at fortolke, hvis dens regioner holder sig til de 4 urpositioner. En ivrig cirkeldiagramsupporter ville komme frem og foreslå, at dette problem let kunne undgås ved at bruge etiketter og markere procentdelen mod hver region.

Cirkeldiagram med datatiketter

Men igen, for at kortlægge værdien med varen, er vores øjne nødt til at fortsætte med at skifte fokus fra sagnet i bunden af ​​grafen til etiketterne på diagrammet. Løsningen på det ville være at vedhæfte varenavnet også sammen med værdierne - for at få noget, der ligner dette:

Perfekt, ville du sige. Men så spørger jeg Dem - Nu hvor vi har vedhæftet navnene på elementerne sammen med værdierne, hvordan er cirkeldiagrammet ovenfor forskellig fra nedenstående tabel:

Rens tabel med data sorteret efter Procentdel af ordre

Ser disse oplysninger ikke meget bedre ud end etiketter og legender spredt over cirkeldiagrammet. Hvad er brugen af ​​et cirkeldiagram derefter? Visualiseringer formodes at tilføje værdi, de er agenter for konklusioner, de formodes at få dataene til at afsløre dets hemmeligheder. Men i dette tilfælde opfylder cirkeldiagrammet ikke sit løfte.

Gå ind i søjlediagrammet med datavisualisering

Det slankere og meget mere elegante alternativ til cirkeldiagrammet er søjlediagrammet, der er i stand til at udtrykke alt, hvad cirklen siger, og meget mere, uden at lave et rod med etiketter og sagn.

Søjlediagram, der skildrer det samme - let at sammenligne, kontrastere og konkludere

Dette er de samme oplysninger, der nu præsenteres forsigtigt for observatøren. Udover at vise de individuelle værdier, gør dette diagram os i stand til hurtigt at sammenligne populariteten af ​​hver madvare og endda sammenligne den relative forskel i værdi mellem på hinanden følgende varer. Samme data ville have været tilgængelig gennem tabellen, men vores hjerner er bedre til at behandle billeder end at dechiffrere teksten. Derfor er brugen af ​​cirkeldiagrammet reduceret over tid. Selvom det er et yndlingsbillede i medieindustrien, er dette erstattet af bedre og mere sofistikerede repræsentationer. Udover linjediagrammer, tærter og søjlediagrammer er der et utal af andre diagrammer, der kommer godt med. En interessant graf, men ikke så populær for de uindviede, er Sankey Diagram. Dette diagram bruges til at udtrykke fordeling og strømning af stof. Det drejer sig om energi, penge eller endda vand.

Sankey Diagram over energiflow og distribution af en typisk it-medarbejder.

Over er et fiktivt Sankey-diagram, der udtrykker, hvordan og hvor det meste af en IT-medarbejders energi distribueres.

Nyere værktøjer

Med fremkomsten af ​​sociale medier og de forskellige platforme, hvor folk kan skrive deres følelser, anmeldelser og mening, er et datavisualiseringsværktøj, der er blevet ret almindeligt, ordskyen. Ordskyer hjælper os med at finde ud af, hvad folk taler om.

En meget ægte, live word cloud-repræsentation af brugeranmeldelser af PUBG i google play store

Hvis vi ser på ordet sky her, som er bygget fra de 80 bedste anmeldelser af spillet PUBG i google play store, ser vi, at det overordnede svar på spillet er "godt", nogle mennesker kalder det endda for det "bedste" . Imidlertid ser det ud til, at der er et problem med nogle "opdateringer", som folket beder om spilleskaberne om at rette op. Faktisk, når vi tjekker anmeldelser af legebutikken den dag, ser vi den samme ting afspejles.

Problemet med opdateringer. Se også, om du kan finde en forekomst af ordet "venligst" her

Fremtiden

Dette er bare at ridse spidsen af ​​isbjerget. Biblioteker som plot og D3 har taget datavisualisering til et andet niveau. Dette er sket på grund af, at efterspørgslen også er ændret. Hvordan ville du visualisere en smart by på et instrumentbræt? En gigantisk skærm, som vitalerne i en hel by kan vises på. Trafikken, strømforbruget, sundhedsforholdene i forskellige områder, luftkvalitet og en række andre parametre skal vises på en enkelt side. Dette krav beder om en anden tilgang til datavisualisering Så vi har lært, at hvad der er datavisualisering ved hjælp af dette koncept. Vi kan ikke længere holde os med diagrammer og grafer. En ny tilgang er påkrævet, hvor grafer møder kunst og fantasi, hvilket skaber en berigende visuel oplevelse. Denne diskussion beder om en helt anden artikel. Indtil næste gang.

Anbefalede artikler

Denne artikel er en nyttig guide til, hvad der er en datavisualisering. Her har vi drøftet de grundlæggende koncepter med diagrammer og grafer, så du nemt kan forstå datavisualisering. Du kan også se på den følgende artikel for at lære mere -

  1. Karriere i Oracle-databaseadministrator
  2. 7 Den mest nyttige forskel mellem Data mining vs Web mining
  3. Data Analytics-interviewspørgsmål
  4. Eksempler på Big Data Analytics

Kategori: