Introduktion til Data Mart
Verden bliver mere digital, og hver organisation genererer flere petabytes af data. Data Mart er en sådan klassificering af data fra et datavarehus, hvor koncentrationen er på et emne.
Vi kan sige, at det er oplysningerne om en bestemt afdeling eller kategori som salg, finans eller markedsføring osv. Dybest set er det en undergruppe af datalagring. Da der er koncentration om specifikke emner eller afdelinger, kan vi sige, at kilden til den er begrænset, eller at den er afhængig af meget få kilder.
Data Mart vs Data Warehouse
Et datavarehus er et lager med en samling af data fra flere strømme af emnet. Vedligeholdelses- og kontroldelen, som indsamling af rå data og behandling af dem, håndteres hovedsageligt af Corporate Information Technology IT-grupper, der leverer forskellige tjenester til moderorganisationerne.
Datavarehuset omtales også som et centralt datalager eller et virksomhedsdatavarehus. Så kilden til et datavarehus vil være multiple i modsætning til datamartet, som i nogle tilfælde er en undergruppe af datavarehus.
Typer af data Mart
Der er typisk tre typer datamars. De er:
1. Dependent Data Warehouse
En afhængig datamart er rent fra datalageret, og alle de grupperede afhængige danner et virksomhedsdatarager. Det er rent en undergruppe af datalager, da det er oprettet fra det centrale DW.
Da rene og opsummerede data allerede er til stede i det centrale datavarehus ETT-proces, eller Extract Transform and Transportation er forenklet. Vi er bare nødt til at identificere det bestemte delmængde her og udføre ETT ovenpå.
Disse datamarkter er typisk bygget for at opnå bedre tilgængelighed og meget forbedret ydelse med bedre kontrol og effektivitet.
2. Uafhængige data Mart
Dette oprettes ikke fra det centrale datavarehus, og kilden til dette kan være anderledes. Da data er fra andre end den centrale DW ETT-proces er lidt anderledes.
De fleste af de uafhængige datamart bruges af en mindre gruppe organisationer, og kilden til dette er også begrænset. Den uafhængige datamart oprettes generelt, når vi er nødt til at få en løsning i relativt kortere tidsbundet.
3. Hybrid Data Mart
Hybrid datamart giver dig mulighed for at gruppere dataene fra alle andre kilder end det centrale datavarehus DW. Når vi beskæftiger os med ad hoc-integration, vil dette i høj grad gavne det øverste arbejde med alle de produkter, der blev tilføjet til organisationerne eksternt.
Funktioner ved Data Mart
Nedenfor er nogle af funktionerne i en datamart:
- Da datakilden er koncentreret til at blive genstand, forbedres brugerens responstid ved at bruge dem.
- For ofte krævede data vil brug af datamars være fordelagtigt, da det er undergruppe til central DW, og datastørrelsen vil derfor være mindre.
- Eftersom datavolumenet er begrænset, vil behandlingstiden også være ganske reduceret sammenlignet med centrale Dws.
- Disse er dybest set smidige og kan rumme ændringerne i modellen ganske hurtigt og effektivt sammenlignet med datalageret.
- Datamart kræver, at en enkelt fagekspert håndterer, i modsætning til lagerdata, den ekspertise, vi har brug for i flere faglagre. På grund af dette siger vi, at datamart er mere smidig.
- Vi kan adskille adgangskategorier til et lavt niveau med partitionerede data og med datamart, det er meget let.
- Infrastrukturafhængighed er ret begrænset, og data kan gemmes på forskellige hardwareplatforme efter segmentering.
Trin til implementering af data Mart
Nedenfor er de trin, der kræves for at implementere det.
1. Design
Dette vil være det første trin i implementeringen, hvor alle de nødvendige opgaver og kilder identificeres for at indsamle teknisk og forretningsinformation. Senere implementeres den logiske plan, og ved gennemgang konverteres denne til en fysisk plan. Desuden besluttes den logiske og fysiske struktur af dataene her, hvordan man opdeler dataene og feltet for partition som dato eller en hvilken som helst anden fil.
2. Konstruktion
Dette er den anden fase af implementeringen, hvor fysiske databaser blev genereret ved hjælp af RDBMS, som blev bestemt som en del af designprocessen og de logiske strukturer. Alle objekter som skema, indekser, tabeller, visninger osv. Oprettes.
3. Befolkning
Dette er den tredje fase, og her udfyldes data i det, når dataene hentes. Alle de nødvendige transformationer implementeres, før dataene derpå udfyldes.
4. Adgang
Dette er det næste trin i implementeringen, hvor vi vil bruge de befolkede data til forespørgsel til oprettelse af rapporter. Slutbruger bruger dette trin til at forstå dataene ved hjælp af forespørgsler.
5. Håndtering
Dette er den sidste fase i implementeringen af datamart, og her tages hånd om forskellige opgaver såsom adgangshåndtering, systemoptimering og indstilling, styring og tilføjelse af friske data til datamart og planlægning af gendannelsesscenarier for at håndtere eventuelle fejltilfælde.
Fordele ved Data Mart
Følgende er nogle af fordelene ved at bruge det.
- Det er et af de bedste omkostningseffektive alternativer til et datavarehus, hvor du kun har brug for at arbejde på et lille datasegment.
- Adskillelse af data fra kilder vil gøre datamart effektivt, da en bestemt gruppe af mennesker kan arbejde dataene fra en bestemt kilde i stedet for alle, der bruger datalageret.
- Hurtigere adgang til dataene er muligt ved hjælp af datamart, hvis vi ved, hvilket undergruppe vi har brug for for at få adgang.
- Datamart er meget lettere at bruge, så slutbrugerne let kan forespørge oven på dem.
- At komme til implementeringstiden Datamart kræver mindre tid sammenlignet med datavarehuset, da dataene er adskilt i grupper.
- Historiske data fra et bestemt emne kan bruges til let trendanalyse.
Konklusion
Fordi det er koncentreret om et enkelt funktionelt område, er der adskillige fordele både for procesimplementøren og slutbrugeren. Derfor er effektiv martsimplementering påkrævet sammen med et datalager i organisationen.
Anbefalede artikler
Dette er en guide til Hvad er Data Mart. Her diskuterer vi introduktionen, funktioner og top 3-typer sammen med dens funktioner og trin. Du kan også se på de følgende artikler for at lære mere -
- Oracle Data Warehousing
- R Datatyper
- Python-datatyper
- Cassandra Datamodellering
- Komplet guide til datamodel i Cassandra