Introduktion til Data Warehouse Design

Et lager i almindeligt ord betyder at gemme noget på et sted og lignende tilfælde i brancher for at gemme den komplekse mængde data på et sted. Business Intelligence (BI) giver dig mulighed for at forespørge data fra datakilderne, og der kan kun oprettes tillid, når der er et godt design af datalager.

Datavarehuset integrerer flere datakilder og vil yde en god støtte til analyse og analytisk rapportering. Hvis du har et dårligt datalagerdesign, vil det påvirke din organisations vækst ved at have unøjagtige forespørgseldata.

Tag et popularitetseksempel på Amazon webshop ved at bestille varen, og den kan leveres lige uden for døren. Når kunden logger ind på e-handelswebstedet og søger efter det tilgængelige produkt i butikken. Derefter valgte vi og bestilte varen, så snart leverandøren accepterer og straks sendt. Her kan vi spare vores tid på at købe den ønskede vare.

I lignende tilfælde som dette datavarehus kan dataene gemmes og indhentes fra transaktionssystemet. Datavarehuset som et to hovedkoncept

  • OLAP - Online analytisk behandling
  • OLTP - Online transaktionsbehandling

Begge er online-behandlingssystemer, men har nogle forskelle. OLTP administrerer den transaktionsmæssige applikation som ATM, OLAP bruger til analytisk behandling som rapportering, prognoser osv.,

Kravssamling

  • Kravssamling er en fase i design af datalager. Det er nødvendigt at bestemme kriterierne og implementere dem med succes. Der vil være to strategier, der bruges til datalagerdesign, den ene kaldes virksomheden og den anden kaldes teknisk.
  • Forretningsstrategien fokuserer på den langsigtede forretningsvisning og hjælper med at øge profitten for vækst. Det tekniske strategikrav er baseret på brugerrapportering, analyse, valg af hardware, udviklingsmetode, testteknik, implementeringsmiljø og brugeruddannelse.
  • Når vi besluttede den forretningsmæssige og tekniske strategi, er vi også nødt til at designe BCP (Disaster Recovery) -planen. Når der sker en katastrofe af mennesker eller natur, er vi nødt til at have en plan for at gendanne data hurtigt og sikre, at ingen data mister. Udvikling af katastrofes genopretningsplan er en af ​​de udfordrende og skaber tillid til organisationen.

Miljøopsætning

  • Når vi har samlet dataene til datalagerdesign, er vi nødt til at lave en ordentlig miljøopsætning for udvikling, test og produktion. Der bør fortrinsvis være et separat system til anvendelse, database og separat til rapportering / ETL også.
  • Når vi bygger et separat miljø for hver, sikrer vi, at alle ændringer kan udvikles / testes og derefter gå videre til produktion.
  • Hvis vi har et enkelt miljø, der er designet til alle disse aktiviteter, kan det være en ende med problemer og tab af data. For eksempel, når der er sket en hændelse i systemet, kunne vi ikke navigere og finde ud af, hvordan vi kan løse, og det gør det mere kompliceret.

Datamodellering

  • Når kravsamlingen og miljøet er sat op, er det næste at designe, hvordan man tilslutter datakilden, processen og opbevarer i datalageret. Denne teknik kaldes som datamodellering. Det kan være en analyse af objektet og forholdet mellem de andre.
  • Ved design af datalager, designede ingeniørerne, hvordan og hvor dataene skal gemmes. Ved samme lejlighed bør vi også definere den mulige måde at hente dataene fra datavarehuset på. Når kilden er identificeret, kan teamet opbygge logikken og oprette en strukturskemavisning.

Typer af datamodel

Der er tre typer

  • Conceptual
  • Logisk
  • Fysisk

De tre typer datamodel er nævnt nedenfor:

1. Konceptuel: Det siger, HVAD systemet indeholder og det er designet af forretningsarkitekter til at definere omfanget af forretningsstrategi.

2. Logisk: Dette definerer, HVORDAN det logiske kan oprettes i DBMS, det vil blive designet af Business Analyst og Data Architect til at oprette et sæt regler til lagring / hentning af data

3. Fysisk: Dette definerer, HVORDAN systemet kan implementeres.

Brug af Data Warehouse design

At være et godt datalagerdesign kan være tidskrævende, når du henter dataene. Hvert trin skal følge effektivt for at gøre systemet godt. Det vil hjælpe organisationen med at håndtere de komplekse datatyper og forbedre produktiviteten baseret på trendanalysen. Så hvert trin i DWH-arkitekturdesign er vigtigt og mere bevidst i udvælgelsesmetoden. Organisationen træder ind i hver flow efterfølgende og fører til en vellykket implementering af datalageret.

Der er få vigtige applikationsanvendelser af Data Warehouse

1. Bankindustri: De fleste af bankerne bruger datalageret til lagring af en stor mængde transaktionsdata og muligheden for at hente forespørgseldata meget hurtigere. Det kan styres som kundedata, markedstendenser, rapporter, analyse osv.,

2. Finansbranche: Det ligner bank, men det eneste fokus er at forbedre økonomiske ændringer ved at analysere kundedata

3. Regering: I dag administrerer regeringen en masse data online og gemmer i den relationelle database. Hver data har et forhold til hinanden som Aadhaar, PAN er knyttet til mange kilder.

4. Sundhedsvæsen: Sundhedsvæsenets ledere og tjenester så meget information. Det opretholder de kliniske detaljer, kundeoptegnelser og hjælper dem med at forudsige resultaterne, analysere feedback og generere rapporterne.

5. Forsikring: Forsikringsselskab, der primært bruges til datamønstre, kundetendens og vedligeholdelse af poster.

6. Fremstillings- og distributionsindustri: Det er mest brugt i alle brancher til lagring af information om oplysninger og hjælper dem med at forudsige efterspørgsel efter fremstilling og salg. Analyse af den solgte vare, som giver bedre beslutningstagningsteknikker.

7. Detailhandelsservice: Detailhandlere er mellemmanden mellem producenten og kunden. Datavarehouse hjælper dem med promoveringer og tendenser til køb af varer.

8. Telefonbranche: Telefonbrancher administrerer en masse historiske data, som hjælper med til at gøre kundedatatendensen og mål at skubbe reklamekampagner.

Fordele ved datavarehus

  • Leverer forbedret forretningsinformation
  • Sikrer datakvalitet og konsistens
  • Sparer tid og penge
  • Sporer historisk intelligente data
  • Genererer høj ROI

Dis-fordel af Data Warehouse

  • Ekstra rapportarbejde
  • Inflexibilitet og homogenisering af data
  • Bekvemmeligheder ved ejerskab
  • Krav om store mængder ressourcer
  • Skjulte problemer bruger tid

Anbefalede artikler

Dette er en guide til Data Warehouse Design. Her diskuterer vi datalagerdesignteknikken, kravindsamling, miljøopsætning, anvendelser, fordel / Dis-fordel. Du kan også se på den følgende artikel for at lære mere -

  1. Fordelene ved datavarehouse
  2. Implementering af datavarehus
  3. Datavarehusmodellering
  4. Datavarehouse værktøjer
  5. Top 4 forskellige typer datamodeller

Kategori: