Hvad er datamodellen?

Fortolkning og dokumentation af eksisterende softwaredesign og udviklingsprocedurer og transaktioner kaldes informationsmodellering. Metoderne og instrumenterne til informationsmodellering forenkler de komplekse systemdesign for at gøre det enklere for re-engineering at betjene information. Det bruges til at designe et informationslager logisk og fysisk. I dette emne skal vi lære om datavarehusmodellering.

Behov for modellering af datavarehus

  1. Indsamling af forretningskrav
  2. Forbedring af databasens ydelse
  3. Tilvejebringer dokumentation af kilden og målsystemet

1. Indsamling af forretningskrav

Et datavarehus er typisk designet til at bestemme de enheder, der kræves til datavarehuset, og de kendsgerninger, der skal registreres med dataarkitekterne og forretningsbrugere. Dette første design har en masse iteration, inden den endelige model besluttes.

Vi er nødt til at overvinde de fremherskende ulemper i designfasen på dette tidspunkt. Da et eksisterende system implementerer et datavarehus, integrerer arkitekter undertiden en stor del af det gamle system i det nye design, hvilket sparer tid eller afsløring.

Den logiske model fanger effektivt virksomhedens behov og fungerer som et fundament for den fysiske model.

2. Forbedring af databasens ydelse

Kontrol af effektivitet er en væsentlig egenskab ved en datalager. I et datalager involveres enorm information, så det er meget vigtigt at bruge et datamodelprodukt til metadata og datastyring, der bruges af BI-forbrugere.

Den fysiske model tilføjer indeksering for at optimere databasens effektivitet. Ordningerne ændres også undertiden. Hvis et stjerneskema for eksempel lover hurtigere gendannelse af data, kan det skifte til et snefnugskema

3. Tilvejebringer dokumentation af kildesystemet og målsystemet

Ved udvikling af et ETL-system er de fysiske og logiske modeller for kildesystemet og målsystemerne meget vigtige at kontrollere.

Denne dokumentation tilbydes ved informationsmodellering som reference for fremtiden.

Konceptuel datamodel

Den højeste sammenhæng mellem de forskellige enheder bestemmes af en konceptuel datamodel.

Det er det første skridt hen imod oprettelse af en top-down datamodel, der repræsenterer forretningsorganisationens nøjagtige præsentation.

Designer den samlede databasestruktur og viser emneområderne

Omfatter enhedernes art og interaktion. Symboliske notationer (IDEF1X eller IE) repræsenterer forbindelsen mellem emnefelterne. I en informationsmodel viser kardinalitet en til en eller mange forhold

Model af forholdsdata

Modellering af relative oplysninger i transaktionsorienterede OLTP-skemaer bruges. En relationel datamodel har betydelige funktioner:

  • Brug af nøgle
  • Dataredundans
  • Forholdet mellem data

Brug af nøgle

Hovednøglen i en tabel er nøglen. Det bruges som en enkelt identifikation. En kolonne, der ikke er nul, er en primær nøgle. Til hovednøglen bruges den fremmede nøgle. De forbinder oplysningerne fra en tabel til en anden tabel og opretter forbindelse.

Dataredundans

Forholdsinformationsmodellen anvender informationsintegritetslove

Dataredundans elimineres. Et stykke information indsamles ikke gentagne gange. Dette sikrer konsistensen af ​​dataene og begrænset datalagring

Forholdet mellem data

Alle data gemmes i tabeller, og hvert forhold har kolonner og rækker.

En overskrift og et organ skal være på bordet. Overskriften er tabellisten med kolonner, og tabellen består af rækkerne. Tuplen er den enkeltværdi, der er produceret ved et kryds og en række kryds.

Multidimensionel datamodel

En organisation, der afspejler en virksomheds betydelige enheder og forbindelsen mellem dem, er et logisk perspektiv af en multidimensionel datamodel. Databaserne og tabellerne er ikke begrænset til en naturlig database. ER-diagrammerne er ikke afbildet.

  • Egenskaber
  • Fakta
  • Dimension

en. Dimension

  1. Et aspekt er en dataindsamling, der består af individuelle informationskomponenter, der ikke overlapper hinanden
  2. Du kan indstille, gruppere og filtrere oplysninger til visning og gennemsøgning af slutbrugere.

b. Fakta

  1. En tabel med kolonner, der bruges til at svare på firmaproblemer af numeriske grunde.
  2. Foranstaltningerne er additive, semi-additive og non-additive

c. Egenskaber

  1. De abstrakte betingelser er designet til at lette opsummeringen af ​​oplysninger i en undersøgelse
  2. De kan også beskrives som kolonneoverskrifter, som ikke er inkluderet i en rapportberegning.

Fordele ved den dimensionelle model

  1. Standardisering af dimensioner gør det nemt at rapportere på tværs af forretningsområder.
  2. Dimensionalt også til lagring af data for at gøre det lettere at hente data fra dataene, når dataene er gemt i databasen.
  3. Virksomheden er meget forståelig for den dimensionelle model. Denne model er baseret på virksomhedsbetingelser, så virksomheden forstår betydningen af ​​hver virkelighed, aspekt eller funktion.
  4. For hurtig informationsspørgsmål deformaliseres og optimeres dimensionelle modeller. Mange relationsdatabaseplattformer anerkender denne model og optimerer forespørgselspræstationsplaner.
  5. Dimensionelle modeller kan rumme ændringer bekvemt. Tabeller med dimensioner kan omfatte yderligere kolonner uden at have indflydelse på brugen af ​​disse tabeller af de nuværende apps til apps for virksomheden.

Modellering af bedste praksis

Inden datamodellen begynder, skal der udføres en komplet analyse af kundefirmaens behov. Det bør være ekstremt vigtigt at møde kunderne for at diskutere krav og teknikker til informationsmodellering og at få virksomhedsfagspecialister til straks at bekræfte det.

Virksomheden skal forstå datamodellen, hvad enten det er i et grafisk / metadataformat eller som forretningsregler for tekster.

Anbefalede artikler

Dette er en guide til Data Warehouse Modeling. Her diskuterer vi datamodellen, hvorfor er det nødvendigt i datalagring sammen med dets fordele såvel som typer modeller. Du kan også se på den følgende artikel for at lære mere -

  1. Datavarehouse værktøjer
  2. Typer af datavarehus
  3. Dataanalyseværktøjer
  4. Data Science værktøjer
  5. Oracle Data Warehousing

Kategori: