Introduktion til Star Schema

Stjerneskema er den nemmeste tilgang og dimensionelle model, hvor funktionstabeller, dimensioner og fakta er arrangeret på en organiseret måde, og det anvendes mest i Business Intelligence og Data Warehousing. Et stjerneskema dannes ved at arrangere hver faktum med dens relaterede dimensioner, der ligner en stjerne. En kendsgerning er et uendeligt resultat, såsom salgsoplysninger og login-tællinger. En dimension er indsamlingen af ​​referencer data inklusive fakta, såsom dato, detaljer om produktet og kunder. Stjerneskema er optimeret til store dataforespørgsler i datalagring, online analytisk behandling af datakuber og også ad-hoc forespørgsler.

Sådan opretter du et stjerneskema?

Her vil brugeren oprette stjerneskema ved konvertering af enhed-forholdsmodellen. Enhedsforholdsmodeller er for komplekse til at forklare de funktionelle mængder og attributter, så det forenkles til dimensionelt stjerneskema som følger:

  • Find virksomhedsproceduren fra visning af enhedsforhold og forstå modellen, der kan opdeles i flere dimensionelle modeller. En enhedsrelation består af forretningsdata.
  • Find mange til mange tabeller i enhedsforhold, der forklarer firmaproceduren og konverter dem til dimensionelle model reality-tabeller. Denne tabel indeholder data bestående af faktatabellen og en dimensionstabel med numeriske værdier og unikke nøgleegenskaber.
  • Tanken bag denne proces er at differentiere de udvekslingsbaserede informationstabeller eller de slettede informationstabeller. Så det er nødvendigt at designe mange til adskillige forhold. For eksempel er der i ERP-databasen fakturadetaljer, som er udvekslingstabellen. Detaljer, der opdateres og opdateres, er udvekslingsbaserede tabeller. Sammenligner man begge tabeller, er det afledt, at dataene er virkelig statiske.
  • Realitetstabellen er en repræsentation af en dimensionel model, der viser mange til adskillige netværk mellem endelige målinger. Dette resulterer i, at udenlandske nøgler i virkelighedstabeller deler mange til adskillige, hvilket er et tællbart forhold. det meste af denne tabel falder ind under udvekslingsbaserede tabeller
  • Det sidste trin i design af stjerneskema er at de-normalisere opholdsstabellerne i måttabeller. Den obligatoriske nøgle er at oprette en duplikatnøgle. Denne nøgle er afhængig af reality-tabellen, som hjælper med til bedre forståelse. Find dato og tid fra entitetsforholdsdesign og arkiver dimensionstabellen. Datoer gemmes som dato- og tidsstempler. En datodimensionskolonne repræsenterer år, måned eller dato eller tid

Eksempel: Tidsdimensionaltabellen har TIMEID, Quartername, QuarterNo, MonthName, MonthNo, DayName, DayofMonth, DayOfWeek, som kan være vigtige kriterier for dimensionelle tabeller. Tilsvarende har alle tabeller unikt id og attributter. Forespørgselssprog som SQL kan anvendes til datamining, datavarehus og dataanalyse.

Syntaks af Cube-definition:

Define cube (cube-name)(dimension-list): (measure-list)

Kuber er indsat for at adressere alarmerne på forskellige niveauer, og responstid for at besvare forespørgslen er mindst. Det fås som et forudbygget design og kan bruges i krævede situationer. Oprettelse af stjerneskema er meget let og effektivt at anvende og er også tilpasningsdygtigt. Fuldførelse af faktatabellen og dimensionstabellen er obligatorisk, hvilket igen dannes som stjerne og kan dannes ved hjælp af SQL-forespørgsler eller løbskode. Dette design er lavet til bedre forståelse og let hentning af data.

Egenskaber ved stjerneskema

1. Stjerneskema giver hurtige aggregeringer og beregninger, som samlede solgte varer og indtægter af indtægter opnået ved udgangen af ​​hver måned. Disse detaljer og proces kan filtreres i henhold til kravene ved at indramme passende forespørgsler.

2. Det har kapacitet til at filtrere dataene fra normaliserede data og give behov for datalagring. Den tilknyttede information til den normaliserede tabel er stablet i fanen med flere dimensioner. Der genereres en unik nøgle til hver faktabord for at identificere hver række.

3. Faktabord er måling af specifikke begivenheder inklusive endelige talværdier og består af fremmede nøgler relateret til dimensionstabeller. Denne tabel er indrammet med faktaværdier på atomniveau og tillader at gemme flere poster ad gangen. Der er tre forskellige typer faktabord.

4. Faktatabeller for transaktioner består af data om specifikke begivenheder såsom feriebegivenheder, salgsbegivenheder.

5. Registrering af fakta for givne perioder som kontooplysninger i slutningen af ​​hvert kvartal.

6. Tabeller med hurtig aggregering i en bestemt periode kaldes akkumulerende snapshot-tabeller.

7. Dimensionelle tabeller indeholder detaljerede attributdata, poster, der findes i faktatabellen. Dimensionstabellen kan have forskellige funktioner. Måltabeller bruges hovedsageligt som Tid og dato Dimensionstabel, Produkt- og indkøbsordre Måltabel, Medarbejder- og kontodetaljer Måltabel, Geografi og placeringstimetabell. Disse tabeller er tildelt en enkelt heltal datatype, som er den duplikate primære nøgle.

8. Brugeren kan designe sin tabel i henhold til kravene. For eksempel, hvis han har brug for en salgsdimensionel tabel med produkt- og kundenøgle, dato og tidstast, indtægterne fra indtægtsgenereret nøgle. Hvis forretningsmanden indrammer en produktdimensionel tabel med nøgleattributter såsom farve, dato for den købte vare, promoveringsnøgle og klientnøgle.

Fordele

  • Det er dannet med simpel logik og forespørgsler let at udtrække data fra transaktionsprocessen.
  • Det har en fælles rapporteringslogik, som impliseres dynamisk.
  • Stjerneskema kan tilbyde en stigning i ydelsen til rapportering af applikationer.
  • Stjerneskema designet af fodring af terninger anvendt af Online Transaction Process til at opbygge og få terningerne til at fungere effektivt.

Ulemper

  • Det har høj integritet og en høj de-normaliseret tilstand. Hvis brugeren ikke opdaterer værdierne, vil den komplette proces blive sammenbrudt. Beskyttelsen og sikkerheden er ikke pålidelige op til grænsen. Det er ikke så fleksibelt som en analytisk model og udvider ikke sin effektive støtte til mange relationer.
  • Stjerneskema er implementeret i databasen for at kontrollere hurtigere gendannelse af data. Forespørgslen bruges til at vælge behovet i stedet for at søge i hele databasen. De filtrerede og valgte data kan anvendes i forskellige tilfælde. Derfor er dette stjerneskema en simpel model, der let vedtages.

Anbefalet artikel

Dette er en guide til Hvad er stjerneskema? Her diskuterer vi introduktionen til stjerneskemaet og dets egenskaber sammen med fordele og ulemper. Du kan også gennemgå vores andre foreslåede artikler for at lære mere -

  1. Oversigt over fakta tabel
  2. Star Schema vs Snowflake Schema | Topforskelle
  3. Datavarehusmodellering med typer
  4. AWS-databaser med fordele
  5. AWS-datapipeline

Kategori: