Introduktion til dimensionstabel
En dimensionstabel findes i stjerne- eller snefnugsskemaet. Dimensionstabeller 'hjælper med at beskrive dimensioner, dvs. dimensionværdier, attributter og taster. Det er generelt lille i størrelse. Størrelsen kan variere fra flere til tusinde rækker. Den beskriver objekter, der findes i faktabordet. Dimensionstabel refererer til indsamlingen eller gruppen af oplysninger, der er relateret til enhver målbar begivenhed. De danner en kerne til dimensionel modellering. Den indeholder en søjle, der kan betragtes som en primær nøglekolonne, der hjælper med til unikt at identificere hver dimensioner række eller post. Det samles med faktaborde gennem denne nøgle. Når det oprettes en nøgle kaldet surrogatnøgle, der genereres af systemet, bruges til unikt at identificere rækkerne i dimensionen.
Hvorfor skal vi bruge?
- Dens hjælp til at gemme historien om informationen eller dimensionelle oplysninger.
- Det er let at forstå end de normaliserede tabeller.
- Flere kolonner kan føjes til tabellen uden at påvirke de eksisterende applikationer, der bruger dem.
Typer af dimensionstabel
Følgende er de forskellige typer dimensionstabel:
1. SCD (langsomt skiftende dimensioner)
Dimensionattributterne, der har tendens til at ændre sig langsomt med tiden i stedet for at ændre sig i et regelmæssigt tidsinterval kaldes langsomt skiftende dimensioner. For eksempel ændres adresse- og telefonnummer, men ikke regelmæssigt. Lad os se et eksempel på en mand, der rejser til forskellige lande, så han er nødt til at ændre sin adresse i henhold til dette land. Dette kan gøres på tre måder:
Type1: Overskriv den forrige værdi. Denne metode er let at anvende og hjælper med at spare plads og dermed reducere omkostningerne. Men historien går tabt i dette scenarie.
Tabellen før ændringen
ID | NAVN | LAND | NATIONALITET |
1001 | Rachel | Indien | indiske |
Tabel efter ændringen
ID | NAVN | LAND | NATIONALITET |
1001 | Rachel | Kina | indiske |
Type2: Tilføj en ny række med den nye værdi. I denne metode gemmes historikken og kan bruges når det er nødvendigt. Men det tager stor plads og øger dermed omkostningerne.
Tabellen før ændringen
ID | NAVN | LAND | NATIONALITET |
1001 | Rachel | Indien | indiske |
Tabel efter ændringen
ID | NAVN | LAND | NATIONALITET |
1001 | Rachel | Indien | indiske |
1001 | Rachel | Kina | indiske |
Type3: Tilføj en ny kolonne. Det er den bedste tilgang, da historien let kan opretholdes.
Tabellen før Skift
ID | NAVN | LAND | NATIONALITET |
1001 | Rachel | Indien | indiske |
Tabel efter ændring
ID | NAVN | LAND | GAMMEL LAND | NATIONALITET |
1001 | Rachel | Kina | Indien | indiske |
2. Overensstemmende dimension
Denne dimension deles mellem flere emneområder eller datamarkter. Samme kan bruges i forskellige projekter uden ændringer udført i det samme. Dette bruges til at opretholde konsistensen. Konformede dimensioner er dem, der er nøjagtigt ens eller en ordentlig delmængde af enhver anden dimension.
3. Uønsket dimension
En uønsket dimension er en gruppe af attributter med lav kardinalitet. Det indeholder forskellige eller forskellige attributter, der ikke er relateret til nogen anden attribut. Disse kan bruges til at implementere RCD (hurtigt skiftende dimension) såsom flag, vægt osv.
4. Degenereret dimension
Det attributter, der er gemt i selve faktortabellen og ikke som en separat dimensionstabel, disse attributter kaldes degenereret dimension. For f.eks. Billetnummer, fakturanummer, transaktionsnummer osv.
5. Rollespilsdimension
Det at have flere forhold til faktatabellen kaldes rollespilsdimension. Med andre ord er det, når den samme dimensionstast med alle tilhørende attributter er knyttet til mange fremmede nøglepresenter i faktatabellen. Det kan opfylde flere formål inden for den samme eksisterende database.
Hvordan fungerer det i datavarehuset?
- Dimension henviser til indsamlingen eller gruppen af oplysninger, der er relateret til en målbar begivenhed. De danner en kerne til dimensionel modellering. Når der oprettes en dimension, genereres en struktur for et projekt. Oprettet kan bruges på tværs af forskellige projekter, og det afspejler ideen om genanvendelighed. Når der foretages en ændring i nogen af det, afspejles dens virkning kun i den pågældende tabel. Når en rapport skal oprettes, kan brugeren tage dataene fra, da dimensionstabeller indeholder alle de nødvendige oplysninger.
- Ved udførelse af dimensionsmodellering indlæses atomdataene i dimensionelle strukturer. Derefter genereres eller opbygges dimensionelle modeller omkring forretningsprocesserne. Under oprettelsen skal det huskes at filtrere domæneværdier og gemme etiketter for rapporterne i disse tabeller. Det skal sikres, at surrogatnøgle (Systemgenereret nøgle, der bruges under oprettelsen af en dimensionstabel, som hjælper med til unikt at identificere hver post, der findes i dimensionstabellen.) Skal bruges, mens dimensionstabellen oprettes. Det skal denormaliseres, fordi deres opgave er at lade brugeren læse og analysere dataene let så effektivt i stedet for at styre transaktioner. Dimensionens hovedmål er at give filtrering, udføre gruppering og effektiv mærkning.
Fordele
Nedenfor er de forskellige fordele ved dimensionstabellen:
- Det har en enkel struktur.
- Det er let at analysere og forstå.
- Denormaliserede data.
- Hjælper med at bevare historisk information for enhver dimension.
- Let at hente data fra det.
- Hurtig at oprette og implementere.
- Det giver konteksten omkring enhver forretningsproces.
Konklusion - Dimensionstabel
Dette er en integreret del af datamodellering. Det bruges i stjerne- eller snefnugsskema. Det indeholder dimensioner, nøgler og værdier for attributterne i faktatabellen. Der er forskellige typer, som bruges i forskellige scenarier.
Anbefalede artikler
Dette er en guide til dimensionstabel. Her har vi drøftet Typer, Hvordan fungerer Dimension Table i datavarehuset med Fordele. Du kan også gennemgå vores andre relaterede artikler for at lære mere-
- Faktabord vs dimensionstabel
- Hvad er fakta tabel?
- Hvad er Tableau?
- Datas blanding i Tableau