Introduktion til ETL-interviewspørgsmål og svar

ETL står for Extract-Transform-Load. Det er et systemfundament for datavarehus, hvor dataene udvindes fra de forskellige kilder, og derefter transformeres dataene, hvor dataene håndhæves eller behandles for at gøre kvaliteten, konsistensen af ​​dataene i et passende præsentationsformat og derefter til sidst data indlæses i Data Warehouse i præsentationsformat, så det kan hjælpe slutbrugeren med at få oplysningerne let og kan træffe beslutning.

Nedenfor er de øverste ETL-interviewspørgsmål i 2019, der ofte stilles i et interview

Hvis du leder efter et job, der er relateret til ETL, er du nødt til at forberede dig til ETL Interviewspørgsmål i 2019. Selvom hvert interview er anderledes, og omfanget af et job også er anderledes, kan vi hjælpe dig med de bedste ETL-interviewspørgsmål og -svar, som vil hjælpe dig med at tage springet og få din succes i dit interview.

Del 1 - ETL-interviewspørgsmål (grundlæggende)

Denne første del dækker grundlæggende ETL-interviewspørgsmål og svar

1. Udvid ETL-systemet i datavarehuset? Forklare

Svar:
Extract-Transform-Load (ETL) -system er grundlaget for datalageret. Et korrekt designet ETL-system udtrækker data fra kildesystemerne, håndhæver datakvalitet og konsistensstandarder, bekræfter data, så separate kilder kan bruges sammen og endelig leverer data i et præsentationsklar format, så applikationsudviklere kan bygge applikationer og slutbrugere kan træffe beslutninger.

2. Betydningen af ​​ETL-systemet i datavarehuset?

Svar :
Fjerner fejl og korrigerer manglende data. Det giver dokumenterede mål for tillid til data. Fanger strømmen af ​​tværnationale data til opbevaring. Justerer data fra flere kilder, der skal bruges sammen. Strukturerer data, der kan bruges af slutbrugerværktøjer.

3. Hvad er den daglige proces i ETL-systemet?

Svar :
Byg udviklings- / test / produktionssæt af ETL-processer. Forstå afvekslingen af ​​forskellige bagværelsedatastrukturer, herunder flade filer, normaliserede skemaer, XML-skemaer og stjernetilknyttede (dimensionelle) skemaer. Analyser og udpak kildedata. Byg et omfattende datasystem til rengøring af data. Strukturer data i dimensionelle skemaer for den mest effektive levering til slutbrugere, forretningsgenstandsværktøjer, data-mining-værktøjer, OLAP-terninger og analytiske applikationer. Lever data effektivt både til stærkt centraliserede og dybt distribuerede datalager ved hjælp af de samme teknikker. Indstil den overordnede ETL-proces for optimal ydelse.

Lad os gå til de næste ETL-interviewspørgsmål.

4. Dataformater i ETL-systemet?

Svar :
Der er forskellige dataformater i ETL, nogle af dem er flade filer, XML-datasæt, uafhængige DBMS-arbejdstabeller, normaliserede enheds- / relation (E / R) -skemaer og dimensionelle datamodeller.

5. Dataprofilering i ETL-system?

Svar :
Dataprofilering er en systematisk undersøgelse af kvaliteten, omfanget og konteksten af ​​en datakilde for at tillade et ETL-system at blive bygget. På en ekstrem måde kræver en meget ren datakilde, der er godt vedligeholdt, inden den ankommer til datalageret, minimal transformation og menneskelig indgriben for at indlæse direkte i de endelige dimensionstabeller og faktaborde.

6. Hvad er en ETL-validator?

Svar :
ETL Validator er et datatestningsværktøj, der i høj grad forenkler testen af ​​dataintegration, datavarehus og datamigreringsprojekter. Det gør brug af vores patenterede ELV-arkitektur til at udtrække, indlæse og validere data fra datakilder såsom databaser, flade filer, XML, Hadoop og BI-systemer.

Del 2 - ETL-interviewspørgsmål (avanceret)

Lad os nu se på de avancerede ETL-interviewspørgsmål.

7. Hvad er operationerne i ETL-systemet?

Svar :
De følgende tre operationer: Ekstraherer dataene fra dit transnationale system, der kan være en Oracle, Microsoft eller en hvilken som helst anden relationel database. Transformerer dataene ved at udføre datarensningsoperationer. En belastning er en proces til skrivning af dataene i måldatabasen.

8. Navngiv nogle af de ETL-værktøjer, der oftest bruges på markedet?

Svar:
Der er forskellige ETL-værktøjer, der bruges på markedet, men nogle af de fugtigt foretrukne ETL-værktøjer
• Oracle Warehouse Builder (OWB)
• SAP Data Services.
• IBM Infosphere Information Server.
• SAS Data Management.
• Power Center Informatica.
• Elixir repertoire til data ETL.
• Data Migrator (IBI)
• SQL Server Integration Services (SSIS)

9. Hvad er ETL-teamets roller og ansvar?

Svar:
ETL-teamets roller på det højeste niveau er at opbygge bagværelset i datalageret.
• Lever data mest effektivt til slutbrugerværktøjer
• Tilføje værdi til data i rengørings- og overensstemmelsestrinnene
• Beskyt og dokumenter linjen til data
• Uddrag af data fra de originale kilder
• Kvalitetssikring og rengøring af data
• Konfigurering af etiketter og målinger i de data, der skal opnås
• konsistens på tværs af de originale kilder
• Levering af data i et fysisk format, der kan bruges af forespørgselsværktøjer,
• Rapportforfattere og betjeningspaneler.

Lad os gå til de næste ETL-interviewspørgsmål.

10. Hvilken rolle har konsekvensanalyse i ETL-systemet?

Svar:
Effektanalyse undersøger metadataene, der er knyttet til et objekt (i dette tilfælde en tabel eller kolonne) og bestemmer, hvad der påvirkes af en ændring i dets struktur eller indhold. Ændring af data-iscenesættelsesobjekter kan ødelægge processer, der er afgørende for korrekt indlæsning af datalageret. Tilladelse af ad-hoc-ændringer til datastaserende objekter er skadelig for succes med dit projekt. Når en tabel er oprettet i iscenesættelsesområdet, skal du udføre en konsekvensanalyse, inden der foretages ændringer i den. Mange ETL-værktøjsudbydere leverer effektanalysefunktionalitet, men denne funktionalitet overses ofte under ETL-produktets proof-of-concept, fordi det er en bagværelsesfunktion og
Ikke rigtig vigtigt, indtil datalageret er i gang og begynder at udvikle sig.

11. Hvordan behandler du den faste fil med fast længde?

Svar:
Et fillayout med fast længde skal indeholde filnavnet, hvor feltet begynder; dens længde; og dens datatype (normalt tekst eller nummer). Undertiden leveres slutpositionen. Hvis det ikke er det, skal du beregne slutpositionen for hvert felt baseret på dets startposition og længde, hvis det kræves af dit ETL-værktøj. I de fleste ETL-værktøjer skal du sandsynligvis indtaste fillayoutet for den flade fil manuelt. Når layoutet er indtastet, husker værktøjet layoutet og forventer det samme layout, hver gang det interagerer med den faktiske flade fil. Hvis fillayouten ændres, eller dataene forskydes fra dets tildelte positioner, skal ETL-processen programmeres til at mislykkes. Ved behandling af faste filer med fast længde skal du prøve at validere, at placeringen af ​​dataene i filen er nøjagtige. En hurtig kontrol for at validere positionerne er at teste ethvert felt for dato (eller klokkeslæt) for at sikre, at det er en gyldig dato. Hvis positionerne flyttes, indeholder datofeltet sandsynligvis alfa-tegn eller ulogiske tal. Andre felter med meget specifikke domæner kan testes på samme måde. XML tilbyder mere konkrete valideringsevner. Hvis datavalidering eller konsistens er et problem, kan du prøve at overbevise dataleverandøren om at levere dataene i XML-format.

12.Hvorfor realtids-ETL i datavarehus?

Svar:
Datavarehus var nødvendigt for at give et urokkeligt sæt data til forretningsbeslutnings beslutningstagere, hvilket giver et pålideligt informationsgulv, hvorpå de skal stå. Til up-to-the-moment rapportering mod en blinkende database blev forretningsbrugere rettet mod produktionsapplikationer, der driver virksomheden. Derfor var brugere nødt til at gå til datavarehuset for at få et historisk billede af, hvad der skete i branchen som i går og måtte se på mange OLTP-systemer for at få et billede af, hvad der skete i dag. Forretningsbrugere accepterede aldrig fuldstændigt dette skel. Datavarehus har naturligvis absolut brug for konstante kundeinformationsstrømme fra en operation, men i stigende grad operative systemer er afhængige af datalagerberigelse af kundeoplysninger også. Derfor er det forudsigeligt, at organisationer er begyndt at udforske arkitektoniske alternativer, der kan understøtte mere generaliserede integrationsscenarier, der flytter operationelle data mellem applikationer og samtidig ind og ud af lageret med stadig større hastighed.

Anbefalede artikler

Dette har været en guide til Liste over ETL-interviewspørgsmål og-svar, så kandidaten let kan nedbryde disse ETL-interviewspørgsmål. Du kan også se på de følgende artikler for at lære mere -

  1. Azure Paas vs Iaas - Funktioner
  2. 9 Fantastiske kortReducer interviewspørgsmål og svar
  3. Top 11 mest nyttige RDBMS-interviewspørgsmål og svar
  4. 10 mest fantastiske PHP-interviewspørgsmål til erfarne
  5. Kend de top 5 nyttige DBA-interviewspørgsmål og svar

Kategori: