Ab initio Interview Spørgsmål og svar

Så du har endelig fundet dit drømmejob i Ab initio, men spekulerer på, hvordan man knækker Ab initio-interviewet, og hvad der kan være de sandsynlige Ab initio-interviewspørgsmål for 2018. Hvert interview er anderledes, og omfanget af et job er også anderledes. Med dette i tankerne har vi designet de mest almindelige Ab initio Interview Spørgsmål og svar for 2018 for at hjælpe dig med at få succes i dit interview.

Nedenfor er de øverste Ab initio-interviewspørgsmål, der ofte stilles i et interview. Disse interviewspørgsmål er delt i to dele er som følger:

Del 1 - Ab initio-interviewspørgsmål (grundlæggende)

Denne første del dækker basale Ab initio-interviewspørgsmål og svar.

1. Hvad er komponenter eller funktioner tilgængelige i ab initio?

Svar:
De vigtigste komponenter i ab initio er her nedenfor,

KomponentFormål
DedupSådan fjernes dubletter
TilslutteFor at deltage i flere inputdatasæt baseret på en fælles nøgleværdi.
SortereDenne komponent omordner dataene. Det tager sorteringsordren og dumper data til hukommelsen
FilterEnhver betinget relateret fjernelse af data.
ReplikerDette er en komponent hovedsageligt til parallelismen, da en ekstra kopi af data er nyttig, mens andre noder ikke er tilgængelige.
fusionereDenne komponent er at kombinere flere inputdata.

2. Hvilke typer af parallelbehandling er der?

Svar:
Dette er de almindelige Ab initio-interviewspørgsmål, der stilles i et interview. Forskellige typer af parallelbehandling er,

  1. Komponent parallelisme
  2. Data parallelitet
  3. Parallellitet i rørledningen

Komponentparallelitet: En applikation, der har flere komponenter, der kører på systemet samtidig. Men dataene er adskilte. Dette opnås gennem parallel behandling på komponentniveau.

Dataparallelitet: Data er opdelt i segmenter og kører operationerne samtidigt. Denne form for proces opnås ved hjælp af dataparallalismen

Pipeline parallelism: En applikation med flere komponenter, men kører på det samme datasæt. Dette bruger pipeline parallelism.

3. Hvad er den forskellige måde at nå partitionerne på?

Svar:
Der er flere måder at udføre partitionerne på.

SkillevæggeBeskrivelse
EkspressionDatadeling i henhold til datamanipulationssprog.
NøgleGruppering af dataene efter specifikke taster
BelastningsbalanceDynamisk belastningsafbalancering
ProcentSegreger dataene, hvor outputstørrelsen er på fraktionerne på 100
RækkeviddeOpdel dataene jævnt baseret på en nøgle og et interval mellem knudepunkterne
Runde RobinFordeling af data jævnt i blokformat på tværs af outputpartitionerne.

Lad os gå til det næste Ab initio-interview Spørgsmål.

4. Hvad er et multifilsystem?

Svar:
Multifile er et sæt mapper på forskellige noder i en klynge. De har en identisk katalogstruktur. Multifilsystemet fører til en bedre ydelse, da det er parallel behandling, hvor dataene findes på flere diske.

Det oprettes med kontrolpartitionen på den ene knude og datapartitioner på de andre noder for at distribuere behandlingen for at forbedre ydelsen.

5. Forskel mellem Hadoop og Ab initio?

Svar:

HadoopAb initio
Open sourceEgen software
Parallel behandling gennem kortlægninger og reduktionsmaskinerParallel behandlingsarkitektur
Alle forskellige data passer bedst herBedst til traditionelle EDW-implementeringer
Fejltolerance opnåsFejltolerance opnås ikke
MapReduce kontrolleres på alle komponenter eller funktionerKomponenter som sammenføjning, gruppe, sortering er let

udført

Billig som open source og kan afprøve alle sager til forretningsbrug.Dyrt og gældende for en forretningssag med høj værdi på grund af omkostningerne
Løst koblede komponenter, hvor tilpassede funktioner er byggetTæt koblet mellem komponenterne, da de anbefales stærkt baseret på forretningsbrug.

Del 2 - Ab initio-interviewspørgsmål (avanceret)

Lad os nu se på de avancerede Ab initio-interviewspørgsmål.

6. Hvilken form for layout understøtter Ab initio?

Svar:

  • Understøtter serielle og parallelle layouts.
  • Et graflayout understøtter både serielle og parallelle layout ad gangen.
  • Et multifilsystem er et 4-vejs parallelt system
  • En komponent i et grafisk system kan køre 4-vejs parallelt system.

7. Hvad er forholdet mellem Enterprise metadata miljø (EME), det grafiske udviklingsmiljø (GDE) og samarbejdssystemet?

Svar:
CoOperating System: Det fungerer oven på operativsystemet, og dette leveres af ab initio og det er basen for alle Ab Initio processer. Luftkommandoer er en af ​​de funktioner, der kan installeres på forskellige operativsystemer som UNIX, Linux, IBM osv

Dette er følgende funktioner, det giver,
- Administrerer og kører Ab Initio-grafer og styrer ETL-processerne
- Tilvejebringelse af udvidelser
- ETL processer overvågning og fejlfinding
- Metadatastyring og interaktion med EME

GDE: Det er en designkomponent og bruges til at køre ab initio-graferne.

Grafer dannes af komponenterne (foruddefineret eller brugerdefineret) og strømme og parametrene. Det leverer ETL-processen i Ab Initio, der er repræsenteret ved grafer.

Mulighed for at køre, debug proceslogs job og spore eksekveringslogfiler

Enterprise Meta-Environment (EME): Det er et miljø til opbevaring og også metadatastyring (Både forretningsmæssige og tekniske metadata). Metadataene åbnes fra det grafiske udviklingsmiljø og også webbrowseren eller den samarbejdende kommandolinje. Det er ab initio-depot for alle pladsholdere.

Lad os gå til de næste spørgsmål om Ab initio-interview.

8.Hvordan behandles data, og hvad er grundlæggende i denne tilgang?

Svar:
Der er visse aktiviteter, der kræver indsamling af data, og det bedste er, at behandlingen i vid udstrækning afhænger af det samme i mange tilfælde. Inden behandlingen af ​​dataene skal den opholde sig på en pladsholder som et veldefineret lager. Denne opgave afhænger af nogle vigtige faktorer, som de er

1. Indsamling af data
2. Præsentation
3. Finale resultater
4.Analysis
5.Sorting

9. Hvad er forskellen mellem partitionering med key og round robin?

Svar :
Dette er de avancerede Ab initio-interviewspørgsmål, der stilles i et interview. Partition med nøgle
I dette skal vi specificere den nøgle, baseret på hvilken partitionen vil ske. Det resulterer i velafbalancerede data på grund af de nøglebaserede partitioner. Det er nyttigt for nøgleafhængig
parallelitet.
Partition af round robin: I dette fordeler data jævnt i blokstørrelsesbunker partitionerne opdelt på en rækkefølge over outputpartitionen. Det er ikke nøglen
baseret og resultater er velafbalancerede data, især med en blokstørrelse på 1. Det er nyttigt til
registrere uafhængig parallelisme.

10. Hvordan forbedrer du ydelsen på en graf?

Svar :
Der er mange måder, hvordan grafens ydelse kan forbedres.
1) Reducer brugen af ​​flere komponenter i bestemte faser.
2) Brug en raffineret og veldefineret værdi af maksimale kerneværdier til sortering og sammenføjning af komponenter
3) Minimer brugen af ​​regulære ekspressionsfunktioner som re_index i overførselsfunktionerne
4) Minimer sorteret sammenføjningskomponent, og udskift dem om muligt med i / hukommelsesforbindelse i hukommelsen
5) Brug kun de påkrævede felter i sorteringen, omformatér, sammenføj komponenter
6) Brug af fase eller flowbuffer i tilfælde af sammenfletning eller sorteret sammenføjning
7) Brug hash join, hvis de to sæt input er lille ellers er det bedre at vælge den sorterede sammenføjning til den enorme inputstørrelse
8) For større datasæt skal du bedst ikke bruge sendingen som partitioneret
9) Reducer antallet af sorteringskomponenter under behandling.
10) Undgå unødvendig opdeling af data

Anbefalet artikel

Dette har været en guide til Liste over Ab initio-interviewspørgsmål og-svar, så kandidaten let kan nedbryde disse Ab initio-interviewspørgsmål. Her i dette indlæg har vi undersøgt top Ab initio Interview spørgsmål, som ofte stilles i interviews. Du kan også se på de følgende artikler for at lære mere -

  1. Spørgsmål til Android-interview - Top 10 nyttige spørgsmål
  2. Spørgsmål om statistikintervaller | Nyttige og mest stillede
  3. Minitab-interviewspørgsmål - Top 7 nyttige spørgsmål at lære
  4. Splunk Interview Spørgsmål og svar, du burde vide