Ab initio Interview Spørgsmål og svar
Så du har endelig fundet dit drømmejob i Ab initio, men spekulerer på, hvordan man knækker Ab initio-interviewet, og hvad der kan være de sandsynlige Ab initio-interviewspørgsmål for 2018. Hvert interview er anderledes, og omfanget af et job er også anderledes. Med dette i tankerne har vi designet de mest almindelige Ab initio Interview Spørgsmål og svar for 2018 for at hjælpe dig med at få succes i dit interview.Nedenfor er de øverste Ab initio-interviewspørgsmål, der ofte stilles i et interview. Disse interviewspørgsmål er delt i to dele er som følger:
Del 1 - Ab initio-interviewspørgsmål (grundlæggende)
Denne første del dækker basale Ab initio-interviewspørgsmål og svar.
1. Hvad er komponenter eller funktioner tilgængelige i ab initio?
Svar:
De vigtigste komponenter i ab initio er her nedenfor,
Komponent | Formål |
Dedup | Sådan fjernes dubletter |
Tilslutte | For at deltage i flere inputdatasæt baseret på en fælles nøgleværdi. |
Sortere | Denne komponent omordner dataene. Det tager sorteringsordren og dumper data til hukommelsen |
Filter | Enhver betinget relateret fjernelse af data. |
Repliker | Dette er en komponent hovedsageligt til parallelismen, da en ekstra kopi af data er nyttig, mens andre noder ikke er tilgængelige. |
fusionere | Denne komponent er at kombinere flere inputdata. |
2. Hvilke typer af parallelbehandling er der?
Svar:
Dette er de almindelige Ab initio-interviewspørgsmål, der stilles i et interview. Forskellige typer af parallelbehandling er,
- Komponent parallelisme
- Data parallelitet
- Parallellitet i rørledningen
Komponentparallelitet: En applikation, der har flere komponenter, der kører på systemet samtidig. Men dataene er adskilte. Dette opnås gennem parallel behandling på komponentniveau.
Dataparallelitet: Data er opdelt i segmenter og kører operationerne samtidigt. Denne form for proces opnås ved hjælp af dataparallalismen
Pipeline parallelism: En applikation med flere komponenter, men kører på det samme datasæt. Dette bruger pipeline parallelism.
3. Hvad er den forskellige måde at nå partitionerne på?
Svar:
Der er flere måder at udføre partitionerne på.
Skillevægge | Beskrivelse |
Ekspression | Datadeling i henhold til datamanipulationssprog. |
Nøgle | Gruppering af dataene efter specifikke taster |
Belastningsbalance | Dynamisk belastningsafbalancering |
Procent | Segreger dataene, hvor outputstørrelsen er på fraktionerne på 100 |
Rækkevidde | Opdel dataene jævnt baseret på en nøgle og et interval mellem knudepunkterne |
Runde Robin | Fordeling af data jævnt i blokformat på tværs af outputpartitionerne. |
Lad os gå til det næste Ab initio-interview Spørgsmål.
4. Hvad er et multifilsystem?
Svar:
Multifile er et sæt mapper på forskellige noder i en klynge. De har en identisk katalogstruktur. Multifilsystemet fører til en bedre ydelse, da det er parallel behandling, hvor dataene findes på flere diske.
Det oprettes med kontrolpartitionen på den ene knude og datapartitioner på de andre noder for at distribuere behandlingen for at forbedre ydelsen.
5. Forskel mellem Hadoop og Ab initio?
Svar:
Hadoop | Ab initio |
Open source | Egen software |
Parallel behandling gennem kortlægninger og reduktionsmaskiner | Parallel behandlingsarkitektur |
Alle forskellige data passer bedst her | Bedst til traditionelle EDW-implementeringer |
Fejltolerance opnås | Fejltolerance opnås ikke |
MapReduce kontrolleres på alle komponenter eller funktioner | Komponenter som sammenføjning, gruppe, sortering er let
udført |
Billig som open source og kan afprøve alle sager til forretningsbrug. | Dyrt og gældende for en forretningssag med høj værdi på grund af omkostningerne |
Løst koblede komponenter, hvor tilpassede funktioner er bygget | Tæt koblet mellem komponenterne, da de anbefales stærkt baseret på forretningsbrug. |
Del 2 - Ab initio-interviewspørgsmål (avanceret)
Lad os nu se på de avancerede Ab initio-interviewspørgsmål.
6. Hvilken form for layout understøtter Ab initio?
Svar:
- Understøtter serielle og parallelle layouts.
- Et graflayout understøtter både serielle og parallelle layout ad gangen.
- Et multifilsystem er et 4-vejs parallelt system
- En komponent i et grafisk system kan køre 4-vejs parallelt system.
7. Hvad er forholdet mellem Enterprise metadata miljø (EME), det grafiske udviklingsmiljø (GDE) og samarbejdssystemet?
Svar:
CoOperating System: Det fungerer oven på operativsystemet, og dette leveres af ab initio og det er basen for alle Ab Initio processer. Luftkommandoer er en af de funktioner, der kan installeres på forskellige operativsystemer som UNIX, Linux, IBM osv
Dette er følgende funktioner, det giver,
- Administrerer og kører Ab Initio-grafer og styrer ETL-processerne
- Tilvejebringelse af udvidelser
- ETL processer overvågning og fejlfinding
- Metadatastyring og interaktion med EME
GDE: Det er en designkomponent og bruges til at køre ab initio-graferne.
Grafer dannes af komponenterne (foruddefineret eller brugerdefineret) og strømme og parametrene. Det leverer ETL-processen i Ab Initio, der er repræsenteret ved grafer.
Mulighed for at køre, debug proceslogs job og spore eksekveringslogfiler
Enterprise Meta-Environment (EME): Det er et miljø til opbevaring og også metadatastyring (Både forretningsmæssige og tekniske metadata). Metadataene åbnes fra det grafiske udviklingsmiljø og også webbrowseren eller den samarbejdende kommandolinje. Det er ab initio-depot for alle pladsholdere.
Lad os gå til de næste spørgsmål om Ab initio-interview.
8.Hvordan behandles data, og hvad er grundlæggende i denne tilgang?
Svar:
Der er visse aktiviteter, der kræver indsamling af data, og det bedste er, at behandlingen i vid udstrækning afhænger af det samme i mange tilfælde. Inden behandlingen af dataene skal den opholde sig på en pladsholder som et veldefineret lager. Denne opgave afhænger af nogle vigtige faktorer, som de er
1. Indsamling af data
2. Præsentation
3. Finale resultater
4.Analysis
5.Sorting
9. Hvad er forskellen mellem partitionering med key og round robin?
Svar :
Dette er de avancerede Ab initio-interviewspørgsmål, der stilles i et interview. Partition med nøgle
I dette skal vi specificere den nøgle, baseret på hvilken partitionen vil ske. Det resulterer i velafbalancerede data på grund af de nøglebaserede partitioner. Det er nyttigt for nøgleafhængig
parallelitet.
Partition af round robin: I dette fordeler data jævnt i blokstørrelsesbunker partitionerne opdelt på en rækkefølge over outputpartitionen. Det er ikke nøglen
baseret og resultater er velafbalancerede data, især med en blokstørrelse på 1. Det er nyttigt til
registrere uafhængig parallelisme.
10. Hvordan forbedrer du ydelsen på en graf?
Svar :
Der er mange måder, hvordan grafens ydelse kan forbedres.
1) Reducer brugen af flere komponenter i bestemte faser.
2) Brug en raffineret og veldefineret værdi af maksimale kerneværdier til sortering og sammenføjning af komponenter
3) Minimer brugen af regulære ekspressionsfunktioner som re_index i overførselsfunktionerne
4) Minimer sorteret sammenføjningskomponent, og udskift dem om muligt med i / hukommelsesforbindelse i hukommelsen
5) Brug kun de påkrævede felter i sorteringen, omformatér, sammenføj komponenter
6) Brug af fase eller flowbuffer i tilfælde af sammenfletning eller sorteret sammenføjning
7) Brug hash join, hvis de to sæt input er lille ellers er det bedre at vælge den sorterede sammenføjning til den enorme inputstørrelse
8) For større datasæt skal du bedst ikke bruge sendingen som partitioneret
9) Reducer antallet af sorteringskomponenter under behandling.
10) Undgå unødvendig opdeling af data
Anbefalet artikel
Dette har været en guide til Liste over Ab initio-interviewspørgsmål og-svar, så kandidaten let kan nedbryde disse Ab initio-interviewspørgsmål. Her i dette indlæg har vi undersøgt top Ab initio Interview spørgsmål, som ofte stilles i interviews. Du kan også se på de følgende artikler for at lære mere -
- Spørgsmål til Android-interview - Top 10 nyttige spørgsmål
- Spørgsmål om statistikintervaller | Nyttige og mest stillede
- Minitab-interviewspørgsmål - Top 7 nyttige spørgsmål at lære
- Splunk Interview Spørgsmål og svar, du burde vide