Introduktion til Hbase Interview Spørgsmål og svar

HBase er et populært søjleorienteret NoSQL-databasestyringssystem, der kører oven på Hadoop Distribueret filsystem (HDFS). Det er velegnet til sparsomme datasæt, som er almindelige i mange tilfælde af big data-brug.

Her er de top 10 mest stillede 2019 HBase Interview Spørgsmål og svar: Så du har endelig fundet dit drømmejob i HBase, men spekulerer på, hvordan du knækker Hbase-interviewet, og hvad der kan være de sandsynlige spørgsmål om Hbase Interview 2019. Hver samtale er forskellig, og omfanget af et job er også anderledes. Med dette i tankerne har vi designet de mest almindelige Hbase-interviewspørgsmål og svar, så du får succes i dit interview. Disse spørgsmål er opdelt i to dele er som følger:

Del 1 - HBase Interview Spørgsmål (Grundlæggende)

Denne første del dækker grundlæggende HBase Interview Spørgsmål og svar.

1. Hvornår skal du bruge HBase?

Svar:
Hbase er ikke egnet til alle brugssager. Et bedst egnet scenario kan identificeres med følgende kontroller -
i.Datavolumen: Skal have petabytes af data, der skal behandles i et distribueret miljø.
ii.Applikation: HBase er ikke egnet til OLTP (Online Transaction Processing) -systemer, som kræver komplekse multi-statement-transaktioner. Det mangler også kompleks SQL-understøttelse, som er påkrævet til relationel analyse. Det foretrækkes, når du har en enorm mængde data med en lidt anderledes skema.
iii.Cluster-hardware: HBase kører oven på HDFS. Og HDFS fungerer effektivt med et stort antal noder (minimum 5). Så HBase kan kun være et godt valg med god hardwarestøtte.
iv.Not Traditionel RDBMS: Hbase kan ikke understøtte nogen brugssag, der kræver traditionelle funktioner som Deltag i flere tabeller, komplekse SQls med indlejrede eller vinduesfunktioner etc.
v.Quick tilfældig adgang til data: Hvis du har brug for en tilfældig og realtidsadgang til dine data, er HBase en passende kandidat. Det er også en perfekt pasform til opbevaring af store borde med multistrukturerede data.

2. Hvad er forskellen mellem Cassandra og HBase?

Svar:
Både HBase og Cassandra har distribueret NoSQL-database til Big Data fra Hadoop-økosystemet. Begge er bygget til forskellige brugssager.
HBase har en slags master-slave-arkitektur med flere komponenter som Zookeeper, Namenode, HBase Master (Hmaster), og datakoder osv. Cassandra behandler alle knudepunkter som mestere, hvilket betyder, at alle noder er lige og udfører alle funktioner.
HBase er optimeret til læsning, skrivning sker kun med masternoden og har en stærk konsistens for læsning efter skrivning. Cassandra har fremragende læseevne i en række, hvis eventuel konsistens vælges.
Hbase understøtter ikke indbyggede sekundære indekser, Cassandra understøtter sekundære indekser på kolonnefamilier, hvor kolonnenavnet er kendt.
Oprindeligt blev Hbase oprettet i Google, og de kaldte det BigTable. Selv nu er API'er til Bigtable og HBase kompatible. Oprindelsen af ​​Cassandra er fra et papir til DynamoDB, som er NoSQL-database fra AWS.

Lad os gå til de næste HBase-interviewspørgsmål.

3. Hvad er de vigtigste komponenter i Hbase?

Svar:
HBase a har tre vigtige komponenter - HMaster, Region Server og ZooKeeper.
i.HBase Master - HBase-tabeller er opdelt i regioner. Mens opstart Master bestemmer, hvilket område der skal tildeles til hvilken regionserver (Regionserver vil være en knude i en klynge). Det håndterer også tabelmetadatafunktioner som oprette eller ændre skemaet. Denne komponent spiller også en vigtig rolle i bedring af fejl
ii. Regionserver - Som nævnt ovenfor sker det her, at faktiske data skrives og læses. Dette er faktiske klynknoder. Dette vil have regioner med mange tabeller, der afgøres ved at starte og slutte række taster. En typisk regionserver kan tjene op til tusinde regioner
iii.ZooKeeper - ZooKeeper er en klyngekoordinationsramme, der i vid udstrækning bruges i Hadoop økosystem.Zookeeper sporer alle servere (Master- og regionservere), der er til stede i klynge HMaster-kontakter ZooKeeper, og der produceres meddelelser i tilfælde af fejl.

4. Hvad er HBase Bloom-filter?

Svar:
Dette er de almindelige HBase-interviewspørgsmål, der stilles i et interview. Et HBase Bloom-filter er en effektiv mekanisme til at teste, om en butikfil (Når der er skrevet noget til HBase, skrives det først til en lagerhukommelse, når denne memstore når en bestemt størrelse, skylles den til disk til en butikfil) ) indeholder en bestemt række eller række-col-celle. Normalt er den eneste måde at beslutte, om en rækkenøgle er til stede i en butikfil, at kontrollere filens blokindeks, som har startrækketasten for hver blok i butikfilen. Bloom-filtre fungerer som en data-struktur i hukommelsen, som hjælper med at reducere disklæsninger til kun de filer, der sandsynligvis indeholder den række - Ikke alle gemte filer. Så det fungerer som et indeks i hukommelsen for at indikere en sandsynlighed for at finde en række i en bestemt butikfil.

5. Hvad er komprimering? Forklar forskellige typer af det.

Svar:
HBase lagrer alle de modtagne operationer i sit hukommelsesområde i memstore. Når hukommelsesbufferen er fuld, skylles den til disk. Da dette kan skabe mange små filer i HDFS fra tid til anden, kan HBase vælge filer, der skal komprimeres sammen til en større. En komprimering kaldes Mindre, når HBase kun vælger nogle af HFiles, der skal komprimeres, men ikke alle. I en større komprimering vælges alle filer til at blive komprimeret sammen. En større komprimering fungerer som en mindre, bortset fra at slettemarkeringerne kan fjernes, når de er anvendt på alle de relaterede celler, og alle ekstra versioner af den samme celle vil også blive tabt.

Del 2 - HBase-interviewspørgsmål (avanceret)

Lad os nu se på de avancerede HBase Interview Questions.

6.Hvordan HBase version data?

Svar:
Når et stykke data indsættes / opdateres / slettes, opretter HBase en ny version til den kolonne. Faktisk sletning sker kun under komprimering. Hvis en bestemt celle overskredet et antal tilladte versioner, falder ekstra versioner under komprimering

7. Hvad er forskellen mellem at få og scanne?

Svar:
Get vil returnere en kun enkelt række fra Hbase-tabel baseret på den givne rækkenøgle. Scan-kommando returnerer sæt rækker afhængigt af den givne søgeforhold. Normalt er get hurtigere end scanning. Så foretrækker at bruge det, hvis det er muligt.

Lad os gå til de næste HBase-interviewspørgsmål.

8. Hvad sker der, når du sletter en række?

Svar:
På sletningstidspunktet slettes kommandodata ikke fysisk fra filsystemet, men i stedet usynlige ved at indstille en markør. Fysisk sletning sker under en komprimering
Kolonne, version og slettemarkører er tre forskellige typer markører, der markerer sletning af henholdsvis en kolonne, version af kolonne og kolonnefamilie.

9. Forklar forskellen mellem HBase og Hive.

Svar:
Dette er det avancerede HBase-interviewspørgsmål, der stilles i et interview. HBase og Hive er begge helt forskellige Hadoop-baserede teknologier til databehandling. Hive er en relationel-lignende SQL-kompatibel distribueret lagerramme, mens HBase er en NoSQL-nøgleværdi-butik. Hive fungerer som et abstraktionslag på toppen af ​​Hadoop med SQL-understøttelse. Basisadgangsmønsteret er meget begrænset med to primære operationer-get og scan. HBase er ideel til databehandling i realtid, hvor Hive er et ideelt valg til batchdatabehandling.

10. Hvad er Hlog og HFile?

Svar:
HLog er den forudgående logfil, også kendt som WAL, og HFile er den ægte datalagringsfil. Data skrives først til den forudgående logfil og skrives også i MemStore. Når MemStore er fuld, skylles indholdet af MemStore til disken i HFiles.

Anbefalet artikel

Dette har været en guide til Liste over Hbase-interviewspørgsmål og-svar, så kandidaten let kan nedbryde disse Hbase-interviewspørgsmål. Du kan også se på de følgende artikler for at lære mere -

  1. Nyttige spørgsmål til gruppeinterview
  2. Vigtige grundlæggende interviewtip
  3. Væsentlige trin til forberedelse af interview
  4. Interviewspørgsmål for at stille en finansieringskandidat