HBase Arkitektur - Koncept & komponenter - Funktioner & fordele

Indholdsfortegnelse:

Anonim

Introduktion til HBase Architecture

HBase er et open source, distribueret datalagringssystem for nøgleværdier og kolonneorienteret database med høj skriveoutput og tilfældig læseydelse med lav latens. Ved at bruge HBase kan vi udføre online realtidsanalyse. HBase-arkitektur har stærk tilfældig læsbarhed. I HBase afskærmes data fysisk i det, der er kendt som regioner. Hver region hostes af en enkelt regionsserver, og en eller flere regioner er ansvarlige for hver regionserver. HBase Architecture er sammensat af master-slaveservere. Klyngen HBase har en hovednode kaldet HMaster og flere regionservere kaldet HRegion Server (HRegion Server). Der er flere regioner - regioner i hver regional server.

HDFS-opbevaringsmekanisme

I HDFS gemmes data i tabellen som vist ovenfor.

Hver række har en nøgle.

Kolonne: Det er en samling af data, der hører til en kolonnefamilie, og de er inkluderet inde i rækken.

Kolonnefamilie: Hver kolonnefamilie består af en eller flere kolonner.

Hver tabel indeholder en samling af kolonnefamilier. Disse kolonner er ikke en del af skemaet.

HBase har dynamiske kolonner. Forskellige celler kan have forskellige kolonner, fordi kolonnenavne er kodet inde i cellerne

Kolonnekvalifikator: Kolonnenavn kaldes kolonnekvalifikator.

HBase-arkitekturkomponenter

Der er hovedelementer i HBase-arkitekturen: HMaster og Region Server. Regionale HBase Saving Data.

1. HMaster

HMaster-knuden er let og bruges til at tildele regionen til serverregionen.

Der er nogle hovedansvar for Hmaster, som er:

  • Udførelse af nogle administrationsopgaver, herunder indlæsning, balance, oprettelse af data, opdatering, sletning osv.

Ansvarlig for ændringer i skemaet eller ændringer i META-data i henhold til klientansøgningens retning

  • Meget DDL-arbejde på HBase-tabeller håndteres af HMaster.

Nogle af de metoder, som HMaster Interface udsætter, er hovedsageligt. META dataorienterede metoder.

  • Tabel (oprette, fjerne, aktivere, deaktivere, fjerne tabel)
  • KolonneFamilie (tilføj kolonne, rediger kolonne)
  • Region (flyt, tildel)

Klienten kommunikerer både HMaster og ZooKeeper tovejs. Det kontakter HRegion-servere direkte for at læse og skrive operationer. HMaster tildeler regioner til servere i regionen og kontrollerer på sin side regionale serveres sundhedsstatus.

2. Regionserver

Vi kan få en grov idé om regionserveren ved hjælp af et diagram, der er givet nedenfor.

Regionservere fungerer noder, der håndterer kundernes anmodninger om læsning, skrivning, opdatering og sletning. Region Server er let, den kører på alle noder i klyngen Hadoop. Regionserveren har som hovedopgave at gemme dataene i områder og udføre kundeanmodninger. En anden vigtig opgave for HBase Region Server er at bruge Auto-Sharding-metoden til at udføre belastningsbalancering ved dynamisk at distribuere HBase-tabellen, når den bliver for stor efter indsættelse af data.

Flere HRegion-servere kan kontaktes af HMaster og udføre følgende funktioner:

  • Administrering og regionale hostings
  • Opdel automatisk regioner
  • Håndtering af anmodninger om læsning og skrivning
  • Direkte kundekommunikation

3. HDFS

HDFS står for Hadoop Distribueret filsystem. Den gemmer hver fil i flere blokke og replikerer blokke over en Hadoop-klynge for at opretholde fejltolerance. HDFS leverer høj fejltolerance og fungerer med materialer til lave omkostninger. Ved at bruge billig råvarehardware til at tilføje noder til klyngen og processen og gemme den vil give kunden bedre resultater end den eksisterende hardware. HDFS kontakter komponenterne i HBase og gemmer en masse data på en distribueret måde.

4. Zookeeper

Zookeeper er et open source-projekt. HMaster og HRegionServers registrerer sig selv hos ZooKeeper.
Det leverer forskellige tjenester såsom vedligeholdelse af konfigurationsinformation, navngivning, levering af distribueret synkronisering osv. Distribueret synkronisering er processen med at levere koordinationstjenester mellem noder for at få adgang til kørende applikationer. Det har flydende knudepunkter, der repræsenterer regionservere. Master-servere bruger disse noder til at søge efter tilgængelige servere.

Disse noder bruges også til at spore netværkspartitioner og serverfejl. Zookeeper er det interaktive medium mellem klientregionens server. Hvis en klient ønsker at kommunikere med regionserveren, er zookeeper kommunikationsmediet mellem dem.

Sådan initialiseres søgning i HBase Architecture

Som du ved, gemmes META-tabelpladsen af ​​Zookeeper. Hver gang en kunde nærmer sig eller skriver anmodninger om HBase, er proceduren som følger.

Kunden finder ud af ZooKeeper, hvordan man placerer dem META-bordet. Klienten anmoder derefter om den passende rækkenøgle fra META-tabellen for at få adgang til regionens serverplacering. Med META-tabelplacering, cache cachen disse oplysninger. Kunden må ikke henvise til dem META-tabellen, før og hvis området flyttes eller flyttes. Derefter bliver META-serveren anmodet om igen, og cachen opdateres. Som altid spilder ikke kunder tid på at finde Region Server-placeringen på META Server, så det sparer tid og fremskynder søgeprocessen.

Funktioner

Det er let at integrere fra kilde såvel som destinationen med Hadoop.

Det distribuerede lager som HDFS understøttes.

Det har en tilfældig adgangsfunktion ved hjælp af en intern Hash-tabel til at gemme data til hurtigere søgninger i HDFS-filer.

Fordele ved HBase Architecture

  • Disse kan gemme store datasæt
  • Vi kan dele databasen
  • Gigabyte til petabytes omkostningseffektivt
  • Høj tilgængelighed gennem replikation og fiasko

Ulemper ved HBase Architecture

  • SQL-struktur understøtter ikke
  • Understøtter ikke transaktion
  • Kun med nøgle sorteret
  • Problemer med hukommelseshukommelse

Konklusion

HBase er en af ​​NonSql-søjleorienteret distribueret database i apache. Mens man sammenligner med Hadoop eller Hive, klarer HBase sig bedre for at hente færre poster. Så i denne artikel diskuterede vi HBase-arkitektur, og det er vigtige komponenter.

Anbefalede artikler

Dette har været en guide til HBase Architecture. Her diskuterede vi konceptet, komponenter, funktioner, fordele og ulemper. Du kan også gennemgå vores andre foreslåede artikler for at lære mere -

  1. Hvad er Big Data Technology?
  2. HDFS vs HBase, hvilken der er bedre
  3. Hvad er forsamlingssprog?
  4. Introduktion til HTML