Introduktion til Hive Drop-tabel

Nøgleordet “DROP” henviser til sletning. For sletning af data kræver vi, at data er til stede i bikuben.

I Hadoop har vi to funktionaliteter:

  1. Data opbevaring
  2. Databehandling

Til datalagring kommer HDFS (Hadoop Distribueret filsystem) ind i billedet. Når vi siger, at vi har data i bikupetabellen, betyder det to ting:

  1. Data findes i HDFS
  2. Vi har en hive-tabel oprettet over denne HDFS-fil, og vi indlæser den HDFS-fils data i bikubetabellen.

Så dybest set, for at hive drop-tabellen skal have dataene, er datafilen en forudsætning. I denne artikel skal vi se, hvordan man taber tabeller i bikuben, hvad der sker, når tabellen falder, og alle ting, der er relateret til droptabellen i bikuben.

Typer af drop-tabel i Hive

I bikuben er der to typer borde:

  1. Intern tabel eller administreret tabel
  2. Ekstern tabel eller ikke-administreret tabel

Administreret tabel / intern tabel:

  1. I Hive er user / hive / warehouse standardkataloget. Interne tabeller gemmes som standard i dette bibliotek. Vi behøver ikke at angive placeringen manuelt, mens vi opretter tabellen.
  2. "Drop table" -kommando sletter dataene permanent.
  3. Hive administrerer al sikkerhed for administrerede tabeller.

Jeg har en tabel der allerede findes i biblioteket "bruger / hive / lager" kaldet "koder".

For at kontrollere, om den eksisterende tabel er administreret eller ikke administreret, kunne vi bruge kommandoen nedenfor:

Kommandosyntax:

Beskriv formateret tabelnavn;

Produktion:

Lad os se, de data, der er præsenteret i tabelkoder.

Først ved hjælp af hive-kommando-

For det andet ved hjælp af Hue (Hadoop User Experience en Web UI)

Slet kommando: Drop table table_name;

Produktion:

Hvis jeg nu vil vælge dataene fra "koder", vil det give mig en fejl, fordi tabellen er slettet.

Vil heller ikke kunne se denne tabel i det standardmappe, der er

”Bruger / bistade / lager”

Se her,

Ikke-administreret tabel / Ekstern tabel:

  1. Eksterne tabeller, vi er forpligtet til at angive den sti, hvor vi har brug for at gemme den tabel ved hjælp af nøgleordet 'placering' i oprette tabel kommando.

For eksempel:

Opret ekstern tabel TG_s2_json.products

(produktnr. streng, produktnavnstreng, beskrivelsesstreng, aktiv streng, oprettet datostreng, opdateret datostreng) rækkeformat afgrænset felt afsluttet med ', '

LOCATION '/user/data/hive/stg_s2_json.db/products';

  1. Hive sletter kun metadataene. Data er permanente.
  2. Disse tabeller kunne bruges af alle, der har adgang til HDFS, så de er nødt til at administrere sikkerhed på mappeniveau.

For at forstå, hvordan den eksterne tabel tabes, bruger vi tabellen "produkter".

Lad os kontrollere, om tabellen er intern eller ekstern. Igen "beskriver formateret tabelnavn" kommando.

Overhold “limit 10” i den valgte kommando. Tabelprodukter indeholder nedenstående data:

Hvis du vil kontrollere det i farvetone, ser det sådan ud:

Lad os se, hvad der sker, når vi taber denne tabel:

Syntaks:

Drop table table_name;

Produktion:

Nu, hvis du prøver at hente tabellens data, kaster det en fejl.

For det første ved at bruge kommandoen “select” på terminalen, vil det kaste mig en fejl, hvilket betyder, at metadata for den eksterne tabel slettes.

Se fejl her:

For det andet, når man tjekker på datatilstanden, er filen “products.json” stadig til stede i HDFS, hvilket betyder, at dataene er permanente.

Konklusion

Jeg vil gøre det let og give dig nøglepunkter til begge slags borde. Du bestemmer, hvilken type der passer til dine krav.

Intern tabel

Ekstern tabel

Også kaldet "Managed Table"Også kaldet "Ikke-styret tabel"
Ingen grund til at angive placering, Hive standardkatalog administrerer disse dataBrug for at give placering
Sletter tabellens metadata såvel som (Data er midlertidig)Hive efterlader dataene urørt (Data er permanente)
Selve bikuben kontrollerer bordets sikkerhedBrug for at administrere sikkerhed på mappeniveau

Anbefalede artikler

Dette er en guide til Hive Drop Table. Her diskuterer vi introduktionen af ​​Hive Drop Table, Typer af Drop Table i Hive langs Syntax. Du kan også gennemgå vores andre foreslåede artikler for at lære mere -

  1. Hvad er en bikube?
  2. Hive Arkitektur
  3. Hive-kommandoer
  4. Hvad er Oracle-database
  5. Hive ordre af
  6. Hive installation

Kategori: