Vytvoriť úľ, zmeniť ho & Vypustiť stôl

Obsah:

Anonim

V tomto výučbe je možné pozorovať operácie s tabuľkami, ako napríklad vytváranie, zmeny a rušenie tabuliek v úli.

Na snímke obrazovky nižšie vytvárame tabuľku so stĺpcami a meníme názov tabuľky.

1. Vytvorenie tabuľky guru_sample s dvoma názvami stĺpcov ako „empid“ a „empname“

2. Zobrazenie tabuliek prítomných v databáze guru99

3. Guru_sample zobrazujúci sa pod tabuľkami

4. Zmena tabuľky „guru_sample“ ako „guru_sampleNew“

5. Opäť, keď vykonáte príkaz „show“, zobrazí sa nový názov Guru_sampleNew

Dropping table guru_sampleNew:

Typy tabuliek a ich použitie:

Príchod k tabuľkám je to rovnako ako spôsob, ktorý vytvárame v tradičných relačných databázach. Na tabuľkách je možné vykonávať funkcie, ako je filtrovanie, spájanie.

Úľ sa zaoberá dvoma typmi štruktúr tabuliek, ako sú interné a externé tabuľky, v závislosti od načítania a návrhu schémy v úli.

Interné stoly

  • Interná tabuľka je svojou povahou pevne spojená. V tomto type tabuľky najskôr musíme vytvoriť tabuľku a načítať údaje.
  • Túto môžeme nazvať ako údaje o schéme .
  • Zrušením tejto tabuľky budú odstránené údaje aj schéma.
  • Uložené umiestnenie tejto tabuľky bude na / user / hive / warehouse.

Kedy zvoliť internú tabuľku:

  • Ak je spracovanie údajov k dispozícii v lokálnom súborovom systéme
  • Ak chceme, aby program Hive spravoval celý životný cyklus údajov vrátane odstránenia

Úryvok ukážkového kódu pre internú tabuľku

1. Vytvorenie internej tabuľky

 Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);Row format delimitedFields terminated by '\t';

2. Vložte údaje do internej tabuľky

 Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;

3. Zobrazte obsah tabuľky

 Hive>select * from guruhive_internaltable;

4. Ak chcete odhodiť interný stôl

 Hive>DROP TABLE guruhive_internaltable;

Ak ste guruhive_internaltable vyhodili, vrátane jeho metadát a údajov sa z úľa odstránia.

Z nasledujúceho screenshotu môžeme sledovať výstup

Vo vyššie uvedenom kóde a zo snímkovania obrazovky robíme nasledujúce veci,

  • Vytvorte vnútornú tabuľku
  • Vložte údaje do internej tabuľky
  • Zobraziť obsah tabuľky
  • Zahodiť interný stôl

Vonkajšie stoly

  • Externý stôl je svojou povahou voľne spojený. Dáta budú k dispozícii v HDFS. Tabuľka sa vytvorí na dátach HDFS.
  • Iným spôsobom môžeme povedať, že vytvára svoju schému na dátach .
  • V čase zrušenia tabuľky zruší iba schému, údaje budú stále k dispozícii v HDFS ako predtým.
  • Externé tabuľky poskytujú možnosť vytvoriť viac schém pre údaje uložené v HDFS namiesto vymazania údajov vždy, keď sa aktualizuje schéma

Kedy zvoliť externú tabuľku:

  • Ak je spracovanie údajov dostupné v HDFS
  • Užitočné, keď sa súbory používajú mimo Hive

Vzorový úryvok kódu pre externú tabuľku

1. Vytvorte externú tabuľku

Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)Row format delimitedFields terminated by '\t'LOCATION '/user/guru99hive/guruhive_external;

2. Ak neurčujeme umiestnenie v čase vytvárania tabuľky, môžeme údaje načítať manuálne

 Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;

3. Zobrazte obsah tabuľky

 Hive>select * from guruhive_external;

4. Ak chcete odhodiť interný stôl

 Hive>DROP TABLE guruhive_external;

Z nasledujúceho záberu obrazovky môžeme sledovať výstup

Vo vyššie uvedenom kóde robíme nasledujúce veci

  • Vytvorte externú tabuľku
  • Načítajte údaje do externej tabuľky
  • Zobraziť obsah tabuľky
  • Vypúšťanie externej tabuľky

Rozdiel medzi internými vs externými tabuľkami

Funkcia Interné Vonkajšie
Schéma Údaje o schéme Schéma údajov
Skladová lokácia / usr / úľ / sklad Umiestnenie HDFS
Dostupnosť údajov V rámci lokálneho súborového systému V rámci HDFS