V tomto výučbe je možné pozorovať operácie s tabuľkami, ako napríklad vytváranie, zmeny a rušenie tabuliek v úli.
Na snímke obrazovky nižšie vytvárame tabuľku so stĺpcami a meníme názov tabuľky.
1. Vytvorenie tabuľky guru_sample s dvoma názvami stĺpcov ako „empid“ a „empname“
2. Zobrazenie tabuliek prítomných v databáze guru99
3. Guru_sample zobrazujúci sa pod tabuľkami
4. Zmena tabuľky „guru_sample“ ako „guru_sampleNew“
5. Opäť, keď vykonáte príkaz „show“, zobrazí sa nový názov Guru_sampleNew
Dropping table guru_sampleNew:
Typy tabuliek a ich použitie:
Príchod k tabuľkám je to rovnako ako spôsob, ktorý vytvárame v tradičných relačných databázach. Na tabuľkách je možné vykonávať funkcie, ako je filtrovanie, spájanie.
Úľ sa zaoberá dvoma typmi štruktúr tabuliek, ako sú interné a externé tabuľky, v závislosti od načítania a návrhu schémy v úli.
Interné stoly
- Interná tabuľka je svojou povahou pevne spojená. V tomto type tabuľky najskôr musíme vytvoriť tabuľku a načítať údaje.
- Túto môžeme nazvať ako údaje o schéme .
- Zrušením tejto tabuľky budú odstránené údaje aj schéma.
- Uložené umiestnenie tejto tabuľky bude na / user / hive / warehouse.
Kedy zvoliť internú tabuľku:
- Ak je spracovanie údajov k dispozícii v lokálnom súborovom systéme
- Ak chceme, aby program Hive spravoval celý životný cyklus údajov vrátane odstránenia
Úryvok ukážkového kódu pre internú tabuľku
1. Vytvorenie internej tabuľky
Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);Row format delimitedFields terminated by '\t';
2. Vložte údaje do internej tabuľky
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;
3. Zobrazte obsah tabuľky
Hive>select * from guruhive_internaltable;
4. Ak chcete odhodiť interný stôl
Hive>DROP TABLE guruhive_internaltable;
Ak ste guruhive_internaltable vyhodili, vrátane jeho metadát a údajov sa z úľa odstránia.
Z nasledujúceho screenshotu môžeme sledovať výstup
Vo vyššie uvedenom kóde a zo snímkovania obrazovky robíme nasledujúce veci,
- Vytvorte vnútornú tabuľku
- Vložte údaje do internej tabuľky
- Zobraziť obsah tabuľky
- Zahodiť interný stôl
Vonkajšie stoly
- Externý stôl je svojou povahou voľne spojený. Dáta budú k dispozícii v HDFS. Tabuľka sa vytvorí na dátach HDFS.
- Iným spôsobom môžeme povedať, že vytvára svoju schému na dátach .
- V čase zrušenia tabuľky zruší iba schému, údaje budú stále k dispozícii v HDFS ako predtým.
- Externé tabuľky poskytujú možnosť vytvoriť viac schém pre údaje uložené v HDFS namiesto vymazania údajov vždy, keď sa aktualizuje schéma
Kedy zvoliť externú tabuľku:
- Ak je spracovanie údajov dostupné v HDFS
- Užitočné, keď sa súbory používajú mimo Hive
Vzorový úryvok kódu pre externú tabuľku
1. Vytvorte externú tabuľku
Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)Row format delimitedFields terminated by '\t'LOCATION '/user/guru99hive/guruhive_external;
2. Ak neurčujeme umiestnenie v čase vytvárania tabuľky, môžeme údaje načítať manuálne
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;
3. Zobrazte obsah tabuľky
Hive>select * from guruhive_external;
4. Ak chcete odhodiť interný stôl
Hive>DROP TABLE guruhive_external;
Z nasledujúceho záberu obrazovky môžeme sledovať výstup
Vo vyššie uvedenom kóde robíme nasledujúce veci
- Vytvorte externú tabuľku
- Načítajte údaje do externej tabuľky
- Zobraziť obsah tabuľky
- Vypúšťanie externej tabuľky
Rozdiel medzi internými vs externými tabuľkami
Funkcia | Interné | Vonkajšie |
---|---|---|
Schéma | Údaje o schéme | Schéma údajov |
Skladová lokácia | / usr / úľ / sklad | Umiestnenie HDFS |
Dostupnosť údajov | V rámci lokálneho súborového systému | V rámci HDFS |