Stiahnite si PDF
Nasledujú často kladené otázky v rozhovoroch pre nováčikov a skúsených vývojárov HBase.
1) Vysvetlite, čo je Hbase?
Hbase je stĺpcovo orientovaný systém na správu databáz, ktorý beží nad HDFS (Hadoop Distribute File System). Hbase nie je úložisko relačných údajov a nepodporuje jazyk štruktúrovaných dotazov, ako je SQL.
V Hbase riadi hlavný uzol servery klastra a regiónu tak, aby ukladali časti tabuliek, a pracuje s údajmi.
2) Vysvetlite, prečo používať Hbase?
- Vysokokapacitný úložný systém
- Distribuovaný dizajn pre veľké tabuľky
- Stĺpovo orientované obchody
- Horizontálne škálovateľné
- Vysoký výkon a dostupnosť
- Základným cieľom Hbase sú milióny stĺpcov, tisíce verzií a miliardy riadkov
- Na rozdiel od HDFS (Hadoop Distribute File System) podporuje náhodné operácie CRUD v reálnom čase
3) Uveďte, ktoré sú kľúčové komponenty Hbase?
- Zookeeper: Vykonáva koordinačnú prácu medzi klientom a Hbase Maserom
- Hbase Master: Hbase Master monitoruje regionálny server
- RegionServer: RegionServer monitoruje región
- Región: Obsahuje v pamäti dátové úložisko (MemStore) a Hfile.
- Katalógové tabuľky: Katalógové tabuľky pozostávajú z koreňov ROOT a META
4) Vysvetlite, z čoho pozostáva Hbase?
- Hbase sa skladá zo sady tabuliek
- A každá tabuľka obsahuje riadky a stĺpce ako tradičná databáza
- Každá tabuľka musí obsahovať prvok definovaný ako primárny kľúč
- Stĺpec Hbase označuje atribút objektu
5) Uveďte koľko prevádzkových príkazov v Hbase?
Operačné velenie v Hbase je asi päť typov
- Získajte
- Daj
- Odstrániť
- Skenovať
- Prírastok
6) Vysvetlite, čo je WAL a Hlog v Hbase?
WAL (Write Ahead Log) je podobný protokolu MySQL BIN; zaznamenáva všetky zmeny, ku ktorým dochádza v dátach. Je to štandardný sekvenčný súbor od spoločnosti Hadoop a ukladá sa v ňom HLogkey. Tieto kľúče pozostávajú z postupného čísla a skutočných údajov a používajú sa na prehrávanie ešte nie pretrvávajúcich údajov po zlyhaní servera. Takže v hotovosti za zlyhanie servera funguje WAL ako línia života a získava stratené dáta.
7) Kedy by ste mali používať Hbase?
- Veľkosť dát je obrovská: Keď máte k dispozícii tony a milióny záznamov
- Kompletný redizajn: Keď presúvate RDBMS na Hbase, považujete to za kompletný re-design, potom iba zmenu portov
- Príkazy bez SQL: Máte niekoľko funkcií, ako sú transakcie; vnútorné spojenia, zadané stĺpce atď.
- Investícia do infraštruktúry: Aby ste mohli byť Hbase skutočne užitoční, musíte mať dostatok klastra
8) Čo je v Hbase čo sú rodiny stĺpcov?
Skupiny stĺpcov tvoria základnú jednotku fyzického úložiska v Hbase, na ktoré sa aplikujú funkcie ako kompresie.
9) Vysvetlite, čo je kľúč riadku?
Kľúč riadku je definovaný aplikáciou. Pretože kombinovaný kľúč je vopred nastavený kľúčom riadok, umožňuje aplikácii definovať požadované poradie triedenia. Umožňuje tiež logické zoskupovanie buniek a zaisťuje, aby boli všetky bunky s rovnakým kľúčom riadku umiestnené na rovnakom serveri.
10) Vysvetlite deléciu v Hbase? Uveďte, aké sú tri typy značiek náhrobných kameňov v Hbase?
Keď odstránite bunku v Hbase, údaje sa v skutočnosti nevymažú, ale nastaví sa značka náhrobku, čím sa odstránené bunky stanú neviditeľnými. Hbase deleted sú skutočne odstránené počas zhutňovania.
Existujú tri typy značiek náhrobných kameňov:
- Značka odstránenia verzie: Na odstránenie označí jednu verziu stĺpca
- Značka odstránenia stĺpca: Na odstránenie označí všetky verzie stĺpca
- Značka odstránenia rodiny: Na odstránenie sa označia všetky stĺpce pre rodinu stĺpcov
11) Vysvetlite, ako vlastne program Hbase odstráni riadok?
V Hbase bude všetko, čo napíšete, uložené z RAM na disk, tieto zápisy na disk sú nemenným blokujúcim zhutňovaním. Počas procesu mazania v Hbase značka odstránenia veľkého procesu zhutňovania zatiaľ čo menšie zhutnenia nie. Pri normálnom odstránení to vedie k odstráneniu označenia náhrobku - tieto údaje o odstránení, ktoré predstavujú, sa odstránia počas zhutňovania.
Ak tiež odstránite údaje a pridáte viac údajov, ale so skoršou časovou pečiatkou ako časovou pečiatkou náhrobku, ďalšie znaky Gets môžu byť maskované značkou mazania / náhrobku, a teda vloženú hodnotu dostanete až po väčšom zhutnení.
12) Vysvetlite, čo sa stane, ak zmeníte veľkosť bloku rodiny stĺpcov v už obsadenej databáze?
Keď zmeníte veľkosť bloku rodiny stĺpcov, nové údaje zaberú novú veľkosť bloku, zatiaľ čo staré údaje zostanú v starej veľkosti bloku. Počas zhutňovania údajov budú mať staré údaje novú veľkosť bloku. Nové súbory, keď sú vyprázdnené, majú novú veľkosť bloku, zatiaľ čo existujúce údaje sa budú naďalej správne načítať. Všetky údaje by sa po ďalšom väčšom zhutnení mali transformovať na novú veľkosť bloku.
13) Uveďte rozdiel medzi Hbase a relačnou databázou?
Hbase | Relačná databáza |
|
|
14) Čo je trieda HBaseFsck?
V nástroji HBase, ktorý je implementovaný triedou HBaseFsck, je k dispozícii názov nástroja s názvom back. Ponúka niekoľko prepínačov príkazového riadku, ktoré ovplyvňujú jeho správanie.
15) Aké sú hlavné kľúčové štruktúry HBase?
Kľúč riadku a kľúč stĺpca sú dve najdôležitejšie kľúčové štruktúry, ktoré sa v HBase používajú
16) Diskutujte o tom, ako môžete používať filtre v serveri Apache HBase
Filtre v HBase Shell. Bol predstavený v Apache HBase 0.92, ktorý vám pomôže vykonať filtrovanie na strane servera pre prístup k HBase cez shell HBase alebo šetrnosť.
17) HBase podporuje štruktúru syntaxe ako SQL áno alebo nie?
Nie, bohužiaľ, podpora SQL pre HBase nie je momentálne k dispozícii. Avšak pomocou Apache Phoenix môžeme načítať údaje z HBase prostredníctvom dotazov SQL.
18) Aký je význam zhutnenia v HBase?
V čase ťažkých prichádzajúcich zápisov je nemožné dosiahnuť optimálny výkon tým, že v jednom obchode bude jeden súbor. HBase vám pomôže skombinovať všetky tieto súbory HF, aby ste znížili počet semien disku pre každé čítanie. Tento proces je známy ako Compaction in HBase.
19) Ako budete implementovať spojenia v HBase?
HBase, nepodporuje spojenia priamo, ale používa MapReduce úlohy, dotazy na spojenia je možné implementovať načítaním údajov pomocou rôznych tabuliek HBase.
20) Vysvetlite JMX týkajúce sa HBSE
Java Management Extensions alebo JMX je stav exportu aplikácií Java je pre ne štandardom.
21) Na čo slúži MasterServer?
Master sever vám pomôže tiež priradiť región k regionálnemu serveru. Pomáha vám tiež zvládnuť vyrovnávanie zaťaženia, ktoré používame serverom MasterServer.
22) Definujte Termín Thrift
Apache Thrift je napísaný v jazyku C ++. Poskytuje kompilátory schém pre rôzne programovacie jazyky ako C ++, Perl, PHP, Python, Ruby a ďalšie.
23) Prečo používať triedu HColumnDescriptor?
Podrobnosti týkajúce sa rodiny stĺpcov, ako sú nastavenia kompresie, počet verzií, sú uložené v. HColumnDescriptor.
24) Čo je to bunka v HBase?
Bunka v HBase je najmenšia jednotka tabuľky Hbase. Pomôže vám uchovať kúsok údajov vo forme n-tice {riadok, stĺpec, verzia}
25) Čo je to filter Bloom?
HBase podporuje Bloom Filter pomáha vám zvýšiť celkovú priepustnosť klastra. Filter HBase Bloom je priestorovo efektívny mechanizmus na testovanie, či súbor HFile obsahuje určitú bunku riadku alebo riadku.
26) Povedzte mi o typoch operácií HBase?
Ans. Dva typy operácií HBase sú:
- Prečítajte si operáciu
- Operácia zápisu
27) Na čo slúži HBase HMaster?
Hlavné zodpovednosti kapitána sú:
- Koordinácia regionálnych serverov
- Správcovské funkcie
28) Ktorú techniku môžete použiť v HBase na priamy prístup k HFile bez pomoci HBase?
Pre priamy prístup k HFile bez použitia HBase používame metódu HFile.main ().
29) Môže byť regionálny server umiestnený na všetkých DataNodes?
Áno, regionálne servery bežia na rovnakých serveroch ako DataNodes
30) Pomenujte filter, ktorý akceptuje veľkosť stránky ako parameter v HBase
Filter s názvom PageFilter prijíma veľkosť stránky ako parameter.
Tento dokument bol zostavený pomocou nástrojov na okamžitý prevod HTML.
- Ďalšie