50 najčastejších otázok týkajúcich sa rozhovorov s Teradata Odpovede

Anonim

Stiahnite si PDF

1) Ako definujete Teradata? Uveďte niektoré z ich základných charakteristík.

Teradata je v podstate RDMS, ktorý sa používa na pohon spoločností Datamart, Datawarehouse, OLAP, OLTP a DSS. Niektoré základné charakteristiky Teradaty sú uvedené nižšie.

  • Je schopný bežať na jednom uzloch aj na viacerých uzloch.
  • V systéme je zabudovaný paralelizmus.
  • Veľmi kompatibilný s normami ANSI.
  • Má sklon správať sa rovnako ako server.
  • Je to otvorený systém, ktorý sa v podstate vykonáva pre systémy UNIX MR-RAS, Suse Linux ETC, WIN2K atď.

2) Aké sú novo vyvinuté funkcie aplikácie Teradata?

Niektoré z novo vyvinutých funkcií aplikácie Teradata sú: -

  • Automatizovaná časová analýza
  • Rozšírenie možností kompresie, ktoré umožňuje flexibilnú kompresiu údajov s asi 20-krát väčším počtom údajov ako v predchádzajúcej verzii.
  • Inovácie spojené so zákazníkom, ako je hľadisko tetradata.

3) Zvýraznite niekoľko dôležitých komponentov Teradaty.

Niektoré dôležité komponenty Teradata sú: -

  • Bynet
  • Prístupový modul procesora (AMP)
  • Analýza motora (PE)
  • Virtuálny disk (vDisk)
  • Virtuálny úložný systém (VSS)

4) Uveďte postup, pomocou ktorého môžeme spúšťať úlohy Teradata v prostredí UNIX.

Všetko, čo musíte urobiť, je vykonať vykonanie v systéme UNIX spôsobom, ako je uvedené nižšie.

$ Sh> BTEQ <[cesta skriptu]> [cesta protokolového súboru]

alebo

$ Sh> BTEQ <[cesta skriptu] TEE [cesta protokolového súboru]

5) Ako v Teradate generujeme sekvenciu?

V Teradate generujeme postupnosť pomocou stĺpca identity

6) Ako sa počas zobrazenia generuje sekvencia pomocou Teradata?

Musíte len použiť CSUM.

7) Na stôl sa kladie určité zaťaženie a tiež každú hodinu. Ráno je pomerne nízka premávka a v noci veľmi veľká premávka. Podľa tejto situácie, ktorá je najvhodnejšia utilita a ako sa má táto utilita načítať?

Najdôležitejšou pomôckou tu musí byť Tpump. Využitím zmenšovania alebo zväčšovania veľkosti paketu je možné ľahko zvládnuť prenos.

8) Ak skript rýchleho načítania zlyhá a budete mať k dispozícii iba tabuľky s chybami, ako budete reštartovať?

V tomto prípade existujú v zásade dva spôsoby reštartovania.

  • Spustenie starého súboru - Uistite sa, že úplne nevypustíte chybové tabuľky. Namiesto toho skúste opraviť chyby, ktoré sa nachádzajú v skripte alebo v súbore, a potom ich spustite znova.
  • Spustenie nového súboru - V tomto procese sa skript vykoná jednoducho pomocou príkazov koniec načítania a začiatok. To pomôže pri odstraňovaní zámku, ktorý bol vložený do cieľovej tabuľky, a môže tiež odstrániť daný záznam z tabuľky rýchleho protokolu. Po dokončení môžete celý skript znova spustiť.

9) Uveďte niekoľko nástrojov ETL, ktoré spadajú pod Teradata.

Niektoré z nástrojov ETL, ktoré sa bežne používajú v Teradata, sú DataStage, Informatica, SSIS atď.

10) Zvýraznite niekoľko výhod, ktoré majú nástroje ETL oproti TD.

Niektoré z výhod, ktoré majú nástroje ETL oproti TD, sú: -

  • Je možné prevádzkovať viac heterogénnych cieľov, ako aj zdrojov.
  • Proces ladenia je vďaka nástrojom ETL oveľa jednoduchší vďaka plnohodnotnej podpore grafického používateľského rozhrania.
  • Komponenty nástrojov ETL sa dajú ľahko znovu použiť a v dôsledku toho, ak dôjde k aktualizácii na hlavný server, potom sa automaticky aktualizujú aj všetky príslušné aplikácie pripojené k serveru.
  • Otočenie a otočenie sa dá ľahko vykonať pomocou nástrojov ETL.

11) Aký je význam ukladania do pamäte cache v Teradata?

Ukladanie do medzipamäte sa považuje za ďalšiu výhodu pri používaní Teradata, pretože primárne pracuje so zdrojom, ktorý zostáva v rovnakom poradí, tj sa často nemení. Cache je niekedy obvykle zdieľaná medzi aplikáciami.

12) Ako môžeme skontrolovať verziu Teradata, ktorú momentálne používame?

Stačí dať príkaz .HOW VERSION.

13) Uveďte oprávnený dôvod, prečo funkcia Multi-load podporuje NUSI namiesto USI.

Riadok podtabuľky indexu sa stane v rovnakom zosilňovači rovnakým spôsobom ako riadok údajov v NUSI. Každý zosilňovač je teda prevádzkovaný osobitne a paralelne.

14) Ako sa po spustení reštartuje klientsky systém MLOAD?

Skript je potrebné odoslať ručne, aby bolo možné ľahko načítať údaje z kontrolného bodu, ktorý prichádza ako posledný.

15) Ako sa po vykonaní procesu reštartuje server MLOAD Teradata?

Proces sa v zásade vykonáva od posledného známeho kontrolného bodu a po vykonaní údajov po vykonaní skriptu MLOAD sa server reštartuje.

16) Čo sa myslí uzlom?

Uzol sa v zásade označuje ako sortiment komponentov hardvéru a softvéru. Server sa zvyčajne označuje ako uzol.

17) Povedzme, že existuje súbor, ktorý pozostáva zo 100 záznamov, z ktorých musíme preskočiť prvých a posledných 20 záznamov. Čo bude útržok kódu?

Na vykonanie tejto úlohy musíme použiť BTEQ Utility. V skripte sa použije preskočenie 20 a tiež opakovanie 60.

18) Vysvetlite PDE.

PDE v podstate znamená Parallel Data Extension. PDE je v podstate vrstva rozhrania softvéru, ktorá sa nachádza nad operačným systémom, a dáva databáze šancu pracovať v paralelnom prostredí.

19) Čo je to TPD?

TPD v zásade znamená Trusted Parallel Database a v zásade funguje pod PDE. Teradata je databázou, ktorá primárne pracuje pod PDE. To je dôvod, prečo sa Teradata zvyčajne označuje ako dôveryhodná paralelná alebo čistá paralelná databáza.

20) Čo sa myslí ovládačom kanálu?

Kanálový ovládač je softvér, ktorý slúži ako médium komunikácie medzi PE a všetkými aplikáciami, ktoré bežia na kanáloch pripojených ku klientom.

21) Čo sa myslí pod bránou Teradata?

Rovnako ako ovládač kanála, Teradata Gateway funguje ako médium komunikácie medzi analyzátorom a aplikáciami, ktoré sú pripojené k sieťovým klientom. Každému uzlu je priradená iba jedna brána.

22) Čo sa myslí pod virtuálnym diskom?

Virtuálny disk je v podstate kompilácia celého radu valcov, ktoré sú fyzickými diskami. Niekedy sa označuje ako diskové pole.

23) Vysvetlite význam Amp?

Amp v zásade znamená Access Module Processor a je vlastne procesorom, ktorý pracuje prakticky a v zásade sa používa na správu jednej časti databázy. Túto konkrétnu časť databázy nemôže zdieľať žiadny iný zosilňovač. Táto forma architektúry sa teda bežne nazýva architektúra „shared-nothing“.

24) Čo obsahuje Amp a aké sú všetky operácie, ktoré vykonáva?

Zosilňovač v zásade pozostáva zo subsystému databázového manažéra a je schopný vykonávať operácie uvedené nižšie.

  • Prebieha DML
  • Prebieha DDL
  • Implementácia agregácií a pripojení.
  • Uvoľnenie a použitie zámkov atď.

25) Čo sa rozumie analýzou motora?

PE je náhodou akýsi Vproc. Jeho primárnou funkciou je prijímať požiadavky SQL a doručovať odpovede v prostredí SQL. Skladá sa zo širokej škály softvérových komponentov, ktoré sa používajú na rozdelenie SQL na rôzne kroky a následné odoslanie týchto krokov na stránky AMP.

26) Čo máte na mysli analýzou?

Analýza je proces zaoberajúci sa analýzou symbolov reťazca, ktoré sú buď v počítačovom jazyku, alebo v prirodzenom jazyku.

27) Aké sú funkcie syntaktického analyzátora?

Analyzátor: -

  • Kontroluje sémantické chyby
  • Kontroluje syntaktické chyby
  • Kontroluje existenciu objektu

28) Čo sa myslí dispečerom?

Dispečer vezme celú zbierku požiadaviek a potom ich uloží do fronty. Celý proces sa udržuje v rovnakom poradí, aby bolo možné doručiť viac sád odpovedí.

29) Koľko relácií MAX dokáže PE zvládnuť v konkrétnom čase?

PE zvládne v konkrétnom okamihu celkovo 120 relácií.

30) Vysvetlite BYNET.

BYNET v zásade slúži ako médium komunikácie medzi komponentmi. Je primárne zodpovedný za odosielanie správ a je tiež zodpovedný za vykonávanie zlúčenia, ako aj triedenia.

31) Čo sa rozumie pod pojmom klika?

O Clique sa v podstate vie, že je to uzol, ktorý sa zdieľa medzi bežnými diskovými jednotkami. Prítomnosť Clique je nesmierne dôležitá, pretože pomáha predchádzať poruchám uzlov.

32) Čo sa stane, keď uzol utrpí pád?

Kedykoľvek dôjde k poklesu úrovne výkonu uzla, všetky príslušné Vprocs okamžite migrujú na nový uzol z uzla zlyhania, aby získali všetky dáta späť zo spoločných jednotiek.

33) Uveďte zoznam všetkých foriem ZÁMOKOV, ktoré sú k dispozícii v Teradata.

V zásade existujú štyri typy ZÁMOKOV, ktoré spadajú pod Teradata. Jedná sa o: -

  • Prečítajte si Lock
  • Zámok prístupu
  • Exkluzívny zámok
  • Write Lock

34) Aká je konkrétna určená úroveň, na ktorej je v LOKALITE pravdepodobne uplatnený ZÁMOK?

  • Úroveň tabuľky - Všetky riadky, ktoré sa nachádzajú v tabuľke, budú určite uzamknuté.
  • Uzamknutie úrovne databázy - všetky objekty, ktoré sa nachádzajú v databáze, budú uzamknuté.
  • Uzamknutie úrovne riadkov - Zamknuté budú iba tie riadky, ktoré zodpovedajú konkrétnemu riadku.

35) Aké je skóre v AMP, ktoré sú aktívne zapojené do primárneho indexu?

Iba jeden AMP je aktívne zapojený do primárneho indexu.

36) Aký význam má v Teradata príkaz UPSERT?

UPSERT v zásade znamená Update Else Insert. Táto možnosť je k dispozícii iba v serveri Teradata.

37) Zvýraznite výhody PPI (Partition Primary Index).

PPI sa v zásade používa na ukladanie dát na základe rozsahu alebo kategórie. Pokiaľ ide o rozsahové dotazy, nie je potrebné využitie skenovania celej tabuľky, pretože sa okamžite presunie na nasledujúci oddiel, čím preskočí všetky ostatné oddiely.

38) Uveďte veľkosti SMALLINT, BYTEINT a INTEGER.

SMALLINT - 2 bajty - 16 bitiek -> -32768 až 32767

BYTEINT - 1 bajt - 8 bitov -> -128 až 127

INTEGER - 4 bajty - 32 bitov -> -2 147 483 648 až 2 147 483 647

39) Čo sa rozumie v pláne najmenších nákladov?

Plán najmenších nákladov sa v zásade vykoná za najkratšiu cestu v kratšom čase.

40) Zvýraznite body rozdielov medzi databázou a používateľom v aplikácii Teradata.

  • Databáza je v zásade pasívna, zatiaľ čo používateľ je aktívny.
  • Databáza ukladá predovšetkým všetky objekty databázy, zatiaľ čo používateľ môže ukladať ľubovoľné objekty, či už ide o makro, tabuľku, zobrazenie atď.
  • Databáza nemá heslo, zatiaľ čo užívateľ musí zadávať heslo.

41) Zvýraznite rozdiely medzi primárnym kľúčom a primárnym indexom.

  • Primárny index je úplne povinný, zatiaľ čo primárny kľúč je voliteľný.
  • Primárny index má limit 64 tabuliek / stĺpcov, zatiaľ čo primárny kľúč nijaký limit nemá.
  • Primárny index umožňuje duplikáty a nulové hodnoty, zatiaľ čo primárny kľúč nie.
  • Primárny index je fyzický mechanizmus, zatiaľ čo primárny kľúč je čisto logický mechanizmus.

42) Vysvetlite, ako sa využíva priestor na cievku.

Spool space v Teradata sa v zásade používa na vykonávanie dotazov. Z celkového priestoru, ktorý je k dispozícii v serveri Teradata, je 20% priestoru v podstate pridelených priestoru na spoolovanie.

43) Zvýraznite potrebu ladenia výkonu.

Ladenie výkonu v Teradate sa v zásade vykonáva s cieľom identifikovať všetky úzke miesta a potom ich vyriešiť.

44) Komentujte, či je úzke miesto chybou alebo nie.

Z technického hľadiska nie je úzke miesto formou chyby, ale určite spôsobuje určité oneskorenie systému.

45) Ako možno identifikovať úzke miesta?

V zásade existujú štyri spôsoby identifikácie úzkeho miesta. Jedná sa o: -

  • Vizuálne vysvetlenie Teradata
  • Vysvetlite modifikátor žiadosti
  • Manažér Teradata
  • Monitorovanie výkonu

46) Čo sa myslí pod plánom najvyšších nákladov?

Podľa plánu najvyšších nákladov je čas potrebný na vykonanie procesu dlhší a trvá najdlhšou dostupnou cestou.

47) Zvýraznite všetky režimy, ktoré sú k dispozícii v položke Úroveň spoľahlivosti.

Nízky, Nie, Vysoký a Pripojiť sa sú štyri režimy, ktoré sú k dispozícii pod úrovňou dôvery.

48) Vymenujte päť fáz, ktoré spadajú do programu MultiLoad Utility.

Predbežná fáza, fáza DML, fáza získavania údajov, fáza aplikácie a konečná fáza.

49) Zvýraznite obmedzenia programu TPUMP Utility.

Nasledujú obmedzenia obslužného programu TPUMP: -

  • Nemôžeme použiť príkaz SELECT.
  • Dátové súbory nie je možné zreťaziť.
  • Agregované a exponenciálne operátory nie sú podporované.
  • Aritmetické funkcie nie sú podporované.

50) Ako sa nastavujú parametre režimu relácie v BTEQ?

.set transakcia relácie BTET -> režim transakcií Teradata

.set transakcia relácie ANSI -> režim ANSI

Tieto príkazy budú fungovať, iba ak budú zadané pred prihlásením do relácie.