Architektúra SAP HANA, LandScape, dimenzovanie: Kompletný návod

Databáza SAP HANA je platforma pre správu údajov zameranú na hlavnú pamäť. Databáza SAP HANA beží na serveri SUSE Linux Enterprises Server a je založená na jazyku C ++.

Databázu SAP HANA je možné distribuovať na viac počítačov.

Výhody SAP HANA sú uvedené nižšie -

SAP HANA je užitočná, pretože je veľmi rýchla vďaka všetkým údajom načítaným do pamäte a bez nutnosti načítania údajov z disku.
SAP HANA je možné použiť na účely OLAP (online analýza) a OLTP (online transakcia) v jednej databáze.

Databáza SAP HANA pozostáva zo sady strojov na spracovanie v pamäti. Výpočtový stroj je hlavným procesorom v pamäti na spracovanie v SAP HANA. Funguje s iným procesorom ako Relational database Engine (Row and Column engine), OLAP Engine atď.

Relačná databázová tabuľka sa nachádza v úložisku stĺpcov alebo riadkov.

Pre tabuľku SAP HANA existujú dva typy úložiska.

Uloženie typu riadku (pre tabuľku riadkov).
Sklad typu stĺpca (pre tabuľku stĺpca).

Textové údaje a údaje grafu sa nachádzajú v textovom stroji a grafickom stroji. V databáze SAP HANA je niekoľko ďalších nástrojov. Údaje sa môžu v týchto motoroch ukladať, pokiaľ je k dispozícii dostatok miesta.

V tomto návode sa naučíte

Architektúra SAP HANA
SAP HANA na šírku
Dimenzovanie SAP HANA

Architektúra SAP HANA

Dáta sú komprimované rôznymi kompresnými technikami (napr. Kódovanie slovníka, kódovanie dĺžky behu, riedke kódovanie, klastrové kódovanie, nepriame kódovanie) v obchode SAP HANA Column.

Po dosiahnutí limitu hlavnej pamäte v systéme SAP HANA sa z hlavnej pamäte uvoľnia celé databázové objekty (tabuľka, pohľad atď.), Ktoré sa nepoužívajú, a uložia sa na disk.

Názvy týchto objektov sú definované sémantikou aplikácie a v prípade potreby sa znova načítajú z disku do hlavnej pamäte. Za normálnych okolností databáza SAP HANA spravuje vykladanie a načítanie údajov automaticky.

Používateľ však môže načítať a uvoľniť údaje z jednotlivých tabuliek manuálne výberom tabuľky v štúdiu SAP HANA v príslušnej schéme - kliknutím pravým tlačidlom myši a výberom možnosti „Vyložiť / Načítať“.

Server SAP HANA pozostáva z

Indexový server
Predprocesorový server
Menný server
Štatistický server
Motor XS

Indexový server SAP HANA
Hlavným serverom databázy SAP HANA sú indexové servery. Podrobnosti o každom serveri sú uvedené nižšie -

Je to hlavný databázový komponent SAP HANA
Obsahuje skutočné úložiská údajov a mechanizmus na ich spracovanie.
Indexový server spracuje prichádzajúce príkazy SQL alebo MDX.

Nižšie je uvedená architektúra servera Index Server.

Prehľad indexového servera SAP HANA

Správca relácií a transakcií: Komponent relácie riadi relácie a pripojenia pre databázu SAP HANA. Koordinátor transakčných manažérov a kontroluje transakcie.

Procesor SQL a MDX: Súčiastka procesora SQL vyhľadáva údaje a odosiela im ich v stroji na spracovanie dotazov, tj. SQL / SQL Script / R / Calc Engine. Procesor MDX dopytuje a manipuluje s multidimenzionálnymi údajmi (napr. Analytické zobrazenie v SAP HANA).

Stroj SQL / SQL Script / R / Calc: Táto súčasť vykonáva skript SQL / SQL a prevádza výpočtové údaje vo výpočtovom modeli.

Repository: Repository keep the versioning of SAP HANA metadata object eg (Attribute view, Analytic View, Stored procedure).

Vrstva perzistencie: Táto vrstva využíva vstavanú funkciu „Obnova po katastrofe“ databázy SAP HANA. Záloha sa do nej ukladá ako body ukladania do objemu dát.

Predprocesorový server

Tento server sa používa pri textovej analýze a pri použití funkcie vyhľadávania extrahuje údaje z textu.

Menný server

Tento server obsahuje všetky informácie o prostredí systému. V distribuovanom serveri obsahuje menný server informácie o každej spustenej súčasti a umiestnení údajov na serveri. Tento server obsahuje informácie o serveri, na ktorom existujú údaje.

Štatistický server

Štatistický server je zodpovedný za zhromažďovanie údajov týkajúcich sa stavu, alokácie / spotreby zdrojov a výkonu systému SAP HANA.

Server XS

Server XS obsahuje modul XS Engine. Umožňuje externým aplikáciám a vývojárom používať databázu SAP HANA prostredníctvom klienta XS Engine. Aplikácia externého klienta môže pomocou protokolu HTTP prenášať údaje prostredníctvom modulu XS pre server HTTP.

SAP HANA na šírku

„HANA“ znamená vysoko výkonné analytické zariadenie je kombináciou hardvérovej a softvérovej platformy.

Kvôli zmenám v architektúre počítača je výkonnejší počítač k dispozícii z hľadiska procesora, pamäte RAM a pevného disku.
SAP HANA je riešením úzkeho miesta pre výkon, v ktorom sú všetky dáta uložené v hlavnej pamäti a nie je potrebné často prenášať dáta z diskových I / O do hlavnej pamäte.

Ďalej sú uvedené inovácie SAP HANA v oblasti hardvéru / softvéru.

V systéme SAP HANA existujú dva typy relačných dátových úložísk: ukladanie riadkov a ukladanie stĺpcov.

Obchod s riadkami

Je to rovnaké ako tradičné databázy, napr. (Oracle, SQL Server). Jediný rozdiel je v tom, že všetky dáta sú na rozdiel od tradičnej databázy, kde sú dáta uložené na pevnom disku, uložené v riadkovej úložnej oblasti v pamäti SAP HANA.

Obchod so stĺpcami

Sklad stĺpcov je súčasťou databázy SAP HANA a spravuje údaje stĺpcovým spôsobom v pamäti SAP HANA. Tabuľky stĺpcov sú uložené v oblasti Sklad stĺpov. Sklad Column poskytuje dobrý výkon pre operácie zápisu a súčasne optimalizuje operáciu čítania.

Výkon operácie čítania a zápisu optimalizovaný s menej ako dvoma dátovými štruktúrami.

Hlavné úložisko

Hlavné úložisko obsahuje hlavnú časť údajov. V hlavnom úložisku sa na kompresiu údajov používa vhodná metóda kompresie údajov (slovníkové kódovanie, klastrové kódovanie, riedke kódovanie, kódovanie dĺžky behu atď.), Ktoré šetria pamäť a urýchľujú vyhľadávanie.

V hlavnom úložisku budú operácie zápisu na komprimované dáta nákladné, takže operácia zápisu priamo nezmení komprimované údaje v hlavnom úložisku. Namiesto toho sa všetky zmeny zapíšu do samostatnej oblasti v stĺpcovom úložisku známej ako „Delta Storage“.
Úložisko Delta je optimalizované na operáciu zápisu a používa normálnu kompresiu. Operácie zápisu nie sú povolené v hlavnom úložisku, ale sú povolené v delta úložisku. Operácie čítania sú povolené v obidvoch úložiskách.

Môžeme manuálne načítať dáta do hlavnej pamäte voľbou „Načítať do pamäte“ a Unload dáta z hlavnej pamäte voľbou „Vyberať z pamäte“, ako je to zobrazené nižšie.

Skladovanie Delta

Úložisko Delta sa používa na operáciu zápisu a používa základnú kompresiu. Všetky nepotvrdené úpravy v údajoch tabuľky stĺpcov uložené v delta úložisku.

Ak chceme tieto zmeny presunúť do hlavného úložiska, použite operáciu „delta merge“ od štúdia SAP HANA, ako je uvedené nižšie -

Účelom operácie zlúčenia delta je presun zmien, ktoré sa zhromažďujú v úložisku delta do hlavného úložiska.
Po vykonaní operácie Delta Merge na tabuľke stĺpcov miazgy sa obsah hlavnej pamäte uloží na disk a prepočíta sa kompresia.

Proces presunu údajov z Delta do hlavného úložiska počas delta zlúčenia

Existuje medzipamäť (L1-Delta), ktorá je riadkovým úložiskom. Takže v SAP HANA tabuľka stĺpcov funguje ako ukladanie riadkov kvôli delte L1.

Užívateľ spustí dotaz na aktualizáciu / vloženie v tabuľke (Fyzický operátor sú príkazy SQL.).
Údaje najskôr prejdite na L1. Keď L1 posúva údaje ďalej (L1 - nepotvrdené údaje)
Potom dáta idú do vyrovnávacej pamäte L2-delta, ktorá je orientovaná na stĺpec. (L2 - potvrdené údaje)
Keď je proces L2-delta dokončený, dáta idú do hlavného úložiska.

Takže stĺpcové úložisko je optimalizované na zápis aj na čítanie vďaka L1-Delta a hlavnému úložisku. L1-Delta obsahuje všetky nepotvrdené údaje. Odovzdané údaje sa presunú do hlavného obchodu cez L2-Delta. Z hlavného úložiska údaje idú do vrstvy perzistencie (šípka označujúca tu je fyzický operátor, ktorý odosiela príkaz SQL v obchode stĺpcov). Po spracovaní príkazu SQL v úložisku stĺpcov idú údaje do vrstvy perzistencie.

Napr. Nižšie je riadková tabuľka

Údaje tabuľky sú uložené na disku v lineárnom formáte, takže nižšie je uvedené, ako sa ukladajú údaje na disku tabuľky riadkov a stĺpcov -

V pamäti SAP HANA je táto tabuľka uložená v riadku na disku ako formát -

Adresa pamäte

A v stĺpci sa údaje ukladajú na disk ako -

Adresa pamäte

Údaje sa na disk ukladajú po stĺpcoch v lineárnom formáte. Dáta je možné komprimovať technikou kompresie.

Takže Column store má tú výhodu, že šetrí pamäť.

Dimenzovanie SAP HANA

Dimenzovanie je termín, ktorý sa používa na určenie hardvérových požiadaviek pre systém SAP HANA, ako sú RAM, pevný disk a CPU atď.

Hlavným dôležitým komponentom pre dimenzovanie je pamäť a druhým dôležitým komponentom pre dimenzovanie je CPU. Treťou hlavnou súčasťou je disk, ale veľkosť je úplne závislá od pamäte a procesora.

V implementácii SAP HANA je jednou z najdôležitejších úloh určiť správnu veľkosť servera podľa obchodných požiadaviek.

SAP HANA DB sa líšia veľkosťou s normálnym DBMS z hľadiska -

Požiadavka na hlavnú pamäť pre SAP HANA (veľkosť pamäte je určená údajmi o metadátach a transakciách v SAP HANA)
Požiadavka na CPU pre SAP HANA (Prognóza CPU je odhadovaná nepresná).
Požiadavka na diskový priestor pre SAP HANA (počíta sa pre perzistenciu údajov a pre protokolovanie údajov)

CPU aplikačného servera a pamäť aplikačného servera zostávajú nezmenené.

Pre výpočet výpočtu veľkosti poskytla spoločnosť SAP rôzne pokyny a metódu na výpočet správnej veľkosti.

Môžeme použiť nižšie uvedenú metódu