Čo je to OLAP? Cube, Operations & Typy v dátovom sklade

Čo je to OLAP?

Online Analytical Processing (OLAP) je kategória softvéru, ktorá umožňuje používateľom analyzovať informácie z viacerých databázových systémov súčasne. Je to technológia, ktorá umožňuje analytikom získavať a prezerať obchodné údaje z rôznych hľadísk.

Analytici často musia zhromažďovať, agregovať a spájať údaje. Tieto operácie v relačných databázach sú náročné na zdroje. Pomocou OLAP môžu byť údaje vopred vypočítané a predbežne agregované, čo umožňuje rýchlejšiu analýzu.

Databázy OLAP sú rozdelené do jednej alebo viacerých kociek. Kocky sú navrhnuté tak, aby bolo ľahké vytvárať a prezerať správy. OLAP znamená Online Analytical Processing.

V tomto návode sa naučíte

  • OLAP kocka
  • Základné analytické operácie OLAP
  • Typy systémov OLAP
  • ROLAP
  • MOLAP
  • Hybridný OLAP
  • Výhody OLAP
  • Nevýhody OLAP

OLAP kocka:

Jadrom koncepcie OLAP je OLAP kocka. Kocka OLAP je dátová štruktúra optimalizovaná na veľmi rýchlu analýzu údajov.

Kocka OLAP pozostáva z číselných faktov nazývaných miery, ktoré sú kategorizované podľa dimenzií. OLAP kocka sa nazýva aj hyperkocka .

Dátové operácie a analýza sa zvyčajne vykonávajú pomocou jednoduchej tabuľky, v ktorej sú hodnoty údajov usporiadané do formátu riadkov a stĺpcov. To je ideálne pre dvojrozmerné údaje. OLAP však obsahuje multidimenzionálne údaje, pričom údaje sa zvyčajne získavajú z iného a nesúvisiaceho zdroja. Používanie tabuľky nie je optimálna možnosť. Kocka môže logicky a usporiadane ukladať a analyzovať viacrozmerné údaje.

Ako to funguje?

Dátový sklad by extrahoval informácie z viacerých zdrojov údajov a formátov, ako sú textové súbory, hárky programu Excel, multimediálne súbory atď.

Extrahované dáta sa vyčistia a transformujú. Dáta sa načítajú na server OLAP (alebo kocku OLAP), kde sú vopred vypočítané informácie pre ďalšiu analýzu.

Základné analytické operácie OLAP

Štyri typy analytických operácií v OLAP sú:

  1. Vyhrnúť
  2. Hĺbková analýza
  3. Plátok a kocka
  4. Otočiť (otočiť)

1) Roll-up:

Súhrn je tiež známy ako „konsolidácia“ alebo „agregácia“. Operáciu Roll-up je možné vykonať dvoma spôsobmi

  1. Zmenšovanie rozmerov
  2. Stúpanie v hierarchii konceptov. Hierarchia konceptov je systém zoskupovania vecí na základe ich poradia alebo úrovne.

Zvážte nasledujúci diagram

  • V tomto príklade sa mestá New Jersey a Lost Angles zrolovali do krajiny USA
  • Údaje o predaji v New Jersey sú 440 a 1560 v Los Angeles. Po súhrne sa stanú 2 000
  • V tomto procese agregácie sa hierarchia údajov o umiestnení posúva nahor z mesta do krajiny.
  • Pri procese zrolovania je potrebné odstrániť najmenej jeden alebo viac rozmerov. V tomto príklade je odstránená štvrtá dimenzia.

2) Vŕtanie

Pri hĺbkovej analýze sú údaje fragmentované na menšie časti. Je to opak procesu rollup. Dá sa to urobiť cez

  • Posun nadol v hierarchii konceptov
  • Zvyšovanie dimenzie

Zvážte vyššie uvedený diagram

  • Štvrťrok Q1 je rozčlenený na mesiace január, február a marec. Zodpovedajúcim predajom sú aj registre.
  • V tomto príklade sú pridané dimenzionálne mesiace.

3) Plátok:

Tu sa vyberie jedna dimenzia a vytvorí sa nová kocka.

Nasledujúci diagram vysvetľuje, ako fungovala operácia rezu:

  • Čas dimenzie je nakrájaný na plátky s filtrom Q1.
  • Nová kocka je vytvorená úplne.

Kocky:

Táto operácia je podobná výseku. Rozdiel v kockách spočíva v tom, že vyberiete 2 alebo viac dimenzií, ktorých výsledkom je vytvorenie kocky.

4) Otočte

V programe Pivot otáčate údajové osi, aby ste poskytli náhradnú prezentáciu údajov.

V nasledujúcom príklade je pivot založený na typoch položiek.

Typy systémov OLAP

Hierarchická štruktúra OLAP

Typ OLAP Vysvetlenie
Relačný OLAP (ROLAP): ROLAP je rozšírený RDBMS spolu s multidimenzionálnym mapovaním údajov na vykonávanie štandardnej relačnej operácie.
Viacrozmerný OLAP (MOLAP) MOLAP Implementuje operáciu vo viacrozmerných dátach.
Hybridné online analytické spracovanie (HOLAP) V prístupe HOLAP sú agregované súčty uložené v multidimenzionálnej databáze, zatiaľ čo podrobné údaje sú uložené v relačnej databáze. To ponúka dátovú efektívnosť modelu ROLAP aj výkonnosť modelu MOLAP.
Desktop OLAP (DOLAP) V prostredí Desktop OLAP si používateľ stiahne časť údajov z databázy lokálne alebo na svoju pracovnú plochu a analyzuje ich. DOLAP je nasadenie relatívne lacnejšie, pretože ponúka veľmi málo funkcií v porovnaní s inými systémami OLAP.
Webový OLAP (WOLAP) Webový OLAP, čo je systém OLAP prístupný cez webový prehliadač. WOLAP je trojstupňová architektúra. Skladá sa z troch komponentov: klient, middleware a databázový server.
Mobilný OLAP: Mobilný OLAP pomáha používateľom získať prístup a analyzovať údaje OLAP pomocou ich mobilných zariadení
Priestorový OLAP: SOLAP je vytvorený s cieľom uľahčiť správu priestorových aj priestorových údajov v geografickom informačnom systéme (GIS)

ROLAP

ROLAP pracuje s údajmi, ktoré existujú v relačnej databáze. Fakty a tabuľky dimenzií sa ukladajú ako relačné tabuľky. Umožňuje tiež multidimenzionálnu analýzu údajov a je najrýchlejšie rastúcim OLAP.

Výhody modelu ROLAP:

  • Vysoká účinnosť dát. Ponúka vysokú účinnosť údajov, pretože výkon dotazov a prístupový jazyk sú optimalizované najmä pre multidimenzionálnu analýzu údajov.
  • Škálovateľnosť. Tento typ systému OLAP ponúka škálovateľnosť pre správu veľkého množstva dát, a to aj vtedy, keď sa dáta neustále zväčšujú.

Nevýhody modelu ROLAP:

  • Dopyt po vyšších zdrojoch: ROLAP vyžaduje vysoké využitie pracovných síl, softvérových a hardvérových zdrojov.
  • Súhrnné obmedzenia údajov. Nástroje ROLAP používajú SQL na všetky výpočty súhrnných údajov. Pre spracovanie výpočtov však nie sú stanovené žiadne limity.
  • Pomalý výkon dopytu. Výkon dotazov v tomto modeli je v porovnaní s programom MOLAP pomalý

MOLAP

MOLAP používa na zobrazovanie multidimenzionálnych zobrazení údajov viacdimenzionálne úložné moduly založené na poliach. V zásade používajú kocku OLAP.

Viac informácií o OLAP sa dozviete tu

Hybridný OLAP

Hybridný OLAP je zmesou ROLAP aj MOLAP. Ponúka rýchly výpočet MOLAP a vyššiu škálovateľnosť ROLAP. HOLAP používa dve databázy.

  1. Agregované alebo vypočítané údaje sú uložené vo viacrozmernej kocke OLAP
  2. Podrobné informácie sú uložené v relačnej databáze.

Výhody hybridného OLAP:

  • Tento druh OLAP pomáha šetriť miesto na disku a zostáva kompaktný, čo pomáha predchádzať problémom súvisiacim s rýchlosťou a pohodlím prístupu.
  • Hybridné HOLAP využíva technológiu kocky, ktorá umožňuje rýchlejší výkon pre všetky typy dát.
  • ROLAP sú okamžite aktualizované a používatelia HOLAP majú prístup k týmto okamžite aktualizovaným údajom v reálnom čase. MOLAP prináša čistenie a konverziu dát, čím zvyšuje ich relevantnosť. To prináša to najlepšie z oboch svetov.

Nevýhody hybridného OLAP:

  • Väčšia úroveň zložitosti : Hlavnou nevýhodou systémov HOLAP je, že podporuje nástroje a aplikácie ROLAP aj MOLAP. Je to teda veľmi komplikované.
  • Možné prekrytia : Existuje vyššia pravdepodobnosť prekrytia, najmä pokiaľ ide o ich funkčnosť.

Výhody OLAP

  • OLAP je platforma pre všetky typy podnikania vrátane plánovania, zostavovania rozpočtu, vykazovania a analýzy.
  • Informácie a výpočty sú v kocke OLAP konzistentné. Toto je zásadná výhoda.
  • Rýchlo vytvorte a analyzujte scenáre „Čo keby“
  • Ľahko vyhľadajte v databáze OLAP široké alebo konkrétne výrazy.
  • OLAP poskytuje základné kamene pre nástroje obchodného modelovania, nástroje na dolovanie údajov a nástroje na vykazovanie výkonu.
  • Umožňuje používateľom robiť dáta z kociek na plátky a kocky podľa rôznych dimenzií, mier a filtrov.
  • Je to dobré na analýzu časových radov.
  • Nájsť niektoré klastre a odľahlé hodnoty je s OLAP ľahké.
  • Jedná sa o výkonný vizualizačný online analytický systém procesov, ktorý poskytuje rýchlejšie časy odozvy

Nevýhody OLAP

  • OLAP vyžaduje usporiadanie údajov do schémy hviezd alebo snehových vločiek. Implementácia a správa týchto schém je komplikovaná
  • V jednej kocke OLAP nemôžete mať veľké množstvo dimenzií
  • K transakčným údajom nie je možné získať prístup v systéme OLAP.
  • Akákoľvek úprava v kocke OLAP vyžaduje úplnú aktualizáciu kocky. Toto je časovo náročný proces

Zhrnutie:

  • OLAP je technológia, ktorá umožňuje analytikom získavať a prezerať obchodné údaje z rôznych uhlov pohľadu.
  • Jadrom koncepcie OLAP je OLAP kocka.
  • Rôzne podnikové aplikácie a ďalšie dátové operácie vyžadujú použitie OLAP Cube.
  • V OLAP je primárnych päť typov analytických operácií 1) Roll-up 2) Drill-down 3) Slice 4) Kocky a 5) Pivot
  • Tri typy široko používaných systémov OLAP sú MOLAP, ROLAP a Hybrid OLAP.
  • Desktop OLAP, Web OLAP a Mobile OLAP sú niektoré ďalšie typy systémov OLAP.

Zaujímavé články...