Schéma hviezdy a snehovej vločky v dátovom sklade s príkladmi

Obsah:

Anonim

Čo je to multidimenzionálna schéma?

Multidimenzionálna schéma je špeciálne navrhnutá na modelovanie systémov dátových skladov. Schémy sú navrhnuté tak, aby vyhovovali jedinečným potrebám veľmi veľkých databáz určených na analytické účely (OLAP).

Typy schémy dátového skladu:

Nasledujú 3 hlavné typy viacrozmerných schém, z ktorých každé má svoje jedinečné výhody.

  • Hviezdna schéma
  • Schéma snehovej vločky
  • Galaxy Schema

V tomto výučbe sa dozviete viac o-

  • Čo je to schéma hviezd?
  • Čo je schéma snehovej vločky?
  • Schéma hviezdy vs Schéma snehovej vločky: Kľúčové rozdiely
  • Čo je to schéma Galaxy?
  • Čo je to klastrová schéma hviezd?

Čo je to schéma hviezd?

Hviezdna schéma v dátovom sklade, v ktorej môže mať stred hviezdy jednu tabuľku faktov a množstvo súvisiacich tabuliek dimenzií. Je známa ako hviezdna schéma, pretože svojou štruktúrou pripomína hviezdu. Dátový model Star Schema je najjednoduchším typom schémy Data Warehouse. Je známa tiež ako schéma zapojenia hviezd a je optimalizovaná na dopytovanie veľkých množín údajov.

V nasledujúcom príklade schémy hviezd je tabuľka faktov v strede, ktorá obsahuje kľúče ku každej tabuľke dimenzií, napríklad Dealer_ID, ID modelu, Date_ID, Product_ID, Branch_ID a ďalšie atribúty, ako sú predané jednotky a výnosy.

Príklad schémy hviezdnych schém

Charakteristika hviezdnej schémy:

  • Každá dimenzia v hviezdnej schéme je reprezentovaná jedinou jednorozmernou tabuľkou.
  • Tabuľka dimenzií by mala obsahovať množinu atribútov.
  • Tabuľka dimenzií je spojená s tabuľkou faktov pomocou cudzieho kľúča
  • Tabuľka dimenzií nie sú navzájom spojené
  • Tabuľka faktov by obsahovala kľúč a mieru
  • Hviezdna schéma je ľahko pochopiteľná a poskytuje optimálne využitie disku.
  • Tabuľky dimenzií nie sú normalizované. Napríklad na vyššie uvedenom obrázku Country_ID nemá vyhľadávaciu tabuľku Country, ako by to mal návrh OLTP.
  • Schéma je široko podporovaná nástrojmi BI

Čo je schéma snehovej vločky?

Schéma snehovej vločky v dátovom sklade je logické usporiadanie tabuliek vo viacrozmernej databáze tak, že diagram ER pripomína tvar snehovej vločky. Schéma snehovej vločky je rozšírením hviezdnej schémy a dodáva ďalšie dimenzie. Tabuľky dimenzií sú normalizované, čím sa údaje rozdelia na ďalšie tabuľky.

V nasledujúcom príklade schémy snehových vločiek sa krajina ďalej normalizuje na samostatnú tabuľku.

Príklad schémy snehových vločiek

Charakteristika schémy snehovej vločky:

  • Hlavnou výhodou schémy snehových vločiek je využitie menšieho miesta na disku.
  • Do schémy sa pridáva ľahšia implementácia dimenzie
  • Z dôvodu viacerých tabuliek je výkon dotazov znížený
  • Primárnou výzvou, ktorej budete čeliť pri používaní schémy snehovej vločky, je to, že je potrebné vykonať viac úsilia v oblasti údržby, pretože je k dispozícii viac vyhľadávacích tabuliek.

Schéma hviezdy vs Schéma snehovej vločky: Kľúčové rozdiely

Nasleduje kľúčový rozdiel medzi hviezdnou schémou a schémou snehovej vločky:

Hviezdna schéma Schéma snehovej vločky
Hierarchie dimenzií sú uložené v rozmerovej tabuľke. Hierarchie sú rozdelené do samostatných tabuliek.
Obsahuje tabuľku faktov obklopenú tabuľkami dimenzií. Jedna tabuľka faktov obklopená tabuľkou dimenzií, ktoré sú zase obklopené tabuľkou dimenzií
V hviezdnej schéme iba jeden spoj vytvára vzťah medzi tabuľkou faktov a akýmikoľvek tabuľkami dimenzií. Schéma snehovej vločky vyžaduje na načítanie údajov veľa spojení.
Jednoduchý dizajn DB. Veľmi zložitý DB dizajn.
Denormalizovaná dátová štruktúra a dopyt tiež bežia rýchlejšie. Normalizovaná dátová štruktúra.
Vysoká úroveň redundancie údajov Redundancia údajov na veľmi nízkej úrovni
Tabuľka Single Dimension obsahuje agregované údaje. Rozdelenie údajov do rôznych dimenzií.
Spracovanie kociek je rýchlejšie. Spracovanie kocky môže byť kvôli zložitému spojeniu pomalé.
Ponúka dotazy s vyššou výkonnosťou pomocou optimalizácie dotazu Star join. Tabuľky môžu byť spojené s viacerými rozmermi. Schému snehovej vločky predstavuje centralizovaná tabuľka faktov, ktorá je nepravdepodobná v súvislosti s viacerými dimenziami.

Čo je to schéma Galaxy?

Galaxy Schema obsahuje dve tabuľky faktov Tento rozmer podiel tabuliek medzi nimi. Nazýva sa tiež Schéma konštelácie faktov. Schéma sa považuje za kolekciu hviezd, odtiaľ pochádza názov Galaxy Schema.

Príklad schémy Galaxy

Ako vidíte v predchádzajúcom príklade, existujú dve tabuľky s faktami

  1. Príjmy
  2. Výrobok.

V schémach Galaxy sa zdieľanie dimenzií nazýva Konformované dimenzie.

Charakteristika schémy Galaxy:

  • Dimenzie v tejto schéme sú rozdelené do samostatných dimenzií na základe rôznych úrovní hierarchie.
  • Napríklad ak má geografia štyri úrovne hierarchie, ako je región, krajina, štát a mesto, potom by schéma Galaxy mala mať štyri dimenzie.
  • Navyše je možné vytvoriť tento typ schémy rozdelením jednohviezdičkovej schémy do viacerých hviezdnych schém.
  • V tejto schéme sú veľké rozmery, ktoré je potrebné vytvoriť na základe úrovní hierarchie.
  • Táto schéma je užitočná na agregáciu tabuliek faktov pre lepšie pochopenie.

Čo je to klastrová schéma hviezd?

Schéma snehovej vločky obsahuje plne rozšírené hierarchie. To však môže pridať na schéme zložitosť a vyžaduje to ďalšie spojenia. Na druhej strane, hviezdna schéma obsahuje úplne zbalené hierarchie, čo môže viesť k nadbytočnosti. Najlepším riešením môže byť teda rovnováha medzi týmito dvoma schémami, čo je návrh schémy hviezdnej klastra.

Príklad schémy hviezdokôp

Prekrývajúce sa dimenzie možno nájsť ako vidly v hierarchiách. Vidlica sa stane, keď entita vystupuje ako rodič v dvoch rôznych dimenzionálnych hierarchiách. Subjekty vidlice sa potom identifikovali ako klasifikácia so vzťahmi jeden na viac.

Zhrnutie:

  • Multidimenzionálna schéma je špeciálne navrhnutá na modelovanie systémov dátových skladov
  • Hviezdna schéma je najjednoduchší typ schémy Data Warehouse. Je známa ako hviezdna schéma, pretože svojou štruktúrou pripomína hviezdu.
  • Schéma snehovej vločky je rozšírením hviezdnej schémy a dodáva ďalšie dimenzie. Nazýva sa snehová vločka, pretože jej schéma pripomína snehovú vločku.
  • V hviezdnej schéme iba jedno spojenie definuje vzťah medzi tabuľkou faktov a akýmikoľvek tabuľkami dimenzií.
  • Schéma hviezd obsahuje tabuľku faktov obklopenú tabuľkami dimenzií.
  • Schéma snehovej vločky je obklopená tabuľkou dimenzií, ktoré sú zase obklopené tabuľkou dimenzií
  • Schéma snehovej vločky vyžaduje na načítanie údajov veľa spojení.
  • Schéma Galaxy obsahuje dve tabuľky faktov, ktoré zdieľajú tabuľky dimenzií. Nazýva sa tiež Schéma konštelácie faktov.
  • Schéma hviezdokopy obsahuje atribúty schémy Hviezda a Snehová vločka.