Kakšna je razlika med podatkovnim skladiščem in kocko?


Odgovor 1:

Kocka podatkov

V kontekstu računalniškega programiranja je podatkovna kocka (ali datacube) večdimenzionalni niz vrednosti, ki se običajno uporablja za opisovanje časovnih vrst slikovnih podatkov. Kocka podatkov se uporablja za predstavljanje podatkov skupaj z neko mero zanimanja. Čeprav se imenuje 'kocka', je lahko enodimenzionalna, dvodimenzionalna, tridimenzionalna ali višjerazsežna. Vsaka dimenzija predstavlja novo merilo, medtem ko celice v kocki predstavljajo zanimiva dejstva.

Razmislite o zgornji kocki sistema za upravljanje nakupovalnih centrov.

Vsak stolpec predstavlja število prodaj v vsaki trgovini.

Vsaka vrstica predstavlja različne oddelke nakupovalnega središča.

Vsaka plast predstavlja mesec.

Tu so vidne vrednosti junijskega meseca.

Torej, število prodajnih izdelkov v trgovini 2 v mesecu juniju je 47.

(Za več si oglejte stran 136, Data Mining: Concepts and Techniques by Han and Kamber, 3. izdaja)

Podatkovno skladišče

Pri računanju je podatkovno skladišče (DW ali DWH), znano tudi kot poslovno skladišče podatkov (EDW), sistem, ki se uporablja za poročanje in analizo podatkov, in velja za osrednjo sestavino poslovne inteligence.

DW so osrednja skladišča integriranih podatkov iz enega ali več različnih virov. Na enem mestu hranijo trenutne in zgodovinske podatke.

Preprosta razlaga: Skladišče podatkov je eno mesto, kjer se shranjuje veliko podatkov iz različnih virov, da se lahko poročajo.

Predstavljajte si verigo mega centrov Reliance v Indiji. Po vsej državi obstajajo mega središči Reliance. Vsak nakupovalni center pošlje podatke različnih oddelkov v centralna skladišča. Na enem mestu se zbira, ki se imenuje skladišče podatkov. Uporablja se za upravljanje različnih vrst podatkov. Podatki se uporabljajo tudi za izvajanje različnih vrst analiz, na primer vzorca nakupa.

Torej, zgoraj navedena dva izraza; Data Warehouse in Data kocka sta si povsem različni, vendar nista primerljivi, zato med dvema ne moremo navesti razlike med seboj.

Vir:

[1] Wikipedija

[2] Podatkovno rudarjenje: pojmi in tehnike Han in Kamber

Bil si Vyas


Odgovor 2:

Kadar se kdo sklicuje na shrambo podatkov, se sklicuje na sheme zvezd, ki temeljijo na Kimballu, sheme normaliziranih podatkovnih skladišč, ki temeljijo na Inmonu, in sheme območja uprizarjanja, ki so bile fizično ustvarjene v relacijski podatkovni bazi, kot so Oracle, DB2 itd. sheme zvezd se imenujejo tudi Data Mart (s).

Kocka je referenca za večdimenzionalno shranjevanje z uporabo orodij OLAP, kot so Cognos, Hyperion itd.


Odgovor 3:

Kadar se kdo sklicuje na shrambo podatkov, se sklicuje na sheme zvezd, ki temeljijo na Kimballu, sheme normaliziranih podatkovnih skladišč, ki temeljijo na Inmonu, in sheme območja uprizarjanja, ki so bile fizično ustvarjene v relacijski podatkovni bazi, kot so Oracle, DB2 itd. sheme zvezd se imenujejo tudi Data Mart (s).

Kocka je referenca za večdimenzionalno shranjevanje z uporabo orodij OLAP, kot so Cognos, Hyperion itd.