dátové sklady sú tvorené na základe dlhodobo fixovaných snímok databáz prevádzkových informačný systém a prípadne rôzne externé zdroje. Dátové sklady využívajú databázové technológie, OLAP, data mining, vizualizáciu dát.

Hlavné charakteristiky dátových skladov.

  • obsahuje historické údaje;
  • uchováva podrobné informácie, ako aj čiastočne a úplne zhrnuté údaje;
  • údaje sú väčšinou statické;
  • neregulované, neštruktúrované a heuristickým spôsobom spracovanie dát;
  • stredná a nízka intenzita spracovania transakcií;
  • nepredvídateľný spôsob využívania údajov;
  • určené na analýzu;
  • zameraný na tematické oblasti;
  • podpora strategického rozhodovania;
  • slúži relatívne malému počtu vedúcich pracovníkov.

Pojem OLAP (On-Line Analytical Processing) sa používa na označenie modelu prezentácie údajov a tým aj technológie ich spracovania v dátových skladoch. OLAP na poskytovanie využíva viacrozmerný pohľad na agregované údaje rýchly prístup strategicky dôležitá informácia na účely hĺbkovej analýzy. Aplikácie OLAP by mali mať tieto základné vlastnosti:

  • viacrozmerný reprezentácia údajov;
  • podpora zložitých výpočtov;
  • správne zohľadnenie faktora času.

Výhody OLAP:

  • povýšenie výkon výrobný personál, vývojári aplikačné programy. Včasný prístup k strategickým informáciám.
  • poskytuje používateľom dostatok sily na vykonanie vlastných zmien v schéme.
  • Aplikácie OLAP sa spoliehajú na dátové sklady a OLTP systémy, ktoré z nich prijímajú aktuálne dáta, čím šetrí kontrola integrity firemné údaje.
  • zníženie zaťaženia systémov OLTP a dátové sklady.

OLAP a OLTP. Charakteristiky a hlavné rozdiely

OLAP OLTP
Uloženie údajov by mali zahŕňať interné podnikové údaje aj externé údaje hlavným zdrojom informácií vstupujúcich do prevádzkovej databázy sú aktivity spoločnosti a analýza údajov vyžaduje zapojenie externých zdrojov informácií (napríklad štatistické výkazy)
Objem analytických databáz je minimálne rádovo väčší ako objem prevádzkových. pre spoľahlivú analýzu a prognózovanie v Uloženie údajov potrebujete mať informácie o činnosti korporácie a stave trhu už niekoľko rokov Na operatívne spracovanie sú potrebné údaje za posledných niekoľko mesiacov
Uloženie údajov by mali obsahovať jednotne prezentované a dohodnuté informácie, ktoré sa čo najviac približujú obsahu prevádzkových databáz. Na extrakciu a „čistenie“ informácií z rôznych zdrojov je potrebný komponent. V mnohých veľkých korporáciách je súčasne (z historických dôvodov) niekoľko prevádzkových informačných systémov s vlastnými databázami. Operačné databázy môžu obsahovať sémanticky ekvivalentné informácie prezentované v rôznych formátoch, s rôznymi údajmi o čase ich prijatia, niekedy dokonca protichodné.
Množinu dotazov na analytickú databázu nemožno predvídať. dátové sklady existujú, aby odpovedali na požiadavky analytikov ad hoc. Počítajte len s tým, že žiadosti nebudú prichádzať príliš často a ovplyvnia veľké množstvo informácií. Veľkosti analytických databáz podporujú používanie dopytov s agregátmi (súčet, min, max, priemerný atď.) Systémy spracovania údajov sú navrhnuté tak, aby riešili špecifické problémy. Informácie z databázy sa vyberajú často a v malých častiach. Obyčajne je už počas návrhu známy súbor dotazov na operačnú databázu
Pri malej variabilite analytických databáz (iba pri načítavaní údajov) sa usporiadanie polí ukazuje ako rozumné, viac rýchle metódy indexovanie pre hromadné vzorkovanie, ukladanie vopred agregovaných údajov Systémy spracovania dát sú svojou povahou vysoko variabilné, čo je zohľadnené v použitom DBMS (normalizovaná štruktúra databázy, riadky sú uložené mimo poradia, B-stromy na indexovanie, transakčnosť)
Informácie analytických databáz sú pre spoločnosť také dôležité, že je potrebná veľká granulácia ochrany (individuálne prístupové práva k určitým riadkom a / alebo stĺpcom tabuľky) Pre systémy na spracovanie údajov to zvyčajne stačí ochranu informácií na úrovni stola

Pravidlá Codda pre systémy OLAP

V roku 1993 Codd publikoval OLAP pre používateľov analytikov: Aké by to malo byť. Načrtol v ňom základné koncepty online analytického spracovania a identifikoval 12 pravidiel, ktoré musia produkty spĺňať, aby mohli poskytovať online analytické spracovanie.

  1. Konceptuálna viacrozmerná reprezentácia. Model OLAP musí byť vo svojom jadre viacrozmerný. Viacrozmerný koncepčný diagram alebo vlastná reprezentácia uľahčuje modelovanie a analýzu, ako aj výpočty.
  2. Transparentnosť. Používateľ je schopný získať všetky potrebné údaje zo stroja OLAP bez toho, aby mal podozrenie, odkiaľ pochádzajú. Bez ohľadu na to, či je produkt OLAP súčasťou nástrojov používateľa alebo nie, táto skutočnosť by mala byť pre používateľa neviditeľná. Ak je OLAP poskytovaný výpočtovou technikou klient-server, potom by táto skutočnosť mala byť, ak je to možné, pre používateľa neviditeľná. OLAP by mal byť dodávaný v kontexte skutočne otvorenej architektúry, ktorá umožňuje užívateľovi, nech je kdekoľvek, komunikovať so serverom pomocou analytického nástroja. Okrem toho sa musí dosiahnuť transparentnosť aj vtedy, keď analytický nástroj interaguje s homogénnymi a heterogénnymi databázovými prostrediami.
  3. Dostupnosť. OLAP musí poskytnúť svoje vlastné logický diagram na prístup do heterogénneho databázového prostredia a vykonávanie vhodných transformácií na poskytovanie údajov používateľovi. Okrem toho je potrebné vopred sa postarať o to, kde a ako a aké typy organizácie fyzických údajov budú skutočne použité. Systém OLAP by mal pristupovať iba k údajom, ktoré sú skutočne potrebné, a nie sa na ne vzťahovať všeobecný princíp„kuchynský lievik“, ktorý znamená zbytočné vstupy.
  4. Neustále výkon pri vypracovávaní správ. Výkon reporting by nemal výrazne klesať s rastom počtu dimenzií a veľkosti databázy.
  5. Architektúra klient-server. Vyžaduje sa nielen to, aby bol produkt produktom klient/server, ale aj serverový komponent musí byť dostatočne inteligentný, aby sa rôzni klienti mohli pripojiť s minimálnym úsilím a programovaním.
  6. Všeobecná mnohorozmernosť. Všetky rozmery musia byť rovnaké, každý rozmer musí byť ekvivalentný štruktúrou aj operačnými schopnosťami. Je pravda, že pre jednotlivé merania sú povolené ďalšie prevádzkové možnosti (zrejme sa predpokladá čas), ale napr doplnkové funkcie by mal byť daný akejkoľvek dimenzii. Nemalo by to byť tak, že zákl dátové štruktúry, výpočtové formáty alebo formáty prehľadov boli špecifickejšie pre jednu dimenziu.
  7. Dynamické ovládanie riedke matrice. Systémy OLAP by mali automaticky upravovať svoju fyzickú schému na základe typu modelu, objemov údajov a riedkosti databázy.
  8. Podpora viacerých používateľov. Nástroj OLAP musí poskytovať schopnosť zdieľanie(žiadosť a doplnenie), integrita a bezpečnosť.
  9. Neobmedzené krížové operácie. Pre akékoľvek merania musia byť povolené všetky druhy operácií.
  10. Intuitívna manipulácia s údajmi. Manipulácia s údajmi sa uskutočňovala prostredníctvom priamych akcií na bunky v režime zobrazenia bez použitia ponúk a viacerých operácií.
  11. Flexibilné možnosti prehľadov. Merania by mali byť umiestnené v správe tak, ako si to používateľ želá.
  12. Neobmedzené

OLAP (OnLine Analytical Processing) nie je názov konkrétneho produktu, ale celej online technológie analytického spracovania, ktorá zahŕňa analýzu údajov a reportovanie. Používateľ má k dispozícii viacrozmernú tabuľku, ktorá automaticky sumarizuje údaje v rôznych sekciách a umožňuje rýchlu správu výpočtov a formy zostavy.

Hoci sa v niektorých publikáciách analytické spracovanie nazýva online aj interaktívne, prídavné meno „online“ najpresnejšie odráža význam technológie OLAP. Vývoj manažérskych manažérskych rozhodnutí patrí do kategórie oblastí, ktoré sú najviac falošne prístupné automatizácii. Dnes je však možnosť asistovať manažérovi pri rozvoji rozhodnutí a hlavne výrazne urýchliť proces vypracovávania rozhodnutí, ich výberu a prijímania.

Systémy na podporu rozhodovania majú zvyčajne prostriedky na poskytovanie súhrnných údajov pre rôzne vzorky z počiatočného súboru používateľovi vo forme vhodnej na vnímanie a analýzu. Takéto agregačné funkcie spravidla tvoria viacrozmernú množinu údajov, často nazývanú hyperkocka alebo metakocka, ktorej osi obsahujú parametre a bunky obsahujú agregované údaje, ktoré od nich závisia - a takéto údaje môžu byť uložené aj v relačných tabuľkách, ale v tejto V prípade, že hovoríme o logickej organizácii dát, a nie o fyzickej implementácii ich uloženia.

Pozdĺž každej osi môžu byť údaje usporiadané do hierarchie reprezentujúcej rôzne úrovne detailov.

Podľa dimenzií v multidimenzionálnom modeli sa vyčleňujú faktory, ktoré ovplyvňujú činnosť podniku (napríklad: čas, produkty, pobočky spoločnosti atď.). Výsledná kocka OLAP je potom naplnená ukazovateľmi aktivity podniku (ceny, tržby, plán, zisky, peňažný tok atď.). Je potrebné poznamenať, že na rozdiel od geometrickej kocky nemusia mať steny kocky OLAP rovnakú veľkosť. Toto vyplnenie je možné vykonať ako pri skutočných údajoch operačné systémy a predpovedané na základe historických údajov. Dimenzie hyperkocky môžu byť zložité, hierarchické a možno medzi nimi vytvoriť vzťahy. Počas analýzy môže užívateľ meniť uhol pohľadu na dáta (tzv. operácia zmeny logického pohľadu), čím si dáta prezerá v rôznych sekciách a rieši špecifické problémy. Na kockách je možné vykonávať rôzne operácie, vrátane predpovedania a podmieneného plánovania (analýza čo ak).

Vďaka tomuto dátovému modelu môžu používatelia formulovať zložité dotazy, generovať zostavy a prijímať podmnožiny údajov. Operatívne analytické spracovanie môže výrazne zjednodušiť a urýchliť proces prípravy a rozhodovania riadiacich pracovníkov. Online analytické spracovanie slúži na premenu údajov na informácie. Zásadne sa líši od tradičného procesu podpory rozhodovania, ktorý je najčastejšie založený na zvážení štruktúrovaných správ.


Technológia OLAP sa vzťahuje na typ intelektuálnej analýzy a zahŕňa 12 princípov:

1. Konceptuálna viacrozmerná reprezentácia. Používateľ-analytik vidí svet podniku ako multidimenzionálny a model OLAP musí byť vo svojom jadre multidimenzionálny.

2. Transparentnosť. Architektúra systému OLAP by mala byť otvorená, aby umožnila užívateľovi, nech je kdekoľvek, komunikovať pomocou analytického nástroja – klienta – so serverom.

3. Dostupnosť. Používateľ OLAP analytik musí byť schopný vykonávať analýzu založenú na spoločnej koncepčnej schéme obsahujúcej celopodnikové údaje v relačnej databáze, ako aj údaje zo starších databáz, na spoločných metódach prístupu a na spoločnom analytickom modeli. Systém OLAP by mal pristupovať iba k údajom, ktoré sú skutočne potrebné, a nemal by uplatňovať všeobecný princíp „kuchynského lievika“, ktorý znamená zbytočné vstupy.

4. Konzistentný výkon pri tvorbe správ. So zvýšením počtu dimenzií alebo veľkosti databázy by používateľ analytik nemal zaznamenať výrazný pokles výkonu.

5. Architektúra klient-server . Väčšina údajov potrebných pre online analýzu sa dnes nachádza na sálových počítačoch s prístupom k užívateľským pracovným staniciam cez LAN. To znamená, že produkty OLAP musia byť schopné pracovať v prostredí klient-server.

6. Všeobecná mnohorozmernosť. Každá dimenzia by sa mala uplatňovať bez ohľadu na jej štruktúru a prevádzkové možnosti. Základné dátové štruktúry, vzorce a formáty vykazovania by nemali byť zaujaté voči žiadnej jednej dimenzii.

7. Dynamické riadenie riedkych matíc. Fyzický dizajn nástroja OLAP musí byť plne prispôsobiteľný špecifickému analytickému modelu, aby bolo možné optimálne spravovať riedke matice. Sparity (merané v percentách prázdne bunky všetkým možným) je jednou z charakteristík šírenia údajov.

8. Podpora viacerých používateľov. Nástroj OLAP musí poskytovať možnosť zdieľania dotazov a rozširovania viacerých používateľov analytikov pri zachovaní integrity a bezpečnosti.

9. Neobmedzené krížové operácie. Rôzne operácie môžu vzhľadom na svoju hierarchickú povahu reprezentovať závislé vzťahy v modeli OLAP, to znamená, že sú medzifunkčné. Ich vykonanie by nemalo vyžadovať, aby analytický používateľ predefinoval tieto výpočty a operácie.

10. Intuitívna manipulácia s údajmi. Pohľad používateľa analytika na dimenzie definované v analytickom modeli musí obsahovať všetky potrebné informácie na vykonávanie akcií na modeli OLAP, t.j. nemali by vyžadovať použitie systému menu alebo iné operácie s viacerými používateľskými rozhraniami.

11. Flexibilné možnosti prehľadov. Nástroje na podávanie správ by mali byť syntetizované údaje alebo informácie vyplývajúce z dátového modelu v akejkoľvek možnej orientácii. To znamená, že riadky, stĺpce alebo stránky zostavy musia súčasne zobrazovať viacero dimenzií modelu OLAP s možnosťou zobrazenia ľubovoľnej podmnožiny prvkov (hodnôt) obsiahnutých v dimenzii a v ľubovoľnom poradí.

12. Neobmedzený rozmer a počet úrovní agregácie. Štúdia o možnom počte potrebných meraní potrebných v analytickom modeli ukázala, že až 19 meraní môže byť súčasne použitým používateľom analytika. To vedie k odporúčaniu o počte dimenzií podporovaných systémom OLAP. Okrem toho by každý zo spoločných rozmerov nemal byť obmedzený počtom úrovní agregácie definovaných užívateľom-analytikom.

Ako špecializované OLAP systémy v súčasnosti ponúkané na trhu môžete špecifikovať CalliGraph, Business Intelligence.

Na riešenie jednoduchých úloh analýzy dát je možné použiť rozpočtové riešenie - kancelárske aplikácie Microsoft Excel a Access, ktoré obsahujú elementárne nástroje technológie OLAP, ktoré umožňujú vytvárať kontingenčné tabuľky a na ich základe zostavovať rôzne zostavy.

cieľ ročníková práca je štúdium technológie OLAP, koncepcie jej implementácie a štruktúry.

AT modernom svete počítačové siete a výpočtové systémy vám umožňujú analyzovať a spracovávať veľké množstvo údajov.

Veľké množstvo informácií značne komplikuje hľadanie riešení, ale umožňuje získať oveľa presnejšie výpočty a analýzy. Na vyriešenie tohto problému existuje celá trieda informačné systémy vykonanie analýzy. Takéto systémy sa nazývajú systémy na podporu rozhodovania (DSS) (DSS, Decision Support System).

Na vykonanie analýzy musí DSS akumulovať informácie, ktoré majú prostriedky na ich vstup a uloženie. Celkovo sú v DSS riešené tri hlavné úlohy:

· zadávanie údajov;

· úložisko dát;

· analýza dát.

Zadávanie údajov do DSS sa vykonáva automaticky zo senzorov charakterizujúcich stav prostredia alebo procesu, alebo ľudským operátorom.

Ak sa údaje zadávajú automaticky zo senzorov, údaje sa hromadia signálom pripravenosti, ktorý sa objaví, keď sa objavia informácie, alebo cyklickým dotazovaním. Ak zadávanie vykonáva človek, mali by používateľom poskytnúť pohodlné prostriedky na zadávanie údajov, ktoré ich kontrolujú na správnosť zadania, ako aj vykonávať potrebné výpočty.

Pri súčasnom zadávaní údajov viacerými operátormi je potrebné riešiť problémy úpravy a paralelného prístupu k tým istým údajom.

DSS poskytuje analytikom údaje vo forme správ, tabuliek, grafov na štúdium a analýzu, preto takéto systémy poskytujú funkcie na podporu rozhodovania.

V subsystémoch zadávania údajov, nazývaných OLTP (On-linetransactionprocessing), je implementované prevádzkové spracovanie údajov. Na ich implementáciu sa používajú konvenčné systémy správy databáz (DBMS).

Analytický subsystém môže byť zostavený na základe:

· podsystémy analýzy vyhľadávania informácií založené na relačných DBMS a statických dotazoch pomocou jazyka SQL;

· podsystémy prevádzkovej analýzy. Na implementáciu takýchto subsystémov sa využíva technológia online analytického spracovania dát OLAP s využitím konceptu viacrozmernej reprezentácie dát;

· subsystémy intelektuálnej analýzy. Tento subsystém implementuje metódy a algoritmy DataMining.

Z pohľadu užívateľa poskytujú OLAP-systémy prostriedky flexibilného prezerania informácií v rôznych sekciách, automatický príjem agregovaných dát, vykonávanie analytických operácií konvolúcie, detailovania, porovnávania v čase. Vďaka tomu všetkému sú OLAP systémy riešením s veľkými výhodami v oblasti prípravy dát pre všetky typy business reportingu, zahŕňajúce prezentáciu dát v rôznych sekciách a rôzne úrovne hierarchie, ako sú správy o predaji, rôzne formy rozpočtov a iné. OLAP systémy majú veľké výhody takejto prezentácie v iných formách analýzy dát, vrátane prognózovania.

1.2 Definícia OLAP-systémy

Technológia komplexnej multidimenzionálnej analýzy dát sa nazýva OLAP. OLAP je kľúčovým komponentom organizácie dátového skladu.

Funkcionalitu OLAP je možné implementovať rôznymi spôsobmi, napríklad jednoduchou analýzou údajov kancelárske aplikácie a komplexnejšie - distribuované analytické systémy založené na serverových produktoch.

OLAP (On-LineAnalyticalProcessing) je technológia pre online analytické spracovanie dát, ktorá využíva nástroje a metódy na zber, ukladanie a analýzu viacrozmerných dát a na podporu rozhodovacích procesov.

Hlavným účelom OLAP systémov je podpora analytických činností, ľubovoľných požiadaviek od používateľov analytikov. Účelom analýzy OLAP je testovať vznikajúce hypotézy.

Použitie systému OLAP vám umožňuje automatizovať strategickú úroveň riadenia organizácie. OLAP (Online Analytical Processing - analytické spracovanie dát v reálnom čase) je výkonná technológia na spracovanie a výskum dát. Systémy postavené na báze technológie OLAP poskytujú takmer neobmedzené možnosti na zostavovanie správ, vykonávanie zložitých analytických výpočtov, vytváranie prognóz a scenárov a vývoj rôznych možností plánov.

Plnohodnotné OLAP systémy sa objavili začiatkom 90. rokov ako výsledok rozvoja informačných systémov na podporu rozhodovania. Sú určené na transformáciu rôznych, často nesúrodých údajov užitočná informácia. Systémy OLAP môžu organizovať údaje podľa určitého súboru kritérií. Nie je však potrebné, aby kritériá mali jasné charakteristiky.

Systémy OLAP našli svoje uplatnenie v mnohých otázkach strategického riadenia organizácie: riadenie výkonnosti podniku, strategické plánovanie, rozpočtovanie, prognózovanie rozvoja, finančné výkazníctvo, analýza práce, simulácia externého a interného prostredia organizácie, ukladanie dát a reporting.

Štruktúra systému OLAP

Prevádzka systému OLAP je založená na spracovaní viacrozmerných dátových polí. Viacrozmerné polia sú usporiadané tak, že každý prvok poľa má mnoho vzťahov s inými prvkami. Na vytvorenie multidimenzionálneho poľa musí systém OLAP získavať vstupné údaje z iných systémov (napr. ERP alebo CRM systémov), alebo prostredníctvom externého vstupu. Používateľ systému OLAP dostáva potrebné údaje v štruktúrovanej forme v súlade s jeho požiadavkou. Na základe zadaného postupu si viete predstaviť štruktúru OLAP systému.

Vo všeobecnosti sa štruktúra systému OLAP skladá z nasledujúce položky:

  • databázy . Databáza je zdrojom informácií pre fungovanie systému OLAP. Typ databázy závisí od typu OLAP systému a algoritmov OLAP servera. Spravidla sa využívajú relačné databázy, multidimenzionálne databázy, dátové sklady a pod.
  • OLAP server. Poskytuje správu viacrozmernej dátovej štruktúry a vzťahu medzi databázou a používateľmi systému OLAP.
  • vlastné aplikácie. Tento prvok štruktúry systému OLAP spravuje požiadavky používateľov a generuje výsledky prístupu k databáze (prehľady, grafy, tabuľky atď.)

V závislosti od spôsobu organizácie, spracovania a ukladania údajov je možné implementovať systémy OLAP lokálnych počítačov používateľov alebo pomocou dedikovaných serverov.

Existujú tri hlavné spôsoby ukladania a spracovania údajov:

  • lokálne . Údaje sú umiestnené na počítačoch používateľov. Spracovanie, analýza a správa dát sa vykonáva na miestnych pracoviskách. Táto štruktúra systému OLAP má značné nevýhody spojené s rýchlosťou spracovania údajov, bezpečnosťou údajov a obmedzeným využitím viacrozmernej analýzy.
  • relačné databázy. Tieto databázy sa používajú, keď systém OLAP spolupracuje so systémom CRM alebo systémom ERP. Dáta sú uložené na serveri týchto systémov vo forme relačných databáz alebo dátových skladov. Server OLAP pristupuje k týmto databázam, aby vytvoril potrebné viacrozmerné štruktúry a vykonal analýzu.
  • multidimenzionálne databázy. V tomto prípade sú dáta organizované ako špeciálny dátový sklad na dedikovanom serveri. Všetky dátové operácie sa vykonávajú na tomto serveri, ktorý prevádza pôvodné dáta do viacrozmerných štruktúr. Takéto štruktúry sa nazývajú kocky OLAP. Zdrojmi údajov na vytvorenie kocky OLAP sú relačné databázy a/alebo súbory klientov. Dátový server vykonáva predbežnú prípravu a spracovanie údajov. OLAP server pracuje s kockou OLAP bez priameho prístupu k zdrojom údajov (relačné databázy, klientske súbory atď.).

Typy OLAP systémov

Podľa spôsobu ukladania a spracovania dát možno všetky OLAP systémy rozdeliť do troch hlavných typov.


1. ROLAP (Relational OLAP - relačné OLAP systémy) - tento typ OLAP systému pracuje s relačnými databázami. K údajom sa pristupuje priamo do relačnej databázy. Dáta sú uložené v relačných tabuľkách. Používatelia majú možnosť vykonávať viacrozmernú analýzu ako v tradičných systémoch OLAP. To sa dosiahne používaním SQL nástroje a špeciálne požiadavky.

Jednou z výhod ROLAP je schopnosť efektívnejšie spracovávať veľké množstvo dát. Ďalšou výhodou ROLAP je schopnosť efektívne spracovávať číselné aj textové údaje.

Medzi nevýhody ROLAP patrí nízky výkon (v porovnaní s tradičnými systémami OLAP), pretože spracovanie údajov vykonáva server OLAP. Ďalšou nevýhodou je obmedzenie funkčnosti v dôsledku použitia SQL.


2. MOLAP (Multidimenzionální OLAP - multidimenzionálne OLAP systémy). Tento typ OLAP systémov patrí medzi tradičné systémy. Rozdiel medzi tradičným systémom OLAP a inými systémami spočíva v predbežnej príprave a optimalizácii údajov. Tieto systémy spravidla využívajú dedikovaný server, na ktorom sú dáta vopred spracované. Údaje sa generujú v viacrozmerné polia- OLAP kocky.

Systémy MOLAP sú najefektívnejšie v spracovaní údajov. uľahčujú reorganizáciu a štruktúru údajov pre rôzne požiadavky používateľov. Analytické nástroje MOLAP vám umožňujú vykonávať zložité výpočty. Ďalšou výhodou MOLAP je schopnosť rýchlo generovať dotazy a získať výsledky. To je zabezpečené predbežným formovaním OLAP kociek.

Medzi nevýhody systému MOLAP patrí obmedzenie objemu spracovávaných dát a redundancia dát, pretože na vytvorenie viacrozmerných kociek v rôznych aspektoch musia byť údaje duplikované.


3. HOLAP (Hybrid OLAP - hybridné OLAP systémy). Hybridné systémy OLAP sú kombináciou systémov ROLAP a MOLAP. Hybridné systémy sa pokúsili spojiť výhody dvoch systémov: využitie multidimenzionálnych databáz a manažment relačných databáz. Systémy HOLAP umožňujú ukladať veľké množstvo údajov v relačných tabuľkách a spracované údaje sa umiestňujú do vopred zostavených viacrozmerných kociek OLAP. Výhodou tohto druhu systému je škálovateľnosť údajov, rýchle spracovanie údajov a flexibilný prístup k zdrojom údajov.

Existujú aj iné typy OLAP systémov, ale ide skôr o marketingový ťah výrobcov ako o samostatný typ OLAP systému.

Tieto typy zahŕňajú:

  • WOLAP (Web OLAP). Pohľad na systém OLAP s podporou webové rozhranie. Tieto systémy OLAP majú možnosť prístupu k databázam cez webové rozhranie.
  • DOLAP (Desktop OLAP). Tento typ systému OLAP umožňuje používateľom stiahnuť databázu na lokálne pracovisko a pracovať s ňou lokálne.
  • MobileOLAP. Ide o funkciu systémov OLAP, ktorá umožňuje prácu s databázou na diaľku pomocou mobilných zariadení.
  • SOLAP (priestorový OLAP). Tento typ systémov OLAP je určený na spracovanie priestorových údajov. Vznikol ako výsledok integrácie geografických informačných systémov a systémov OLAP. Tieto systémy umožňujú spracovávať dáta nielen v alfanumerickom formáte, ale aj vo forme vizuálnych objektov a vektorov.

Výhody systému OLAP

Použitie systému OLAP dáva organizácii schopnosť predpovedať a analyzovať rôzne situácie súvisiace so súčasnými aktivitami a perspektívami rozvoja. Tieto systémy možno považovať za doplnkové k podnikovým automatizačným systémom. Všetky výhody systémov OLAP priamo závisia od presnosti, spoľahlivosti a objemu zdrojových údajov.

Hlavné výhody systému OLAP sú:

  • konzistencia informácie o pozadí a výsledky analýzy. V prítomnosti systému OLAP je vždy možné dohľadať zdroj informácií a určiť logický vzťah medzi získanými výsledkami a zdrojovými údajmi. Subjektivita výsledkov analýzy je znížená.
  • vykonávanie viacrozmernej analýzy. Použitie systému OLAP vám umožňuje získať veľa scenárov vývoja udalostí na základe súboru počiatočných údajov. Vďaka analytickým nástrojom je možné modelovať situácie podľa princípu „čo sa stane, ak“.
  • kontrola detailov. Detail prezentácie výsledkov sa môže líšiť v závislosti od potrieb používateľov. V tomto prípade nie je potrebné vykonávať zložité nastavenia systému a opakovať výpočty. Správa môže obsahovať presne tie informácie, ktoré sú potrebné na rozhodovanie.
  • odhalenie skrytých závislostí. Budovaním viacrozmerných vzťahov je možné identifikovať a identifikovať skryté závislosti v rôznych procesoch alebo situáciách, ktoré ovplyvňujú výrobné činnosti.
  • vytvorenie jedinej platformy. Použitím systému OLAP je možné vytvoriť jednotnú platformu pre všetky prognostické a analytické procesy v podniku. Najmä údaje systému OLAP sú základom pre vytváranie prognóz rozpočtu, prognóz predaja, prognóz nákupu, strategických plánov rozvoja atď.

Pojem multidimenzionálnej analýzy dát úzko súvisí s operačnou analýzou, ktorá sa vykonáva pomocou systémov OLAP.

OLAP (On-Line Analytical Processing) je technológia pre online analytické spracovanie dát, ktorá využíva metódy a nástroje na zber, ukladanie a analýzu multidimenzionálnych dát za účelom podpory rozhodovacích procesov.

Hlavným účelom OLAP systémov je podpora analytických činností, ľubovoľných (často sa používa termín ad-hoc) požiadaviek používateľov analytikov. Účelom analýzy OLAP je testovať vznikajúce hypotézy.

Pri počiatkoch technológie OLAP je zakladateľ relačného prístupu E. Codd. V roku 1993 publikoval článok s názvom „OLAP pre používateľov analytikov: Čo by malo byť“. Tento dokument načrtáva základné koncepty online analytického spracovania a identifikuje nasledujúcich 12 požiadaviek, ktoré musia spĺňať produkty, ktoré umožňujú online analytické spracovanie. Tokmakov G.P. Databáza. Databázový koncept, relačný dátový model, SQL jazyky. S. 51

Nižšie je uvedených 12 pravidiel, ktoré Codd načrtol a ktoré definujú OLAP.

1. Multidimenzionálnosť – OLAP-systém na koncepčnej úrovni by mal prezentovať dáta vo forme multidimenzionálneho modelu, ktorý zjednodušuje procesy analýzy a vnímania informácií.

2. Transparentnosť – OLAP systém by mal pred používateľom skrývať skutočnú implementáciu multidimenzionálneho modelu, spôsob organizácie, zdroje, nástroje na spracovanie a ukladanie.

3. Dostupnosť -- OLAP systém musí užívateľovi poskytnúť jediný, konzistentný a konzistentný dátový model, ktorý umožní prístup k dátam bez ohľadu na to, ako alebo kde sú uložené.

4. Konzistentný výkon pri vývoji správ -- Výkonnosť systémov OLAP by sa nemala výrazne znižovať so zvyšujúcim sa počtom analyzovaných dimenzií.

5. Architektúra klient-server -- OLAP systém musí byť schopný pracovať v prostredí klient-server, ako väčšina údajov, ktoré je dnes potrebné podrobiť online analytickému spracovaniu, sa ukladá distribuovane. Hlavnou myšlienkou je, že serverová súčasť nástroja OLAP by mala byť dostatočne inteligentná, aby umožnila vytvorenie spoločnej koncepčnej schémy založenej na zovšeobecnení a konsolidácii rôznych logických a fyzických schém podnikových databáz s cieľom poskytnúť transparentný efekt.

6. Rovnosť rozmerov -- Systém OLAP musí podporovať viacrozmerný model, v ktorom sú všetky rozmery rovnaké. Ak je to nevyhnutné doplnkové vlastnosti môže byť pridelená jednotlivým rozmerom, ale táto možnosť musí byť priradená ľubovoľnému rozmeru.

7. Dynamická správa riedkych matíc -- Systém OLAP musí poskytovať optimálne zaobchádzanie s riedkymi maticami. Rýchlosť prístupu musí byť zachovaná bez ohľadu na umiestnenie dátových buniek a musí byť konštantnou hodnotou pre modely s rôznym počtom rozmerov a rôznym stupňom riedkosti dát.

8. Podpora pre viacužívateľský režim – OLAP-systém by mal poskytovať možnosť pracovať s viacerými používateľmi spolu s jedným analytickým modelom alebo pre nich vytvárať rôzne modely z jedného dáta. Zároveň je možné čítať aj zapisovať dáta, takže systém musí zabezpečiť ich integritu a bezpečnosť.

9. Neobmedzené krížové operácie -- OLAP systém musí zabezpečiť, aby funkčné vzťahy opísané pomocou určitého formálneho jazyka medzi bunkami hyperkocky boli zachované pri vykonávaní akýchkoľvek operácií rezu, rotácie, konsolidácie alebo hĺbkovej analýzy. Systém musí nezávisle (automaticky) vykonať konverziu nadviazané vzťahy bez toho, aby ich používateľ musel prepísať.

10. Intuitívna manipulácia s údajmi -- OLAP systém musí poskytovať spôsob, ako vykonávať operácie rozdeľovania, otáčania, konsolidácie a vŕtania na hyperkocke bez toho, aby používateľ musel vykonávať veľa práce s používateľským rozhraním. Rozmery definované v analytickom modeli musia obsahovať všetky potrebné informácie na vykonanie vyššie uvedených operácií.

11. Flexibilné možnosti podávania správ -- OLAP systém musí podporovať rôznymi spôsobmi vizualizácia dát, t.j. správy by sa mali predkladať vo všetkých možných smeroch. Nástroje na podávanie správ by mali reprezentovať syntetizované údaje alebo informácie vyplývajúce z dátového modelu v akejkoľvek možnej orientácii. To znamená, že riadky, stĺpce alebo strany by mali súčasne zobrazovať rozmery od 0 do N, kde N-- číslo merania celého analytického modelu. Okrem toho každá dimenzia obsahu zobrazená v jednom príspevku, stĺpci alebo stránke musí umožňovať zobrazenie akejkoľvek podmnožiny prvkov (hodnôt) obsiahnutých v dimenzii v ľubovoľnom poradí.

12. Neobmedzená dimenzionalita a počet úrovní agregácie - Štúdia o možnom počte požadovaných dimenzií v analytickom modeli ukázala, že súčasne je možné použiť až 19 dimenzií. Preto dôrazné odporúčanie, aby analytický nástroj bol schopný poskytnúť aspoň 15 a najlepšie 20 meraní súčasne. Okrem toho by každá zo spoločných dimenzií nemala byť obmedzená počtom úrovní agregácie a konsolidácie definovaných užívateľom-analytikom.

Dodatočné pravidlá Codd.

Súbor týchto požiadaviek, ktoré slúžili ako de facto definícia OLAP, pomerne často vyvoláva rôzne kritiky, napríklad pravidlá 1, 2, 3, 6 sú požiadavky a pravidlá 10, 11 sú neformalizované želania. Tokmakov G.P. Databáza. Databázový koncept, relačný dátový model, jazyky SQL. S. 68 Uvedených 12 požiadaviek Codd vám teda neumožňuje presne definovať OLAP. V roku 1995 Codd pridal do zoznamu nasledujúcich šesť pravidiel:

13. Dávková extrakcia vs. interpretácia -- Systém OLAP musí byť rovnako účinný pri poskytovaní prístupu k interným aj externým údajom.

14. Podpora všetkých modelov analýzy OLAP -- Systém OLAP musí podporovať všetky štyri modely analýzy údajov definované Coddom: kategorické, interpretačné, špekulatívne a stereotypné.

15. Zaobchádzanie s denormalizovanými údajmi -- Systém OLAP musí byť integrovaný s denormalizovanými zdrojmi údajov. Úpravy údajov vykonané v prostredí OLAP by nemali viesť k zmenám údajov uložených v pôvodných externých systémoch.

16. Ukladanie výsledkov OLAP: ich oddelenie od pôvodných údajov -- Systém OLAP pracujúci v režime čítania a zápisu musí po úprave pôvodných údajov uložiť výsledky oddelene. Inými slovami, bezpečnosť zdrojových údajov je zabezpečená.

17. Vylúčenie chýbajúcich hodnôt -- Pri prezentovaní údajov používateľovi musí systém OLAP všetky chýbajúce hodnoty zahodiť. Inými slovami, chýbajúce hodnoty sa musia líšiť od hodnôt null.

18 Spracovanie chýbajúcich hodnôt -- OLAP systém musí ignorovať všetky chýbajúce hodnoty bez ohľadu na ich zdroj. Táto funkcia súvisí so 17. pravidlom.

Okrem toho Codd porušil všetkých 18 pravidiel do nasledujúcich štyroch skupín a nazval ich funkciami. Tieto skupiny boli pomenované B, S, R a D.

Medzi hlavné vlastnosti (B) patria nasledujúce pravidlá:

Viacrozmerná koncepčná reprezentácia údajov (pravidlo 1);

Intuitívna manipulácia s údajmi (pravidlo 10);

Dostupnosť (pravidlo 3);

Dávková extrakcia verzus interpretácia (pravidlo 13);

Podpora pre všetky modely analýzy OLAP (pravidlo 14);

Architektúra "klient-server" (pravidlo 5);

Transparentnosť (pravidlo 2);

Podpora pre viacerých hráčov (pravidlo 8)

Špeciálne vlastnosti (S):

Spracovanie nenormalizovaných údajov (pravidlo 15);

Ukladanie výsledkov OLAP: ich ukladanie oddelene od pôvodných údajov (pravidlo 16);

Vylúčenie chýbajúcich hodnôt (pravidlo 17);

Spracovanie chýbajúcich hodnôt (pravidlo 18). Funkcie prehľadov (R):

Flexibilita generovania správ (pravidlo 11);

Správa o štandarde výkonnosti (pravidlo 4);

Automatická konfigurácia fyzickej vrstvy (upravené pôvodné pravidlo 7).

Kontrola merania (D):

Univerzálnosť meraní (pravidlo 6);

Neobmedzený počet dimenzií a úrovní agregácie (pravidlo 12);

Neobmedzené operácie medzi dimenziami (pravidlo 9).