magazyn danych tworzone są na podstawie stałych przez długi okres czasu migawek baz danych operacyjnych System informacyjny i ewentualnie różne źródła zewnętrzne. Hurtownie danych wykorzystują technologie bazodanowe, OLAP, data mining, wizualizację danych.

Główne cechy hurtowni danych.

  • zawiera dane historyczne;
  • przechowuje szczegółowe informacje, a także częściowo i całkowicie podsumowane dane;
  • dane są w większości statyczne;
  • nieuregulowane, nieustrukturyzowane i heurystyczny sposób przetwarzanie danych;
  • średnia i niska intensywność przetwarzania transakcji;
  • nieprzewidywalny sposób wykorzystania danych;
  • przeznaczony do analizy;
  • skupiony na obszary podlegające;
  • wsparcie w podejmowaniu strategicznych decyzji;
  • obsługuje stosunkowo niewielką liczbę kadry kierowniczej.

Terminem OLAP (On-Line Analytical Processing) określa się model prezentacji danych, a tym samym technologię ich przetwarzania w hurtowniach danych. OLAP wykorzystuje wielowymiarowy widok zagregowanych danych, aby zapewnić: szybki dostęp strategicznie ważna informacja do pogłębionej analizy. Aplikacje OLAP powinny mieć następujące podstawowe właściwości:

  • wielowymiarowy Reprezentacja danych;
  • wsparcie dla skomplikowanych obliczeń;
  • prawidłowe uwzględnienie czynnika czasu.

Zalety OLAP:

  • awans wydajność kadra produkcyjna, programiści programy użytkowe. Terminowy dostęp do strategicznych informacji.
  • dając użytkownikom wystarczającą moc do wprowadzania własnych zmian w schemacie.
  • Aplikacje OLAP polegają na magazyn danych i systemów OLTP, otrzymując z nich aktualne dane, co oszczędza kontrola integralności dane korporacyjne.
  • zmniejszenie obciążenia systemów OLTP oraz magazyn danych.

OLAP i OLTP. Charakterystyka i główne różnice

OLAP OLTP
Magazyn danych powinien zawierać zarówno dane wewnętrzne firmy, jak i dane zewnętrzne głównym źródłem informacji wprowadzanych do operacyjnej bazy danych jest działalność korporacji, a analiza danych wymaga zaangażowania zewnętrznych źródeł informacji (np. raportów statystycznych)
Objętość baz analitycznych jest co najmniej o rząd wielkości większa od liczby baz operacyjnych. do rzetelnej analizy i prognozowania w magazyn danych trzeba mieć informacje o działalności korporacji i stanie rynku na kilka lat Do przetwarzania operacyjnego wymagane są dane z ostatnich kilku miesięcy
Magazyn danych powinny zawierać jednolicie przedstawione i uzgodnione informacje, które są jak najbardziej zbliżone do zawartości operacyjnych baz danych. Do wyodrębnienia i „wyczyszczenia” informacji z różnych źródeł potrzebny jest składnik. W wielu dużych korporacjach jednocześnie (ze względów historycznych) funkcjonuje kilka operacyjnych systemów informatycznych z własnymi bazami danych. Operacyjne bazy danych mogą zawierać semantycznie równoważne informacje prezentowane w różnych formatach, z różnymi wskazaniami czasu ich otrzymania, czasem nawet sprzecznymi
Nie można przewidzieć zestawu zapytań do analitycznej bazy danych. magazyn danych istnieje, aby odpowiadać na prośby analityków ad hoc. Możesz tylko liczyć na to, że prośby nie będą przychodzić zbyt często i wpłyną na duże ilości informacji. Analityczne rozmiary baz danych zachęcają do korzystania z zapytań z agregatami (suma, min, max, oznaczać itp.) Systemy przetwarzania danych mają na celu rozwiązywanie konkretnych problemów. Informacje z bazy są wybierane często iw małych porcjach. Zazwyczaj zestaw zapytań do operacyjnej bazy danych jest już znany na etapie projektowania
Przy małej zmienności baz analitycznych (tylko przy wczytywaniu danych) rozsądną okazuje się kolejność tablic, więcej szybkie metody indeksowanie dla próbkowania masowego, przechowywanie danych wstępnie zagregowanych Systemy przetwarzania danych ze swojej natury są wysoce zmienne, co jest uwzględniane w stosowanym DBMS (znormalizowana struktura bazy danych, wiersze są przechowywane w kolejności, B-drzewa do indeksowania, transakcyjność)
Informacje z baz analitycznych są tak krytyczne dla korporacji, że wymagana jest duża granulacja ochrony (indywidualne prawa dostępu do określonych wierszy i/lub kolumn tabeli) W przypadku systemów przetwarzania danych zwykle wystarcza ochrona informacji na poziomie stołu

Zasady dorsza dla systemów OLAP

W 1993 roku Codd opublikował OLAP for Analyst Users: What It Should Be Like. Nakreślił w nim podstawowe koncepcje przetwarzania analitycznego online i zidentyfikował 12 zasad, które muszą spełniać produkty, aby zapewnić przetwarzanie analityczne online.

  1. Koncepcyjna reprezentacja wielowymiarowa. Model OLAP musi być wielowymiarowy w swoim rdzeniu. Wielowymiarowy diagram koncepcyjny lub niestandardowa reprezentacja ułatwia modelowanie i analizę, a także obliczenia.
  2. Przezroczystość. Użytkownik jest w stanie pobrać wszystkie niezbędne dane z maszyny OLAP, nawet nie podejrzewając, skąd pochodzą. Niezależnie od tego, czy produkt OLAP jest częścią narzędzi użytkownika, czy nie, fakt ten powinien być niewidoczny dla użytkownika. Jeśli OLAP zapewnia przetwarzanie klient-serwer, to ten fakt również powinien, o ile to możliwe, być niewidoczny dla użytkownika. OLAP powinien być dostarczany w kontekście prawdziwie otwartej architektury, umożliwiającej użytkownikowi, gdziekolwiek się znajduje, komunikację z serwerem za pomocą narzędzia analitycznego. Ponadto przejrzystość należy osiągnąć również wtedy, gdy narzędzie analityczne współdziała z jednorodnymi i heterogenicznymi środowiskami baz danych.
  3. Dostępność. OLAP musi zapewnić własne schemat logiczny dostęp w heterogenicznym środowisku baz danych i wykonanie odpowiednich przekształceń w celu dostarczenia danych użytkownikowi. Ponadto należy z góry zadbać o to, gdzie i jak oraz jakie rodzaje fizycznej organizacji danych będą faktycznie wykorzystywane. System OLAP powinien mieć dostęp tylko do danych, które są naprawdę potrzebne, a nie mają zastosowania ogólna zasada„lejek kuchenny”, który pociąga za sobą niepotrzebny wkład.
  4. Stały wydajność przy opracowywaniu raportów. Wydajność raportowanie nie powinno znacząco spadać wraz ze wzrostem liczby wymiarów i rozmiaru bazy danych.
  5. Architektura klient-serwer. Nie tylko produkt musi być produktem klient/serwer, ale również komponent serwerowy musi być wystarczająco inteligentny, aby różni klienci mogli się łączyć przy minimalnym wysiłku i programowaniu.
  6. Ogólna wielowymiarowość. Wszystkie wymiary muszą być równe, każdy wymiar musi być równoważny zarówno pod względem struktury, jak i możliwości operacyjnych. Co prawda dla pojedynczych pomiarów dopuszcza się dodatkowe możliwości operacyjne (podobno implikuje czas), ale takie dodatkowe funkcje należy nadać dowolnemu wymiarowi. Nie powinno być tak, że podstawowe struktury danych, formaty obliczeniowe lub sprawozdawcze były bardziej specyficzne dla jednego wymiaru.
  7. Dynamiczna kontrola rzadkie macierze. Systemy OLAP powinny automatycznie dostosowywać swój fizyczny schemat na podstawie typu modelu, ilości danych i rzadkości bazy danych.
  8. Wsparcie dla wielu użytkowników. Narzędzie OLAP musi zapewniać możliwość dzielenie się(żądanie i dodanie), integralność i bezpieczeństwo.
  9. Nieograniczone operacje krzyżowe. Wszystkie rodzaje operacji muszą być dozwolone dla wszelkich pomiarów.
  10. Intuicyjna manipulacja danymi. Manipulacja danymi została przeprowadzona poprzez bezpośrednie działania na komórkach w trybie widoku bez użycia menu i wielu operacji.
  11. Elastyczne opcje raportowania. Pomiary należy umieścić w raporcie tak, jak sobie tego życzy użytkownik.
  12. Nieograniczony

OLAP (OnLine Analytical Processing) nie jest nazwą konkretnego produktu, ale całej technologii analitycznego przetwarzania online, która obejmuje analizę danych i raportowanie. Użytkownik ma do dyspozycji wielowymiarową tabelę, która automatycznie podsumowuje dane w różnych sekcjach i pozwala na szybkie zarządzanie obliczeniami i formą raportu.

Chociaż w niektórych publikacjach przetwarzanie analityczne nazywane jest zarówno online, jak i interaktywnym, przymiotnik „online” najtrafniej oddaje znaczenie technologii OLAP. Rozwój zarządczych decyzji zarządczych należy do kategorii obszarów najbardziej błędnie podatnych na automatyzację. Jednak dzisiaj istnieje możliwość pomocy menedżerowi w opracowaniu decyzji i, co najważniejsze, znacznego przyspieszenia procesu opracowywania decyzji, ich wyboru i przyjmowania.

Systemy wspomagania decyzji zazwyczaj dysponują środkami umożliwiającymi dostarczenie użytkownikowi danych zagregowanych dla różnych próbek ze zbioru początkowego w formie dogodnej do percepcji i analizy. Z reguły takie funkcje agregujące tworzą wielowymiarowy zbiór danych, często nazywany hipersześcianem lub metasześcianem, którego osie zawierają parametry, a komórki zawierają dane zagregowane od nich zależne – i takie dane można również przechowywać w tabelach relacyjnych, ale w tym przypadku mówimy o logicznej organizacji danych, a nie o fizycznej realizacji ich przechowywania.

Wzdłuż każdej osi dane mogą być zorganizowane w hierarchię reprezentującą różne poziomy szczegółowości.

Zgodnie z wymiarami w modelu wielowymiarowym odkłada się na bok czynniki, które wpływają na działalność przedsiębiorstwa (np. czas, produkty, oddziały firmy itp.). Powstała kostka OLAP jest następnie wypełniana wskaźnikami działalności przedsiębiorstwa (ceny, sprzedaż, plan, zyski, przepływy pieniężne itp.). Należy zauważyć, że w przeciwieństwie do sześcianu geometrycznego ściany sześcianu OLAP nie muszą mieć tego samego rozmiaru. To wypełnienie można przeprowadzić tak, jak w przypadku prawdziwych danych system operacyjny i przewidywane na podstawie danych historycznych. Wymiary hipersześcianu mogą być złożone, hierarchiczne, a między nimi można ustanowić relacje. W trakcie analizy użytkownik może zmienić punkt widzenia danych (tzw. operacja zmiany widoku logicznego), tym samym przeglądać dane w różnych przekrojach i rozwiązując określone problemy. Na kostkach można wykonywać różne operacje, w tym prognozowanie i planowanie warunkowe (analiza warunkowa).

Dzięki temu modelowi danych użytkownicy mogą formułować złożone zapytania, generować raporty i otrzymywać podzbiory danych. Operacyjne przetwarzanie analityczne może znacznie uprościć i przyspieszyć proces przygotowania i podejmowania decyzji przez kadrę zarządzającą. Przetwarzanie analityczne online służy przekształceniu danych w informacje. Zasadniczo różni się od tradycyjnego procesu wspomagania decyzji, który opiera się najczęściej na uwzględnianiu ustrukturyzowanych raportów.


Technologia OLAP odnosi się do typu analizy intelektualnej i obejmuje 12 zasad:

1. Koncepcyjna reprezentacja wielowymiarowa. Analityk użytkowników postrzega świat przedsiębiorstwa jako odpowiednio wielowymiarowy, a model OLAP musi być wielowymiarowy w swoim rdzeniu.

2. Przezroczystość. Architektura systemu OLAP powinna być otwarta, umożliwiając użytkownikowi, gdziekolwiek się znajduje, komunikację za pomocą narzędzia analitycznego – klienta – z serwerem.

3. Dostępność. Użytkownik analityk OLAP musi być w stanie przeprowadzić analizę w oparciu o wspólny schemat pojęciowy zawierający dane z całego przedsiębiorstwa w relacyjnej bazie danych, a także dane ze starszych baz danych, na podstawie wspólnych metod dostępu i na wspólnym modelu analitycznym. System OLAP powinien uzyskiwać dostęp tylko do faktycznie potrzebnych danych, a nie stosować ogólnej zasady „lejka kuchennego”, która pociąga za sobą niepotrzebny wkład.

4. Stała wydajność w tworzeniu raportów. Wraz ze wzrostem liczby wymiarów lub wielkości bazy danych użytkownik analityk nie powinien odczuwać znacznego spadku wydajności.

5. Architektura klient-serwer . Większość danych, które dziś trzeba poddać obróbce analitycznej online, znajduje się na komputerach typu mainframe z dostępem do stacji roboczych użytkowników za pośrednictwem sieci LAN. Oznacza to, że produkty OLAP muszą być w stanie pracować w środowisku klient-serwer.

6. Ogólna wielowymiarowość. Każdy wymiar powinien być stosowany niezależnie od jego struktury i możliwości operacyjnych. Podstawowe struktury danych, formuły i formaty raportowania nie powinny być tendencyjne w stosunku do żadnego jednego wymiaru.

7. Dynamiczne zarządzanie rzadkimi macierzami. Fizyczny projekt narzędzia OLAP musi być w pełni dostosowany do konkretnego modelu analitycznego, aby optymalnie zarządzać rzadkimi macierzami. Rzadkość (mierzona jako procent puste komórki do wszystkich możliwych) jest jedną z cech rozpowszechniania danych.

8. Wsparcie dla wielu użytkowników. Narzędzie OLAP musi zapewniać możliwość współdzielenia zapytań i rozszerzania wielu użytkowników analityków przy zachowaniu integralności i bezpieczeństwa.

9. Nieograniczone operacje krzyżowe. Różne operacje, ze względu na ich hierarchiczny charakter, mogą reprezentować zależności zależne w modelu OLAP, czyli są międzyfunkcyjne. Ich wykonanie nie powinno wymagać od użytkownika analityka ponownego zdefiniowania tych obliczeń i operacji.

10. Intuicyjna manipulacja danymi. Widok użytkownika analityka na wymiary zdefiniowane w modelu analitycznym musi zawierać wszystkie niezbędne informacje do wykonywania działań na modelu OLAP, tj. nie powinny wymagać korzystania z systemu menu lub innych operacji na wielu interfejsach użytkownika.

11. Elastyczne opcje raportowania. Narzędziami sprawozdawczymi powinny być zsyntetyzowane dane lub informacje wynikające z modelu danych w dowolnej orientacji. Oznacza to, że wiersze, kolumny lub strony raportu muszą jednocześnie wyświetlać wiele wymiarów modelu OLAP, z możliwością wyświetlania dowolnego podzbioru elementów (wartości) zawartych w wymiarze i w dowolnej kolejności.

12. Nieograniczony wymiar i liczba poziomów agregacji. Badanie dotyczące możliwej liczby niezbędnych pomiarów wymaganych w modelu analitycznym wykazało, że użytkownik analityk może wykorzystać do 19 pomiarów jednocześnie. Prowadzi to do rekomendacji liczby wymiarów obsługiwanych przez system OLAP. Co więcej, każdy ze wspólnych wymiarów nie powinien być ograniczony liczbą poziomów agregacji zdefiniowanych przez użytkownika-analityka.

Jako specjalistyczne systemy OLAP oferowane obecnie na rynku można wskazać CalliGraph, Business Intelligence.

Do rozwiązywania prostych zadań analizy danych można wykorzystać budżetowe rozwiązanie - aplikacje biurowe Microsoft Excel i Access, które zawierają elementarne narzędzia technologii OLAP, które pozwalają tworzyć tabele przestawne i na ich podstawie budować różne raporty.

cel Praca semestralna jest studium technologii OLAP, koncepcji jej wdrożenia i struktury.

W nowoczesny świat sieć komputerowa a systemy obliczeniowe pozwalają analizować i przetwarzać duże ilości danych.

Duża ilość informacji znacznie komplikuje poszukiwanie rozwiązań, ale umożliwia uzyskanie dużo dokładniejszych obliczeń i analiz. Aby rozwiązać ten problem, jest cała klasa systemy informacyjne wykonanie analizy. Takie systemy nazywane są systemami wspomagania decyzji (DSS) (DSS, Decision Support System).

Aby przeprowadzić analizę, DSS musi gromadzić informacje, dysponując środkami do ich wprowadzania i przechowywania. W sumie w DSS rozwiązuje się trzy główne zadania:

· wprowadzanie danych;

· przechowywanie danych;

· analiza danych.

Wprowadzanie danych do DSS odbywa się automatycznie z czujników charakteryzujących stan środowiska lub procesu lub przez człowieka.

Jeśli dane są wprowadzane automatycznie z czujników, dane są gromadzone przez gotowy sygnał, który pojawia się w momencie pojawienia się informacji lub przez cykliczne odpytywanie. Jeżeli dane wprowadzane są przez człowieka, to powinni oni zapewnić użytkownikom wygodny sposób wprowadzania danych sprawdzających ich poprawność oraz dokonywać niezbędnych obliczeń.

Przy wprowadzaniu danych jednocześnie przez kilku operatorów konieczne jest rozwiązanie problemów modyfikacji i równoległego dostępu tych samych danych.

DSS dostarcza analitykom dane w postaci raportów, tabel, wykresów do badań i analiz, dlatego takie systemy zapewniają funkcje wspomagania decyzji.

W podsystemach wprowadzania danych, zwanych OLTP (On-linetransactionprocessing), zaimplementowane jest przetwarzanie danych operacyjnych. Do ich realizacji wykorzystywane są konwencjonalne systemy zarządzania bazami danych (DBMS).

Podsystem analityczny można zbudować w oparciu o:

· podsystemy analizy wyszukiwania informacji oparte na relacyjnym DBMS i zapytaniach statycznych z wykorzystaniem języka SQL;

· podsystemy analizy operacyjnej. Do implementacji takich podsystemów wykorzystywana jest technologia przetwarzania danych analitycznych OLAP online, wykorzystująca koncepcję wielowymiarowej reprezentacji danych;

· podsystemy analizy intelektualnej. Podsystem ten implementuje metody i algorytmy DataMining.

Z punktu widzenia użytkownika, systemy OLAP zapewniają środki elastycznego przeglądania informacji w różnych sekcjach, automatycznego odbioru zagregowanych danych, wykonywania operacji analitycznych splotu, uszczegółowienia, porównywania w czasie. Dzięki temu systemy OLAP są rozwiązaniem o ogromnych zaletach w zakresie przygotowania danych do wszelkiego rodzaju raportowania biznesowego, polegającego na prezentacji danych w różnych przekrojach i różne poziomy hierarchie, takie jak raporty sprzedaży, różne formy budżetów i inne. Systemy OLAP mają duże zalety takiej reprezentacji w innych formach analizy danych, w tym prognozowaniu.

1.2 Definicja OLAP-systemy

Technologia złożonej wielowymiarowej analizy danych nosi nazwę OLAP. OLAP jest kluczowym elementem organizacji hurtowni danych.

Funkcjonalność OLAP można zaimplementować na różne sposoby, tak proste jak analiza danych w aplikacje biurowe i bardziej złożone - rozproszone systemy analityczne oparte na produktach serwerowych.

OLAP (On-LineAnalyticalProcessing) to technologia przetwarzania danych analitycznych online, która wykorzystuje narzędzia i metody gromadzenia, przechowywania i analizy danych wielowymiarowych oraz w celu wsparcia procesów decyzyjnych.

Głównym celem systemów OLAP jest wspomaganie działań analitycznych, dowolnych żądań od użytkowników analityków. Celem analizy OLAP jest testowanie pojawiających się hipotez.

Zastosowanie systemu OLAP pozwala zautomatyzować strategiczny poziom zarządzania organizacją. OLAP (Online Analytical Processing - analityczne przetwarzanie danych w czasie rzeczywistym) to potężna technologia przetwarzania i badania danych. Systemy zbudowane w oparciu o technologię OLAP dają niemal nieograniczone możliwości tworzenia raportów, wykonywania złożonych obliczeń analitycznych, budowania prognoz i scenariuszy oraz opracowywania różnorodnych opcji planów.

Pełnoprawne systemy OLAP pojawiły się na początku lat 90. w wyniku rozwoju informatycznych systemów wspomagania decyzji. Służą do przekształcania różnych, często odmiennych danych w: przydatna informacja. Systemy OLAP mogą organizować dane według pewnego zestawu kryteriów. Nie jest jednak konieczne, aby kryteria miały jasne cechy.

Systemy OLAP znalazły zastosowanie w wielu zagadnieniach zarządzania strategicznego organizacją: zarządzanie efektywnością biznesową, planowanie strategiczne, budżetowanie, prognozowanie rozwoju, sprawozdawczość finansowa, analiza pracy, symulacja środowiska zewnętrznego i wewnętrznego organizacji, przechowywanie danych i raportowanie.

Struktura systemu OLAP

Działanie systemu OLAP opiera się na przetwarzaniu wielowymiarowych tablic danych. Tablice wielowymiarowe są ułożone w taki sposób, że każdy element tablicy ma wiele relacji z innymi elementami. Aby utworzyć wielowymiarową tablicę, system OLAP musi pozyskiwać dane wejściowe z innych systemów (np. systemów ERP lub CRM) lub poprzez wejście zewnętrzne. Użytkownik systemu OLAP otrzymuje niezbędne dane w ustrukturyzowanej formie zgodnie z jego żądaniem. Na podstawie podanej procedury można sobie wyobrazić strukturę systemu OLAP.

Ogólnie struktura systemu OLAP składa się z: następujące produkty:

  • Baza danych . Baza danych jest źródłem informacji o działaniu systemu OLAP. Rodzaj bazy danych zależy od typu systemu OLAP i algorytmów serwera OLAP. Z reguły wykorzystuje się relacyjne bazy danych, wielowymiarowe bazy danych, hurtownie danych itp.
  • Serwer OLAP. Zapewnia zarządzanie wielowymiarową strukturą danych oraz relacją pomiędzy bazą danych a użytkownikami systemu OLAP.
  • aplikacje niestandardowe. Ten element struktury systemu OLAP zarządza zgłoszeniami użytkowników i generuje wyniki dostępu do bazy danych (raporty, wykresy, tabele itp.)

W zależności od sposobu organizowania, przetwarzania i przechowywania danych systemy OLAP mogą być wdrażane na: komputery lokalne użytkowników lub za pomocą dedykowanych serwerów.

Istnieją trzy główne sposoby przechowywania i przetwarzania danych:

  • lokalnie. Dane są przechowywane na komputerach użytkowników. Przetwarzanie, analiza i zarządzanie danymi odbywa się w lokalnych miejscach pracy. Taka konstrukcja systemu OLAP ma istotne wady związane z szybkością przetwarzania danych, bezpieczeństwem danych oraz ograniczonym wykorzystaniem analizy wielowymiarowej.
  • relacyjne bazy danych. Bazy te są wykorzystywane, gdy system OLAP współpracuje z systemem CRM lub systemem ERP. Dane są przechowywane na serwerze tych systemów w postaci relacyjnych baz danych lub hurtowni danych. Serwer OLAP uzyskuje dostęp do tych baz danych, aby utworzyć niezbędne struktury wielowymiarowe i przeprowadzić analizę.
  • wielowymiarowe bazy danych. W tym przypadku dane są zorganizowane jako specjalna hurtownia danych na dedykowanym serwerze. Wszystkie operacje na danych wykonywane są na tym serwerze, który przekształca oryginalne dane w struktury wielowymiarowe. Takie struktury nazywane są kostkami OLAP. Źródłami danych do tworzenia kostki OLAP są relacyjne bazy danych i/lub pliki klienta. Serwer danych dokonuje wstępnego przygotowania i przetwarzania danych. Serwer OLAP współpracuje z kostką OLAP bez bezpośredniego dostępu do źródeł danych (relacyjne bazy danych, pliki klienta itp.).

Rodzaje systemów OLAP

W zależności od sposobu przechowywania i przetwarzania danych wszystkie systemy OLAP można podzielić na trzy główne typy.


1. ROLAP (Relational OLAP - relacyjne systemy OLAP) - ten typ systemu OLAP współpracuje z relacyjnymi bazami danych. Dane są dostępne bezpośrednio do relacyjnej bazy danych. Dane są przechowywane w tabelach relacyjnych. Użytkownicy mają możliwość wykonywania analiz wielowymiarowych jak w tradycyjnych systemach OLAP. Osiąga się to poprzez zastosowanie Narzędzia SQL i specjalne życzenia.

Jedną z zalet ROLAP jest możliwość wydajniejszego przetwarzania dużych ilości danych. Kolejną zaletą ROLAP jest możliwość wydajnego przetwarzania zarówno danych liczbowych, jak i tekstowych.

Do wad systemu ROLAP należy zaliczyć niską wydajność (w porównaniu z tradycyjnymi systemami OLAP), ponieważ: przetwarzanie danych odbywa się przez serwer OLAP. Kolejną wadą jest ograniczenie funkcjonalności ze względu na użycie SQL.


2. MOLAP (Multidimensional OLAP - wielowymiarowe systemy OLAP). Ten typ systemów OLAP należy do systemów tradycyjnych. Różnica między tradycyjnym systemem OLAP a innymi systemami polega na wstępnym przygotowaniu i optymalizacji danych. Systemy te z reguły korzystają z dedykowanego serwera, na którym dane są wstępnie przetwarzane. Dane są generowane w tablice wielowymiarowe- Kostki OLAP.

Systemy MOLAP są najbardziej wydajne w przetwarzaniu danych. ułatwiają reorganizację i strukturę danych dla różnych żądań użytkowników. Narzędzia analityczne MOLAP pozwalają na wykonywanie skomplikowanych obliczeń. Kolejną zaletą MOLAP jest możliwość szybkiego generowania zapytań i uzyskiwania wyników. Zapewnia to wstępne uformowanie kostek OLAP.

Do wad systemu MOLAP można zaliczyć ograniczenie ilości przetwarzanych danych oraz redundancję danych, ponieważ: w celu utworzenia wielowymiarowych kostek w różnych aspektach dane muszą zostać zduplikowane.


3. HOLAP (Hybrydowy OLAP - hybrydowe systemy OLAP). Hybrydowe systemy OLAP to połączenie systemów ROLAP i MOLAP. Systemy hybrydowe próbowały połączyć zalety dwóch systemów: wykorzystanie wielowymiarowych baz danych oraz zarządzanie relacyjnymi bazami danych. Systemy HOLAP pozwalają na przechowywanie dużej ilości danych w tabelach relacyjnych, a przetworzone dane umieszczane są w gotowych wielowymiarowych kostkach OLAP. Zaletami tego rodzaju systemu jest skalowalność danych, szybkie przetwarzanie danych oraz elastyczny dostęp do źródeł danych.

Istnieją inne rodzaje systemów OLAP, ale są one bardziej posunięciem marketingowym producentów niż niezależnym typem systemu OLAP.

Te typy obejmują:

  • WOLAP (Web OLAP). Widok systemu OLAP ze wsparciem interfejs sieciowy. Te systemy OLAP mają możliwość dostępu do baz danych za pośrednictwem interfejsu internetowego.
  • DOLAP (pulpit OLAP). Ten typ systemu OLAP umożliwia użytkownikom pobranie bazy danych do lokalnego miejsca pracy i pracę z nią lokalnie.
  • MobileOLAP. Jest to cecha systemów OLAP, która pozwala na zdalną pracę z bazą danych za pomocą urządzeń mobilnych.
  • SOLAP (przestrzenny OLAP). Tego typu systemy OLAP przeznaczone są do przetwarzania danych przestrzennych. Powstała w wyniku integracji systemów informacji geograficznej i systemów OLAP. Systemy te pozwalają na przetwarzanie danych nie tylko w formacie alfanumerycznym, ale także w postaci obiektów wizualnych i wektorów.

Korzyści z systemu OLAP

Zastosowanie systemu OLAP daje organizacji możliwość przewidywania i analizowania różnych sytuacji związanych z bieżącą działalnością i perspektywami rozwoju. Systemy te można postrzegać jako uzupełnienie systemów automatyki na poziomie przedsiębiorstwa. Wszystkie zalety systemów OLAP zależą bezpośrednio od dokładności, niezawodności i objętości danych źródłowych.

Główne zalety systemu OLAP to:

  • spójność informacje ogólne i wyniki analiz. W obecności systemu OLAP zawsze możliwe jest prześledzenie źródła informacji i ustalenie logicznego związku pomiędzy uzyskanymi wynikami a danymi źródłowymi. Zmniejsza się subiektywność wyników analizy.
  • przeprowadzanie analizy wielowymiarowej. Zastosowanie systemu OLAP pozwala na uzyskanie wielu scenariuszy rozwoju zdarzeń w oparciu o zestaw danych wyjściowych. Dzięki narzędziom analitycznym możliwe jest modelowanie sytuacji zgodnie z zasadą „co się stanie, jeśli”.
  • kontrola szczegółów. Szczegółowość prezentacji wyników może się różnić w zależności od potrzeb użytkowników. W takim przypadku nie ma potrzeby przeprowadzania skomplikowanych ustawień systemu i powtarzania obliczeń. Raport może zawierać dokładnie te informacje, które są niezbędne do podejmowania decyzji.
  • ujawnianie ukrytych zależności. Budując wielowymiarowe relacje, możliwe staje się identyfikowanie i identyfikowanie ukrytych zależności w różnych procesach czy sytuacjach, które wpływają na działalność produkcyjną.
  • stworzenie jednej platformy. Dzięki wykorzystaniu systemu OLAP możliwe staje się stworzenie jednej platformy dla wszystkich procesów prognozowania i analizy w przedsiębiorstwie. W szczególności dane systemu OLAP są podstawą do budowania prognoz budżetowych, prognoz sprzedaży, prognoz zakupów, strategicznych planów rozwoju itp.

Pojęcie wielowymiarowej analizy danych jest ściśle związane z analizą operacyjną, która wykonywana jest za pomocą systemów OLAP.

OLAP (On-Line Analytical Processing) to technologia analitycznego przetwarzania danych online, która wykorzystuje metody i narzędzia do gromadzenia, przechowywania i analizy danych wielowymiarowych w celu wsparcia procesów decyzyjnych.

Głównym celem systemów OLAP jest obsługa działań analitycznych, arbitralnych (często używany termin ad-hoc) żądań od użytkowników analityków. Celem analizy OLAP jest testowanie pojawiających się hipotez.

U początków technologii OLAP jest twórcą podejścia relacyjnego E. Codd. W 1993 roku opublikował artykuł zatytułowany „OLAP for Analyst Users: What It Should Be”. W niniejszym artykule przedstawiono podstawowe koncepcje przetwarzania analitycznego online i określono 12 następujących wymagań, które muszą spełniać produkty, które umożliwiają przetwarzanie analityczne online. Tokmakow GP Baza danych. Koncepcja bazy danych, relacyjny model danych, Języki SQL. S. 51

Poniżej wymieniono 12 zasad nakreślonych przez Codd, które definiują OLAP.

1. Wielowymiarowość - system OLAP na poziomie konceptualnym powinien prezentować dane w postaci wielowymiarowego modelu, co upraszcza procesy analizy i percepcji informacji.

2. Przejrzystość - System OLAP powinien ukrywać przed użytkownikiem rzeczywistą implementację wielowymiarowego modelu, sposób organizacji, źródła, narzędzia przetwarzania i przechowywania.

3. Dostępność — system OLAP musi zapewniać użytkownikowi jeden, spójny i spójny model danych, umożliwiający dostęp do danych niezależnie od tego, jak i gdzie są przechowywane.

4. Spójna wydajność opracowywania raportów — Wydajność systemów OLAP nie powinna znacząco spadać wraz ze wzrostem liczby analizowanych wymiarów.

5. Architektura klient-serwer — system OLAP musi być w stanie pracować w środowisku klient-serwer, ponieważ większość danych, które obecnie muszą być poddane przetwarzaniu analitycznemu online, jest przechowywana w postaci rozproszonej. Główną ideą jest to, że komponent serwerowy narzędzia OLAP powinien być wystarczająco inteligentny, aby umożliwić zbudowanie wspólnego schematu koncepcyjnego opartego na uogólnieniu i konsolidacji różnych logicznych i fizycznych schematów baz danych przedsiębiorstwa w celu zapewnienia przejrzystego efektu.

6. Równość wymiarów — system OLAP musi obsługiwać model wielowymiarowy, w którym wszystkie wymiary są równe. Jeśli to konieczne dodatkowe cechy można nadać poszczególnym wymiarom, ale taką możliwość należy nadać dowolnemu wymiarowi.

7. Dynamiczne zarządzanie rzadkimi macierzami — system OLAP musi zapewniać optymalną obsługę rzadkich macierzy. Szybkość dostępu powinna być utrzymywana niezależnie od lokalizacji komórek danych i być stałą wartością dla modeli o różnej liczbie wymiarów i różnym stopniu rozrzedzenia danych.

8. Obsługa trybu wielu użytkowników - system OLAP powinien zapewniać możliwość pracy z wieloma użytkownikami razem z jednym modelem analitycznym lub tworzenia dla nich różnych modeli z pojedynczych danych. Jednocześnie możliwy jest zarówno odczyt, jak i zapis danych, dlatego system musi zapewniać ich integralność i bezpieczeństwo.

9. Nieograniczone operacje krzyżowe — system OLAP musi zapewniać, że relacje funkcjonalne opisane przy użyciu określonego języka formalnego między komórkami hipersześcianu są zachowywane podczas wykonywania jakichkolwiek operacji wycinania, obracania, konsolidowania lub drążenia. System musi samodzielnie (automatycznie) wykonać konwersję nawiązane relacje bez konieczności ich nadpisywania przez użytkownika.

10. Intuicyjna manipulacja danymi — system OLAP powinien umożliwiać wykonywanie operacji wycinania, obracania, konsolidowania i drążenia na hipersześcianie bez konieczności wykonywania przez użytkownika dużej ilości pracy w interfejsie użytkownika. Wymiary zdefiniowane w modelu analitycznym muszą zawierać wszystkie niezbędne informacje do wykonania powyższych operacji.

11. Elastyczne opcje raportowania – system OLAP musi obsługiwać różne drogi wizualizacja danych, tj. sprawozdania należy składać w każdej możliwej orientacji. Narzędzia sprawozdawcze powinny reprezentować zsyntetyzowane dane lub informacje wynikające z modelu danych w dowolnej możliwej orientacji. Oznacza to, że wiersze, kolumny lub strony powinny jednocześnie pokazywać od 0 do N wymiarów, gdzie N-- numer pomiary całego modelu analitycznego. Ponadto każdy wymiar treści wyświetlany w pojedynczym poście, kolumnie lub stronie musi umożliwiać wyświetlanie dowolnego podzbioru elementów (wartości) zawartych w wymiarze w dowolnej kolejności.

12. Nieograniczona wymiarowość i liczba poziomów agregacji - Badanie możliwej liczby wymaganych wymiarów wymaganych w modelu analitycznym wykazało, że można używać do 19 wymiarów jednocześnie. Stąd silne zalecenie, aby narzędzie analityczne było w stanie zapewnić co najmniej 15, a najlepiej 20 pomiarów jednocześnie. Co więcej, każdy ze wspólnych wymiarów nie powinien być ograniczany liczbą poziomów ścieżek agregacji i konsolidacji zdefiniowanych przez użytkownika-analityka.

Dodatkowe zasady dorsza.

Zbiór tych wymagań, który służył jako de facto definicja OLAP, dość często wywołuje różne krytyki, np. reguły 1, 2, 3, 6 to wymagania, a reguły 10, 11 to niesformalizowane życzenia. Tokmakow GP Baza danych. Pojęcie bazy danych, relacyjny model danych, języki SQL. Str. 68 Tak więc wymienione 12 wymagań Codd nie pozwala na dokładne zdefiniowanie OLAP. W 1995 roku Codd dodał do listy następujące sześć zasad:

13. Ekstrakcja wsadowa a interpretacja — system OLAP musi być równie skuteczny w zapewnianiu dostępu do danych zarówno wewnętrznych, jak i zewnętrznych.

14. Obsługa wszystkich modeli analizy OLAP — system OLAP musi obsługiwać wszystkie cztery modele analizy danych zdefiniowane przez Codda: kategoryczny, interpretacyjny, spekulacyjny i stereotypowy.

15. Obsługa danych zdenormalizowanych — system OLAP musi być zintegrowany ze źródłami danych zdenormalizowanych. Modyfikacje danych dokonywane w środowisku OLAP nie powinny powodować zmian w danych przechowywanych w oryginalnych systemach zewnętrznych.

16. Zapisywanie wyników OLAP: przechowywanie ich oddzielnie od oryginalnych danych -- System OLAP działający w trybie odczytu i zapisu, po zmodyfikowaniu oryginalnych danych, musi oddzielnie zapisywać wyniki. Innymi słowy, zapewnione jest bezpieczeństwo danych źródłowych.

17. Wykluczenie brakujących wartości — Podczas prezentowania danych użytkownikowi system OLAP musi odrzucić wszystkie brakujące wartości. Innymi słowy, brakujące wartości muszą różnić się od wartości null.

18 Obsługa brakujących wartości — system OLAP musi ignorować wszystkie brakujące wartości, niezależnie od ich źródła. Ta funkcja jest związana z 17. zasadą.

Ponadto Codd złamał wszystkie 18 zasad na następujące cztery grupy, nazywając je funkcjami. Grupy te zostały nazwane B, S, R i D.

Główne cechy (B) obejmują następujące zasady:

Wielowymiarowa konceptualna reprezentacja danych (zasada 1);

Intuicyjna manipulacja danymi (zasada 10);

Dostępność (zasada 3);

Ekstrakcja wsadowa a interpretacja (zasada 13);

Wsparcie dla wszystkich modeli analizy OLAP (zasada 14);

Architektura „klient-serwer” (zasada 5);

Przejrzystość (zasada 2);

Wsparcie dla wielu graczy (zasada 8)

Funkcje specjalne (S):

Przetwarzanie danych nieznormalizowanych (zasada 15);

Zapisywanie wyników OLAP: przechowywanie ich oddzielnie od oryginalnych danych (zasada 16);

Wykluczenie brakujących wartości (zasada 17);

Obsługa brakujących wartości (zasada 18). Funkcje raportowania (R):

Elastyczność generowania raportów (zasada 11);

Standard wykonania raportu (zasada 4);

Automatyczna konfiguracja warstwy fizycznej (zmodyfikowana oryginalna reguła 7).

Kontrola pomiaru (D):

Uniwersalność pomiarów (zasada 6);

Nieograniczona liczba wymiarów i poziomów agregacji (zasada 12);

Nieograniczone operacje między wymiarami (zasada 9).