хранилища за даннисе формират на базата на фиксирани за дълъг период от време моментни снимки на бази данни от оперативни информационна системаи евентуално различни външни източници. Складовете за данни използват технологии за бази данни, OLAP, извличане на данни, визуализация на данни.

Основни характеристики на хранилищата за данни.

  • съдържа исторически данни;
  • съхранява подробна информация, както и частично и изцяло обобщени данни;
  • данните са предимно статични;
  • нерегулирани, неструктурирани и евристичен начинобработка на данни;
  • средна и ниска интензивност на обработка на транзакциите;
  • непредвидим начин на използване на данни;
  • предназначени за анализ;
  • фокусиран върху предметни области;
  • подкрепа за вземане на стратегически решения;
  • обслужва сравнително малък брой ръководители.

Терминът OLAP (On-Line Analytical Processing) се използва за описание на модела за представяне на данни и съответно технологията на тяхната обработка в хранилища за данни. OLAP използва многоизмерен изглед на обобщени данни, за да предостави бърз достъпдо стратегически важна информацияза целите на задълбочен анализ. OLAP приложенията трябва да имат следните основни свойства:

  • многоизмерен представяне на данни;
  • поддръжка за сложни изчисления;
  • правилно отчитане на фактора време.

Предимства на OLAP:

  • повишение производителностпроизводствен персонал, разработчици приложни програми. Навременен достъп до стратегическа информация.
  • давайки на потребителите достатъчно власт да направят свои собствени промени в схемата.
  • OLAP приложенията разчитат на хранилища за даннии OLTP системи, като получават актуални данни от тях, което спестява контрол на целосттакорпоративни данни.
  • намаляване на натоварването на OLTP системите и хранилища за данни.

OLAP и OLTP. Характеристики и основни разлики

OLAP OLTP
Съхранение на даннитрябва да включва както вътрешни корпоративни данни, така и външни данни основният източник на информация, влизаща в оперативната база данни, е дейността на корпорацията, а анализът на данни изисква включването на външни източници на информация (например статистически отчети)
Обемът на аналитичните бази данни е поне с порядък по-голям от обема на оперативните. за надеждни анализи и прогнози в хранилище на даннитрябва да имате информация за дейността на корпорацията и състоянието на пазара за няколко години За оперативна обработка са необходими данни за последните няколко месеца
Съхранение на даннитрябва да съдържа еднакво представена и съгласувана информация, която е възможно най-близка до съдържанието на действащите бази данни. Необходим е компонент за извличане и "чистене" на информация от различни източници. В много големи корпорации има няколко оперативни информационни системи със собствени бази данни едновременно (по исторически причини). Оперативните бази данни могат да съдържат семантично еквивалентна информация, представена в различни формати, с различни указания за времето на нейното получаване, понякога дори противоречиви
Наборът от заявки към аналитична база данни не може да бъде предвиден. хранилища за даннисъществуват, за да отговарят на ad hoc заявки на анализатори. Можете да разчитате само на факта, че заявките няма да идват твърде често и да засягат големи количества информация. Размерите на аналитичните бази данни насърчават използването на заявки с агрегати (сума, мин., макс. означаваи т.н.) Системите за обработка на данни са проектирани да решават специфични проблеми. Информацията от базата данни се избира често и на малки порции. Обикновено набор от заявки към оперативната база данни вече е известен по време на проектирането
С малка променливост на аналитичните бази данни (само при зареждане на данни), подреждането на масивите се оказва разумно, повече бързи методииндексиране за масово вземане на проби, съхранение на предварително агрегирани данни Системите за обработка на данни по своята същност са силно променливи, което се взема предвид в използваната СУБД (нормализирана структура на базата данни, редовете се съхраняват неправилно, B-дървета за индексиране, транзакционност)
Информацията от аналитичните бази данни е толкова критична за корпорацията, че е необходима голяма гранулация на защита (индивидуални права за достъп до определени редове и / или колони на таблицата) За системи за обработка на данни обикновено е достатъчно защита на информациятана ниво маса

Правила на Codd за OLAP системи

През 1993 г. Код публикува OLAP за аналитични потребители: какъв трябва да бъде. В него той очерта основните концепции за онлайн аналитична обработка и идентифицира 12 правила, на които продуктите трябва да отговарят, за да предоставят онлайн аналитична обработка.

  1. Концептуално многоизмерно представяне. Един OLAP модел трябва да бъде многоизмерен в основата си. Многомерна концептуална диаграма или персонализирано представяне улеснява моделирането и анализа, както и изчисленията.
  2. Прозрачност. Потребителят може да получи всички необходими данни от OLAP машината, без дори да подозира откъде идват. Независимо дали продуктът OLAP е част от инструментите на потребителя или не, този факт трябва да бъде невидим за потребителя. Ако OLAP се предоставя от изчисления клиент-сървър, тогава този факт също трябва, ако е възможно, да бъде невидим за потребителя. OLAP трябва да се доставя в контекста на наистина отворена архитектура, позволяваща на потребителя, където и да се намира, да комуникира със сървъра с помощта на аналитичен инструмент. Освен това трябва да се постигне прозрачност, когато аналитичният инструмент взаимодейства с хомогенни и разнородни среди на бази данни.
  3. Наличност. OLAP трябва да предостави свои собствени логическа диаграмаза достъп до хетерогенна среда на база данни и извършване на подходящи трансформации за предоставяне на данни на потребителя. Освен това е необходимо предварително да се погрижите къде и как и какви видове физическа организация на данните ще се използват реално. Една OLAP система трябва да има достъп само до данни, които са наистина необходими, а не да се прилага общ принцип"кухненска фуния", което води до ненужно въвеждане.
  4. Константа производителностпри разработване на отчети. производителностотчитането не трябва да спада значително с нарастването на броя на измеренията и размера на базата данни.
  5. Архитектура клиент-сървър. От продукта се изисква не само да бъде клиент/сървър продукт, но и сървърният компонент трябва да бъде достатъчно интелигентен, за да могат различни клиенти да се свързват с минимални усилия и програмиране.
  6. Обща многоизмерност. Всички измерения трябва да са равни, всяко измерение трябва да е еквивалентно както по структура, така и по оперативни възможности. Вярно, допускат се допълнителни оперативни възможности за индивидуални измервания (явно се подразбира време), но такива допълнителни функциитрябва да се даде на всяко измерение. Не трябва да е така, че осн структури от данни, изчислителните или отчетните формати бяха по-специфични за едно измерение.
  7. Динамичен контрол разредени матрици. OLAP системите трябва автоматично да коригират физическата си схема въз основа на типа на модела, обемите на данните и разрядността на базата данни.
  8. Многопотребителска поддръжка. OLAP инструментът трябва да предоставя възможност споделяне(заявка и допълнение), цялостност и сигурност.
  9. Неограничени кръстосани операции. Всички видове операции трябва да бъдат разрешени за всякакви измервания.
  10. Интуитивно манипулиране на данни. Манипулирането на данни се извършва чрез директни действия върху клетки в режим на изглед, без да се използват менюта и множество операции.
  11. Гъвкави опции за отчитане. Измерванията трябва да бъдат поставени в отчета по начина, по който потребителят иска.
  12. Неограничен

OLAP (OnLine Analytical Processing) не е името на конкретен продукт, а на цяла технология за онлайн аналитична обработка, която включва анализ на данни и докладване. На потребителя се предоставя многоизмерна таблица, която автоматично обобщава данните в различни секции и ви позволява бързо да управлявате изчисленията и формата на отчета.

Въпреки че в някои публикации аналитичната обработка се нарича едновременно онлайн и интерактивна, прилагателното „онлайн“ най-точно отразява смисъла на OLAP технологията. Разработването на управленски управленски решения попада в категорията на най-фалшиво податливите на автоматизация области. Въпреки това днес има възможност да се помогне на мениджъра при разработването на решения и, най-важното, значително да се ускори процесът на разработване на решения, техния избор и приемане.

Системите за подпомагане на вземането на решения обикновено разполагат със средствата да предоставят на потребителя обобщени данни за различни проби от първоначалния набор във форма, удобна за възприемане и анализ. По правило такива агрегатни функции образуват многомерен набор от данни, често наричан хиперкуб или метакуб, чиито оси съдържат параметри, а клетките съдържат агрегатни данни, които зависят от тях - и такива данни могат да се съхраняват и в релационни таблици, но в това В този случай говорим за логическа организация на данните, а не за физическо изпълнение на тяхното съхранение.

По всяка ос данните могат да бъдат организирани в йерархия, представляваща различни нива на детайлност.

Според измеренията в многомерния модел се оставят настрана факторите, които влияят върху дейността на предприятието (например: време, продукти, фирмени клонове и др.). След това полученият OLAP-куб се попълва с индикатори за дейността на предприятието (цени, продажби, план, печалби, паричен поток и др.). Трябва да се отбележи, че за разлика от геометричен куб, лицата на OLAP куб не трябва да имат еднакъв размер. Това попълване може да се извърши както с реални данни операционна системаи прогнозирани въз основа на исторически данни. Измеренията на хиперкуба могат да бъдат сложни, йерархични и между тях могат да се установяват връзки. По време на анализа потребителят може да промени гледната точка на данните (така наречената операция за промяна на логическия изглед), като по този начин преглежда данните в различни раздели и решава конкретни проблеми. Върху кубовете могат да се извършват различни операции, включително прогнозиране и условно планиране (анализ какво-ако).

Благодарение на този модел на данни потребителите могат да формулират сложни заявки, да генерират отчети и да получават подгрупи от данни. Оперативната аналитична обработка може значително да опрости и ускори процеса на подготовка и вземане на решения от управленския персонал. Онлайн аналитичната обработка служи за превръщането на данните в информация. Той е фундаментално различен от традиционния процес за подпомагане на вземането на решения, който се основава най-често на разглеждане на структурирани отчети.


OLAP технологията се отнася до типа интелектуален анализ и включва 12 принципа:

1. Концептуално многоизмерно представяне. Потребителят-аналитик вижда света на предприятието като многоизмерен по природа, съответно и OLAP моделът трябва да бъде многоизмерен в основата си.

2. Прозрачност. Архитектурата на OLAP системата трябва да бъде отворена, позволяваща на потребителя, където и да се намира, да комуникира чрез аналитичен инструмент - клиента - със сървъра.

3. Наличност. Потребителят на OLAP анализатор трябва да може да извършва анализ въз основа на обща концептуална схема, съдържаща данни за цялото предприятие в релационна база данни, както и данни от наследени наследени бази данни, на общи методи за достъп и на общ аналитичен модел. Една OLAP система трябва да осъществява достъп само до действително необходимите данни, а не да прилага общия принцип на "кухненската фуния", който включва ненужно въвеждане.

4. Постоянно представяне при разработването на отчети. С увеличаване на броя на измеренията или размера на базата данни, потребителят на анализатора не трябва да изпитва значително намаляване на производителността.

5. Архитектура клиент-сървър . Повечето от данните, които днес трябва да бъдат подложени на онлайн аналитична обработка, се съдържат в мейнфрейми с достъп до потребителските работни станции през LAN. Това означава, че OLAP продуктите трябва да могат да работят в среда клиент-сървър.

6. Обща многоизмерност. Всяко измерение трябва да се прилага независимо от неговата структура и оперативни възможности. Основните структури на данни, формули и формати за отчитане не трябва да бъдат предубедени към нито едно измерение.

7. Динамично управление на разредени матрици. Физическият дизайн на OLAP инструмента трябва да бъде напълно адаптивен към конкретния аналитичен модел, за да управлява оптимално разредените матрици. Рядкост (измерена като процент празни клеткидо всички възможни) е една от характеристиките на разпространението на данни.

8. Многопотребителска поддръжка. OLAP инструментът трябва да предоставя възможност за споделяне на заявки и разширяване на множество потребители на анализатори, като същевременно поддържа целостта и сигурността.

9. Неограничени кръстосани операции. Различни операции, поради техния йерархичен характер, могат да представляват зависими връзки в OLAP модела, т.е. те са многофункционални. Тяхното изпълнение не трябва да изисква потребителят анализатор да предефинира тези изчисления и операции.

10. Интуитивно манипулиране на данни. Изгледът на потребителя-аналитик на измеренията, дефинирани в аналитичния модел, трябва да съдържа цялата необходима информация за извършване на действия върху OLAP модела, т.е. те не трябва да изискват използването на система от менюта или други операции с множество потребителски интерфейси.

11. Гъвкави опции за отчитане. Инструментите за отчитане трябва да бъдат синтезирани данни или информация, произтичащи от модела на данни във всяка възможна ориентация. Това означава, че редовете, колоните или страниците на отчет трябва да показват множество измерения на OLAP модел едновременно, с възможност за показване на всяко подмножество от елементи (стойности), съдържащи се в измерението, и в произволен ред.

12. Неограничен размер и брой нива на агрегиране. Проучване на възможния брой необходими измервания, изисквани в аналитичен модел, показа, че до 19 измервания могат да бъдат използвани едновременно от потребител-аналитик. Това води до препоръка относно броя на измеренията, поддържани от OLAP системата. Освен това всяко от общите измерения не трябва да се ограничава от броя на нивата на агрегиране, определени от потребителя-аналитик.

Като специализирани OLAP системи, предлагани в момента на пазара, можете да посочите CalliGraph, Business Intelligence.

За решаване на прости задачи за анализ на данни е възможно да се използва бюджетно решение - офис приложения Microsoft Excel и Access, които съдържат елементарни OLAP технологични инструменти, които ви позволяват да създавате обобщени таблици и да изграждате различни отчети въз основа на тях.

цел срочна писмена работае изучаването на OLAP технологията, концепцията за нейното внедряване и структура.

AT модерен свят компютърни мрежии изчислителните системи ви позволяват да анализирате и обработвате големи количества данни.

Голямото количество информация значително усложнява търсенето на решения, но дава възможност да се получат много по-точни изчисления и анализи. За да разрешите този проблем, има целият клас информационни системиизвършване на анализа. Такива системи се наричат ​​системи за подпомагане на вземането на решения (DSS) (DSS, Decision Support System).

За да извърши анализа, DSS трябва да натрупа информация, като има средства за нейното въвеждане и съхранение. Общо има три основни задачи, решени в DSS:

· въвеждане на данни;

· хранилище за данни;

· Анализ на данни.

Въвеждането на данни в DSS се извършва автоматично от сензори, характеризиращи състоянието на околната среда или процес, или от човешки оператор.

Ако данните се въвеждат автоматично от сензори, тогава данните се натрупват чрез сигнал за готовност, който възниква, когато се появи информация, или чрез циклично запитване. Ако въвеждането се извършва от човек, тогава те трябва да предоставят на потребителите удобни средства за въвеждане на данни, които ги проверяват за правилността на въвеждането, както и да извършват необходимите изчисления.

При едновременно въвеждане на данни от няколко оператора е необходимо да се решат проблемите с модификацията и паралелния достъп на едни и същи данни.

DSS предоставя на анализаторите данни под формата на отчети, таблици, графики за проучване и анализ, поради което такива системи предоставят функции за подпомагане на вземането на решения.

В подсистемите за въвеждане на данни, наречени OLTP (On-linetransactionprocessing), се реализира оперативна обработка на данни. За тяхното реализиране се използват конвенционални системи за управление на бази данни (СУБД).

Подсистемата за анализ може да бъде изградена на базата на:

· подсистеми за анализ на търсене на информация, базирани на релационни СУБД и статични заявки, използващи езика SQL;

· подсистеми за оперативен анализ. За реализиране на такива подсистеми се използва технологията за онлайн аналитична обработка на данни OLAP, използваща концепцията за многомерно представяне на данни;

· подсистеми за интелектуален анализ. Тази подсистема прилага DataMining методи и алгоритми.

От гледна точка на потребителя OLAP-системите осигуряват средство за гъвкав преглед на информация в различни раздели, автоматично получаване на обобщени данни, извършване на аналитични операции на свиване, детайлизиране, сравнение във времето. Благодарение на всичко това, OLAP системите са решение с големи предимства в областта на подготовката на данни за всички видове бизнес отчети, включващи представяне на данни в различни раздели и различни нивайерархии, като отчети за продажби, различни форми на бюджети и други. OLAP системите имат големи предимства на такова представяне в други форми на анализ на данни, включително прогнозиране.

1.2 Определение OLAP-системи

Технологията за сложен анализ на многоизмерни данни се нарича OLAP. OLAP е ключов компонент на организацията на хранилището на данни.

Функционалността на OLAP може да бъде внедрена по различни начини, толкова просто като анализиране на данни в офис приложения, и по-сложни - разпределени аналитични системи, базирани на сървърни продукти.

OLAP (On-LineAnalyticalProcessing) е технология за онлайн аналитична обработка на данни, която използва инструменти и методи за събиране, съхраняване и анализ на многоизмерни данни и за подпомагане на процесите на вземане на решения.

Основната цел на OLAP системите е да поддържат аналитични дейности, произволни заявки от потребители на анализатори. Целта на OLAP анализа е да тества възникващите хипотези.

Използването на OLAP система ви позволява да автоматизирате стратегическото ниво на управление на организацията. OLAP (Online Analytical Processing - аналитична обработка на данни в реално време) е мощна технология за обработка и изследване на данни. Системите, изградени на базата на OLAP технологията, предоставят почти неограничени възможности за съставяне на отчети, извършване на сложни аналитични изчисления, изграждане на прогнози и сценарии и разработване на различни варианти на планове.

Пълноценните OLAP системи се появяват в началото на 90-те години в резултат на развитието на информационните системи за подпомагане на вземането на решения. Те са предназначени да трансформират различни, често различни данни в полезна информация. OLAP системите могат да организират данни според набор от критерии. Не е необходимо обаче критериите да имат ясни характеристики.

OLAP системите са намерили своето приложение в много въпроси на стратегическото управление на организацията: управление на бизнес ефективността, стратегическо планиране, бюджетиране, прогнозиране на развитието, финансови отчети, анализ на работата, симулация на външната и вътрешната среда на организацията, съхранение на данни и отчитане.

Структура на OLAP система

Работата на системата OLAP се основава на обработката на многомерни масиви от данни. Многомерните масиви са подредени по такъв начин, че всеки елемент от масива има много връзки с други елементи. За да формира многоизмерен масив, една OLAP система трябва да получи входни данни от други системи (например ERP или CRM системи) или чрез външен вход. Потребителят на системата OLAP получава необходимите данни в структуриран вид в съответствие с неговата заявка. Въз основа на определената процедура можете да си представите структурата на OLAP системата.

Като цяло структурата на OLAP системата се състои от следните елементи:

  • база данни . Базата данни е източникът на информация за работата на OLAP системата. Типът база данни зависи от вида на OLAP системата и алгоритмите на OLAP сървъра. Като правило се използват релационни бази данни, многомерни бази данни, хранилища за данни и др.
  • OLAP сървър. Той осигурява управление на многомерната структура на данните и връзката между базата данни и потребителите на OLAP системата.
  • персонализирани приложения. Този елемент от структурата на системата OLAP управлява потребителските заявки и генерира резултатите от достъпа до базата данни (отчети, графики, таблици и др.)

В зависимост от метода на организиране, обработка и съхранение на данни могат да се внедряват OLAP системи локални компютрипотребители или използване на специализирани сървъри.

Има три основни начина за съхраняване и обработка на данни:

  • локално. Данните се хостват на компютрите на потребителите. Обработката, анализът и управлението на данните се извършват на местни работни места. Тази структура на OLAP системата има значителни недостатъци, свързани със скоростта на обработка на данните, сигурността на данните и ограниченото използване на многомерен анализ.
  • релационни бази данни. Тези бази данни се използват, когато OLAP система работи заедно с CRM система или ERP система. Данните се съхраняват на сървъра на тези системи под формата на релационни бази данни или хранилища за данни. OLAP сървърът има достъп до тези бази данни, за да формира необходимите многоизмерни структури и да извърши анализ.
  • многомерни бази данни. В този случай данните са организирани като специално хранилище на данни на специален сървър. Всички операции с данни се извършват на този сървър, който преобразува оригиналните данни в многоизмерни структури. Такива структури се наричат ​​OLAP кубове. Източници на данни за формиране на OLAP куб са релационни бази данни и/или клиентски файлове. Сървърът за данни извършва предварителна подготовка и обработка на данните. OLAP сървърът работи с OLAP куб без директен достъп до източници на данни (релационни бази данни, клиентски файлове и др.).

Видове OLAP системи

В зависимост от метода на съхранение и обработка на данни, всички OLAP системи могат да бъдат разделени на три основни типа.


1. ROLAP (Relational OLAP - релационни OLAP системи) - този тип OLAP система работи с релационни бази данни. Данните се достъпват директно до релационната база данни. Данните се съхраняват в релационни таблици. Потребителите имат способността да извършват многоизмерен анализ, както в традиционните OLAP системи. Това се постига чрез използването SQL инструментии специални заявки.

Едно от предимствата на ROLAP е способността за по-ефективна обработка на големи количества данни. Друго предимство на ROLAP е способността за ефективна обработка както на числови, така и на текстови данни.

Недостатъците на ROLAP включват ниска производителност (в сравнение с традиционните OLAP системи), т.к обработката на данни се извършва от OLAP сървъра. Друг недостатък е ограничението на функционалността поради използването на SQL.


2. MOLAP (Multidimensional OLAP - многомерни OLAP системи). Този тип OLAP системи принадлежат към традиционните системи. Разликата между традиционната OLAP система и другите системи е в предварителната подготовка и оптимизация на данните. Тези системи, като правило, използват специален сървър, на който данните се обработват предварително. Данните се генерират в многомерни масиви- OLAP кубове.

MOLAP системите са най-ефективни при обработката на данни. те улесняват реорганизирането и структурирането на данни за различни потребителски заявки. MOLAP аналитичните инструменти ви позволяват да извършвате сложни изчисления. Друго предимство на MOLAP е възможността за бързо генериране на заявки и получаване на резултати. Това се осигурява чрез предварителното формиране на OLAP кубове.

Недостатъците на системата MOLAP включват ограничаването на обема на обработваните данни и излишъка на данни, т.к. за формирането на многоизмерни кубове, в различни аспекти, данните трябва да бъдат дублирани.


3. HOLAP (Hybrid OLAP - хибридни OLAP системи). Хибридните OLAP системи са комбинация от ROLAP и MOLAP системи. Хибридните системи се опитват да комбинират предимствата на две системи: използването на многоизмерни бази данни и управление на релационни бази данни. HOLAP системите ви позволяват да съхранявате голямо количество данни в релационни таблици, а обработените данни се поставят в предварително изградени многоизмерни OLAP кубове. Предимствата на този вид система са мащабируемост на данните, бърза обработка на данни и гъвкав достъп до източници на данни.

Има и други видове OLAP системи, но те са по-скоро маркетингов ход на производителите, отколкото независим тип OLAP система.

Тези видове включват:

  • WOLAP (Web OLAP). Изглед на OLAP системата с поддръжка уеб интерфейс. Тези OLAP системи имат възможност за достъп до бази данни чрез уеб интерфейс.
  • DOLAP (Desktop OLAP). Този тип OLAP система позволява на потребителите да изтеглят база данни на локално работно място и да работят с нея локално.
  • MobileOLAP. Това е функция на OLAP системите, която ви позволява да работите с базата данни от разстояние с помощта на мобилни устройства.
  • SOLAP (пространствен OLAP). Този тип OLAP системи са проектирани да обработват пространствени данни. Появи се в резултат на интеграцията на географски информационни системи и OLAP системи. Тези системи ви позволяват да обработвате данни не само в буквено-цифров формат, но и под формата на визуални обекти и вектори.

Предимства на OLAP система

Използването на OLAP система дава възможност на организацията да прогнозира и анализира различни ситуации, свързани с текущи дейности и перспективи за развитие. Тези системи могат да се разглеждат като допълващи системите за автоматизация на корпоративно ниво. Всички предимства на OLAP системите пряко зависят от точността, надеждността и обема на изходните данни.

Основните предимства на OLAP системата са:

  • последователност обща информацияи резултатите от анализа. При наличието на OLAP система винаги е възможно да се проследи източникът на информация и да се определи логическата връзка между получените резултати и изходните данни. Субективността на резултатите от анализа е намалена.
  • провеждане на многовариантен анализ. Използването на OLAP система ви позволява да получите много сценарии за развитие на събития въз основа на набор от първоначални данни. Благодарение на инструментите за анализ е възможно да се моделират ситуации според принципа „какво ще се случи, ако“.
  • детайлен контрол. Детайлността на представянето на резултатите може да варира в зависимост от нуждите на потребителите. В този случай няма нужда да извършвате сложни системни настройки и да повтаряте изчисленията. Докладът може да съдържа точно тази информация, която е необходима за вземане на решение.
  • разкриване на скрити зависимости. Чрез изграждане на многоизмерни връзки става възможно да се идентифицират и идентифицират скрити зависимости в различни процеси или ситуации, които засягат производствените дейности.
  • създаване на единна платформа. Чрез използването на OLAP система става възможно създаването на единна платформа за всички процеси на прогнозиране и анализ в едно предприятие. По-специално, данните от системата OLAP са основата за изграждане на бюджетни прогнози, прогнози за продажби, прогнози за покупки, стратегически планове за развитие и др.

Концепцията за многомерен анализ на данни е тясно свързана с оперативния анализ, който се извършва с помощта на OLAP системи.

OLAP (On-Line Analytical Processing) е технология за онлайн аналитична обработка на данни, която използва методи и инструменти за събиране, съхраняване и анализ на многоизмерни данни с цел подпомагане на процесите на вземане на решения.

Основната цел на OLAP системите е да поддържат аналитични дейности, произволни (често се използва терминът ad-hoc) заявки от потребители анализатори. Целта на OLAP анализа е да тества възникващите хипотези.

В основата на OLAP технологията стои основателят на релационния подход Е. Код. През 1993 г. той публикува статия, озаглавена „OLAP за потребители на анализатори: какво трябва да бъде“. Този документ очертава основните концепции за онлайн аналитична обработка и идентифицира следните 12 изисквания, на които трябва да отговарят продуктите, позволяващи онлайн аналитична обработка. Токмаков Г.П. База данни. Концепция за база данни, релационен модел на данни, SQL езици. С. 51

По-долу са изброени 12-те правила, очертани от Код, които дефинират OLAP.

1. Многомерност - OLAP-системата на концептуално ниво трябва да представя данните под формата на многомерен модел, което опростява процесите на анализ и възприемане на информация.

2. Прозрачност - OLAP системата трябва да скрие от потребителя реалното изпълнение на многоизмерен модел, метода на организация, източниците, инструментите за обработка и съхранение.

3. Наличност -- OLAP системата трябва да предоставя единен, последователен и последователен модел на данни на потребителя, позволяващ достъп до данните, независимо от това как или къде се съхраняват.

4. Последователна производителност при разработване на отчети -- Производителността на OLAP системите не трябва да намалява значително, тъй като броят на анализираните измерения се увеличава.

5. Архитектура клиент-сървър -- OLAP системата трябва да може да работи в среда клиент-сървър, като повечето от данните, които днес трябва да бъдат подложени на онлайн аналитична обработка, се съхраняват разпределени. Основната идея тук е, че сървърният компонент на инструмента OLAP трябва да бъде достатъчно интелигентен, за да позволи изграждането на обща концептуална схема, базирана на обобщаването и консолидирането на различни логически и физически схеми на корпоративни бази данни, за да осигури прозрачен ефект.

6. Равенство на измеренията -- Една OLAP система трябва да поддържа многомерен модел, в който всички измерения са равни. Ако е необходимо допълнителни характеристикиможе да се даде на отделни измерения, но тази опция трябва да се даде на всяко измерение.

7. Динамично управление на разредени матрици -- Една OLAP система трябва да осигурява оптимална работа с разредени матрици. Скоростта на достъп трябва да се поддържа независимо от местоположението на клетките с данни и да бъде постоянна стойност за модели с различен брой измерения и различна степен на разреденост на данните.

8. Поддръжка на многопотребителски режим - OLAP-системата трябва да осигурява възможност за работа с множество потребители заедно с един аналитичен модел или създаване на различни модели за тях от единични данни. В същото време са възможни както четене, така и запис на данни, така че системата трябва да гарантира тяхната цялост и сигурност.

9. Неограничени кръстосани операции -- Една OLAP система трябва да гарантира, че функционалните връзки, описани с помощта на определен формален език между клетките на хиперкубите, се запазват при извършване на каквито и да било операции за разделяне, завъртане, консолидиране или разбивка. Системата трябва независимо (автоматично) да извърши преобразуването установени взаимоотношениябез да се изисква потребителят да ги замени.

10. Интуитивно манипулиране на данни – OLAP системата трябва да предоставя начин за извършване на операции по разделяне, завъртане, консолидиране и разбиване на хиперкуб, без потребителят да трябва да върши много работа с потребителския интерфейс. Размерите, дефинирани в аналитичния модел, трябва да съдържат цялата необходима информация за извършване на горните операции.

11. Гъвкави опции за отчитане -- OLAP системата трябва да поддържа различни начинивизуализация на данни, т.е. докладите трябва да се подават във всяка възможна ориентация. Инструментите за отчитане трябва да представляват синтезирани данни или информация, произтичащи от модела на данни във всяка възможна ориентация. Това означава, че редовете, колоните или страниците трябва да показват от 0 до N измерения едновременно, където N-- числоизмервания на целия аналитичен модел. Освен това всяко измерение на съдържанието, показано в отделна публикация, колона или страница, трябва да позволява всяко подмножество от елементи (стойности), съдържащи се в измерението, да бъде показано в произволен ред.

12. Неограничена размерност и брой нива на агрегиране - Проучване на възможния брой необходими измерения, изисквани в аналитичен модел, показа, че до 19 измерения могат да се използват едновременно. Оттук и силната препоръка аналитичният инструмент да може да предоставя поне 15 и за предпочитане 20 измервания едновременно. Освен това, всяко от общите измерения не трябва да се ограничава от броя на нивата на агрегиране и пътища за консолидация, дефинирани от потребителя-анализатор.

Допълнителни правила на Codd.

Наборът от тези изисквания, които служат като де факто дефиниция на OLAP, често предизвикват различни критики, например правила 1, 2, 3, 6 са изисквания, а правила 10, 11 са неформализирани желания. Токмаков Г.П. База данни. Концепция за база данни, релационен модел на данни, SQL езици. P. 68 По този начин изброените 12 изисквания на Codd не ви позволяват да дефинирате точно OLAP. През 1995 г. Код добавя следните шест правила към списъка:

13. Пакетно извличане срещу интерпретация -- OLAP системата трябва да бъде еднакво ефективна при осигуряване на достъп както до вътрешни, така и до външни данни.

14. Поддръжка за всички модели за анализ на OLAP -- Една OLAP система трябва да поддържа и четирите модела за анализ на данни, дефинирани от Codd: категоричен, интерпретативен, спекулативен и стереотипен.

15. Работа с денормализирани данни -- OLAP система трябва да бъде интегрирана с денормализирани източници на данни. Модификациите на данните, направени в OLAP среда, не трябва да водят до промени в данните, съхранявани в оригиналните външни системи.

16. Запазване на OLAP резултати: съхраняването им отделно от оригиналните данни -- OLAP система, работеща в режим на четене-запис, след като модифицира оригиналните данни, трябва да запише резултатите отделно. С други думи, сигурността на изходните данни е гарантирана.

17. Изключване на липсващи стойности-- Когато представя данни на потребителя, OLAP системата трябва да отхвърли всички липсващи стойности. С други думи, липсващите стойности трябва да са различни от нулевите стойности.

18 Боравене с липсващи стойности -- Една OLAP система трябва да игнорира всички липсващи стойности, независимо от техния източник. Тази функция е свързана със 17-то правило.

Освен това Код разделя всичките 18 правила на следните четири групи, наричайки ги функции. Тези групи бяха наречени B, S, R и D.

Основните характеристики (B) включват следните правила:

Многомерно концептуално представяне на данни (правило 1);

Интуитивно манипулиране на данни (правило 10);

Наличност (правило 3);

Пакетно извличане срещу интерпретация (правило 13);

Поддръжка за всички модели за OLAP анализ (правило 14);

Архитектура "клиент-сървър" (правило 5);

Прозрачност (правило 2);

Поддръжка на мултиплейър (правило 8)

Специални характеристики (S):

Обработка на ненормализирани данни (правило 15);

Запазване на OLAP резултати: съхраняването им отделно от оригиналните данни (правило 16);

Изключване на липсващи стойности (правило 17);

Обработка на липсващи стойности (правило 18). Функции за отчитане (R):

Гъвкавост на генериране на отчети (правило 11);

Стандарт за изпълнение на доклада (правило 4);

Автоматична конфигурация на физическия слой (модифицирано оригинално правило 7).

Контрол на измерването (D):

Универсалност на измерванията (правило 6);

Неограничен брой измерения и нива на агрегиране (правило 12);

Неограничени операции между измеренията (правило 9).