데이터 웨어하우스운영 데이터베이스의 장기간에 걸쳐 고정된 스냅샷을 기반으로 형성됩니다. 정보 시스템그리고 아마도 다양한 외부 소스. 데이터 웨어하우스는 데이터베이스 기술, OLAP, 데이터 마이닝, 데이터 시각화를 사용합니다.

데이터 웨어하우스의 주요 특성.

  • 과거 데이터를 포함합니다.
  • 부분적으로 및 완전히 요약 된 데이터뿐만 아니라 자세한 정보를 저장합니다.
  • 데이터는 대부분 정적입니다.
  • 규제되지 않고 구조화되지 않은 발견적 방법데이터 처리;
  • 중간 및 낮은 강도의 거래 처리;
  • 예측할 수 없는 데이터 사용 방식
  • 분석을 위해 설계되었습니다.
  • 에 초점을 맞춘 주제 영역;
  • 전략적 의사결정 지원;
  • 상대적으로 적은 수의 경영진에게 서비스를 제공합니다.

OLAP(On-Line Analytical Processing)라는 용어는 데이터 프레젠테이션 모델을 설명하고 이에 따라 데이터 웨어하우스에서 처리하는 기술을 설명하는 데 사용됩니다. OLAP는 집계된 데이터의 다차원 보기를 사용하여 빠른 접근전략적으로 중요한 정보심층 분석을 위해. OLAP 응용 프로그램에는 다음과 같은 기본 속성이 있어야 합니다.

  • 다차원 데이터 프레젠테이션;
  • 복잡한 계산 지원;
  • 시간 요소의 올바른 고려.

OLAP의 장점:

  • 프로모션 성능제작진, 개발자 응용 프로그램. 전략적 정보에 대한 적시 액세스.
  • 사용자에게 스키마를 자체적으로 변경할 수 있는 충분한 권한을 부여합니다.
  • OLAP 애플리케이션이 의존하는 데이터 웨어하우스및 OLTP 시스템에서 최신 데이터를 수신하여 무결성 제어기업 데이터.
  • OLTP 시스템의 부하를 줄이고 데이터 웨어하우스.

OLAP 및 OLTP. 특성 및 주요 차이점

OLAP OLTP
데이터 저장소내부 기업 데이터와 외부 데이터를 모두 포함해야 합니다. 운영 데이터베이스에 입력되는 주요 정보 출처는 기업의 활동이며 데이터 분석에는 외부 정보 출처(예: 통계 보고서)의 참여가 필요합니다.
분석 데이터베이스의 볼륨은 운영 데이터베이스의 볼륨보다 적어도 10배 이상 큽니다. 신뢰할 수 있는 분석 및 예측을 위해 데이터 저장소몇 년 동안 회사의 활동과 시장 상태에 대한 정보가 필요합니다. 운영 처리를 위해 지난 몇 개월 동안의 데이터가 필요합니다.
데이터 저장소운영 데이터베이스의 내용에 가능한 한 가깝게 일관되게 제시되고 합의된 정보를 포함해야 합니다. 다양한 소스에서 정보를 추출하고 "정리"하려면 구성 요소가 필요합니다. 많은 대기업에는 (역사적인 이유로) 동시에 자체 데이터베이스가 있는 여러 운영 정보 시스템이 있습니다. 운영 데이터베이스에는 수신 시간에 대한 표시가 다르고 때로는 모순되기도 하는 서로 다른 형식으로 표시되는 의미상 동일한 정보가 포함될 수 있습니다.
분석 데이터베이스에 대한 쿼리 집합은 예측할 수 없습니다. 데이터 웨어하우스임시 분석가 요청에 응답하기 위해 존재합니다. 요청이 너무 자주 오지 않고 많은 양의 정보에 영향을 미치지 않는다는 사실만 믿을 수 있습니다. 분석 데이터베이스 크기는 집계(합계, 최소, 최대, 평균등.) 데이터 처리 시스템은 특정 문제를 해결하도록 설계되었습니다. 데이터베이스의 정보는 자주 그리고 소량으로 선택됩니다. 일반적으로 운영 데이터베이스에 대한 쿼리 집합은 설계 중에 이미 알려져 있습니다.
분석 데이터베이스의 작은 변동성(데이터를 로드할 때만)으로 배열의 순서는 합리적으로 판명됩니다. 빠른 방법대량 샘플링을 위한 인덱싱, 사전 집계된 데이터 저장 데이터 처리 시스템은 본질적으로 매우 가변적이며, 이는 사용된 DBMS(정규화된 데이터베이스 구조, 행이 순서 없이 저장됨, 인덱싱을 위한 B-트리, 거래성)
분석 데이터베이스의 정보는 기업에 매우 중요하므로 대규모 보호가 필요합니다(테이블의 특정 행 및/또는 열에 대한 개별 액세스 권한). 데이터 처리 시스템의 경우 일반적으로 충분합니다. 정보 보호테이블 수준에서

OLAP 시스템에 대한 Codd 규칙

1993년 Codd는 분석 사용자를 위한 OLAP: What It Should Be Like를 발표했습니다. 그 책에서 그는 온라인 분석 처리의 기본 개념을 설명하고 제품이 온라인 분석 처리를 제공하기 위해 충족해야 하는 12가지 규칙을 식별했습니다.

  1. 개념적 다차원 표현. OLAP 모델은 핵심이 다차원이어야 합니다. 다차원 개념 다이어그램 또는 사용자 정의 표현은 계산뿐 아니라 모델링 및 분석을 용이하게 합니다.
  2. 투명도. 사용자는 어디에서 왔는지 의심하지 않고도 OLAP 시스템에서 필요한 모든 데이터를 얻을 수 있습니다. OLAP 제품이 사용자 도구의 일부인지 여부에 관계없이 이 사실은 사용자에게 보이지 않아야 합니다. OLAP가 클라이언트-서버 컴퓨팅에 의해 제공되는 경우 이 사실은 가능하다면 사용자에게도 보이지 않아야 합니다. OLAP는 사용자가 어디에 있든 분석 도구를 사용하여 서버와 통신할 수 있도록 하는 진정한 개방형 아키텍처의 컨텍스트에서 제공되어야 합니다. 또한 분석 도구가 동종 및 이종 데이터베이스 환경과 상호 작용할 때 투명성도 확보해야 합니다.
  3. 유효성. OLAP는 자체적으로 제공해야 합니다. 논리도이기종 데이터베이스 환경에 접근하고 적절한 변환을 수행하여 사용자에게 데이터를 제공합니다. 또한 물리적 데이터 조직이 실제로 어디에, 어떻게, 어떤 형태로 사용될 것인지에 대한 사전 주의가 필요하다. OLAP 시스템은 실제로 필요한 데이터에만 액세스해야 하며 적용해서는 안 됩니다. 일반 원칙불필요한 입력을 수반하는 "주방 깔때기".
  4. 끊임없는 성능보고서를 개발할 때. 성능차원 수와 데이터베이스 크기의 증가에 따라 보고가 크게 떨어지지 않아야 합니다.
  5. 클라이언트-서버 아키텍처. 제품은 클라이언트/서버 제품이어야 할 뿐만 아니라 서버 구성 요소도 최소한의 노력과 프로그래밍으로 서로 다른 클라이언트가 연결할 수 있을 만큼 지능적이어야 합니다.
  6. 일반적인 다차원성. 모든 차원은 동일해야 하며, 각 차원은 구조 및 운영 능력 면에서 동일해야 합니다. 사실, 개별 측정에 대해 추가 작동 가능성이 허용되지만(시간이 내포되어 있음) 그러한 추가 기능어떤 차원에 주어져야 합니다. 기본이 되어서는 안된다. 데이터 구조, 계산 또는 보고 형식이 하나의 측정기준에 더 구체적이었습니다.
  7. 동적 제어 희소 행렬. OLAP 시스템은 모델 유형, 데이터 볼륨 및 데이터베이스 희소성을 기반으로 물리적 스키마를 자동으로 조정해야 합니다.
  8. 다중 사용자 지원. OLAP 도구는 다음 기능을 제공해야 합니다. 나누는(요청 및 추가), 무결성 및 보안.
  9. 무제한 교차 작업. 모든 측정에는 모든 종류의 작업이 허용되어야 합니다.
  10. 직관적인 데이터 조작. 데이터 조작은 메뉴와 여러 작업을 사용하지 않고 보기 모드에서 셀에 대한 직접 작업을 통해 수행되었습니다.
  11. 유연한 보고 옵션. 측정값은 사용자가 원하는 방식으로 보고서에 배치되어야 합니다.
  12. 제한 없는

OLAP(OnLine Analytical Processing)는 특정 제품의 이름이 아니라 데이터 분석 및 보고를 포함하는 전체 온라인 분석 처리 기술의 이름입니다. 사용자에게는 다양한 섹션의 데이터를 자동으로 요약하는 다차원 테이블이 제공되며 이를 통해 계산 및 보고서 형식을 빠르게 관리할 수 있습니다.

일부 간행물에서는 분석 처리를 온라인 및 대화식이라고 부르지만 형용사 "온라인"은 OLAP 기술의 의미를 가장 정확하게 반영합니다. 경영 관리 의사 결정의 개발은 자동화에 가장 잘 맞는 영역의 범주에 속합니다. 그러나 오늘날에는 결정 개발 과정에서 관리자를 지원할 수 있는 기회가 있으며, 가장 중요한 것은 결정 개발 프로세스, 선택 및 채택 속도를 크게 높일 수 있는 기회가 있습니다.

의사 결정 지원 시스템에는 일반적으로 초기 세트의 다양한 샘플에 대한 집계 데이터를 지각 및 분석에 편리한 형태로 사용자에게 제공하는 수단이 있습니다. 일반적으로 이러한 집계 함수는 하이퍼큐브 또는 메타큐브라고도 하는 다차원 데이터 세트를 형성하며, 축에는 매개변수가 포함되어 있고 셀에는 이에 종속되는 집계 데이터가 포함되어 있습니다. 이러한 데이터는 관계형 테이블에도 저장할 수 있습니다. 스토리지의 물리적 구현이 아니라 논리적 조직 데이터에 대해 이야기하는 경우입니다.

각 축을 따라 데이터를 다양한 세부 수준을 나타내는 계층 구조로 구성할 수 있습니다.

다차원 모델의 차원에 따라 기업 활동에 영향을 미치는 요소(예: 시간, 제품, 회사 지점 등)는 제외됩니다. 결과 OLAP 큐브는 기업 활동의 지표(가격, 판매, 계획, 이익, 현금 흐름 등)로 채워집니다. 기하학적 정육면체와 달리 OLAP 정육면체의 면은 같은 크기일 필요가 없습니다. 이 채우기는 실제 데이터와 같이 수행할 수 있습니다. 운영체제, 그리고 과거 데이터를 기반으로 예측했습니다. Hypercube 차원은 복잡하고 계층적일 수 있으며 차원 간에 관계를 설정할 수 있습니다. 분석하는 동안 사용자는 데이터에 대한 관점을 변경할 수 있습니다(소위 논리적 관점을 변경하는 작업). 따라서 다른 섹션에서 데이터를 보고 특정 문제를 해결할 수 있습니다. 예측 및 조건부 스케줄링(가정 분석)을 포함하여 큐브에서 다양한 작업을 수행할 수 있습니다.

이 데이터 모델 덕분에 사용자는 복잡한 쿼리를 공식화하고 보고서를 생성하며 데이터의 하위 집합을 받을 수 있습니다. 운영 분석 처리는 관리 직원이 준비하고 결정을 내리는 프로세스를 크게 단순화하고 가속화할 수 있습니다. 온라인 분석 처리는 데이터를 정보로 전환하는 목적을 제공합니다. 이는 대부분 구조화된 보고서를 고려하는 기존의 의사 결정 지원 프로세스와 근본적으로 다릅니다.


OLAP 기술은 지적 분석 유형을 나타내며 12가지 원칙을 포함합니다.

1. 개념적 다차원 표현. 사용자 분석가는 각각 기업의 세계를 본질적으로 다차원으로 보고 OLAP 모델은 그 핵심이 다차원이어야 합니다.

2. 투명도. OLAP 시스템의 아키텍처는 열려 있어야 하며 사용자가 어디에 있든 분석 도구(클라이언트)를 사용하여 서버와 통신할 수 있어야 합니다.

3. 유효성. OLAP 분석가 사용자는 관계형 데이터베이스의 전사적 데이터와 레거시 레거시 데이터베이스의 데이터, 공통 액세스 방법 및 공통 분석 모델을 포함하는 공통 개념 스키마를 기반으로 분석을 수행할 수 있어야 합니다. OLAP 시스템은 실제로 필요한 데이터에만 액세스해야 하며 불필요한 입력을 수반하는 일반적인 "주방 깔때기" 원칙을 적용하지 않아야 합니다.

4. 보고서 개발의 일관된 성능. 차원 수 또는 데이터베이스 크기가 증가해도 분석가 사용자는 성능이 크게 저하되지 않아야 합니다.

5. 클라이언트-서버 아키텍처 . 오늘날 온라인 분석 처리를 받아야 하는 대부분의 데이터는 LAN을 통해 사용자 워크스테이션에 액세스할 수 있는 메인프레임에 포함되어 있습니다. 이는 OLAP 제품이 클라이언트-서버 환경에서 작동할 수 있어야 함을 의미합니다.

6. 일반 다차원성. 각 차원은 구조 및 운영 능력에 관계없이 적용되어야 합니다. 기본 데이터 구조, 수식 및 보고 형식이 어느 한 차원으로 편향되어서는 안 됩니다.

7. 희소 행렬의 동적 관리. OLAP 도구의 물리적 설계는 희소 행렬을 최적으로 관리하기 위해 특정 분석 모델에 완전히 적응할 수 있어야 합니다. 희소성(백분율로 측정됨 빈 셀가능한 모든 것)은 데이터 보급의 특성 중 하나입니다.

8. 다중 사용자 지원. OLAP 도구는 무결성과 보안을 유지하면서 쿼리를 공유하고 여러 분석가 사용자를 보강하는 기능을 제공해야 합니다.

9. 무제한 교차 작업. 다양한 작업은 계층적 특성으로 인해 OLAP 모델에서 종속 관계를 나타낼 수 있습니다. 즉, 교차 기능입니다. 실행을 위해 분석가 사용자가 이러한 계산 및 작업을 재정의할 필요가 없어야 합니다.

10. 직관적인 데이터 조작. 분석 모델에 정의된 차원에 대한 분석가 사용자의 보기에는 OLAP 모델에서 작업을 수행하는 데 필요한 모든 정보가 포함되어야 합니다. 메뉴 시스템이나 기타 여러 사용자 인터페이스 작업을 사용할 필요가 없습니다.

11. 유연한 보고 옵션. 보고 도구는 가능한 모든 방향에서 데이터 모델에서 나온 합성 데이터 또는 정보여야 합니다. 이는 보고서의 행, 열 또는 페이지가 OLAP 모델의 여러 차원을 동시에 표시해야 하며 차원에 포함된 요소(값)의 하위 집합을 임의의 순서로 표시할 수 있어야 한다는 것을 의미합니다.

12. 무제한 차원 및 집계 수준 수. 분석 모델에 필요한 필요한 측정의 가능한 수에 대한 연구는 분석 사용자가 동시에 최대 19개의 측정을 사용할 수 있음을 보여주었습니다. 이는 OLAP 시스템에서 지원하는 차원 수에 대한 권장 사항으로 이어집니다. 또한 각 공통 차원은 사용자 분석가가 정의한 집계 수준의 수에 의해 제한되어서는 안 됩니다.

현재 시중에 나와 있는 특화된 OLAP 시스템으로 비즈니스 인텔리전스인 CalliGraph를 지정할 수 있습니다.

간단한 데이터 분석 작업을 해결하기 위해 피벗 테이블을 만들고 이를 기반으로 다양한 보고서를 작성할 수 있는 기본 OLAP 기술 도구가 포함된 Microsoft Excel 및 Access Office 응용 프로그램과 같은 예산 솔루션을 사용할 수 있습니다.

겨냥하다 학기말 OLAP 기술, 구현 및 구조의 개념에 대한 연구입니다.

현대 세계 컴퓨터 네트워크컴퓨팅 시스템을 사용하면 많은 양의 데이터를 분석하고 처리할 수 있습니다.

많은 양의 정보는 솔루션 검색을 크게 복잡하게 하지만 훨씬 더 정확한 계산 및 분석을 얻을 수 있습니다. 이 문제를 해결하기 위해, 전체 수업 정보 시스템분석을 수행합니다. 이러한 시스템을 DSS(의사결정 지원 시스템)라고 합니다.

분석을 수행하기 위해 DSS는 입력 및 저장 수단이 있는 정보를 축적해야 합니다. 전체적으로 DSS에서 해결된 세 가지 주요 작업이 있습니다.

· 데이터 투입;

· 데이터 저장고;

· 데이터 분석.

DSS에 대한 데이터 입력은 환경이나 프로세스의 상태를 특성화하는 센서 또는 작업자가 자동으로 수행합니다.

센서에서 자동으로 데이터가 입력되면 정보가 나타날 때 발생하는 준비 신호 또는 주기적 폴링에 의해 데이터가 누적됩니다. 입력이 사람에 의해 수행되는 경우 입력의 정확성을 확인하고 필요한 계산을 수행하는 데이터를 입력하기 위한 편리한 수단을 사용자에게 제공해야 합니다.

여러 운영자가 동시에 데이터를 입력하는 경우 동일한 데이터의 수정 및 병렬 액세스 문제를 해결해야 합니다.

DSS는 분석가에게 연구 및 분석을 위한 보고서, 표, 그래프 형태의 데이터를 제공하므로 이러한 시스템이 의사결정 지원 기능을 제공합니다.

OLTP(On-linetransactionprocessing)라고 하는 데이터 입력 하위 시스템에서 운영 데이터 처리가 구현됩니다. 구현을 위해 기존 DBMS(데이터베이스 관리 시스템)가 사용됩니다.

분석 하위 시스템은 다음을 기반으로 구축할 수 있습니다.

· SQL 언어를 사용하는 관계형 DBMS 및 정적 쿼리에 기반한 정보 검색 분석의 하위 시스템;

· 운영 분석 하위 시스템. 이러한 하위 시스템을 구현하기 위해 다차원 데이터 표현의 개념을 사용하여 온라인 분석 데이터 처리 OLAP 기술이 사용됩니다.

· 지적 분석 하위 시스템. 이 하위 시스템은 DataMining 방법 및 알고리즘을 구현합니다.

사용자의 관점에서 OLAP 시스템은 다양한 섹션의 정보를 유연하게 볼 수 있는 수단, 집계된 데이터의 자동 수신, 컨볼루션의 분석 작업 수행, 시간 경과에 따른 상세화, 비교를 제공합니다. 이 모든 덕분에 OLAP 시스템은 다양한 섹션의 데이터 표시 및 다른 수준판매 보고서, 다양한 형태의 예산 등과 같은 계층. OLAP 시스템은 예측을 포함한 다른 형태의 데이터 분석에서 이러한 표현의 큰 장점을 가지고 있습니다.

1.2 정의 OLAP-시스템

복잡한 다차원 데이터 분석 기술을 OLAP이라고 합니다. OLAP는 데이터 웨어하우스 조직의 핵심 구성 요소입니다.

OLAP 기능은 데이터를 분석하는 것처럼 다양한 방법으로 구현할 수 있습니다. 사무실 응용 프로그램, 그리고 서버 제품을 기반으로 하는 보다 복잡한 분산 분석 시스템.

OLAP(On-LineAnalyticalProcessing)은 다차원 데이터를 수집, 저장 및 분석하고 의사 결정 프로세스를 지원하기 위한 도구와 방법을 사용하는 온라인 분석 데이터 처리 기술입니다.

OLAP 시스템의 주요 목적은 분석 활동, 분석 사용자의 임의 요청을 지원하는 것입니다. OLAP 분석의 목적은 새로운 가설을 테스트하는 것입니다.

OLAP 시스템을 사용하면 전략적 수준의 조직 관리를 자동화할 수 있습니다. OLAP(Online Analytical Processing - 실시간 분석 데이터 처리)는 데이터를 처리하고 연구하는 강력한 기술입니다. OLAP 기술을 기반으로 구축된 시스템은 보고서 컴파일, 복잡한 분석 계산 수행, 예측 및 시나리오 구축, 다양한 계획 옵션 개발에 거의 무한한 가능성을 제공합니다.

본격적인 OLAP 시스템은 90년대 초반 의사결정 지원 정보시스템의 발달로 등장했다. 그들은 다양하고 종종 이질적인 데이터를 다음으로 변환하도록 설계되었습니다. 유용한 정보. OLAP 시스템은 몇 가지 기준에 따라 데이터를 구성할 수 있습니다. 그러나 기준이 명확한 특성을 가질 필요는 없습니다.

OLAP 시스템은 비즈니스 성과 관리, 전략적 계획, 예산 책정, 개발 예측, 재무 보고, 작업 분석, 조직의 외부 및 내부 환경 시뮬레이션, 데이터 저장 및 보고와 같은 조직의 전략적 관리의 많은 문제에서 응용 프로그램을 찾았습니다.

OLAP 시스템의 구조

OLAP 시스템의 작동은 다차원 데이터 배열의 처리를 기반으로 합니다. 다차원 배열은 배열의 각 요소가 다른 요소와 많은 관계를 갖도록 배열됩니다. 다차원 배열을 형성하기 위해 OLAP 시스템은 다른 시스템(예: ERP 또는 CRM 시스템) 또는 외부 입력을 통해 입력 데이터를 가져와야 합니다. OLAP 시스템의 사용자는 자신의 요청에 따라 필요한 데이터를 구조화된 형태로 수신합니다. 지정된 절차를 기반으로 OLAP 시스템의 구조를 상상할 수 있습니다.

일반적으로 OLAP 시스템의 구조는 다음과 같이 구성됩니다. 다음 항목:

  • 데이터베이스 . 데이터베이스는 OLAP 시스템의 운영을 위한 정보의 소스입니다. 데이터베이스 유형은 OLAP 시스템 유형과 OLAP 서버의 알고리즘에 따라 다릅니다. 일반적으로 관계형 데이터베이스, 다차원 데이터베이스, 데이터 웨어하우스 등이 사용됩니다.
  • OLAP 서버. 다차원 데이터 구조의 관리 ​​및 OLAP 시스템의 데이터베이스와 사용자 간의 관계를 제공합니다.
  • 맞춤형 애플리케이션. OLAP 시스템 구조의 이 요소는 사용자 요청을 관리하고 데이터베이스(보고서, 그래프, 테이블 등)에 대한 액세스 결과를 생성합니다.

데이터를 구성, 처리 및 저장하는 방법에 따라 OLAP 시스템을 구현할 수 있습니다. 로컬 컴퓨터사용자 또는 전용 서버를 사용합니다.

데이터를 저장하고 처리하는 세 가지 주요 방법이 있습니다.

  • 로컬 . 데이터는 사용자의 컴퓨터에서 호스팅됩니다. 처리, 분석 및 데이터 관리는 현지 작업장에서 수행됩니다. OLAP 시스템의 이러한 구조는 데이터 처리 속도, 데이터 보안 및 다차원 분석의 제한된 사용과 관련된 심각한 단점을 가지고 있습니다.
  • 관계형 데이터베이스. 이러한 데이터베이스는 OLAP 시스템이 CRM 시스템 또는 ERP 시스템과 함께 작동할 때 사용됩니다. 데이터는 관계형 데이터베이스 또는 데이터 웨어하우스의 형태로 이러한 시스템의 서버에 저장됩니다. OLAP 서버는 이러한 데이터베이스에 액세스하여 필요한 다차원 구조를 형성하고 분석을 수행합니다.
  • 다차원 데이터베이스. 이 경우 데이터는 전용 서버에 특수 데이터 웨어하우스로 구성됩니다. 모든 데이터 작업은 원본 데이터를 다차원 구조로 변환하는 이 서버에서 수행됩니다. 이러한 구조를 OLAP 큐브라고 합니다. OLAP 큐브를 형성하기 위한 데이터 소스는 관계형 데이터베이스 및/또는 클라이언트 파일입니다. 데이터 서버는 데이터의 사전 준비 및 처리를 수행합니다. OLAP 서버는 데이터 소스(관계형 데이터베이스, 클라이언트 파일 등)에 직접 액세스하지 않고 OLAP 큐브와 함께 작동합니다.

OLAP 시스템 유형

데이터 저장 및 처리 방법에 따라 모든 OLAP 시스템은 세 가지 주요 유형으로 나눌 수 있습니다.


1. ROLAP(관계형 OLAP - 관계형 OLAP 시스템) - 이 유형의 OLAP 시스템은 관계형 데이터베이스에서 작동합니다. 데이터는 관계형 데이터베이스에 직접 액세스됩니다. 데이터는 관계형 테이블에 저장됩니다. 사용자는 기존 OLAP 시스템에서와 같이 다차원 분석을 수행할 수 있습니다. 이것은 사용을 통해 달성됩니다. SQL 도구및 특별 요청.

ROLAP의 장점 중 하나는 많은 양의 데이터를 보다 효율적으로 처리할 수 있다는 것입니다. ROLAP의 또 다른 장점은 숫자 및 텍스트 데이터를 모두 효율적으로 처리할 수 있다는 것입니다.

ROLAP의 단점은 낮은 성능을 포함합니다(기존 OLAP 시스템에 비해). 데이터 처리는 OLAP 서버에 의해 수행됩니다. 또 다른 단점은 SQL 사용으로 인한 기능의 제한입니다.


2. MOLAP(다차원 OLAP - 다차원 OLAP 시스템). 이러한 유형의 OLAP 시스템은 기존 시스템에 속합니다. 기존 OLAP 시스템과 다른 시스템의 차이점은 데이터의 사전 준비 및 최적화에 있습니다. 이러한 시스템은 일반적으로 데이터가 사전 처리되는 전용 서버를 사용합니다. 데이터는 다음에서 생성됩니다. 다차원 배열- OLAP 큐브.

MOLAP 시스템은 데이터 처리에서 가장 효율적입니다. 다양한 사용자 요청에 따라 데이터를 쉽게 재구성하고 구조화할 수 있습니다. MOLAP 분석 도구를 사용하면 복잡한 계산을 수행할 수 있습니다. MOLAP의 또 다른 장점은 쿼리를 빠르게 생성하고 결과를 얻을 수 있다는 것입니다. 이것은 OLAP 큐브의 예비 형성에 의해 보장됩니다.

MOLAP 시스템의 단점은 처리되는 데이터의 양과 데이터 중복성의 제한이 있습니다. 다차원 큐브의 형성을 위해서는 다양한 측면에서 데이터를 복제해야 합니다.


3. HOLAP(하이브리드 OLAP - 하이브리드 OLAP 시스템). 하이브리드 OLAP 시스템은 ROLAP 및 MOLAP 시스템의 조합입니다. 하이브리드 시스템은 다차원 데이터베이스 사용과 관계형 데이터베이스 관리라는 두 가지 시스템의 장점을 결합하려고 시도했습니다. HOLAP 시스템을 사용하면 관계형 테이블에 많은 양의 데이터를 저장할 수 있으며 처리된 데이터는 미리 구축된 다차원 OLAP 큐브에 배치됩니다. 이러한 종류의 시스템의 장점은 데이터 확장성, 빠른 데이터 처리 및 데이터 소스에 대한 유연한 액세스입니다.

다른 유형의 OLAP 시스템이 있지만 독립적인 유형의 OLAP 시스템보다 제조업체의 마케팅 움직임에 가깝습니다.

이러한 유형에는 다음이 포함됩니다.

  • WOLAP(웹 OLAP). 지원되는 OLAP 시스템 보기 웹 인터페이스. 이러한 OLAP 시스템에는 웹 인터페이스를 통해 데이터베이스에 액세스할 수 있는 기능이 있습니다.
  • DOLAP(데스크톱 OLAP). 이러한 유형의 OLAP 시스템을 사용하면 사용자가 데이터베이스를 로컬 작업장에 다운로드하여 로컬에서 작업할 수 있습니다.
  • 모바일OLAP. 이것은 모바일 장치를 사용하여 원격으로 데이터베이스 작업을 할 수 있는 OLAP 시스템의 기능입니다.
  • SOLAP(공간 OLAP). 이러한 유형의 OLAP 시스템은 공간 데이터를 처리하도록 설계되었습니다. 지리 정보 시스템과 OLAP 시스템의 통합 결과로 나타났습니다. 이러한 시스템을 사용하면 영숫자 형식뿐만 아니라 시각적 개체 및 벡터 형식으로도 데이터를 처리할 수 있습니다.

OLAP 시스템의 이점

OLAP 시스템을 사용하면 조직이 현재 활동 및 개발 전망과 관련된 다양한 상황을 예측하고 분석할 수 있습니다. 이러한 시스템은 엔터프라이즈 수준의 자동화 시스템을 보완하는 것으로 볼 수 있습니다. OLAP 시스템의 모든 장점은 원본 데이터의 정확성, 신뢰성 및 볼륨에 직접적으로 의존합니다.

OLAP 시스템의 주요 장점은 다음과 같습니다.

  • 일관성 배경 정보및 분석 결과. OLAP 시스템이 있는 경우 항상 정보 소스를 추적하고 얻은 결과와 소스 데이터 간의 논리적 관계를 결정할 수 있습니다. 분석 결과의 주관성이 떨어집니다.
  • 다변량 분석 수행. OLAP 시스템을 사용하면 초기 데이터 세트를 기반으로 이벤트 개발에 대한 많은 시나리오를 얻을 수 있습니다. 분석 도구 덕분에 "만약에 일어날 일" 원칙에 따라 상황을 모델링할 수 있습니다.
  • 세부 제어. 결과 제시의 세부 사항은 사용자의 요구에 따라 다를 수 있습니다. 이 경우 복잡한 시스템 설정을 수행하고 계산을 반복할 필요가 없습니다. 보고서에는 의사 결정에 필요한 정보가 정확히 포함될 수 있습니다.
  • 숨겨진 종속성 표시. 다차원적 관계를 구축함으로써 생산 활동에 영향을 미치는 다양한 프로세스 또는 상황에서 숨겨진 종속성을 식별하고 식별하는 것이 가능합니다.
  • 단일 플랫폼 생성. OLAP 시스템을 사용하여 기업의 모든 예측 및 분석 프로세스를 위한 단일 플랫폼을 만드는 것이 가능합니다. 특히, OLAP 시스템 데이터는 예산 예측, 판매 예측, 구매 예측, 전략 개발 계획 등을 구축하는 기반이 됩니다.

다차원 데이터 분석의 개념은 OLAP 시스템을 통해 수행되는 운영 분석과 밀접한 관련이 있습니다.

OLAP(On-Line Analytical Processing)는 의사결정 프로세스를 지원하기 위해 다차원 데이터를 수집, 저장 및 분석하는 방법과 도구를 사용하는 온라인 분석 데이터 처리 기술입니다.

OLAP 시스템의 주요 목적은 분석 활동, 분석 사용자의 임의(임시라는 용어가 자주 사용됨) 요청을 지원하는 것입니다. OLAP 분석의 목적은 새로운 가설을 테스트하는 것입니다.

OLAP 기술의 기원에는 관계형 접근 방식 E. Codd의 창시자가 있습니다. 1993년에 그는 "분석 사용자를 위한 OLAP: What It Should Be"라는 제목의 기사를 발표했습니다. 이 백서에서는 온라인 분석 처리의 기본 개념을 설명하고 온라인 분석 처리를 허용하는 제품이 충족해야 하는 다음 12가지 요구 사항을 식별합니다. Tokmakov G.P. 데이터 베이스. 데이터베이스 개념, 관계형 데이터 모델, SQL 언어. 에스. 51

아래는 Codd가 OLAP를 정의하는 12가지 규칙입니다.

1. 다차원성 - 개념적 수준의 OLAP 시스템은 정보의 분석 및 인식 프로세스를 단순화하는 다차원 모델의 형태로 데이터를 제시해야 합니다.

2. 투명성 - OLAP 시스템은 다차원 모델의 실제 구현, 구성 방법, 소스, 처리 및 저장 도구를 사용자에게 숨겨야 합니다.

3. 가용성 -- OLAP 시스템은 사용자에게 일관되고 일관된 단일 데이터 모델을 제공해야 저장 방법이나 위치에 관계없이 데이터에 액세스할 수 있습니다.

4. 일관된 보고서 개발 성능 - OLAP 시스템의 성능은 분석되는 차원의 수가 증가함에 따라 크게 감소하지 않아야 합니다.

5. 클라이언트-서버 아키텍처 -- OLAP 시스템은 클라이언트-서버 환경에서 작동할 수 있어야 합니다. 오늘날 온라인 분석 처리에 필요한 대부분의 데이터는 분산 저장됩니다. 여기서 주요 아이디어는 OLAP 도구의 서버 구성 요소가 투명한 효과를 제공하기 위해 다양한 논리적 및 물리적 기업 데이터베이스 스키마의 일반화 및 통합을 기반으로 공통 개념 스키마를 구축할 수 있을 만큼 충분히 지능적이어야 한다는 것입니다.

6. 차원의 동일성 -- OLAP 시스템은 모든 차원이 동일한 다차원 모델을 지원해야 합니다. 필요하다면 추가 특성개별 차원에 지정할 수 있지만 이 옵션은 모든 차원에 지정해야 합니다.

7. 희소 행렬의 동적 관리 -- OLAP 시스템은 희소 행렬의 최적 처리를 제공해야 합니다. 액세스 속도는 데이터 셀의 위치에 관계없이 유지되어야 하며 차원 수와 데이터 희소도가 다른 모델에 대해 일정한 값이어야 합니다.

8. 다중 사용자 모드 지원 - OLAP 시스템은 하나의 분석 모델로 여러 사용자와 함께 작업하거나 단일 데이터에서 여러 사용자를 위한 다른 모델을 생성할 수 있는 기능을 제공해야 합니다. 동시에 데이터 읽기와 쓰기가 모두 가능하므로 시스템은 무결성과 보안을 보장해야 합니다.

9. 무제한 교차 작업 -- OLAP 시스템은 슬라이스, 회전, 통합 또는 드릴다운 작업을 수행할 때 하이퍼큐브의 셀 간에 특정 형식 언어를 사용하여 설명된 기능적 관계가 유지되도록 해야 합니다. 시스템은 독립적으로(자동으로) 변환을 수행해야 합니다. 확립된 관계사용자가 재정의하지 않아도 됩니다.

10. 직관적인 데이터 조작 -- OLAP 시스템은 사용자가 많은 사용자 인터페이스 작업을 수행하지 않고도 하이퍼큐브에서 슬라이스, 회전, 통합 및 드릴 작업을 수행하는 방법을 제공해야 합니다. 해석 모델에 정의된 치수에는 위의 작업을 수행하는 데 필요한 모든 정보가 포함되어야 합니다.

11. 유연한 보고 옵션 -- OLAP 시스템이 지원해야 함 다양한 방법데이터 시각화, 즉 보고서는 가능한 모든 방향으로 제출되어야 합니다. 보고 도구는 가능한 모든 방향에서 데이터 모델에서 생성된 합성 데이터 또는 정보를 나타내야 합니다. 이는 행, 열 또는 페이지가 0에서 N 차원까지 동시에 표시되어야 함을 의미합니다. 여기서 N-- 번호전체 분석 모델의 측정. 또한 단일 게시물, 열 또는 페이지에 표시되는 각 콘텐츠 차원은 차원에 포함된 요소(값)의 하위 집합이 임의의 순서로 표시되도록 허용해야 합니다.

12. 무제한 차원 및 집계 수준 수 - 분석 모델에서 요구되는 요구 차원의 가능한 수에 대한 연구는 최대 19개의 차원을 동시에 사용할 수 있음을 보여주었습니다. 따라서 분석 도구가 동시에 최소 15개, 바람직하게는 20개 측정값을 제공할 수 있다는 강력한 권장 사항입니다. 또한 각 공통 차원은 사용자 분석가가 정의한 집계 및 통합 경로 수준의 수에 의해 제한되어서는 안 됩니다.

Codd의 추가 규칙.

OLAP의 사실상 정의 역할을 한 이러한 요구 사항 집합은 종종 다양한 비판을 야기합니다. 예를 들어 규칙 1, 2, 3, 6은 요구 사항이고 규칙 10, 11은 비공식적인 소망입니다. Tokmakov G.P. 데이터 베이스. 데이터베이스 개념, 관계형 데이터 모델, SQL 언어. P. 68 따라서 Codd의 12가지 요구사항으로는 OLAP를 정확하게 정의할 수 없습니다. 1995년 Codd는 다음 6가지 규칙을 목록에 추가했습니다.

13. 일괄 추출 대 해석 -- OLAP 시스템은 내부 및 외부 데이터에 대한 액세스를 제공하는 데 동등하게 효율적이어야 합니다.

14. 모든 OLAP 분석 모델에 대한 지원 -- OLAP 시스템은 Codd가 정의한 범주형, 해석적, 추측 및 고정관념의 네 가지 데이터 분석 모델을 모두 지원해야 합니다.

15. 비정규화된 데이터 처리 -- OLAP 시스템은 비정규화된 데이터 소스와 통합되어야 합니다. OLAP 환경에서 수행된 데이터 수정으로 인해 원래 외부 시스템에 저장된 데이터가 변경되어서는 안 됩니다.

16. OLAP 결과 저장: 원본 데이터와 별도로 유지 -- 읽기-쓰기 모드로 작동하는 OLAP 시스템은 원본 데이터를 수정한 후 결과를 별도로 저장해야 합니다. 즉, 소스 데이터의 보안이 보장됩니다.

17. 결측값 제외-- 사용자에게 데이터를 제시할 때 OLAP 시스템은 모든 결측값을 버려야 합니다. 즉, 결측값은 널값과 달라야 합니다.

18 결측값 처리 ​​-- OLAP 시스템은 출처에 관계없이 모든 결측값을 무시해야 합니다. 이 기능은 17번째 규칙과 관련이 있습니다.

또한 Codd는 18가지 규칙을 모두 기능이라고 하는 다음 4개 그룹으로 나누었습니다. 이 그룹은 B, S, R 및 D로 명명되었습니다.

주요 기능(B)에는 다음 규칙이 포함됩니다.

데이터의 다차원 개념적 표현(규칙 1);

직관적인 데이터 조작(규칙 10)

가용성(규칙 3);

일괄 추출 대 해석(규칙 13);

모든 OLAP 분석 모델 지원(규칙 14)

아키텍처 "클라이언트-서버"(규칙 5);

투명성(규칙 2);

멀티플레이어 지원(규칙 8)

특수 기능(S):

비정규화 데이터 처리(규칙 15)

OLAP 결과 저장: 원본 데이터와 별도로 저장(규칙 16).

결측값 제외(규칙 17);

결측값 처리(규칙 18). 보고 기능(R):

보고서 생성의 유연성(규칙 11);

보고 성과 기준(규칙 4);

자동 물리 계층 구성(수정된 원래 규칙 7).

측정 제어(D):

측정의 보편성(규칙 6);

차원 및 집계 수준의 무제한(규칙 12)

차원 간 무제한 작업(규칙 9).