انبارهای دادهبر اساس عکس های فوری ثابت در یک دوره زمانی طولانی از پایگاه های داده عملیاتی تشکیل می شوند سیستم اطلاعاتو احتمالاً منابع خارجی مختلف. انبارهای داده از فناوری های پایگاه داده، OLAP، داده کاوی، تجسم داده ها استفاده می کنند.

مشخصات اصلی انبارهای داده

  • حاوی داده های تاریخی
  • اطلاعات دقیق و همچنین داده های جزئی و کامل را ذخیره می کند.
  • داده ها عمدتا ثابت هستند.
  • بی نظم، بدون ساختار و روش اکتشافیپردازش داده ها؛
  • شدت متوسط ​​و کم پردازش تراکنش؛
  • روش غیرقابل پیش بینی استفاده از داده ها؛
  • طراحی شده برای تجزیه و تحلیل؛
  • تمرکز بر حوزه های موضوعی;
  • پشتیبانی از تصمیم گیری استراتژیک؛
  • به تعداد نسبتاً کمی از مدیران خدمات ارائه می دهد.

اصطلاح OLAP (پردازش تحلیلی آنلاین) برای توصیف مدل ارائه داده ها و بر این اساس، فناوری پردازش آنها در انبارهای داده استفاده می شود. OLAP از یک نمای چند بعدی از داده های انبوه برای ارائه استفاده می کند دسترسی سریعبه صورت استراتژیک اطلاعات مهمبرای اهداف تجزیه و تحلیل عمیق برنامه های OLAP باید ویژگی های اساسی زیر را داشته باشند:

  • چند بعدی ارائه داده ها;
  • پشتیبانی از محاسبات پیچیده؛
  • در نظر گرفتن صحیح عامل زمان

مزایای OLAP:

  • ترویج کاراییکارکنان تولید، توسعه دهندگان برنامه های کاربردی. دسترسی به موقع به اطلاعات استراتژیک
  • به کاربران قدرت کافی برای ایجاد تغییرات در طرحواره می دهد.
  • برنامه های OLAP متکی هستند انبارهای دادهو سیستم های OLTP، داده های به روز را از آنها دریافت می کنند که باعث صرفه جویی می شود کنترل یکپارچگیداده های شرکتی
  • کاهش بار روی سیستم های OLTP و انبارهای داده.

OLAP و OLTP. ویژگی ها و تفاوت های اصلی

OLAP OLTP
ذخیره اطلاعاتباید شامل داده های داخلی شرکت و داده های خارجی باشد منبع اصلی اطلاعاتی که وارد پایگاه داده عملیاتی می شود، فعالیت های شرکت است و تجزیه و تحلیل داده ها مستلزم دخالت منابع خارجی اطلاعات (به عنوان مثال، گزارش های آماری) است.
حجم پایگاه های داده های تحلیلی حداقل یک مرتبه بزرگتر از حجم پایگاه های عملیاتی است. برای تحلیل و پیش بینی قابل اعتماد در ذخیره دادهشما باید اطلاعاتی در مورد فعالیت های شرکت و وضعیت بازار برای چندین سال داشته باشید برای پردازش عملیاتی، داده های چند ماه گذشته مورد نیاز است
ذخیره اطلاعاتباید حاوی اطلاعات یکسان ارائه شده و توافق شده باشد که تا حد امکان به محتوای پایگاه های داده عملیاتی نزدیک باشد. برای استخراج و «پاک کردن» اطلاعات از منابع مختلف به یک جزء نیاز است. در بسیاری از شرکت های بزرگ، چندین سیستم اطلاعات عملیاتی با پایگاه داده های خاص خود به طور همزمان وجود دارد (به دلایل تاریخی). پایگاه‌های اطلاعاتی عملیاتی ممکن است حاوی اطلاعات معادل معنایی باشد که در قالب‌های مختلف، با نشانه‌های متفاوتی از زمان دریافت آن، گاهی اوقات حتی متناقض ارائه شده است.
مجموعه پرس و جوها در برابر یک پایگاه داده تحلیلی قابل پیش بینی نیست. انبارهای دادهوجود دارد تا به درخواست‌های تحلیلگر موقت پاسخ دهد. فقط می‌توانید روی این واقعیت حساب کنید که درخواست‌ها خیلی زیاد نمی‌شوند و بر حجم زیادی از اطلاعات تأثیر نمی‌گذارند. اندازه های پایگاه داده تحلیلی استفاده از پرس و جوها را با تجمیع ترغیب می کند (جمع، حداقل، حداکثر، منظور داشتنو غیره.) سیستم های پردازش داده برای حل مشکلات خاص طراحی شده اند. اطلاعات از پایگاه داده اغلب و در بخش های کوچک انتخاب می شوند. معمولاً مجموعه ای از پرس و جوها به پایگاه داده عملیاتی از قبل در طول طراحی شناخته شده است
با تنوع کمی از پایگاه داده های تحلیلی (فقط هنگام بارگیری داده ها)، ترتیب آرایه ها معقول است، بیشتر روش های سریعنمایه سازی برای نمونه گیری انبوه، ذخیره سازی داده های از پیش تجمیع شده سیستم های پردازش داده به دلیل ماهیت خود بسیار متغیر هستند، که در DBMS مورد استفاده در نظر گرفته می شود (ساختار پایگاه داده عادی، ردیف ها خارج از نظم ذخیره می شوند، درختان B برای نمایه سازی، معامله گری)
اطلاعات پایگاه‌های اطلاعاتی تحلیلی برای شرکت بسیار حیاتی است که به یک سری حفاظت بزرگ نیاز است (حق دسترسی فردی به ردیف‌ها و/یا ستون‌های خاص جدول) برای سیستم های پردازش داده، معمولاً کافی است حفاظت از اطلاعاتدر سطح میز

قوانین کد برای سیستم های OLAP

در سال 1993، Codd OLAP را برای کاربران تحلیلگر منتشر کرد: چگونه باید باشد. در آن، او مفاهیم اساسی پردازش تحلیلی آنلاین را تشریح کرد و 12 قاعده را که محصولات برای ارائه پردازش تحلیلی آنلاین باید رعایت کنند، شناسایی کرد.

  1. نمایش چند بعدی مفهومی. یک مدل OLAP باید در هسته خود چند بعدی باشد. یک نمودار مفهومی چند بعدی یا نمایش سفارشی مدل‌سازی و تحلیل و همچنین محاسبات را تسهیل می‌کند.
  2. شفافیت. کاربر می‌تواند تمام داده‌های لازم را از دستگاه OLAP دریافت کند، بدون اینکه حتی گمان کند از کجا آمده‌اند. صرف نظر از اینکه محصول OLAP بخشی از ابزارهای کاربر است یا خیر، این واقعیت باید برای کاربر نامرئی باشد. اگر OLAP توسط محاسبات سرویس گیرنده-سرور ارائه می شود، در صورت امکان، این واقعیت نیز باید برای کاربر نامرئی باشد. OLAP باید در چارچوب یک معماری واقعاً باز ارائه شود و به کاربر اجازه دهد در هر کجا که باشد با استفاده از یک ابزار تحلیلی با سرور ارتباط برقرار کند. علاوه بر این، هنگامی که ابزار تحلیلی با محیط های پایگاه داده همگن و ناهمگن تعامل داشته باشد، باید شفافیت نیز حاصل شود.
  3. دسترسی. OLAP باید خود را ارائه دهد نمودار منطقیبرای دسترسی به یک محیط پایگاه داده ناهمگن و انجام تبدیل های مناسب برای ارائه داده به کاربر. علاوه بر این، لازم است از قبل در مورد مکان و نحوه و نوع سازماندهی داده های فیزیکی واقعاً مورد استفاده قرار گیرد. یک سیستم OLAP فقط باید به داده‌هایی دسترسی داشته باشد که واقعاً مورد نیاز هستند و اعمال نمی‌شوند اصل کلی"قیف آشپزخانه" که مستلزم ورودی غیر ضروری است.
  4. مقدار ثابت کاراییهنگام تهیه گزارش ها کاراییگزارش دهی نباید با رشد تعداد ابعاد و اندازه پایگاه داده به میزان قابل توجهی کاهش یابد.
  5. معماری سرویس گیرنده-سرور. نه تنها محصول مورد نیاز است که یک محصول مشتری/سرور باشد، بلکه مؤلفه سرور نیز باید به اندازه کافی هوشمند باشد تا مشتریان مختلف بتوانند با حداقل تلاش و برنامه نویسی به یکدیگر متصل شوند.
  6. چند بعدی بودن عمومی همه ابعاد باید برابر باشند، هر بعد باید هم در ساختار و هم در قابلیت های عملیاتی معادل باشد. درست است، امکانات عملیاتی اضافی برای اندازه گیری های فردی مجاز است (ظاهراً زمان دلالت دارد)، اما چنین توابع اضافیباید به هر ابعادی داده شود. این نباید طوری باشد که اساسی باشد ساختارهای دادهفرمت های محاسباتی یا گزارش دهی بیشتر به یک بعد اختصاص داشت.
  7. کنترل دینامیک ماتریس های پراکنده. سیستم های OLAP باید به طور خودکار طرح فیزیکی خود را بر اساس نوع مدل، حجم داده ها و پراکندگی پایگاه داده تنظیم کنند.
  8. پشتیبانی چند کاربره ابزار OLAP باید این توانایی را فراهم کند اشتراک گذاری(درخواست و اضافه)، یکپارچگی و امنیت.
  9. عملیات متقابل نامحدود همه نوع عملیات باید برای هر اندازه گیری مجاز باشد.
  10. دستکاری داده های بصری دستکاری داده ها از طریق اقدامات مستقیم بر روی سلول ها در حالت مشاهده بدون استفاده از منوها و عملیات های متعدد انجام شد.
  11. گزینه های گزارش دهی انعطاف پذیر اندازه گیری ها باید به روشی که کاربر می خواهد در گزارش قرار گیرد.
  12. نامحدود

OLAP (پردازش تحلیلی آنلاین) نام یک محصول خاص نیست، بلکه نام یک فناوری پردازش تحلیلی آنلاین است که شامل تجزیه و تحلیل داده ها و گزارش می شود. یک جدول چند بعدی به کاربر ارائه می شود که به طور خودکار داده ها را در بخش های مختلف خلاصه می کند و به شما امکان می دهد تا محاسبات و فرم گزارش را به سرعت مدیریت کنید.

اگرچه در برخی از نشریات پردازش تحلیلی هم به صورت آنلاین و هم تعاملی نامیده می شود، صفت "آنلاین" به درستی بیانگر معنای فناوری OLAP است. توسعه تصمیمات مدیریتی مدیریتی در دسته حوزه هایی قرار می گیرد که به اشتباه در معرض اتوماسیون هستند. با این حال، امروزه فرصتی برای کمک به مدیر در توسعه تصمیمات و مهمتر از همه، سرعت بخشیدن به روند توسعه تصمیمات، انتخاب و اتخاذ آنها وجود دارد.

سیستم‌های پشتیبانی تصمیم معمولاً ابزاری را دارند که داده‌های جمعی را برای نمونه‌های مختلف از مجموعه اولیه به شکلی مناسب برای درک و تجزیه و تحلیل در اختیار کاربر قرار دهند. به عنوان یک قاعده، چنین توابع انبوهی یک مجموعه داده چند بعدی را تشکیل می دهند، که اغلب ابرمکعب یا متاکوب نامیده می شود، که محورهای آن حاوی پارامترهایی هستند، و سلول ها حاوی داده های انبوهی هستند که به آنها بستگی دارد - و چنین داده هایی نیز می توانند در جداول رابطه ای ذخیره شوند، اما در این در مورد داده های سازمانی منطقی صحبت می کنیم و نه در مورد اجرای فیزیکی ذخیره سازی آنها.

در امتداد هر محور، داده ها را می توان در یک سلسله مراتب سازماندهی کرد که سطوح مختلف جزئیات را نشان می دهد.

با توجه به ابعاد در مدل چند بعدی، عواملی که بر فعالیت‌های شرکت تأثیر می‌گذارند کنار گذاشته می‌شوند (به عنوان مثال: زمان، محصولات، شعب شرکت و غیره). سپس مکعب OLAP حاصل با شاخص‌های فعالیت شرکت (قیمت‌ها، فروش، طرح، سود، جریان نقدی و غیره) پر می‌شود. لازم به ذکر است که برخلاف یک مکعب هندسی، وجه های یک مکعب OLAP لازم نیست اندازه یکسانی داشته باشند. این پر کردن را می توان مانند داده های واقعی انجام داد سیستم های عامل، و بر اساس داده های تاریخی پیش بینی شده است. ابعاد هایپرمکعب می تواند پیچیده، سلسله مراتبی باشد و روابط بین آنها برقرار شود. در طول تجزیه و تحلیل، کاربر می تواند دیدگاه خود را بر روی داده ها تغییر دهد (به اصطلاح عملیات تغییر نمای منطقی)، در نتیجه داده ها را در بخش های مختلف مشاهده کرده و مشکلات خاص را حل می کند. عملیات های مختلفی را می توان بر روی مکعب ها انجام داد، از جمله پیش بینی و زمان بندی شرطی (تحلیل چه می شود).

به لطف این مدل داده، کاربران می توانند پرس و جوهای پیچیده را فرموله کنند، گزارش تولید کنند و زیر مجموعه های داده را دریافت کنند. پردازش تحلیلی عملیاتی می تواند به طور قابل توجهی فرآیند آماده سازی و تصمیم گیری توسط پرسنل مدیریت را ساده و سرعت بخشد. پردازش تحلیلی آنلاین با هدف تبدیل داده ها به اطلاعات انجام می شود. اساساً با فرآیند پشتیبانی تصمیم گیری سنتی که اغلب بر اساس در نظر گرفتن گزارش های ساختاریافته است، متفاوت است.


فناوری OLAP به نوع تحلیل فکری اشاره دارد و شامل 12 اصل است:

1. نمایش چند بعدی مفهومی. کاربر تحلیلگر جهان شرکت را به ترتیب ماهیت چند بعدی می بیند و مدل OLAP باید در هسته خود چند بعدی باشد.

2. شفافیت. معماری سیستم OLAP باید باز باشد و به کاربر این امکان را می دهد که در هر کجا که باشد، با استفاده از یک ابزار تحلیلی - مشتری - با سرور ارتباط برقرار کند.

3. دسترسی. یک کاربر تحلیلگر OLAP باید بتواند تجزیه و تحلیل را بر اساس یک طرح مفهومی مشترک شامل داده‌های کل سازمانی در یک پایگاه داده رابطه‌ای و همچنین داده‌هایی از پایگاه‌های داده قدیمی، روش‌های دسترسی رایج و یک مدل تحلیلی مشترک انجام دهد. یک سیستم OLAP باید فقط به داده‌هایی که واقعاً مورد نیاز است دسترسی داشته باشد و از اصل کلی «قیف آشپزخانه» که مستلزم ورودی‌های غیر ضروری است، استفاده نکند.

4. عملکرد ثابت در تهیه گزارش. با افزایش تعداد ابعاد یا اندازه پایگاه داده، کاربر تحلیلگر نباید کاهش قابل توجهی در عملکرد را تجربه کند.

5. معماری سرویس گیرنده-سرور . بیشتر داده‌هایی که امروزه باید تحت پردازش تحلیلی آنلاین قرار گیرند، در مین‌فریم‌هایی با دسترسی به ایستگاه‌های کاری کاربر از طریق LAN وجود دارند. این بدان معناست که محصولات OLAP باید بتوانند در محیط سرویس گیرنده-سرور کار کنند.

6. چند بعدی بودن عمومی. هر بعد باید بدون توجه به ساختار و قابلیت های عملیاتی آن اعمال شود. ساختارهای داده، فرمول‌ها و فرمت‌های گزارش‌دهی زیربنایی نباید نسبت به یک بعد تعصب داشته باشند.

7. مدیریت پویا ماتریس های پراکنده. طراحی فیزیکی یک ابزار OLAP باید کاملاً با مدل تحلیلی خاص سازگار باشد تا بتوان بهینه ماتریس‌های پراکنده را مدیریت کرد. پراکندگی (به صورت درصد اندازه گیری می شود سلول های خالیبه همه ممکن) یکی از ویژگی های انتشار داده است.

8. پشتیبانی چند کاربره. یک ابزار OLAP باید توانایی اشتراک پرس و جو و افزایش چندین کاربر تحلیلگر را با حفظ یکپارچگی و امنیت فراهم کند.

9. عملیات متقابل نامحدود. عملیات مختلف، به دلیل ماهیت سلسله مراتبی خود، می توانند روابط وابسته را در مدل OLAP نشان دهند، یعنی متقابل هستند. اجرای آنها نباید نیازی به تعریف مجدد این محاسبات و عملیات توسط کاربر تحلیلگر داشته باشد.

10. دستکاری داده های بصری. دیدگاه کاربر تحلیلگر از ابعاد تعریف شده در مدل تحلیلی باید شامل تمام اطلاعات لازم برای انجام اقدامات بر روی مدل OLAP باشد. آنها نباید به استفاده از سیستم منو یا سایر عملیات رابط کاربری چندگانه نیاز داشته باشند.

11. گزینه های گزارش دهی انعطاف پذیر. ابزارهای گزارش دهی باید داده ها یا اطلاعات حاصل از مدل داده در هر جهت ممکن ترکیب شوند. این بدان معناست که سطرها، ستون‌ها یا صفحات یک گزارش باید چندین بعد از یک مدل OLAP را به طور همزمان نمایش دهند، با قابلیت نمایش زیرمجموعه‌ای از عناصر (مقادیر) موجود در بعد، و به هر ترتیبی.

12. ابعاد و تعداد سطوح تجمع نامحدود. مطالعه بر روی تعداد احتمالی اندازه گیری های لازم مورد نیاز در یک مدل تحلیلی نشان داد که حداکثر 19 اندازه گیری می تواند به طور همزمان توسط یک کاربر تحلیلگر مورد استفاده قرار گیرد. این منجر به توصیه ای در مورد تعداد ابعاد پشتیبانی شده توسط سیستم OLAP می شود. علاوه بر این، هر یک از ابعاد مشترک نباید با تعداد سطوح تجمیع تعریف شده توسط کاربر تحلیلگر محدود شود.

به عنوان سیستم های تخصصی OLAP که در حال حاضر در بازار ارائه می شوند، می توانید CalliGraph، Business Intelligence را مشخص کنید.

برای حل وظایف ساده تجزیه و تحلیل داده ها، می توان از یک راه حل بودجه استفاده کرد - برنامه های Microsoft Excel و Access Office، که حاوی ابزارهای اولیه فناوری OLAP هستند که به شما امکان می دهد جداول محوری ایجاد کنید و گزارش های مختلفی را بر اساس آنها بسازید.

هدف مقاله ترممطالعه فناوری OLAP، مفهوم پیاده سازی و ساختار آن است.

AT دنیای مدرن شبکه های کامپیوترو سیستم های محاسباتی به شما امکان تجزیه و تحلیل و پردازش حجم زیادی از داده ها را می دهند.

حجم زیادی از اطلاعات جستجوی راه حل ها را بسیار پیچیده می کند، اما به دست آوردن محاسبات و تجزیه و تحلیل بسیار دقیق تر را ممکن می کند. برای حل این مشکل، وجود دارد تمام کلاس سیستم های اطلاعاتیانجام تجزیه و تحلیل چنین سیستم هایی را سیستم های پشتیبانی تصمیم (DSS) (DSS, Decision Support System) می نامند.

برای انجام تجزیه و تحلیل، DSS باید اطلاعات را با داشتن ابزار ورودی و ذخیره سازی انباشته کند. در کل، سه کار اصلی در DSS حل شده است:

· ورود اطلاعات؛

· ذخیره سازی داده ها

· تحلیل داده ها.

ورود داده ها به DSS به طور خودکار از حسگرهایی که وضعیت محیط یا فرآیند را مشخص می کنند یا توسط یک اپراتور انسانی انجام می شود.

اگر داده‌ها به‌طور خودکار از حسگرها وارد شوند، داده‌ها توسط یک سیگنال آماده جمع‌آوری می‌شوند که هنگام ظاهر شدن اطلاعات یا با نظرسنجی چرخه‌ای رخ می‌دهد. اگر ورودی توسط یک انسان انجام شود، آنها باید ابزارهای مناسبی را برای وارد کردن داده ها در اختیار کاربران قرار دهند که آنها را از نظر صحت ورودی بررسی می کند و همچنین محاسبات لازم را انجام می دهد.

هنگام ورود همزمان داده توسط چندین اپراتور، لازم است مشکلات اصلاح و دسترسی موازی همان داده ها حل شود.

DSS داده هایی را در قالب گزارش ها، جداول، نمودارها برای مطالعه و تحلیل در اختیار تحلیلگران قرار می دهد، به همین دلیل است که چنین سیستم هایی عملکردهای پشتیبانی تصمیم را ارائه می دهند.

در زیرسیستم های ورود داده ها که OLTP (On-linetransactionprocessing) نامیده می شوند، پردازش داده های عملیاتی اجرا می شود. برای پیاده سازی آنها از سیستم های مدیریت پایگاه داده مرسوم (DBMS) استفاده می شود.

زیرسیستم تحلیل را می توان بر اساس موارد زیر ساخت:

· زیرسیستم های تحلیل بازیابی اطلاعات بر اساس DBMS رابطه ای و پرس و جوهای ایستا با استفاده از زبان SQL.

· زیرسیستم های تحلیل عملیاتی. برای پیاده‌سازی چنین زیرسیستم‌هایی، از فناوری پردازش داده‌های تحلیلی آنلاین OLAP با استفاده از مفهوم نمایش داده‌های چند بعدی استفاده می‌شود.

· زیر سیستم های تحلیل فکری. این زیرسیستم روش ها و الگوریتم های DataMining را پیاده سازی می کند.

از دیدگاه کاربر، سیستم‌های OLAP ابزاری برای مشاهده انعطاف‌پذیر اطلاعات در بخش‌های مختلف، دریافت خودکار داده‌های جمع‌آوری‌شده، انجام عملیات تحلیلی کانولوشن، جزئیات، مقایسه در طول زمان فراهم می‌کنند. با تشکر از همه اینها، سیستم های OLAP راه حلی با مزیت های بزرگ در زمینه آماده سازی داده ها برای انواع گزارش های تجاری است که شامل ارائه داده ها در بخش های مختلف و سطوح مختلفسلسله مراتب، مانند گزارش های فروش، اشکال مختلف بودجه، و غیره. سیستم های OLAP مزایای بزرگی از چنین ارائه ای در سایر اشکال تجزیه و تحلیل داده ها از جمله پیش بینی دارند.

1.2 تعریف OLAP-سیستم های

فن آوری تجزیه و تحلیل داده های چند بعدی پیچیده OLAP نامیده می شود. OLAP جزء کلیدی یک سازمان انبار داده است.

عملکرد OLAP را می توان به روش های مختلفی پیاده سازی کرد، به سادگی تجزیه و تحلیل داده ها برنامه های اداری، و پیچیده تر - سیستم های تحلیلی توزیع شده بر اساس محصولات سرور.

OLAP (On-LineAnalyticalProcessing) یک فناوری برای پردازش داده های تحلیلی آنلاین است که از ابزارها و روش هایی برای جمع آوری، ذخیره و تجزیه و تحلیل داده های چند بعدی و به منظور پشتیبانی از فرآیندهای تصمیم گیری استفاده می کند.

هدف اصلی سیستم های OLAP پشتیبانی از فعالیت های تحلیلی، درخواست های دلخواه کاربران تحلیلگر است. هدف از تجزیه و تحلیل OLAP آزمایش فرضیه های در حال ظهور است.

استفاده از سیستم OLAP به شما امکان می دهد تا سطح استراتژیک مدیریت سازمان را خودکار کنید. OLAP (پردازش تحلیلی آنلاین - پردازش داده های تحلیلی در زمان واقعی) یک فناوری قدرتمند برای پردازش و تحقیق داده ها است. سیستم‌هایی که بر اساس فناوری OLAP ساخته شده‌اند، تقریباً امکانات نامحدودی را برای جمع‌آوری گزارش‌ها، انجام محاسبات تحلیلی پیچیده، ساخت پیش‌بینی‌ها و سناریوها، و توسعه گزینه‌های مختلف طرح فراهم می‌کنند.

سیستم های OLAP تمام عیار در اوایل دهه 90 در نتیجه توسعه سیستم های اطلاعات پشتیبانی تصمیم ظاهر شدند. آنها طراحی شده اند تا داده های مختلف، اغلب متفاوت، را به داده های مختلف تبدیل کنند اطلاعات مفید. سیستم های OLAP می توانند داده ها را بر اساس مجموعه ای از معیارها سازماندهی کنند. با این حال، لزومی ندارد که معیارها دارای ویژگی های واضح باشند.

سیستم های OLAP کاربرد خود را در بسیاری از مسائل مدیریت استراتژیک یک سازمان یافته اند: مدیریت عملکرد کسب و کار، برنامه ریزی استراتژیک، بودجه بندی، پیش بینی توسعه، گزارش مالی، تجزیه و تحلیل کار، شبیه سازی محیط خارجی و داخلی سازمان، ذخیره سازی داده ها و گزارش گیری.

ساختار یک سیستم OLAP

عملکرد سیستم OLAP بر اساس پردازش آرایه های داده چند بعدی است. آرایه های چند بعدی به گونه ای چیده شده اند که هر عنصر آرایه روابط زیادی با عناصر دیگر دارد. برای تشکیل یک آرایه چند بعدی، یک سیستم OLAP باید داده های ورودی را از سیستم های دیگر (به عنوان مثال سیستم های ERP یا CRM) یا از طریق ورودی خارجی دریافت کند. کاربر سیستم OLAP داده های لازم را به صورت ساختاریافته مطابق با درخواست خود دریافت می کند. بر اساس رویه مشخص شده، می توانید ساختار سیستم OLAP را تصور کنید.

به طور کلی، ساختار یک سیستم OLAP شامل: موارد زیر:

  • پایگاه داده . پایگاه داده منبع اطلاعات برای عملکرد سیستم OLAP است. نوع پایگاه داده به نوع سیستم OLAP و الگوریتم های سرور OLAP بستگی دارد. به عنوان یک قاعده، از پایگاه داده های رابطه ای، پایگاه های داده چند بعدی، انبارهای داده و غیره استفاده می شود.
  • سرور OLAP. مدیریت ساختار داده چند بعدی و ارتباط بین پایگاه داده و کاربران سیستم OLAP را فراهم می کند.
  • برنامه های کاربردی سفارشی. این عنصر از ساختار سیستم OLAP درخواست های کاربر را مدیریت می کند و نتایج دسترسی به پایگاه داده (گزارش ها، نمودارها، جداول و غیره) را تولید می کند.

بسته به روش سازماندهی، پردازش و ذخیره داده ها، سیستم های OLAP را می توان بر روی آن پیاده سازی کرد کامپیوترهای محلیکاربران یا استفاده از سرورهای اختصاصی

سه روش اصلی برای ذخیره و پردازش داده ها وجود دارد:

  • به صورت محلی . داده ها در رایانه های کاربران میزبانی می شوند. پردازش، تجزیه و تحلیل و مدیریت داده ها در محل کار محلی انجام می شود. این ساختار سیستم OLAP دارای اشکالات قابل توجهی است که با سرعت پردازش داده ها، امنیت داده ها و استفاده محدود از تجزیه و تحلیل چند بعدی مرتبط است.
  • پایگاه داده های رابطه ای. این پایگاه های داده زمانی استفاده می شوند که یک سیستم OLAP با یک سیستم CRM یا یک سیستم ERP کار می کند. داده ها در سرور این سیستم ها به صورت پایگاه داده های رابطه ای یا انبارهای داده ذخیره می شوند. سرور OLAP به این پایگاه داده ها دسترسی پیدا می کند تا ساختارهای چند بعدی لازم را تشکیل دهد و تجزیه و تحلیل را انجام دهد.
  • پایگاه های داده چند بعدی. در این مورد، داده ها به عنوان یک انبار داده ویژه در یک سرور اختصاصی سازماندهی می شوند. تمامی عملیات داده بر روی این سرور انجام می شود که داده های اصلی را به ساختارهای چند بعدی تبدیل می کند. چنین ساختارهایی را مکعب های OLAP می نامند. منابع داده برای تشکیل یک مکعب OLAP پایگاه داده های رابطه ای و/یا فایل های مشتری هستند. سرور داده آماده سازی و پردازش اولیه داده ها را انجام می دهد. سرور OLAP با مکعب OLAP بدون دسترسی مستقیم به منابع داده (پایگاه‌های اطلاعاتی، فایل‌های مشتری و غیره) کار می‌کند.

انواع سیستم های OLAP

بسته به روش ذخیره سازی و پردازش داده ها، تمام سیستم های OLAP را می توان به سه نوع اصلی تقسیم کرد.


1. ROLAP (Relation OLAP - Relational OLAP system) - این نوع سیستم OLAP با پایگاه داده های رابطه ای کار می کند. داده ها مستقیماً به پایگاه داده رابطه ای دسترسی دارند. داده ها در جداول رابطه ای ذخیره می شوند. کاربران توانایی انجام تجزیه و تحلیل چند بعدی را مانند سیستم های OLAP سنتی دارند. این از طریق استفاده به دست می آید ابزارهای SQLو درخواست های ویژه

یکی از مزایای ROLAP توانایی پردازش کارآمدتر حجم زیادی از داده ها است. مزیت دیگر ROLAP توانایی پردازش کارآمد داده های عددی و متنی است.

از معایب ROLAP می توان به عملکرد پایین (در مقایسه با سیستم های OLAP سنتی) اشاره کرد، زیرا پردازش داده ها توسط سرور OLAP انجام می شود. یکی دیگر از معایب محدودیت عملکرد به دلیل استفاده از SQL است.


2. MOLAP (Multidimensional OLAP - multidimensional OLAP system). این نوع از سیستم های OLAP متعلق به سیستم های سنتی است. تفاوت بین سیستم OLAP سنتی و سایر سیستم ها در آماده سازی اولیه و بهینه سازی داده ها نهفته است. این سیستم ها، به عنوان یک قاعده، از یک سرور اختصاصی استفاده می کنند که داده ها روی آن از قبل پردازش شده است. داده ها در تولید می شوند آرایه های چند بعدی- مکعب های OLAP.

سیستم های MOLAP کارآمدترین سیستم ها در پردازش داده ها هستند. آنها سازماندهی مجدد و ساختار داده ها را برای درخواست های مختلف کاربر آسان می کنند. ابزارهای تحلیلی MOLAP به شما امکان انجام محاسبات پیچیده را می دهد. یکی دیگر از مزایای MOLAP توانایی تولید سریع پرس و جو و دریافت نتایج است. این با تشکیل مقدماتی مکعب های OLAP تضمین می شود.

از معایب سیستم MOLAP می توان به محدودیت حجم داده های پردازش شده و افزونگی داده ها اشاره کرد. برای تشکیل مکعب های چند بعدی، در جنبه های مختلف، داده ها باید کپی شوند.


3. HOLAP (Hybrid OLAP - Hybrid OLAP system). سیستم های هیبریدی OLAP ترکیبی از سیستم های ROLAP و MOLAP هستند. سیستم های ترکیبی سعی کرده اند مزایای دو سیستم را ترکیب کنند: استفاده از پایگاه های داده چند بعدی و مدیریت پایگاه های داده رابطه ای. سیستم های HOLAP به شما امکان می دهند حجم زیادی از داده ها را در جداول رابطه ای ذخیره کنید و داده های پردازش شده در مکعب های OLAP چند بعدی از پیش ساخته شده قرار می گیرند. از مزایای این نوع سیستم می توان به مقیاس پذیری داده ها، پردازش سریع داده ها و دسترسی انعطاف پذیر به منابع داده اشاره کرد.

انواع دیگری از سیستم های OLAP وجود دارد، اما آنها بیشتر یک حرکت بازاریابی توسط تولید کنندگان هستند تا یک نوع مستقل از سیستم OLAP.

این انواع عبارتند از:

  • WOLAP (وب OLAP). نمای سیستم OLAP با پشتیبانی رابط وب. این سیستم های OLAP توانایی دسترسی به پایگاه های داده از طریق رابط وب را دارند.
  • DOLAP (دسکتاپ OLAP). این نوع سیستم OLAP به کاربران این امکان را می دهد که یک پایگاه داده را در یک محل کار محلی دانلود کرده و به صورت محلی با آن کار کنند.
  • MobileOLAP. این یکی از ویژگی های سیستم های OLAP است که به شما امکان می دهد با استفاده از دستگاه های تلفن همراه با پایگاه داده از راه دور کار کنید.
  • SOLAP (Spatial OLAP). این نوع سیستم های OLAP برای پردازش داده های مکانی طراحی شده اند. در نتیجه ادغام سیستم های اطلاعات جغرافیایی و سیستم های OLAP ظاهر شد. این سیستم ها به شما امکان می دهند داده ها را نه تنها در قالب الفبایی، بلکه در قالب اشیاء بصری و بردارها نیز پردازش کنید.

مزایای سیستم OLAP

استفاده از سیستم OLAP به سازمان توانایی پیش بینی و تجزیه و تحلیل موقعیت های مختلف مرتبط با فعالیت های جاری و چشم انداز توسعه را می دهد. این سیستم ها را می توان مکمل سیستم های اتوماسیون سطح سازمانی دانست. تمام مزایای سیستم های OLAP مستقیماً به دقت، قابلیت اطمینان و حجم داده های منبع بستگی دارد.

مزایای اصلی سیستم OLAP عبارتند از:

  • ثبات اطلاعات پس زمینهو نتایج تجزیه و تحلیل. در حضور یک سیستم OLAP، همیشه امکان ردیابی منبع اطلاعات و تعیین رابطه منطقی بین نتایج به دست آمده و داده های منبع وجود دارد. ذهنیت نتایج تجزیه و تحلیل کاهش می یابد.
  • انجام تحلیل چند متغیره. استفاده از یک سیستم OLAP به شما امکان می دهد تا سناریوهای زیادی را برای توسعه رویدادها بر اساس مجموعه ای از داده های اولیه دریافت کنید. با توجه به ابزارهای تجزیه و تحلیل، می توان موقعیت ها را بر اساس اصل "چه اتفاقی خواهد افتاد اگر" مدل سازی کرد.
  • کنترل جزئیات. جزئیات ارائه نتایج ممکن است بسته به نیاز کاربران متفاوت باشد. در این مورد، نیازی به انجام تنظیمات پیچیده سیستم و تکرار محاسبات نیست. گزارش ممکن است دقیقاً حاوی اطلاعاتی باشد که برای تصمیم گیری لازم است.
  • آشکار کردن وابستگی های پنهان. با ایجاد روابط چند بعدی، شناسایی و شناسایی وابستگی های پنهان در فرآیندها یا موقعیت های مختلف که بر فعالیت های تولیدی تأثیر می گذارد، امکان پذیر می شود.
  • ایجاد یک پلت فرم واحد. از طریق استفاده از یک سیستم OLAP، ایجاد یک پلت فرم واحد برای کلیه فرآیندهای پیش بینی و تجزیه و تحلیل در یک سازمان امکان پذیر می شود. به طور خاص، داده های سیستم OLAP مبنای ساخت پیش بینی بودجه، پیش بینی فروش، پیش بینی خرید، برنامه های توسعه استراتژیک و غیره است.

مفهوم تحلیل داده های چند بعدی ارتباط نزدیکی با تحلیل عملیاتی دارد که با استفاده از سیستم های OLAP انجام می شود.

OLAP (On-Line Analytical Processing) یک فناوری برای پردازش داده های تحلیلی آنلاین است که از روش ها و ابزارهایی برای جمع آوری، ذخیره و تجزیه و تحلیل داده های چند بعدی به منظور پشتیبانی از فرآیندهای تصمیم گیری استفاده می کند.

هدف اصلی سیستم های OLAP پشتیبانی از فعالیت های تحلیلی، درخواست های دلخواه (اصطلاح ad-hoc اغلب استفاده می شود) از کاربران تحلیلگر است. هدف از تجزیه و تحلیل OLAP آزمایش فرضیه های در حال ظهور است.

در خاستگاه فناوری OLAP بنیانگذار رویکرد رابطه ای E. Codd است. او در سال 1993 مقاله ای با عنوان "OLAP برای کاربران تحلیلگر: آنچه باید باشد" منتشر کرد. این مقاله مفاهیم اساسی پردازش تحلیلی آنلاین را تشریح می‌کند و 12 الزام زیر را که باید توسط محصولاتی که امکان پردازش تحلیلی آنلاین را فراهم می‌کنند برآورده کند، شناسایی می‌کند. توکماکوف G.P. پایگاه داده. مفهوم پایگاه داده، مدل داده های رابطه ای، زبان های SQL. S. 51

12 قانون مشخص شده توسط Codd که OLAP را تعریف می کنند در زیر فهرست شده اند.

1. چند بعدی بودن - سیستم OLAP در سطح مفهومی باید داده ها را در قالب یک مدل چند بعدی ارائه کند که فرآیندهای تجزیه و تحلیل و درک اطلاعات را ساده می کند.

2. شفافیت - یک سیستم OLAP باید پیاده سازی واقعی یک مدل چند بعدی، روش سازماندهی، منابع، پردازش و ابزارهای ذخیره سازی را از کاربر پنهان کند.

3. در دسترس بودن - یک سیستم OLAP باید یک مدل داده واحد، منسجم و منسجم را در اختیار کاربر قرار دهد که امکان دسترسی به داده‌ها را بدون توجه به نحوه و مکان ذخیره‌سازی آنها فراهم کند.

4. عملکرد توسعه گزارش منسجم - با افزایش تعداد ابعاد مورد تجزیه و تحلیل، عملکرد سیستم های OLAP نباید به میزان قابل توجهی کاهش یابد.

5. معماری کلاینت-سرور -- سیستم OLAP باید بتواند در یک محیط "مشتری-سرور" کار کند، زیرا بیشتر داده هایی که امروزه نیاز به پردازش تحلیلی آنلاین دارند، به صورت توزیع شده ذخیره می شوند. ایده اصلی در اینجا این است که مؤلفه سرور ابزار OLAP باید به اندازه کافی هوشمند باشد تا امکان ساخت یک طرح مفهومی مشترک بر اساس تعمیم و ادغام طرحواره‌های مختلف منطقی و فیزیکی پایگاه داده شرکتی را فراهم کند تا یک اثر شفاف ارائه شود.

6. برابری ابعاد - یک سیستم OLAP باید از یک مدل چند بعدی پشتیبانی کند که در آن همه ابعاد برابر هستند. در صورت لزوم ویژگی های اضافیمی توان به ابعاد فردی داد، اما این گزینه باید به هر بعدی داده شود.

7. مدیریت پویا ماتریس های پراکنده - یک سیستم OLAP باید مدیریت بهینه ماتریس های پراکنده را فراهم کند. نرخ دسترسی باید بدون توجه به محل سلول های داده حفظ شود و برای مدل هایی با تعداد ابعاد متفاوت و درجه پراکندگی داده های متفاوت یک مقدار ثابت باشد.

8. پشتیبانی از حالت چند کاربره - سیستم OLAP باید توانایی کار با چندین کاربر را همراه با یک مدل تحلیلی یا ایجاد مدل های مختلف برای آنها از یک داده واحد فراهم کند. در عین حال، خواندن و نوشتن داده ها امکان پذیر است، بنابراین سیستم باید یکپارچگی و امنیت آنها را تضمین کند.

9. عملیات متقاطع نامحدود - یک سیستم OLAP باید اطمینان حاصل کند که روابط عملکردی توصیف شده با استفاده از یک زبان رسمی مشخص بین سلول های ابرمکعب در هنگام انجام هر عملیات برش، چرخش، تثبیت یا حفاری حفظ می شود. سیستم باید به طور مستقل (به طور خودکار) تبدیل را انجام دهد روابط برقرار کردبدون اینکه کاربر مجبور به لغو آنها شود.

10. دستکاری داده های شهودی - یک سیستم OLAP باید راهی برای انجام عملیات برش، چرخش، تثبیت و مته کردن بر روی یک هایپر مکعب بدون نیاز به کاربر رابط کاربری زیادی ارائه دهد. ابعاد تعریف شده در مدل تحلیلی باید حاوی تمامی اطلاعات لازم برای انجام عملیات فوق باشد.

11. گزینه های گزارش دهی انعطاف پذیر -- سیستم OLAP باید پشتیبانی کند راه های مختلفتجسم داده ها، یعنی گزارش ها باید در هر جهت ممکن ارائه شوند. ابزارهای گزارش باید داده های ترکیب شده یا اطلاعات حاصل از مدل داده را در هر جهت ممکن نشان دهند. این بدان معنی است که سطرها، ستون ها یا صفحات باید از 0 تا N ابعاد را به طور همزمان نشان دهند، جایی که N-- شمارهاندازه گیری کل مدل تحلیلی علاوه بر این، هر بعد محتوایی که در یک پست، ستون یا صفحه نمایش داده می‌شود، باید به هر زیرمجموعه‌ای از عناصر (مقادیر) موجود در بعد به هر ترتیبی نشان داده شود.

12. ابعاد نامحدود و تعداد سطوح تجمع - مطالعه بر روی تعداد احتمالی ابعاد مورد نیاز مورد نیاز در یک مدل تحلیلی نشان داد که تا 19 بعد را می توان به طور همزمان استفاده کرد. از این رو توصیه قوی این است که ابزار تحلیلی بتواند حداقل 15 و ترجیحاً 20 اندازه گیری را به طور همزمان ارائه دهد. علاوه بر این، هر یک از ابعاد مشترک نباید با تعداد سطوح مسیرهای تجمیع و تجمیع تعریف شده توسط کاربر تحلیلگر محدود شود.

قوانین اضافی Codd.

مجموعه ای از این الزامات، که به عنوان تعریف واقعی OLAP عمل می کند، اغلب باعث انتقادات مختلفی می شود، به عنوان مثال، قوانین 1، 2، 3، 6 الزامات هستند و قوانین 10، 11 خواسته های غیر رسمی هستند. توکماکوف G.P. پایگاه داده. مفهوم پایگاه داده، مدل داده های رابطه ای، زبان های SQL. ص 68 بنابراین، 12 الزامات فهرست شده Codd به ما اجازه نمی دهد OLAP را به طور دقیق تعریف کنیم. در سال 1995، کاد شش قانون زیر را به لیست اضافه کرد:

13. استخراج دسته ای در مقابل تفسیر - یک سیستم OLAP باید در ارائه دسترسی به داده های داخلی و خارجی به همان اندازه کارآمد باشد.

14. پشتیبانی از همه مدل های تجزیه و تحلیل OLAP - یک سیستم OLAP باید از هر چهار مدل تجزیه و تحلیل داده تعریف شده توسط Codd پشتیبانی کند: طبقه بندی، تفسیری، گمانه زنی و کلیشه ای.

15. مدیریت داده های غیرعادی شده -- یک سیستم OLAP باید با منابع داده غیرعادی شده یکپارچه شود. تغییرات در داده های انجام شده در یک محیط OLAP نباید منجر به تغییر در داده های ذخیره شده در سیستم های خارجی اصلی شود.

16. ذخیره نتایج OLAP: جدا نگه داشتن آنها از داده های اصلی - یک سیستم OLAP که در حالت خواندن و نوشتن کار می کند، پس از اصلاح داده های اصلی، باید نتایج را جداگانه ذخیره کند. به عبارت دیگر، امنیت داده های منبع تضمین می شود.

17. حذف مقادیر از دست رفته-- هنگام ارائه داده ها به کاربر، یک سیستم OLAP باید تمام مقادیر از دست رفته را کنار بگذارد. به عبارت دیگر، مقادیر از دست رفته باید با مقادیر null متفاوت باشند.

18 مدیریت مقادیر گمشده - یک سیستم OLAP باید تمام مقادیر از دست رفته را صرف نظر از منبع آنها نادیده بگیرد. این ویژگی مربوط به قانون هفدهم است.

علاوه بر این، کاد تمام 18 قانون را به چهار گروه زیر تقسیم کرد و آنها را ویژگی نامید. این گروه ها B، S، R و D نامگذاری شدند.

ویژگی های اصلی (B) شامل قوانین زیر است:

نمایش مفهومی چند بعدی داده ها (قانون 1).

دستکاری شهودی داده ها (قانون 10)؛

در دسترس بودن (قانون 3)؛

استخراج دسته ای در مقابل تفسیر (قاعده 13)؛

پشتیبانی از تمام مدل های تحلیل OLAP (قانون 14)؛

معماری "مشتری-سرور" (قانون 5)؛

شفافیت (قاعده 2)؛

پشتیبانی چند نفره (قانون 8)

ویژگی های خاص (S):

پردازش داده های غیر عادی (قانون 15)؛

ذخیره نتایج OLAP: ذخیره آنها جدا از داده های اصلی (قانون 16).

حذف مقادیر از دست رفته (قانون 17)؛

مدیریت مقادیر از دست رفته (قانون 18). ویژگی های گزارش دهی (R):

انعطاف پذیری تولید گزارش (قانون 11)؛

گزارش استاندارد عملکرد (قانون 4)؛

پیکربندی لایه فیزیکی خودکار (قانون اصلی اصلاح شده 7).

کنترل اندازه گیری (D):

جهانی بودن اندازه گیری ها (قانون 6)؛

تعداد نامحدود ابعاد و سطوح تجمع (قانون 12)؛

عملیات نامحدود بین ابعاد (قانون 9).