αποθήκες δεδομένωνδιαμορφώνονται με βάση σταθερά για μεγάλο χρονικό διάστημα στιγμιότυπα βάσεων δεδομένων λειτουργικών σύστημα πληροφορίωνκαι πιθανώς διάφορες εξωτερικές πηγές. Οι αποθήκες δεδομένων χρησιμοποιούν τεχνολογίες βάσεων δεδομένων, OLAP, εξόρυξη δεδομένων, οπτικοποίηση δεδομένων.

Κύρια χαρακτηριστικά των αποθηκών δεδομένων.

  • περιέχει ιστορικά δεδομένα·
  • αποθηκεύει λεπτομερείς πληροφορίες, καθώς και εν μέρει και πλήρως συνοπτικά δεδομένα.
  • τα δεδομένα είναι κυρίως στατικά.
  • ανεξέλεγκτη, αδόμητη και ευρετικό τρόποεπεξεργασία δεδομένων;
  • Μέσης και χαμηλής έντασης επεξεργασίας συναλλαγών.
  • απρόβλεπτος τρόπος χρήσης δεδομένων·
  • σχεδιασμένο για ανάλυση.
  • επικεντρώθηκε σε θεματικές περιοχές;
  • υποστήριξη για τη λήψη στρατηγικών αποφάσεων·
  • εξυπηρετεί μικρό σχετικά αριθμό στελεχών.

Ο όρος OLAP (On-Line Analytical Processing) χρησιμοποιείται για να περιγράψει το μοντέλο παρουσίασης δεδομένων και, κατά συνέπεια, την τεχνολογία επεξεργασίας τους σε αποθήκες δεδομένων. Το OLAP χρησιμοποιεί μια πολυδιάστατη προβολή συγκεντρωτικών δεδομένων για την παροχή γρήγορη πρόσβασηνα στρατηγικά σημαντικές πληροφορίεςγια σκοπούς εις βάθος ανάλυσης. Οι εφαρμογές OLAP θα πρέπει να έχουν τις ακόλουθες βασικές ιδιότητες:

  • πολυδιάστατη παρουσίαση δεδομένων;
  • υποστήριξη για πολύπλοκους υπολογισμούς.
  • σωστή συνεκτίμηση του παράγοντα χρόνου.

Πλεονεκτήματα του OLAP:

  • προβολή εκτέλεσηπροσωπικό παραγωγής, προγραμματιστές προγράμματα εφαρμογής. Έγκαιρη πρόσβαση σε στρατηγικές πληροφορίες.
  • δίνοντας στους χρήστες αρκετή δύναμη για να κάνουν τις δικές τους αλλαγές στο σχήμα.
  • Οι εφαρμογές OLAP βασίζονται σε αποθήκες δεδομένωνκαι συστήματα OLTP, λαμβάνοντας ενημερωμένα δεδομένα από αυτά, τα οποία εξοικονομούν έλεγχος ακεραιότηταςεταιρικά δεδομένα.
  • μείωση του φορτίου στα συστήματα OLTP και αποθήκες δεδομένων.

OLAP και OLTP. Χαρακτηριστικά και κύριες διαφορές

OLAP OLTP
Αποθήκευση δεδομένωνθα πρέπει να περιλαμβάνει τόσο εσωτερικά εταιρικά δεδομένα όσο και εξωτερικά δεδομένα η κύρια πηγή πληροφοριών που εισέρχονται στην επιχειρησιακή βάση δεδομένων είναι οι δραστηριότητες της εταιρείας και η ανάλυση δεδομένων απαιτεί τη συμμετοχή εξωτερικών πηγών πληροφοριών (για παράδειγμα, στατιστικές εκθέσεις)
Ο όγκος των αναλυτικών βάσεων δεδομένων είναι τουλάχιστον μια τάξη μεγέθους μεγαλύτερος από τον όγκο των επιχειρησιακών. για αξιόπιστη ανάλυση και πρόβλεψη αποθήκευση δεδομένωνπρέπει να έχετε πληροφορίες για τις δραστηριότητες της εταιρείας και την κατάσταση της αγοράς εδώ και αρκετά χρόνια Για τη λειτουργική επεξεργασία, απαιτούνται δεδομένα για τους τελευταίους μήνες
Αποθήκευση δεδομένωνθα πρέπει να περιέχει ομοιόμορφα παρουσιαζόμενες και συμφωνημένες πληροφορίες που είναι όσο το δυνατόν πιο κοντά στο περιεχόμενο των λειτουργικών βάσεων δεδομένων. Απαιτείται ένα στοιχείο για την εξαγωγή και τον «καθαρισμό» πληροφοριών από διάφορες πηγές. Σε πολλές μεγάλες εταιρείες, υπάρχουν πολλά λειτουργικά συστήματα πληροφοριών με τις δικές τους βάσεις δεδομένων ταυτόχρονα (για ιστορικούς λόγους). Οι επιχειρησιακές βάσεις δεδομένων μπορεί να περιέχουν σημασιολογικά ισοδύναμες πληροφορίες που παρουσιάζονται σε διαφορετικές μορφές, με διαφορετικές ενδείξεις για το χρόνο λήψης τους, μερικές φορές ακόμη και αντιφατικές
Το σύνολο των ερωτημάτων σε σχέση με μια αναλυτική βάση δεδομένων δεν μπορεί να προβλεφθεί. αποθήκες δεδομένωνυπάρχουν για να ανταποκρίνονται σε αιτήματα ad hoc αναλυτών. Μπορείτε να βασιστείτε μόνο στο γεγονός ότι τα αιτήματα δεν θα έρχονται πολύ συχνά και θα επηρεάζουν μεγάλο όγκο πληροφοριών. Τα μεγέθη των αναλυτικών βάσεων δεδομένων ενθαρρύνουν τη χρήση ερωτημάτων με συγκεντρωτικά στοιχεία (άθροισμα, ελάχιστα, μέγ. σημαίνωκαι τα λοιπά.) Τα συστήματα επεξεργασίας δεδομένων έχουν σχεδιαστεί για την επίλυση συγκεκριμένων προβλημάτων. Οι πληροφορίες από τη βάση δεδομένων επιλέγονται συχνά και σε μικρές μερίδες. Συνήθως, ένα σύνολο ερωτημάτων στη λειτουργική βάση δεδομένων είναι ήδη γνωστό κατά τη διάρκεια του σχεδιασμού
Με μια μικρή μεταβλητότητα των αναλυτικών βάσεων δεδομένων (μόνο κατά τη φόρτωση δεδομένων), η ταξινόμηση των πινάκων αποδεικνύεται λογική, περισσότερο γρήγορες μεθόδουςευρετηρίαση για μαζική δειγματοληψία, αποθήκευση προ-συγκεντρωτικών δεδομένων Τα συστήματα επεξεργασίας δεδομένων από τη φύση τους είναι εξαιρετικά μεταβλητά, κάτι που λαμβάνεται υπόψη στο χρησιμοποιούμενο DBMS (κανονικοποιημένη δομή βάσης δεδομένων, οι σειρές αποθηκεύονται εκτός λειτουργίας, τα δέντρα B για ευρετηρίαση, συναλλακτικότητα)
Οι πληροφορίες των αναλυτικών βάσεων δεδομένων είναι τόσο κρίσιμες για την εταιρεία που απαιτείται μεγάλη διασπορά προστασίας (μεμονωμένα δικαιώματα πρόσβασης σε ορισμένες σειρές ή/και στήλες του πίνακα) Για συστήματα επεξεργασίας δεδομένων, συνήθως είναι αρκετό προστασία πληροφοριώνσε επίπεδο τραπεζιού

Κανόνες Codd για συστήματα OLAP

Το 1993, ο Codd δημοσίευσε το OLAP for Analyst Users: What It Should Be Like. Σε αυτό, περιέγραψε τις βασικές έννοιες της διαδικτυακής αναλυτικής επεξεργασίας και προσδιόρισε 12 κανόνες που πρέπει να πληρούν τα προϊόντα για να παρέχουν διαδικτυακή αναλυτική επεξεργασία.

  1. Εννοιολογική πολυδιάστατη αναπαράσταση. Ένα μοντέλο OLAP πρέπει να είναι πολυδιάστατο στον πυρήνα του. Ένα πολυδιάστατο εννοιολογικό διάγραμμα ή προσαρμοσμένη αναπαράσταση διευκολύνει τη μοντελοποίηση και την ανάλυση καθώς και τους υπολογισμούς.
  2. Διαφάνεια. Ο χρήστης μπορεί να πάρει όλα τα απαραίτητα δεδομένα από το μηχάνημα OLAP, χωρίς καν να υποψιάζεται από πού προέρχονται. Ανεξάρτητα από το αν το προϊόν OLAP αποτελεί μέρος των εργαλείων του χρήστη ή όχι, αυτό το γεγονός θα πρέπει να είναι αόρατο στον χρήστη. Εάν το OLAP παρέχεται από υπολογιστές πελάτη-διακομιστή, τότε αυτό το γεγονός θα πρέπει επίσης, εάν είναι δυνατόν, να είναι αόρατο στον χρήστη. Το OLAP θα πρέπει να παρέχεται στο πλαίσιο μιας πραγματικά ανοιχτής αρχιτεκτονικής, που θα επιτρέπει στον χρήστη, όπου κι αν βρίσκεται, να επικοινωνεί με τον διακομιστή χρησιμοποιώντας ένα αναλυτικό εργαλείο. Επιπλέον, η διαφάνεια πρέπει επίσης να επιτυγχάνεται όταν το αναλυτικό εργαλείο αλληλεπιδρά με ομοιογενή και ετερογενή περιβάλλοντα βάσεων δεδομένων.
  3. Διαθεσιμότητα. Η OLAP πρέπει να παρέχει τη δική της λογικό διάγραμμαγια πρόσβαση σε ένα ετερογενές περιβάλλον βάσης δεδομένων και εκτέλεση κατάλληλων μετασχηματισμών για την παροχή δεδομένων στον χρήστη. Επιπλέον, είναι απαραίτητο να ληφθεί μέριμνα εκ των προτέρων για το πού και πώς και ποιοι τύποι οργάνωσης φυσικών δεδομένων θα χρησιμοποιηθούν πραγματικά. Ένα σύστημα OLAP θα πρέπει να έχει πρόσβαση μόνο σε δεδομένα που είναι πραγματικά απαραίτητα και να μην ισχύει γενική αρχή«χοάνη κουζίνας» που συνεπάγεται περιττή εισαγωγή.
  4. Συνεχής εκτέλεσηκατά την ανάπτυξη αναφορών. ΕκτέλεσηΟι αναφορές δεν πρέπει να μειώνονται σημαντικά με την αύξηση του αριθμού των διαστάσεων και του μεγέθους της βάσης δεδομένων.
  5. Αρχιτεκτονική πελάτη-διακομιστή. Όχι μόνο το προϊόν απαιτείται να είναι προϊόν πελάτη/διακομιστή, αλλά και το στοιχείο διακομιστή απαιτείται επίσης να είναι αρκετά έξυπνο ώστε διαφορετικοί πελάτες να μπορούν να συνδεθούν με ελάχιστη προσπάθεια και προγραμματισμό.
  6. Γενική πολυδιάστατη. Όλες οι διαστάσεις πρέπει να είναι ίσες, κάθε διάσταση πρέπει να είναι ισοδύναμη τόσο στη δομή όσο και στις επιχειρησιακές δυνατότητες. Είναι αλήθεια ότι επιτρέπονται πρόσθετες λειτουργικές δυνατότητες για μεμονωμένες μετρήσεις (προφανώς, υπονοείται χρόνος), αλλά τέτοια πρόσθετες λειτουργίεςπρέπει να δοθεί σε οποιαδήποτε διάσταση. Δεν πρέπει να είναι έτσι ώστε το βασικό ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ, οι υπολογιστικές μορφές ή οι μορφές αναφοράς ήταν πιο συγκεκριμένες σε μία διάσταση.
  7. Δυναμικός έλεγχος αραιοί πίνακες. Τα συστήματα OLAP θα πρέπει να προσαρμόζουν αυτόματα το φυσικό τους σχήμα με βάση τον τύπο του μοντέλου, τους όγκους δεδομένων και την αραιότητα της βάσης δεδομένων.
  8. Υποστήριξη πολλών χρηστών. Το εργαλείο OLAP πρέπει να παρέχει τη δυνατότητα μοιρασιά(αίτημα και προσθήκη), ακεραιότητα και ασφάλεια.
  9. Απεριόριστες διασταυρώσεις. Πρέπει να επιτρέπονται κάθε είδους εργασίες για οποιεσδήποτε μετρήσεις.
  10. Διαισθητικός χειρισμός δεδομένων. Ο χειρισμός δεδομένων πραγματοποιήθηκε μέσω άμεσων ενεργειών σε κελιά σε λειτουργία προβολής χωρίς τη χρήση μενού και πολλαπλών λειτουργιών.
  11. Ευέλικτες επιλογές αναφοράς. Οι μετρήσεις πρέπει να τοποθετούνται στην αναφορά με τον τρόπο που θέλει ο χρήστης.
  12. Απεριόριστος

Το OLAP (OnLine Analytical Processing) δεν είναι το όνομα ενός συγκεκριμένου προϊόντος, αλλά μιας ολόκληρης διαδικτυακής τεχνολογίας αναλυτικής επεξεργασίας που περιλαμβάνει ανάλυση δεδομένων και αναφορά. Ο χρήστης διαθέτει έναν πολυδιάστατο πίνακα που συνοψίζει αυτόματα τα δεδομένα σε διάφορες ενότητες και σας επιτρέπει να διαχειρίζεστε γρήγορα τους υπολογισμούς και τη μορφή της αναφοράς.

Αν και σε ορισμένες δημοσιεύσεις η αναλυτική επεξεργασία ονομάζεται τόσο διαδικτυακή όσο και διαδραστική, το επίθετο "online" αντικατοπτρίζει με μεγαλύτερη ακρίβεια την έννοια της τεχνολογίας OLAP. Η ανάπτυξη των διοικητικών αποφάσεων διαχείρισης εμπίπτει στην κατηγορία των περιοχών που είναι πιο ψευδώς επιδεκτικές στον αυτοματισμό. Ωστόσο, σήμερα υπάρχει η ευκαιρία να βοηθηθεί ο διευθυντής στην ανάπτυξη αποφάσεων και, το πιο σημαντικό, να επιταχυνθεί σημαντικά η διαδικασία ανάπτυξης αποφάσεων, η επιλογή και η υιοθέτησή τους.

Τα συστήματα υποστήριξης αποφάσεων έχουν συνήθως τα μέσα για να παρέχουν στο χρήστη συγκεντρωτικά δεδομένα για διάφορα δείγματα από το αρχικό σύνολο σε μια μορφή κατάλληλη για αντίληψη και ανάλυση. Κατά κανόνα, τέτοιες αθροιστικές συναρτήσεις σχηματίζουν ένα πολυδιάστατο σύνολο δεδομένων, που συχνά ονομάζεται υπερκύβος ή μετακύβος, του οποίου οι άξονες περιέχουν παραμέτρους και τα κελιά περιέχουν συγκεντρωτικά δεδομένα που εξαρτώνται από αυτές - και τέτοια δεδομένα μπορούν επίσης να αποθηκευτούν σε σχεσιακούς πίνακες, αλλά σε αυτό περίπτωση μιλάμε για δεδομένα λογικής οργάνωσης και όχι για φυσική υλοποίηση της αποθήκευσής τους.

Κατά μήκος κάθε άξονα, τα δεδομένα μπορούν να οργανωθούν σε μια ιεραρχία που αντιπροσωπεύει διαφορετικά επίπεδα λεπτομέρειας.

Σύμφωνα με τις διαστάσεις στο πολυδιάστατο μοντέλο, παραμερίζονται παράγοντες που επηρεάζουν τις δραστηριότητες της επιχείρησης (για παράδειγμα: χρόνος, προϊόντα, υποκαταστήματα εταιρείας κ.λπ.). Στη συνέχεια, ο κύβος OLAP που προκύπτει γεμίζει με δείκτες της δραστηριότητας της επιχείρησης (τιμές, πωλήσεις, σχέδιο, κέρδη, ταμειακές ροές κ.λπ.). Θα πρέπει να σημειωθεί ότι, σε αντίθεση με έναν γεωμετρικό κύβο, οι όψεις ενός κύβου OLAP δεν χρειάζεται να έχουν το ίδιο μέγεθος. Αυτή η πλήρωση μπορεί να πραγματοποιηθεί όπως και με πραγματικά δεδομένα λειτουργικά συστήματα, και προβλέπεται βάσει ιστορικών δεδομένων. Οι διαστάσεις του υπερκύβου μπορεί να είναι πολύπλοκες, ιεραρχικές και να δημιουργηθούν σχέσεις μεταξύ τους. Κατά τη διάρκεια της ανάλυσης, ο χρήστης μπορεί να αλλάξει την άποψη των δεδομένων (η λεγόμενη λειτουργία αλλαγής της λογικής προβολής), προβάλλοντας έτσι τα δεδομένα σε διαφορετικές ενότητες και λύνοντας συγκεκριμένα προβλήματα. Μπορούν να εκτελεστούν διάφορες λειτουργίες σε κύβους, συμπεριλαμβανομένης της πρόβλεψης και του προγραμματισμού υπό όρους (ανάλυση τι θα γίνει).

Χάρη σε αυτό το μοντέλο δεδομένων, οι χρήστες μπορούν να διατυπώνουν σύνθετα ερωτήματα, να δημιουργούν αναφορές και να λαμβάνουν υποσύνολα δεδομένων. Η επιχειρησιακή αναλυτική επεξεργασία μπορεί να απλοποιήσει και να επιταχύνει σημαντικά τη διαδικασία προετοιμασίας και λήψης αποφάσεων από το διοικητικό προσωπικό. Η διαδικτυακή αναλυτική επεξεργασία εξυπηρετεί το σκοπό της μετατροπής των δεδομένων σε πληροφορίες. Διαφέρει θεμελιωδώς από την παραδοσιακή διαδικασία υποστήριξης αποφάσεων, η οποία βασίζεται, τις περισσότερες φορές, στην εξέταση δομημένων αναφορών.


Η τεχνολογία OLAP αναφέρεται στον τύπο της πνευματικής ανάλυσης και περιλαμβάνει 12 αρχές:

1. Εννοιολογική πολυδιάστατη αναπαράσταση. Ο χρήστης-αναλυτής βλέπει τον κόσμο της επιχείρησης ως πολυδιάστατο στη φύση του, αντίστοιχα, και το μοντέλο OLAP πρέπει να είναι πολυδιάστατο στον πυρήνα του.

2. Διαφάνεια. Η αρχιτεκτονική του συστήματος OLAP θα πρέπει να είναι ανοιχτή, επιτρέποντας στον χρήστη, όπου κι αν βρίσκεται, να επικοινωνεί χρησιμοποιώντας ένα αναλυτικό εργαλείο - τον πελάτη - με τον διακομιστή.

3. Διαθεσιμότητα. Ένας χρήστης αναλυτής OLAP πρέπει να μπορεί να εκτελεί ανάλυση με βάση ένα κοινό εννοιολογικό σχήμα που περιέχει δεδομένα για όλη την επιχείρηση σε μια σχεσιακή βάση δεδομένων, καθώς και δεδομένα από βάσεις δεδομένων παλαιού τύπου, σε κοινές μεθόδους πρόσβασης και σε ένα κοινό αναλυτικό μοντέλο. Ένα σύστημα OLAP θα πρέπει να έχει πρόσβαση μόνο στα δεδομένα που πραγματικά χρειάζονται και να μην εφαρμόζει τη γενική αρχή της "χοάνης κουζίνας" που συνεπάγεται περιττή εισαγωγή.

4. Συνεπής απόδοση στην ανάπτυξη αναφορών. Με την αύξηση του αριθμού των διαστάσεων ή του μεγέθους της βάσης δεδομένων, ο χρήστης αναλυτής δεν θα πρέπει να αντιμετωπίσει σημαντική μείωση στην απόδοση.

5. Αρχιτεκτονική πελάτη-διακομιστή . Τα περισσότερα από τα δεδομένα που σήμερα πρέπει να υποβληθούν σε ηλεκτρονική αναλυτική επεξεργασία περιέχονται σε κεντρικούς υπολογιστές με πρόσβαση σε σταθμούς εργασίας χρήστη μέσω LAN. Αυτό σημαίνει ότι τα προϊόντα OLAP πρέπει να μπορούν να λειτουργούν σε περιβάλλον πελάτη-διακομιστή.

6. Γενική πολυδιάστατη. Κάθε διάσταση θα πρέπει να εφαρμόζεται ανεξάρτητα από τη δομή και τις επιχειρησιακές της δυνατότητες. Οι υποκείμενες δομές δεδομένων, οι τύποι και οι μορφές αναφοράς δεν θα πρέπει να είναι προκατειλημμένες προς οποιαδήποτε μία διάσταση.

7. Δυναμική διαχείριση αραιών πινάκων. Ο φυσικός σχεδιασμός ενός εργαλείου OLAP πρέπει να είναι πλήρως προσαρμόσιμος στο συγκεκριμένο αναλυτικό μοντέλο προκειμένου να διαχειρίζεται βέλτιστα τους αραιούς πίνακες. Αραιότητα (μετρούμενη ως ποσοστό άδεια κελιάσε όλα τα δυνατά) είναι ένα από τα χαρακτηριστικά της διάδοσης δεδομένων.

8. Υποστήριξη πολλών χρηστών. Ένα εργαλείο OLAP πρέπει να παρέχει τη δυνατότητα κοινής χρήσης ερωτημάτων και αύξησης πολλαπλών χρηστών αναλυτών, διατηρώντας παράλληλα την ακεραιότητα και την ασφάλεια.

9. Απεριόριστες διασταυρώσεις. Διάφορες πράξεις, λόγω της ιεραρχικής τους φύσης, μπορούν να αντιπροσωπεύουν εξαρτημένες σχέσεις στο μοντέλο OLAP, δηλαδή είναι διαλειτουργικές. Η εκτέλεσή τους δεν θα πρέπει να απαιτεί από τον αναλυτή χρήστη να επαναπροσδιορίσει αυτούς τους υπολογισμούς και τις πράξεις.

10. Διαισθητικός χειρισμός δεδομένων. Η προβολή του χρήστη αναλυτή για τις διαστάσεις που ορίζονται στο αναλυτικό μοντέλο πρέπει να περιέχει όλες τις απαραίτητες πληροφορίες για την εκτέλεση ενεργειών στο μοντέλο OLAP, π.χ. δεν θα πρέπει να απαιτούν τη χρήση συστήματος μενού ή άλλες λειτουργίες πολλαπλής διεπαφής χρήστη.

11. Ευέλικτες επιλογές αναφοράς. Τα εργαλεία αναφοράς θα πρέπει να είναι συνθετικά δεδομένα ή πληροφορίες που προκύπτουν από το μοντέλο δεδομένων σε οποιονδήποτε πιθανό προσανατολισμό. Αυτό σημαίνει ότι οι σειρές, οι στήλες ή οι σελίδες μιας αναφοράς πρέπει να εμφανίζουν πολλαπλές διαστάσεις ενός μοντέλου OLAP ταυτόχρονα, με δυνατότητα εμφάνισης οποιουδήποτε υποσυνόλου των στοιχείων (τιμών) που περιέχονται στην ιδιότητα και με οποιαδήποτε σειρά.

12. Απεριόριστη διάσταση και αριθμός επιπέδων συγκέντρωσης. Μια μελέτη σχετικά με τον πιθανό αριθμό των απαραίτητων μετρήσεων που απαιτούνται σε ένα αναλυτικό μοντέλο έδειξε ότι έως και 19 μετρήσεις μπορούν να χρησιμοποιηθούν ταυτόχρονα από έναν αναλυτή χρήστη. Αυτό οδηγεί σε μια σύσταση σχετικά με τον αριθμό των διαστάσεων που υποστηρίζονται από το σύστημα OLAP. Επιπλέον, καθεμία από τις κοινές διαστάσεις δεν πρέπει να περιορίζεται από τον αριθμό των επιπέδων συγκέντρωσης που ορίζει ο χρήστης-αναλυτής.

Ως εξειδικευμένα συστήματα OLAP που προσφέρονται επί του παρόντος στην αγορά, μπορείτε να ορίσετε CalliGraph, Business Intelligence.

Για την επίλυση απλών εργασιών ανάλυσης δεδομένων, μπορείτε να χρησιμοποιήσετε μια λύση προϋπολογισμού - τις εφαρμογές γραφείου Microsoft Excel και Access, οι οποίες περιέχουν στοιχειώδη εργαλεία τεχνολογίας OLAP που σας επιτρέπουν να δημιουργείτε συγκεντρωτικούς πίνακες και να δημιουργείτε διάφορες αναφορές βάσει αυτών.

σκοπός θητείαείναι η μελέτη της τεχνολογίας OLAP, η έννοια της εφαρμογής και της δομής της.

ΣΤΟ σύγχρονος κόσμος δίκτυα υπολογιστώνκαι τα υπολογιστικά συστήματα σάς επιτρέπουν να αναλύετε και να επεξεργάζεστε μεγάλες ποσότητες δεδομένων.

Ένας μεγάλος όγκος πληροφοριών περιπλέκει πολύ την αναζήτηση λύσεων, αλλά καθιστά δυνατή την απόκτηση πολύ ακριβέστερων υπολογισμών και αναλύσεων. Για να λυθεί αυτό το πρόβλημα, υπάρχει ολόκληρη η τάξη πληροφοριακά συστήματαπραγματοποιώντας την ανάλυση. Τέτοια συστήματα ονομάζονται συστήματα υποστήριξης αποφάσεων (DSS) (DSS, Decision Support System).

Για να πραγματοποιήσει την ανάλυση, το DSS πρέπει να συγκεντρώσει πληροφορίες, έχοντας τα μέσα εισαγωγής και αποθήκευσης του. Συνολικά, υπάρχουν τρεις κύριες εργασίες που επιλύονται στο DSS:

· εισαγωγή δεδομένων;

· αποθήκευση δεδομένων;

· ανάλυση δεδομένων.

Η εισαγωγή δεδομένων στο DSS πραγματοποιείται αυτόματα από αισθητήρες που χαρακτηρίζουν την κατάσταση του περιβάλλοντος ή της διαδικασίας ή από έναν άνθρωπο χειριστή.

Εάν τα δεδομένα εισάγονται αυτόματα από αισθητήρες, τότε τα δεδομένα συσσωρεύονται από ένα σήμα ετοιμότητας που εμφανίζεται όταν εμφανίζονται πληροφορίες ή με κυκλική δημοσκόπηση. Εάν η εισαγωγή γίνεται από άνθρωπο, τότε θα πρέπει να παρέχουν στους χρήστες εύχρηστα μέσα για την εισαγωγή δεδομένων που τους ελέγχουν για την ορθότητα της εισαγωγής, καθώς και να κάνουν τους απαραίτητους υπολογισμούς.

Κατά την ταυτόχρονη εισαγωγή δεδομένων από πολλούς χειριστές, είναι απαραίτητο να λυθούν τα προβλήματα τροποποίησης και παράλληλης πρόσβασης των ίδιων δεδομένων.

Το DSS παρέχει στους αναλυτές δεδομένα με τη μορφή αναφορών, πινάκων, γραφημάτων για μελέτη και ανάλυση, γι' αυτό τέτοια συστήματα παρέχουν λειτουργίες υποστήριξης αποφάσεων.

Σε υποσυστήματα εισαγωγής δεδομένων, που ονομάζονται OLTP (On-linetransactionprocessing), εφαρμόζεται η επιχειρησιακή επεξεργασία δεδομένων. Για την εφαρμογή τους χρησιμοποιούνται συμβατικά συστήματα διαχείρισης βάσεων δεδομένων (DBMS).

Το υποσύστημα ανάλυσης μπορεί να κατασκευαστεί με βάση:

· Υποσυστήματα ανάλυσης ανάκτησης πληροφοριών που βασίζονται σε σχεσιακό DBMS και στατικά ερωτήματα που χρησιμοποιούν τη γλώσσα SQL.

· υποσυστήματα επιχειρησιακής ανάλυσης. Για την υλοποίηση τέτοιων υποσυστημάτων, χρησιμοποιείται η τεχνολογία της ηλεκτρονικής επεξεργασίας αναλυτικών δεδομένων OLAP, χρησιμοποιώντας την έννοια της πολυδιάστατης αναπαράστασης δεδομένων.

· υποσυστήματα πνευματικής ανάλυσης. Αυτό το υποσύστημα εφαρμόζει μεθόδους και αλγόριθμους DataMining.

Από την πλευρά του χρήστη, τα συστήματα OLAP παρέχουν ένα μέσο ευέλικτης προβολής πληροφοριών σε διάφορες ενότητες, αυτόματη λήψη συγκεντρωτικών δεδομένων, εκτέλεση αναλυτικών λειτουργιών συνέλιξης, λεπτομερειών, σύγκρισης με την πάροδο του χρόνου. Χάρη σε όλα αυτά, τα συστήματα OLAP αποτελούν μια λύση με μεγάλα πλεονεκτήματα στον τομέα της προετοιμασίας δεδομένων για όλους τους τύπους επιχειρηματικών αναφορών, που περιλαμβάνει την παρουσίαση δεδομένων σε διάφορες ενότητες και διαφορετικά επίπεδαιεραρχίες, όπως αναφορές πωλήσεων, διάφορες μορφές προϋπολογισμών και άλλα. Τα συστήματα OLAP έχουν μεγάλα πλεονεκτήματα μιας τέτοιας αναπαράστασης σε άλλες μορφές ανάλυσης δεδομένων, συμπεριλαμβανομένης της πρόβλεψης.

1.2 Ορισμός OLAP-συστήματα

Η τεχνολογία της πολύπλοκης πολυδιάστατης ανάλυσης δεδομένων ονομάζεται OLAP. Το OLAP είναι ένα βασικό συστατικό μιας οργάνωσης αποθήκης δεδομένων.

Η λειτουργικότητα OLAP μπορεί να υλοποιηθεί με διάφορους τρόπους, τόσο απλό όσο η ανάλυση δεδομένων εφαρμογές γραφείου, και πιο πολύπλοκα - κατανεμημένα αναλυτικά συστήματα που βασίζονται σε προϊόντα διακομιστή.

Το OLAP (On-LineAnalyticalProcessing) είναι μια τεχνολογία για την ηλεκτρονική επεξεργασία αναλυτικών δεδομένων που χρησιμοποιεί εργαλεία και μεθόδους για τη συλλογή, την αποθήκευση και την ανάλυση πολυδιάστατων δεδομένων και για την υποστήριξη διαδικασιών λήψης αποφάσεων.

Ο κύριος σκοπός των συστημάτων OLAP είναι να υποστηρίζουν αναλυτικές δραστηριότητες, αυθαίρετα αιτήματα από χρήστες αναλυτών. Ο σκοπός της ανάλυσης OLAP είναι να ελέγξει τις αναδυόμενες υποθέσεις.

Η χρήση ενός συστήματος OLAP σάς επιτρέπει να αυτοματοποιήσετε το στρατηγικό επίπεδο διαχείρισης του οργανισμού. Η OLAP (Online Analytical Processing - αναλυτική επεξεργασία δεδομένων σε πραγματικό χρόνο) είναι μια ισχυρή τεχνολογία για την επεξεργασία και την έρευνα δεδομένων. Τα συστήματα που κατασκευάζονται με βάση την τεχνολογία OLAP παρέχουν σχεδόν απεριόριστες δυνατότητες για τη σύνταξη αναφορών, την εκτέλεση σύνθετων αναλυτικών υπολογισμών, τη δημιουργία προβλέψεων και σεναρίων και την ανάπτυξη μιας ποικιλίας επιλογών σχεδίων.

Τα πλήρη συστήματα OLAP εμφανίστηκαν στις αρχές της δεκαετίας του '90 ως αποτέλεσμα της ανάπτυξης συστημάτων πληροφοριών υποστήριξης αποφάσεων. Έχουν σχεδιαστεί για να μετατρέπουν διάφορα, συχνά ανόμοια, δεδομένα σε ΧΡΗΣΙΜΕΣ ΠΛΗΡΟΦΟΡΙΕΣ. Τα συστήματα OLAP μπορούν να οργανώσουν δεδομένα σύμφωνα με κάποιο σύνολο κριτηρίων. Ωστόσο, δεν είναι απαραίτητο τα κριτήρια να έχουν σαφή χαρακτηριστικά.

Τα συστήματα OLAP έχουν βρει την εφαρμογή τους σε πολλά θέματα στρατηγικής διαχείρισης ενός οργανισμού: διαχείριση επιχειρηματικής απόδοσης, στρατηγικός σχεδιασμός, προϋπολογισμός, πρόβλεψη ανάπτυξης, οικονομική αναφορά, ανάλυση εργασίας, προσομοίωση εξωτερικού και εσωτερικού περιβάλλοντος του οργανισμού, αποθήκευση δεδομένων και αναφορά.

Δομή συστήματος OLAP

Η λειτουργία του συστήματος OLAP βασίζεται στην επεξεργασία πολυδιάστατων συστοιχιών δεδομένων. Οι πολυδιάστατοι πίνακες είναι διατεταγμένοι με τέτοιο τρόπο ώστε κάθε στοιχείο του πίνακα να έχει πολλές σχέσεις με άλλα στοιχεία. Για να σχηματιστεί ένας πολυδιάστατος πίνακας, ένα σύστημα OLAP πρέπει να λάβει δεδομένα εισόδου από άλλα συστήματα (π.χ. συστήματα ERP ή CRM) ή μέσω εξωτερικής εισόδου. Ο χρήστης του συστήματος OLAP λαμβάνει τα απαραίτητα δεδομένα σε δομημένη μορφή σύμφωνα με το αίτημά του. Με βάση την καθορισμένη διαδικασία, μπορείτε να φανταστείτε τη δομή του συστήματος OLAP.

Γενικά, η δομή ενός συστήματος OLAP αποτελείται από τα ακόλουθα στοιχεία:

  • βάση δεδομένων . Η βάση δεδομένων είναι η πηγή πληροφοριών για τη λειτουργία του συστήματος OLAP. Ο τύπος της βάσης δεδομένων εξαρτάται από τον τύπο του συστήματος OLAP και τους αλγόριθμους του διακομιστή OLAP. Κατά κανόνα χρησιμοποιούνται σχεσιακές βάσεις δεδομένων, πολυδιάστατες βάσεις δεδομένων, αποθήκες δεδομένων κ.λπ.
  • Διακομιστής OLAP. Παρέχει διαχείριση της πολυδιάστατης δομής δεδομένων και της σχέσης μεταξύ της βάσης δεδομένων και των χρηστών του συστήματος OLAP.
  • προσαρμοσμένες εφαρμογές. Αυτό το στοιχείο της δομής του συστήματος OLAP διαχειρίζεται τα αιτήματα των χρηστών και δημιουργεί τα αποτελέσματα της πρόσβασης στη βάση δεδομένων (αναφορές, γραφήματα, πίνακες κ.λπ.)

Ανάλογα με τη μέθοδο οργάνωσης, επεξεργασίας και αποθήκευσης δεδομένων, τα συστήματα OLAP μπορούν να εφαρμοστούν τοπικούς υπολογιστέςχρήστες ή χρήση αποκλειστικών διακομιστών.

Υπάρχουν τρεις κύριοι τρόποι αποθήκευσης και επεξεργασίας δεδομένων:

  • τοπικά. Τα δεδομένα φιλοξενούνται στους υπολογιστές των χρηστών. Η επεξεργασία, η ανάλυση και η διαχείριση δεδομένων πραγματοποιείται σε τοπικούς χώρους εργασίας. Αυτή η δομή του συστήματος OLAP έχει σημαντικά μειονεκτήματα που σχετίζονται με την ταχύτητα επεξεργασίας δεδομένων, την ασφάλεια των δεδομένων και την περιορισμένη χρήση πολυδιάστατης ανάλυσης.
  • σχεσιακές βάσεις δεδομένων. Αυτές οι βάσεις δεδομένων χρησιμοποιούνται όταν ένα σύστημα OLAP λειτουργεί μαζί με ένα σύστημα CRM ή ένα σύστημα ERP. Τα δεδομένα αποθηκεύονται στον διακομιστή αυτών των συστημάτων με τη μορφή σχεσιακών βάσεων δεδομένων ή αποθηκών δεδομένων. Ο διακομιστής OLAP έχει πρόσβαση σε αυτές τις βάσεις δεδομένων για να σχηματίσει τις απαραίτητες πολυδιάστατες δομές και να εκτελέσει ανάλυση.
  • πολυδιάστατες βάσεις δεδομένων. Στην περίπτωση αυτή, τα δεδομένα οργανώνονται ως ειδική αποθήκη δεδομένων σε ειδικό διακομιστή. Όλες οι λειτουργίες δεδομένων εκτελούνται σε αυτόν τον διακομιστή, ο οποίος μετατρέπει τα αρχικά δεδομένα σε πολυδιάστατες δομές. Τέτοιες δομές ονομάζονται κύβοι OLAP. Οι πηγές δεδομένων για το σχηματισμό ενός κύβου OLAP είναι σχεσιακές βάσεις δεδομένων ή/και αρχεία πελάτη. Ο διακομιστής δεδομένων εκτελεί προκαταρκτική προετοιμασία και επεξεργασία δεδομένων. Ο διακομιστής OLAP λειτουργεί με κύβο OLAP χωρίς άμεση πρόσβαση σε πηγές δεδομένων (σχεσιακές βάσεις δεδομένων, αρχεία πελάτη κ.λπ.).

Τύποι συστημάτων OLAP

Ανάλογα με τη μέθοδο αποθήκευσης και επεξεργασίας δεδομένων, όλα τα συστήματα OLAP μπορούν να χωριστούν σε τρεις κύριους τύπους.


1. ROLAP (Σχεσιακό OLAP - σχεσιακά συστήματα OLAP) - αυτός ο τύπος συστήματος OLAP λειτουργεί με σχεσιακές βάσεις δεδομένων. Η πρόσβαση στα δεδομένα γίνεται απευθείας στη σχεσιακή βάση δεδομένων. Τα δεδομένα αποθηκεύονται σε σχεσιακούς πίνακες. Οι χρήστες έχουν τη δυνατότητα να εκτελούν πολυδιάστατη ανάλυση όπως στα παραδοσιακά συστήματα OLAP. Αυτό επιτυγχάνεται με τη χρήση εργαλεία SQLκαι ειδικά αιτήματα.

Ένα από τα πλεονεκτήματα του ROLAP είναι η ικανότητα αποτελεσματικότερης επεξεργασίας μεγάλων ποσοτήτων δεδομένων. Ένα άλλο πλεονέκτημα του ROLAP είναι η ικανότητα αποτελεσματικής επεξεργασίας τόσο αριθμητικών όσο και δεδομένων κειμένου.

Τα μειονεκτήματα του ROLAP περιλαμβάνουν χαμηλή απόδοση (σε σύγκριση με τα παραδοσιακά συστήματα OLAP), επειδή Η επεξεργασία δεδομένων πραγματοποιείται από τον διακομιστή OLAP. Ένα άλλο μειονέκτημα είναι ο περιορισμός της λειτουργικότητας λόγω της χρήσης SQL.


2. MOLAP (Πολυδιάστατα συστήματα OLAP - πολυδιάστατα συστήματα OLAP). Αυτός ο τύπος συστημάτων OLAP ανήκει στα παραδοσιακά συστήματα. Η διαφορά μεταξύ ενός παραδοσιακού συστήματος OLAP και άλλων συστημάτων έγκειται στην προκαταρκτική προετοιμασία και βελτιστοποίηση των δεδομένων. Αυτά τα συστήματα, κατά κανόνα, χρησιμοποιούν έναν αποκλειστικό διακομιστή στον οποίο τα δεδομένα είναι προεπεξεργασμένα. Τα δεδομένα δημιουργούνται σε πολυδιάστατους πίνακες- Κύβοι OLAP.

Τα συστήματα MOLAP είναι τα πιο αποτελεσματικά στην επεξεργασία δεδομένων. διευκολύνουν την αναδιοργάνωση και τη δομή δεδομένων για διαφορετικά αιτήματα χρηστών. Τα αναλυτικά εργαλεία MOLAP σάς επιτρέπουν να εκτελείτε πολύπλοκους υπολογισμούς. Ένα άλλο πλεονέκτημα του MOLAP είναι η δυνατότητα γρήγορης δημιουργίας ερωτημάτων και λήψης αποτελεσμάτων. Αυτό εξασφαλίζεται από τον προκαταρκτικό σχηματισμό κύβων OLAP.

Τα μειονεκτήματα του συστήματος MOLAP περιλαμβάνουν τον περιορισμό του όγκου των επεξεργασμένων δεδομένων και τον πλεονασμό δεδομένων, επειδή για το σχηματισμό πολυδιάστατων κύβων, σε διάφορες πτυχές, τα δεδομένα πρέπει να αντιγραφούν.


3. HOLAP (Hybrid OLAP - hybrid OLAP systems). Τα υβριδικά συστήματα OLAP είναι ένας συνδυασμός συστημάτων ROLAP και MOLAP. Τα υβριδικά συστήματα προσπάθησαν να συνδυάσουν τα πλεονεκτήματα δύο συστημάτων: τη χρήση πολυδιάστατων βάσεων δεδομένων και τη σχεσιακή διαχείριση βάσεων δεδομένων. Τα συστήματα HOLAP σάς επιτρέπουν να αποθηκεύετε μεγάλο όγκο δεδομένων σε σχεσιακούς πίνακες και τα επεξεργασμένα δεδομένα τοποθετούνται σε προκατασκευασμένους πολυδιάστατους κύβους OLAP. Τα πλεονεκτήματα αυτού του είδους συστήματος είναι η επεκτασιμότητα δεδομένων, η γρήγορη επεξεργασία δεδομένων και η ευέλικτη πρόσβαση σε πηγές δεδομένων.

Υπάρχουν άλλοι τύποι συστημάτων OLAP, αλλά είναι περισσότερο μια κίνηση μάρκετινγκ από τους κατασκευαστές παρά ένας ανεξάρτητος τύπος συστήματος OLAP.

Αυτοί οι τύποι περιλαμβάνουν:

  • WOLAP (Web OLAP). Προβολή του συστήματος OLAP με υποστήριξη διεπαφή ιστού. Αυτά τα συστήματα OLAP έχουν τη δυνατότητα πρόσβασης σε βάσεις δεδομένων μέσω μιας διεπαφής ιστού.
  • DOLAP (Desktop OLAP). Αυτός ο τύπος συστήματος OLAP επιτρέπει στους χρήστες να κάνουν λήψη μιας βάσης δεδομένων σε έναν τοπικό χώρο εργασίας και να εργαστούν μαζί της τοπικά.
  • MobileOLAP. Αυτή είναι μια δυνατότητα των συστημάτων OLAP που σας επιτρέπει να εργάζεστε με τη βάση δεδομένων εξ αποστάσεως χρησιμοποιώντας κινητές συσκευές.
  • SOLAP (Χωρική OLAP). Αυτός ο τύπος συστημάτων OLAP έχει σχεδιαστεί για την επεξεργασία χωρικών δεδομένων. Εμφανίστηκε ως αποτέλεσμα της ενοποίησης συστημάτων γεωγραφικών πληροφοριών και συστημάτων OLAP. Αυτά τα συστήματα σάς επιτρέπουν να επεξεργάζεστε δεδομένα όχι μόνο σε αλφαριθμητική μορφή, αλλά και με τη μορφή οπτικών αντικειμένων και διανυσμάτων.

Πλεονεκτήματα ενός συστήματος OLAP

Η χρήση ενός συστήματος OLAP δίνει στον οργανισμό τη δυνατότητα να προβλέψει και να αναλύσει διάφορες καταστάσεις που σχετίζονται με τις τρέχουσες δραστηριότητες και τις προοπτικές ανάπτυξης. Αυτά τα συστήματα μπορούν να θεωρηθούν ως συμπληρωματικά των συστημάτων αυτοματισμού σε επίπεδο επιχείρησης. Όλα τα πλεονεκτήματα των συστημάτων OLAP εξαρτώνται άμεσα από την ακρίβεια, την αξιοπιστία και τον όγκο των δεδομένων προέλευσης.

Τα κύρια πλεονεκτήματα του συστήματος OLAP είναι:

  • συνοχή γενικές πληροφορίεςκαι τα αποτελέσματα της ανάλυσης. Με την παρουσία ενός συστήματος OLAP, είναι πάντα δυνατός ο εντοπισμός της πηγής πληροφοριών και ο προσδιορισμός της λογικής σχέσης μεταξύ των αποτελεσμάτων που λαμβάνονται και των δεδομένων πηγής. Η υποκειμενικότητα των αποτελεσμάτων της ανάλυσης μειώνεται.
  • διεξαγωγή πολυμεταβλητής ανάλυσης. Η χρήση ενός συστήματος OLAP σάς επιτρέπει να λαμβάνετε πολλά σενάρια για την ανάπτυξη γεγονότων με βάση ένα σύνολο αρχικών δεδομένων. Λόγω των εργαλείων ανάλυσης, είναι δυνατή η μοντελοποίηση καταστάσεων σύμφωνα με την αρχή «τι θα συμβεί εάν».
  • έλεγχος λεπτομέρειας. Η λεπτομέρεια της παρουσίασης των αποτελεσμάτων μπορεί να διαφέρει ανάλογα με τις ανάγκες των χρηστών. Σε αυτήν την περίπτωση, δεν χρειάζεται να πραγματοποιήσετε πολύπλοκες ρυθμίσεις συστήματος και να επαναλάβετε τους υπολογισμούς. Η αναφορά μπορεί να περιέχει ακριβώς τις πληροφορίες που είναι απαραίτητες για τη λήψη αποφάσεων.
  • αποκαλύπτοντας κρυφές εξαρτήσεις. Χτίζοντας πολυδιάστατες σχέσεις, καθίσταται δυνατός ο εντοπισμός και ο εντοπισμός κρυφών εξαρτήσεων σε διάφορες διαδικασίες ή καταστάσεις που επηρεάζουν τις παραγωγικές δραστηριότητες.
  • δημιουργία μιας ενιαίας πλατφόρμας. Μέσω της χρήσης ενός συστήματος OLAP, καθίσταται δυνατή η δημιουργία μιας ενιαίας πλατφόρμας για όλες τις διαδικασίες πρόβλεψης και ανάλυσης σε μια επιχείρηση. Συγκεκριμένα, τα δεδομένα του συστήματος OLAP αποτελούν τη βάση για την κατασκευή προβλέψεων προϋπολογισμού, προβλέψεων πωλήσεων, προβλέψεων αγορών, στρατηγικών σχεδίων ανάπτυξης κ.λπ.

Η έννοια της πολυδιάστατης ανάλυσης δεδομένων συνδέεται στενά με τη λειτουργική ανάλυση, η οποία εκτελείται μέσω συστημάτων OLAP.

Το OLAP (On-Line Analytical Processing) είναι μια τεχνολογία για την ηλεκτρονική επεξεργασία αναλυτικών δεδομένων που χρησιμοποιεί μεθόδους και εργαλεία για τη συλλογή, αποθήκευση και ανάλυση πολυδιάστατων δεδομένων προκειμένου να υποστηρίξει τις διαδικασίες λήψης αποφάσεων.

Ο κύριος σκοπός των συστημάτων OLAP είναι να υποστηρίζουν αναλυτικές δραστηριότητες, αυθαίρετα (συχνά χρησιμοποιείται ο όρος ad-hoc) αιτήματα από χρήστες αναλυτών. Ο σκοπός της ανάλυσης OLAP είναι να ελέγξει τις αναδυόμενες υποθέσεις.

Στην απαρχή της τεχνολογίας OLAP είναι ο ιδρυτής της σχεσιακής προσέγγισης E. Codd. Το 1993, δημοσίευσε ένα άρθρο με τίτλο «OLAP for Analyst Users: What It Should Be». Αυτό το έγγραφο περιγράφει τις βασικές έννοιες της ηλεκτρονικής αναλυτικής επεξεργασίας και προσδιορίζει τις ακόλουθες 12 απαιτήσεις που πρέπει να πληρούνται από προϊόντα που επιτρέπουν την ηλεκτρονική αναλυτική επεξεργασία. Tokmakov G.P. Βάση δεδομένων. Έννοια βάσης δεδομένων, μοντέλο σχεσιακών δεδομένων, Γλώσσες SQL. S. 51

Παρακάτω παρατίθενται οι 12 κανόνες που περιέγραψε ο Codd και οι οποίοι ορίζουν το OLAP.

1. Πολυδιάστατο - OLAP-σύστημα σε εννοιολογικό επίπεδο θα πρέπει να παρουσιάζει δεδομένα με τη μορφή ενός πολυδιάστατου μοντέλου, το οποίο απλοποιεί τις διαδικασίες ανάλυσης και αντίληψης των πληροφοριών.

2. Διαφάνεια - Ένα σύστημα OLAP θα πρέπει να κρύβει από τον χρήστη την πραγματική υλοποίηση ενός πολυδιάστατου μοντέλου, τη μέθοδο οργάνωσης, τις πηγές, τα εργαλεία επεξεργασίας και αποθήκευσης.

3. Διαθεσιμότητα -- Ένα σύστημα OLAP πρέπει να παρέχει στο χρήστη ένα ενιαίο, συνεπές και συνεπές μοντέλο δεδομένων, που να επιτρέπει την πρόσβαση στα δεδομένα ανεξάρτητα από τον τρόπο ή τον τόπο αποθήκευσης τους.

4. Συνεπής απόδοση ανάπτυξης αναφορών -- Η απόδοση των συστημάτων OLAP δεν θα πρέπει να μειωθεί σημαντικά καθώς αυξάνεται ο αριθμός των διαστάσεων που αναλύονται.

5. Αρχιτεκτονική πελάτη-διακομιστή -- Ένα σύστημα OLAP πρέπει να μπορεί να λειτουργεί σε περιβάλλον πελάτη-διακομιστή, όπως Τα περισσότερα από τα δεδομένα που σήμερα πρέπει να υποβληθούν σε ηλεκτρονική αναλυτική επεξεργασία αποθηκεύονται διανεμημένα. Η κύρια ιδέα εδώ είναι ότι το στοιχείο διακομιστή του εργαλείου OLAP θα πρέπει να είναι αρκετά έξυπνο ώστε να επιτρέπει τη δημιουργία ενός κοινού εννοιολογικού σχήματος που βασίζεται στη γενίκευση και την ενοποίηση διαφόρων λογικών και φυσικών εταιρικών σχημάτων βάσεων δεδομένων για να παρέχει ένα διαφανές αποτέλεσμα.

6. Ισότητα διαστάσεων -- Ένα σύστημα OLAP πρέπει να υποστηρίζει ένα πολυδιάστατο μοντέλο στο οποίο όλες οι διαστάσεις είναι ίσες. Αν είναι απαραίτητο πρόσθετα χαρακτηριστικάμπορεί να δοθεί σε μεμονωμένες διαστάσεις, αλλά αυτή η επιλογή πρέπει να δοθεί σε οποιαδήποτε διάσταση.

7. Δυναμική διαχείριση αραιών πινάκων -- Ένα σύστημα OLAP πρέπει να παρέχει βέλτιστο χειρισμό αραιών πινάκων. Το ποσοστό πρόσβασης πρέπει να διατηρείται ανεξάρτητα από τη θέση των κελιών δεδομένων και να είναι σταθερή τιμή για μοντέλα με διαφορετικό αριθμό διαστάσεων και διαφορετικό βαθμό αραιότητας δεδομένων.

8. Υποστήριξη για λειτουργία πολλών χρηστών - Το σύστημα OLAP θα πρέπει να παρέχει τη δυνατότητα να λειτουργεί με πολλούς χρήστες μαζί με ένα αναλυτικό μοντέλο ή να δημιουργεί διαφορετικά μοντέλα για αυτούς από ένα μόνο δεδομένα. Ταυτόχρονα, είναι δυνατή τόσο η ανάγνωση όσο και η εγγραφή δεδομένων, επομένως το σύστημα πρέπει να διασφαλίζει την ακεραιότητα και την ασφάλειά τους.

9. Απεριόριστες διασταυρούμενες λειτουργίες -- Ένα σύστημα OLAP πρέπει να διασφαλίζει ότι οι λειτουργικές σχέσεις που περιγράφονται χρησιμοποιώντας μια συγκεκριμένη επίσημη γλώσσα μεταξύ κυψελών υπερκύβου διατηρούνται κατά την εκτέλεση οποιωνδήποτε λειτουργιών κοπής, περιστροφής, ενοποίησης ή διάτρησης. Το σύστημα πρέπει να πραγματοποιήσει ανεξάρτητα (αυτόματα) τη μετατροπή εδραιωμένες σχέσειςχωρίς να απαιτείται από τον χρήστη να τα παρακάμψει.

10. Διαισθητικός χειρισμός δεδομένων -- Ένα σύστημα OLAP πρέπει να παρέχει έναν τρόπο εκτέλεσης λειτουργιών κοπής, περιστροφής, ενοποίησης και διάτρησης σε έναν υπερκύβο χωρίς ο χρήστης να χρειάζεται να κάνει πολλές εργασίες διεπαφής χρήστη. Οι διαστάσεις που ορίζονται στο αναλυτικό μοντέλο πρέπει να περιέχουν όλες τις απαραίτητες πληροφορίες για την εκτέλεση των παραπάνω πράξεων.

11. Ευέλικτες επιλογές αναφοράς -- Το σύστημα OLAP πρέπει να υποστηρίζει διάφορους τρόπουςοπτικοποίηση δεδομένων, π.χ. Οι εκθέσεις θα πρέπει να υποβάλλονται με κάθε δυνατό προσανατολισμό. Τα εργαλεία αναφοράς θα πρέπει να αντιπροσωπεύουν συνθετικά δεδομένα ή πληροφορίες που προκύπτουν από το μοντέλο δεδομένων με οποιονδήποτε πιθανό προσανατολισμό. Αυτό σημαίνει ότι οι σειρές, οι στήλες ή οι σελίδες πρέπει να εμφανίζουν από 0 έως Ν διαστάσεις ταυτόχρονα, όπου Ν-- αριθμόςμετρήσεις ολόκληρου του αναλυτικού μοντέλου. Επιπλέον, κάθε ιδιότητα περιεχομένου που εμφανίζεται σε μία ανάρτηση, στήλη ή σελίδα πρέπει να επιτρέπει την εμφάνιση οποιουδήποτε υποσυνόλου των στοιχείων (τιμών) που περιέχονται στην ιδιότητα με οποιαδήποτε σειρά.

12. Απεριόριστες διαστάσεις και αριθμός επιπέδων συνάθροισης - Μια μελέτη σχετικά με τον πιθανό αριθμό απαιτούμενων διαστάσεων που απαιτούνται σε ένα αναλυτικό μοντέλο έδειξε ότι έως και 19 διαστάσεις μπορούν να χρησιμοποιηθούν ταυτόχρονα. Εξ ου και η ισχυρή σύσταση ότι το αναλυτικό εργαλείο μπορεί να παρέχει τουλάχιστον 15 και κατά προτίμηση 20 μετρήσεις ταυτόχρονα. Επιπλέον, καθεμία από τις κοινές διαστάσεις δεν πρέπει να περιορίζεται από τον αριθμό των επιπέδων των διαδρομών συγκέντρωσης και ενοποίησης που ορίζει ο χρήστης-αναλυτής.

Πρόσθετοι κανόνες του Codd.

Το σύνολο αυτών των απαιτήσεων, το οποίο χρησίμευσε ως ο de facto ορισμός του OLAP, προκαλεί αρκετά συχνά διάφορες επικρίσεις, για παράδειγμα, οι κανόνες 1, 2, 3, 6 είναι απαιτήσεις και οι κανόνες 10, 11 είναι ανεπίσημες επιθυμίες. Tokmakov G.P. Βάση δεδομένων. Έννοια βάσης δεδομένων, μοντέλο σχεσιακών δεδομένων, γλώσσες SQL. Σελ. 68 Έτσι, οι αναφερόμενες 12 απαιτήσεις του Codd δεν σας επιτρέπουν να ορίσετε με ακρίβεια το OLAP. Το 1995, ο Codd πρόσθεσε τους ακόλουθους έξι κανόνες στη λίστα:

13. Εξαγωγή παρτίδας έναντι ερμηνείας -- Ένα σύστημα OLAP πρέπει να είναι εξίσου αποτελεσματικό στο να παρέχει πρόσβαση τόσο σε εσωτερικά όσο και σε εξωτερικά δεδομένα.

14. Υποστήριξη για όλα τα μοντέλα ανάλυσης OLAP -- Ένα σύστημα OLAP πρέπει να υποστηρίζει και τα τέσσερα μοντέλα ανάλυσης δεδομένων που ορίζονται από τον Codd: κατηγορηματικά, ερμηνευτικά, εικαστικά και στερεότυπα.

15. Χειρισμός αποκανονικοποιημένων δεδομένων -- Ένα σύστημα OLAP πρέπει να ενσωματωθεί με αποκανονικές πηγές δεδομένων. Οι τροποποιήσεις σε δεδομένα που γίνονται σε περιβάλλον OLAP δεν θα πρέπει να έχουν ως αποτέλεσμα αλλαγές στα δεδομένα που είναι αποθηκευμένα στα αρχικά εξωτερικά συστήματα.

16. Αποθήκευση αποτελεσμάτων OLAP: διατήρησή τους χωριστά από τα αρχικά δεδομένα -- Ένα σύστημα OLAP που λειτουργεί σε λειτουργία ανάγνωσης-εγγραφής, μετά την τροποποίηση των αρχικών δεδομένων, πρέπει να αποθηκεύσει τα αποτελέσματα ξεχωριστά. Με άλλα λόγια, διασφαλίζεται η ασφάλεια των δεδομένων προέλευσης.

17. Εξαίρεση τιμών που λείπουν-- Κατά την παρουσίαση δεδομένων στον χρήστη, ένα σύστημα OLAP πρέπει να απορρίψει όλες τις τιμές που λείπουν. Με άλλα λόγια, οι τιμές που λείπουν πρέπει να είναι διαφορετικές από τις μηδενικές τιμές.

18 Χειρισμός τιμών που λείπουν -- Ένα σύστημα OLAP πρέπει να αγνοεί όλες τις τιμές που λείπουν, ανεξάρτητα από την πηγή τους. Αυτό το χαρακτηριστικό σχετίζεται με τον 17ο κανόνα.

Επιπλέον, ο Codd έσπασε και τους 18 κανόνες στις ακόλουθες τέσσερις ομάδες, αποκαλώντας τους χαρακτηριστικά. Αυτές οι ομάδες ονομάστηκαν B, S, R και D.

Τα κύρια χαρακτηριστικά (Β) περιλαμβάνουν τους ακόλουθους κανόνες:

Πολυδιάστατη εννοιολογική αναπαράσταση δεδομένων (κανόνας 1).

Διαισθητικός χειρισμός δεδομένων (κανόνας 10).

Διαθεσιμότητα (κανόνας 3).

Εξαγωγή παρτίδας έναντι ερμηνείας (κανόνας 13).

Υποστήριξη για όλα τα μοντέλα ανάλυσης OLAP (κανόνας 14).

Αρχιτεκτονική "πελάτης-διακομιστής" (κανόνας 5).

Διαφάνεια (κανόνας 2).

Υποστήριξη για πολλούς παίκτες (κανόνας 8)

Ειδικά Χαρακτηριστικά (S):

Επεξεργασία μη κανονικοποιημένων δεδομένων (κανόνας 15).

Αποθήκευση αποτελεσμάτων OLAP: αποθήκευση τους χωριστά από τα αρχικά δεδομένα (κανόνας 16).

Εξαίρεση τιμών που λείπουν (κανόνας 17).

Χειρισμός τιμών που λείπουν (κανόνας 18). Χαρακτηριστικά αναφοράς (R):

Ευελιξία στη δημιουργία αναφορών (κανόνας 11).

Αναφορά προτύπου απόδοσης (κανόνας 4).

Αυτόματη διαμόρφωση φυσικού επιπέδου (τροποποιημένος αρχικός κανόνας 7).

Έλεγχος μέτρησης (D):

Καθολικότητα των μετρήσεων (κανόνας 6).

Απεριόριστος αριθμός διαστάσεων και επιπέδων συγκέντρωσης (κανόνας 12).

Απεριόριστες λειτουργίες μεταξύ των διαστάσεων (κανόνας 9).