Online Analytical Processing


Online Analytical Processing

Online Analytical Processing (OLAP) wird neben dem Data-Mining zu den Methoden der analytischen Informationssysteme gezählt. OLAP wird weiterhin den hypothesengestützten Analysemethoden zugeordnet. Der Analyst muss vor der eigentlichen Untersuchung wissen, welche Anfragen er an das OLAP-System stellen möchte. Seine Hypothese wird dann durch das Analyseergebnis bestätigt oder widerlegt.

OLAP-Systeme beziehen ihre Daten entweder aus den operationalen Datenbeständen eines Unternehmens oder aus einem Data-Warehouse (Datenlager). Hierdurch wird verhindert, dass die Analysedaten mit den transaktionsorientierten Datenbeständen in Kontakt kommen, und die Leistungsfähigkeit beeinträchtigt wird. Ebenso ist die Leistung eines OLAP-Systems von der verwendeten Datenhaltungsform und deren Anbindung an den Analyse-Client abhängig.

Im Gegensatz zum Online-Transaction-Processing (OLTP) steht hier die Durchführung komplexer Analysevorhaben im Vordergrund, welche ein sehr hohes Datenaufkommen verursachen. Das Ziel ist, durch multidimensionale Betrachtung dieser Daten ein entscheidungsunterstützendes Analyseergebnis zu gewinnen. Als besondere Zielgruppe wird hier das Management in seiner Rolle als Entscheidungsträger genannt.

Die OLAP zugrunde liegende Struktur ist ein OLAP-Würfel (englisch cube), der aus der operationalen Datenbank erstellt wurde. Dieser ist meist nach dem Sternschema aufgebaut, mit einer Faktentabelle und den jeweiligen Dimensionstabellen.

Inhaltsverzeichnis

Arten

Man unterscheidet zwischen ROLAP („relationales OLAP“), das auf eine relationale Datenbank zugreift, und MOLAP („multidimensionales OLAP“), das auf eine multidimensionale Datenbank zugreift. HOLAP („H“ für „Hybrid“) ist eine Zwischenform zwischen ROLAP und MOLAP. Jeder Typ hat Vor- und Nachteile.

MOLAP speichert Zahlen in Form von Datenpunkten. Dadurch hat MOLAP einen Performance-Vorteil gegenüber OLAP-Systemen, die Daten auf relationaler Basis als Datensätze speichern.

Vorausberechnete OLAP-Systeme weisen eine bessere Performance auf als OLAP-Systeme, die zur Laufzeit rechnen.

In-Memory-Systeme weisen eine bessere Performance auf als festplattenbasierte Systeme, müssen jedoch mit dem Speicher sorgfältig haushalten.

ROLAP skaliert besser, ist dafür aber je nach Performance der eingesetzten relationalen Quellen langsamer als MOLAP. Dies liegt bei ROLAP daran, dass die Daten neben den teils vielleicht schon vorausberechneten Aggregationen in einer vielseitigen, aber eventuell langsameren relationalen Datenbank gespeichert vorliegen, während diese Daten bei MOLAP in geeigneter, schnell zugänglicher Form als Datenpunkt vorliegen. Ein Vorteil von ROLAP wiederum ist, dass weniger Speicherplatz benötigt wird, weil Daten aus vorhandenen Datenbanken abgefragt werden. Dies bietet sich vor allem bei der Auswertung auf Basis von Massendaten in komplexen Data-Warehouse-Umgebungen an.

HOLAP bietet oft einen guten Kompromiss aus ROLAP und MOLAP.

Ein vierter Architekturtyp wird mit DOLAP (D für Desktop) bezeichnet. Hierbei werden die Basisdaten zunächst lokal in den Analyseclient importiert, um eine lokale Analyse vollziehen zu können. Als Nachteil kann hier allerdings eine eventuell zu schwache Hardwareauslegung gesehen werden. Zeitintensiv bei OLAP ist nicht die Auswertung der Daten, sondern die Erstellung und Auffrischung der angelegten Cubes.

Einen weiteren, neuerdings wieder sehr populären Typ stellt memory-based OLAP dar. Hier werden alle Daten im RAM gehalten und alle Werte in Echtzeit berechnet. Diese Technik war in der Vergangenheit hinsichtlich der Datenmengen limitiert. Aufgrund der zunehmenden Verbreitung von 64-Bit Rechner-Architekturen (vgl. 4-GB-Grenze) können jedoch heutzutage auch große Datenmengen mit memory-based OLAP analysiert werden.

OLAP-Werkzeuge werden häufig durch Multidimensionalität charakterisiert. Durch diese Multidimensionalität sollen relevante betriebswirtschaftliche Kennzahlen (bspw. Umsatz- oder Kostengrößen) anhand unterschiedlicher Dimensionen (zum Beispiel Kunden, Regionen, Zeit) mehrdimensional betrachtet und bewertet werden können. Zur bildlichen Darstellung werden OLAP-Würfel verwendet. Diese Würfel sind in verschiedene Dimensionen unterteilt, die wiederum in Elemente untergliedert sind. Diese Elemente bilden einen Verdichtungsbaum oder allgemeiner einen nichtzyklischen gerichteten Graphen, welcher die Aggregationen darstellt.

Anforderungen an ein OLAP-System

12 Regeln nach Codd

Der OLAP-Begriff wurde 1993 von Edgar F. Codd geprägt. Er formulierte zunächst 12 Regeln, die er bis zuletzt auf 18 Regeln erweitert hat. Diese Evaluierungsregeln stellten die erste Anforderungsliste an ein OLAP-System dar. Die Bedeutung der Regeln für die Bewertung eines OLAP-Systems kann heute nicht mehr als besonders hoch eingestuft werden. Dies liegt im Besonderen an ihrer stark anwendungsbezogenen Ausrichtung und ihren teils umstrittenen Regeln.[1] Die Regeln waren aus der Zusammenarbeit mit dem Unternehmen Arbor entstanden, das kurz zuvor die OLAP-Datenbank Essbase vorgestellt hatte – Essbase wird heute durch Oracle unter dem Produktnamen Hyperion Solutions weiterentwickelt und vertrieben.

Wegen ihres Pionierstatus werden die Regeln gern zitiert:[2]

  1. Information Rule (Darstellung von Informationen): Alle Informationen werden durch Werte in Tabellen dargestellt.
  2. Guaranteed Access Rule (Garantierter Zugriff): Jeder Wert muss über Tabellenname, Spaltenname und Wert des Primärschlüssels zugreifbar sein.
  3. Systematic Treatment of Null Values (Systematische Behandlung von Null-Werten): Fehlende Werte werden unabhängig vom Datentyp mit NULL dargestellt.
  4. Dynamic On-line Catalog Based on the Relational Model (Online-Datenkatalog): Die Datenbank und ihre Inhalte werden in einem Online-Datenkatalog (Data Dictionary) in Form von Tabellen beschrieben.
  5. Comprehensive Data Sublanguage Rule (Metasprache): Das relationale System unterstützt Datendefinition, Datenmanipulation und Datenabfrage mit einer einheitlichen Sprache.
  6. View Updating Rule (Aktualisierung von Sichten): Sofern theoretisch möglich, müssen Inhalte von Basistabellen auch über Sichten änderbar sein.
  7. High-level Insert, Update and Delete (Parallele Datenmanipulation): Innerhalb einer Operation können beliebig viele Tupel bearbeitet werden.
  8. Physical Data Independence (Physische Datenunabhängigkeit): Physische Ebene (Speicherung) und konzeptuelles Schema der Datenbank sind unabhängig voneinander.
  9. Logical Data Independence (Logische Datenunabhängigkeit): Die Sicht einer Anwendung und das konzeptuelle Schema der Datenbank sind unabhängig voneinander.
  10. Integrity Independence (Unabhängigkeit der Integrität): Unumgängliche Regeln (Integritätsbedingungen) müssen im Online-Datenkatalog gespeichert werden können.
  11. Distribution Independence (Verteilungsunabhängigkeit): Logische und Physische Datenunabhängigkeit müssen ebenso für verteilte Datenbanken gelten.
  12. Nonsubversion Rule (Kein Unterlaufen der Integrität): Integritätsbedingungen dürfen auf keinen Fall umgangen werden, auch nicht mit Hilfe von niederen Programmiersprachen.

FASMI-Regeln nach Pendse und Creeth

Pendse und Creeth stellten 1995 (Lit.: Pendse) unter dem Akronym FASMI fünf herstellerunabhängige Evaluierungsregeln auf, um damit das OLAP-Konzept zu beschreiben. FASMI steht für „Fast Analysis of Shared Multidimensional Information“ und besagt im Einzelnen:

  1. Fast: Abfragen sollen durchschnittlich fünf Sekunden dauern dürfen. Dabei sollen einfache Abfragen nicht länger als eine Sekunde und nur wenige, komplexere Abfragen bis zu 20 Sekunden Verarbeitungszeit beanspruchen.
  2. Analysis: Ein OLAP-System soll jegliche benötigte Logik bewältigen können. Dabei soll die Definition einer komplexeren Analyseabfrage durch den Anwender mit wenig Programmieraufwand zu realisieren sein.
  3. Shared: Ein OLAP-System soll für den Mehrbenutzerbetrieb ausgelegt sein. Dies bedingt eine Verfügbarkeit geeigneter Zugriffsschutzmechanismen.
  4. Multidimensional: Als Hauptkriterium fordern Pendse und Creeth eine mehrdimensionale Strukturierung der Daten mit voller Unterstützung der Dimensionshierarchien.
  5. Information: Bei der Analyse sollen einem Anwender alle benötigten Daten transparent zur Verfügung stehen. Eine Analyse darf nicht durch Beschränkungen des OLAP-Systems beeinflusst werden.

Zusammenfassend lässt sich feststellen, dass die FASMI-Regeln stärker auf Benutzeranforderungen als auf technische Anforderungen eingehen. Insgesamt sind sie allerdings weniger spezifisch als die Regeln nach Codd, deswegen können nach dieser Definition wesentlich mehr Systeme dem OLAP zugeordnet werden.

Marktübersicht

In The OLAP Report 2006[3] teilt sich der internationale OLAP-Markt wie folgt auf:

Anbieter Marktanteil Bemerkung
Microsoft Corporation 31,6 %
Hyperion Solutions 18,9 % inzwischen von Oracle übernommen
Cognos 12,9 % inzwischen von IBM übernommen
Business Objects 7,3 % inzwischen von SAP übernommen
MicroStrategy 7,3 %
SAP AG 5,8 %
Cartesis 3,7 % inzwischen von Business Objects übernommen, Business Objects dann von SAP übernommen
Applix 3,6 % inzwischen von Cognos übernommen, Cognos dann von IBM übernommen
Infor Global Solutions 3,5 %
Oracle Corporation 2,8 %
Digital Equipment 0,2 % inzwischen von HP übernommen

Siehe auch

Literatur

  • Nils Clausen: OLAP – Multidimensionale Datenbanken. Addison-Wesley-Longman, Bonn 1998, ISBN 3-8273-1402-X.
  • Edgar F. Codd, S. B. Codd, C. T. Salley: Providing OLAP to User-Analysts: An IT Mandate. Codd & Associates, Ann Arbor/Michigan 1993.
  • Bernd Held, Hartmut Erb: Advanced Controlling mit Excel. Unternehmenssteuerung mit OLAP und PALO. Franzis, Poing 2006, ISBN 978-3-7723-7585-9.
  • Hartmut Messerschmidt, Kai Schweinsberg: OLAP mit dem SQL-Server. Eine Einführung in Theorie und Praxis. dpunkt, Heidelberg 2003, ISBN 3-89864-240-2.
  • Nigel Pendse, Richard Creeth: The OLAP Report. In: Business Intelligence. 1995.
  • Carsten Bange u. a.: OLAP & BI - 8 multidimensionale Datenbanken und 17 Reporting und Analyse-Werkzeuge im Vergleich. Oxygon Verlag, München 2005, ISBN 3-93781-805-7.

Weblinks

Wiktionary Wiktionary: OLAP – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Einzelnachweise

  1. Quelle fehlt!
  2. Lore Kern-Bausch, Mario Jeckle: Taschenbuch der Informatik. Datenbanken. 5 Auflage. Fachbuchverlag Leipzig, 2004, ISBN 3-446-22584-6.
  3. Nigel Pendse: Market share analysis. The OLAP market grew faster than predicted in 2006. In: The OLAP Report. 10. April 2007, abgerufen am 10. Mai 2007.

Wikimedia Foundation.

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Online Analytical Processing — Online Analytical Processing,   OLAP …   Universal-Lexikon

  • Online analytical processing — In computing, online analytical processing, or OLAP (  /ˈoʊlæ …   Wikipedia

  • Online Analytical Processing — En informatique, et plus particulièrement dans le domaine des bases de données, le traitement analytique en ligne (anglais online analytical processing abr. OLAP) est un type d application informatique orienté vers l analyse sur le champ d… …   Wikipédia en Français

  • online analytical processing — category of software programs designed to enable many types of analyses of data stored in a database, OLAP (Computers) …   English contemporary dictionary

  • online analytical processing —    Abbreviated OLAP. A category of software used to analyze historical business data to find previously hidden patterns.    Analysts use OLAP software to view data in a multidimensional form, rather than in the more usual two dimensional row and… …   Dictionary of networking

  • Online Analytical Processing Database — Online Analytical Processing Database,   OLAP Datenbank …   Universal-Lexikon

  • Online Analytical Processing (OLAP) — Konzept für die im ⇡ Dialogbetrieb realisierte Verdichtung und Darstellung von managementrelevanten Daten aus einem Data Warehouse. Bei den Daten handelt es sich um Faktendaten, wie z.B. Umsatz oder Kostenkennzahlen, denen eine Vielzahl von… …   Lexikon der Economics

  • Online transaction processing — Online transaction processing, or OLTP, refers to a class of systems that facilitate and manage transaction oriented applications, typically for data entry and retrieval transaction processing. The term is somewhat ambiguous; some understand a… …   Wikipedia

  • Online Transaction Processing — (OLTP), Onlinetransaktionsverarbeitung, bezeichnet ein Benutzungsparadigma von Datenbanksystemen und Geschäftsanwendungen, bei dem die Verarbeitung von Transaktionen im Vordergrund steht. Während früher Batch Verarbeitung gebräuchlich war, und… …   Deutsch Wikipedia

  • Online Transaction Processing (OLTP) — im ⇡ Dialogbetrieb ablaufende Massendatenverarbeitung in operativen DV Systemen, bei der betriebswirtschaftliche ⇡ Transaktionen erfasst und verarbeitet werden. Gegensatz: ⇡ Online Analytical Processing …   Lexikon der Economics