• Überblick bewahren
    • Technik beherrschen
    • Werte schaffen

Point of Views

SAP HANA

Die meisten Datenbanksysteme basieren immer noch auf schon lange etablierten Konzepten, der Spielraum für Performance-Verbesserungen ist eher gering geworden. Hier kommen In-Memory Databases ins Spiel

Read more ...

SAP AIF

Das SAP AIF schließt die Lücke der verstreuten Interface-Technologien und bietet ein einheitliches Framework ...

Read more ...

SAP OOP

Seit Mitte der 1980er Jahre wurde das Konzept der objektorientierten Programmierung (kurz: OOP) zunehmend populär ...

Read more ...

Einleitung

Die Computertechnik entwickelt sich rasant weiter: Immer mehr Rechenkerne und Speicher, immer kleinere Strukturen und immer mehr Daten. Dagegen basieren die meisten Datenbanksysteme immer noch auf schon lange etablierten Konzepten, der Spielraum für Performance-Verbesserungen ist eher gering geworden. Hier kommen In-Memory Databases ins Spiel

Bei der Arbeit mit Datenbanken wird in der Regel zwischen transaktionellen und analytischen Zugriffen unterschieden. Unter transaktionellen Zugriffen versteht man das Einfügen, Ändern oder Löschen von Daten, analytische Zugriffe werten vorhandene Daten aus.

Obwohl heutzutage durch unzählige Sensoren, durch neue Informationstechniken wie das Internet und ähnliches immer mehr Daten in immer kürzerer Zeit generiert werden, skalieren klassische Datenbanksysteme gut genug, um mit der Fülle an transaktionellen Zugriffen zurecht zu kommen.

Riesige Datenmengen führen allerdings zu erheblichem Aufwand bei der Analyse von Daten. Stundenlange Wartezeiten bei komplexen Reports sind keine Seltenheit. Angezeigt werden dann Auswertungen anhand von Daten, die einige Stunden, manchmal auch einige Tage alt sind.

Datenanalysen werden so zu kostenintensiven und dabei recht unflexiblen Prozessen in einem Unternehmen. Oft wird eine Analyse an spezialisierte Datenanalysten delegiert, die den Entscheidungsträgern schließlich - wiederum mit Zeitverzögerung - Zusammenfassungen der Analysen überbringen.

Vor- und Nachteile

Bisherige Datenbanksysteme legen Daten als Reihen im Speicher ab. Eine Reihe entspricht dabei genau einem Datensatz einer bestimmten Tabelle. Somit können Daten in den heutigen Datenspeichern sequentiell am Stück geschrieben oder gelesen werden. Dies ist sehr viel schneller als das ständige Springen zu anderen Speicherbereichen.

Für transaktionelle Zugriffe ist dies auch weiterhin der beste Ansatz. Hier geht es in den meisten Fällen genau darum, ganze Datensätze auszulesen, zu ändern oder zu speichern.

Die Datenanalyse arbeitet aber meist mit einem Großteil der vorhandenen Daten. Dabei sind in der Regel einzelne wenige Attribute eines Datensatzes von Interesse. Diese werden summiert, gemittelt oder anderweitig aggregiert. Bei der Reihen-orientierten Speicherung von Daten, wo einzelne Datensätze im Speicher am Stück gespeichert werden, kann hier nicht sequentiell gelesen werden. Stattdessen müssen unzählige verschiedene Bereiche im Speicher gelesen werden. Der Zeitfaktor ist hierbei enorm, daraus resultieren die oft stundenlangen Laufzeiten von analytischen Reports.

Ein Attribut eines Datensatzes entspricht den Spalten einer bestimmten Tabelle. Legt man die Datensätze im Speicher nicht Reihen-orientiert, sondern Spalten-orientiert ab, so können einzelne Attribute für alle Datensätze ‚am Stück‘, also sequentiell gelesen und aggregiert werden. Der Geschwindigkeitsvorteil ist enorm.

Nun kommt zusätzlich der In-Memory-Effekt zum Tragen:

Computersysteme mit mehreren Terrabyte an Arbeitsspeicher sind heute problemlos realisierbar. Geeignete Kompressionsverfahren und die Unterteilung der Daten in aktive und passive Daten machen es möglich, sämtliche benötigten Daten einer Datenbank im Arbeitsspeicher vorzuhalten. Auch wenn die Zugriffszeiten für Massenspeicher immer kürzer werden: die Zugriffszeiten auf den Arbeitsspeicher sind um ein Vielfaches geringer.

Geeignete Logging-Mechanismen im Massenspeicher sorgen dafür, dass die Daten sicher sind. Der Arbeitsspeicher ist kein permanenter Speicher. Sollte es zu einem Systemfehler, Defekt und folglich zu einem Neustart eines Servers kommen, sind alle Daten im Arbeitsspeicher verloren. Durch im Massenspeicher gesicherte Snapshots und Transaktions-Logs kann die Datenbank allerdings schnell wieder im Arbeitsspeicher aufgebaut werden.

Das macht In-Memory-Datenbanken zu genauso zuverlässigen und sicheren Systemen wie klassische Datenbanken. Nur eben zu erheblich schnelleren.

SAP HANA bietet nun eine Kombination von alten und neuen Konzepten. Daten werden komplett im Arbeitsspeicher sowohl Reihen- als auch Spalten-orientiert gespeichert. Bei transaktionellen Zugriffen wird sequentiell Reihen-orientiert gelesen oder geschrieben, bei analytischen Zugriffen wird sequentiell Spalten-orientiert gelesen.

Von SAP durchgeführte Kundentests zeigen beispielsweise für analytische Zugriffe einen Geschwindigkeitsvorteil von bis zu Faktor 3600 gegenüber herkömmlichen Datenbanksystemen. Natürlich variiert der Vorteil je nach Anwendungsart, Datenmenge und Hardware. Aber selbst bei einem Faktor von ‚nur‘ 1200 reduziert sich beispielsweise die Laufzeit einer analytischen Anfrage von ehemals einer Stunde auf eine Laufzeit von 3 Sekunden. Das kann man zurecht als Echtzeitanalyse bezeichnen.

Fazit

In-Memory Databases beschleunigen vor allem die Datenanalyse dramatisch. Statt stundenlanger Wartezeit auf Analysen von schon wieder veralteten Daten können nun Echtzeitanalysen der aktuellen Daten durchgeführt werden.

Analysen müssen nicht mehr delegiert werden, die Entscheidungsträger im Unternehmen können selbst detailliert und sofort auf gewünschte Informationen zugreifen.

SAP HANA kombiniert etablierte und neue Konzepte und bietet so eine extrem leistungsstarke Basis für neuartige Anwendungen der Datenanalyse. Und ganz nebenbei noch eine zukunftssichere und schnellere Basis für Datentransaktionen.

Kontaktinformation


  Telefon: +49 (2330) 8 488 680
  Telefax: +49 (2330) 8 488 681
   eMail: c.bormann@boremi.de

 Anschrift


boremi GmbH
Zeppelinstr. 53a
58313 Herdecke
 
Copyright (c) boremi GmbH 2014. All rights reserved.
Designed by olwebdesign.com