Suchen

Spaltenorientierte Datenbanken und In-Memory Big Data im Supply Chain Management

| Autor / Redakteur: Anne-Katrin Masuch / Nico Litzel

Big Data wird gemeinhin ungeordnetes Datenvolumen beschrieben, dessen Erfassung, Speicherung, Verwaltung und Analyse eine normale Datenbank nicht bewältigen kann. Allerdings geht es nicht nur um die Menge der enthaltenen Informationen, sondern auch darum, diese aus verschiedenen Blickwinkeln zu strukturieren und zu analysieren.

Firmen zum Thema

Vorteile und Leistungen einer spaltenorientierten Datenbank im Überblick
Vorteile und Leistungen einer spaltenorientierten Datenbank im Überblick
(Bild: Relex)

Big Data bringt nicht nur in Bereichen wie Marketing oder Online-Business Vorteile. Auch traditionelle Zweige, wie Supply Chain Management (SCM), können von strukturierten Big-Data-Lösungen profitieren durch:

  • 1. Mehr Datentransparenz
  • 2. schnelleres, genaueres Leistungs-Monitoring und Ausnahmenidentifizierung
  • 3. Automatisierte Algorithmen
  • 4. Schnellere, genauere Entscheidungsfindung,
  • 5. Akkurate Analysen und Auswertungen

Die Datenmengen in den Firmen wachsen und Unternehmen müssen flexibler und schneller reagieren, um sich zu behaupten. Sie benötigen mehr Geschwindigkeit bei der Datenanalyse. Big Data kann Gewinnmargen um fünf bis 35 Prozent steigern, aber um riesige Datenmengen effektiv einzusetzen und zu analysieren, braucht die Technologie zusätzliche Fähigkeiten: beispielsweise eine spaltenorientierte Datenbank und In-Memory-Computing.

Es gibt zwei Optionen, eine Datenbank einheitlich in einem eindimensionalen Datenstrom anzuordnen: Zeilen- und spaltenorientierte Datenbanken. Um zu verstehen, warum Big-Data-Lösungen zur Optimierung der Supply Chain von einer spaltenorientierten Datenbank profitieren, müssen die Datenbanken zunächst verglichen werden:

Zeilenorientierte Datenbanken

Herkömmliche, relationale Datenbanken sind zeilenorientiert. Zeilen werden in der Datenbanktabelle der Reihe nach geschrieben. Das erlaubt ein schnelles Schreiben und ist daher sinnvoll für Anwendungen, die viele oder alle Spalten zugleich abrufen müssen, wie Datensätze mit personenbezogenen Daten, die bei Abruf nebeneinander erscheinen. Beispielsweise Name, Anschrift, Geburtsdatum, Telefonnummer und so weiter. Das Auslesen von zeilenorientierten Datenbanken dauert allerdings lange, weil alle Zeilen hintereinander gescannt werden.

Zeilenorientierte Datenbanken sind daher für OLTP-Systeme (Online Transactional Processing Systems) wie einem ERP geeignet, aus dem ständig viele Informationen in die Datenbank eingespeist werden müssen. Für häufiges Beschreiben brauchen spaltenorientierte Datenbanken mehr Zeit, sind aber beim Abrufen von Daten schneller.

Spaltenorientierte Datenbanken

Spaltenorientierte Datenbanken schreiben Datensätze Spalte für Spalte, also zuerst alle Zeilen der ersten Spalte, dann alle Zeilen der zweiten Spalte, etc. Das ist sinnvoll für die Analyse vielspaltiger Tabellen, deren Daten nicht gleichzeitig abgerufen werden müssen. Abfragen laufen bis 20-mal schneller als bei zeilenorientierten Datenbanken, da nur die für die Auswertung nötigen Spalten und nicht alle Zeilen durchsucht werden müssen.

Das ist nützlich bei OLAP-Systemen (Online Analytical Processing Systems). Daten in spaltenorientierten Datenbanken lassen sich stark komprimieren, weil Werte desselben Datentyps nebeneinander hinterlegt sind – in zeilenorientierten Datenbanken liegen Werte verschiedener Datensätze nebeneinander, weshalb das nicht möglich ist.

Kurzum: Zeilenbasierte Datenbanken sind zum Abruf vieler verschiedener Spalten oder einzelner Zeilen geeignet. Spaltenbasierte Datenbanken sind besser, wenn viele Zeilen oder einzelne Spalten benötigt und Änderungen an einzelnen Datensätzen durchgeführt werden. Spaltenorientierte Big-Data-Datenbanken, wie Relex, können Millionen Datensätze effizient komprimieren und Kalkulationen In-Memory, also im RAM-Speicher, durchführen. Sie berechnen riesige Datenmengen 100-mal schneller als herkömmliche Systeme. Fortschrittliche Algorithmen und Analysetools verwandeln Daten in eine mächtige Quelle, um bessere Prognosen für Warenauffüllungen anzubieten.

(ID:44459464)