IT-Trends-Blog

IT-Trends-Blog

Opinions expressed on this blog reflect the writer’s views and not the position of the Capgemini Group

NoSQL-Datenbanken: Fünf Mythen auf dem Prüfstand

Kategorie: Digitale Trends

Erst kürzlich fand ich mich in einer Diskussion über Datenhaltungssysteme wieder, in der der Begriff NoSQL missverständlich gebraucht wurde. „NoSQL“ heißt nicht „kein SQL“ sondern „not only SQL“ und beschreibt damit zunächst Datenbanktechnologien, die mit verschiedensten Datenschemata arbeiten. NoSQL ist daher keine einheitliche Kategorie von Datenbanken. Vielmehr verbirgt sich hinter dem Begriff eine große Vielfalt an Ansätzen und Funktionalitäten zur Strukturierung von Daten, sei es als Schlüssel-Wert-Paare, in Dokumentenform, in Spalten oder Graphen. Dadurch können beispielsweise Anwendungsfälle mit unstrukturierten oder agilen Datenschemata realisiert werden, wie es häufig bei Big-Data-Projekten oder im Industrie 4.0-Kontext der Fall ist. Ähnlich vage wie ihre Terminologie werden meiner Einschätzung nach allerdings auch die anderen Fähigkeiten und Eigenschaften der Datenbanktechnologie gehandelt. Deshalb möchte ich die häufigsten Mythen, die sich um NoSQL-Datenbanken ranken, einmal genauer betrachten:

Mythos 1: NoSQL-Datenbanken und Hadoop lösen alle meine Big-Data-Probleme alleine

Wahrheitsgehalt: 50%

Fakt ist, aufgrund der eben genannten Eigenschaften können NoSQL-Datenbanken und Hadoop-Speicherlösungen ein integraler Bestandteil einer wirkungsvollen Big-Data-Strategie sein. Daten können ohne Transformation in ihrem originären Schema gespeichert werden. Außerdem sind die Datenbanken linear skalierbar und bieten eine hohe Vielfalt an unterschiedlichen Features, wie beispielsweise die manchmal besser geeignete Abfragemethode über Graphen. Es stimmt aber auch, dass neben der richtigen Technologie Big-Data-Projekte organisatorische Rahmenbedingungen benötigen, die eine agile und flexible Arbeitsweise ermöglichen. Ganz „von alleine“ geht hier also schon mal Garnichts. Der Einsatz von NoSQL Datenbanken kann daher nur im Verbund mit einer ganzheitlichen Big-Data-Architektur und einem entsprechenden Organisationsverständnis erfolgreich sein.

Mythos 2: Mit NoSQL können wir sofort ungeahnte Schätze in unseren externen und internen Daten heben

Wahrheitsgehalt: 40%

Zwar können jetzt viele oder schnelle unstrukturierte Daten einfacher gespeichert werden. Tatsächlich müssen neue und performante(re) Speicherlösungen aber immer auch mit den richtigen Analysetools, kundigen Mitarbeitern und passenden Methoden kombiniert werden. Nur gemeinsam mit Analytics-Lösungen wie Spark oder R und auf Basis eines fundierten Erfahrungsschatzes mit wirksamen Analysemodellen können NoSQL Datenbanken ihre volle Stärke ausspielen. Auch muss die Kombination von externen Datenquellen im Einzelfall genau untersucht werden. Es macht nicht immer Sinn, beispielsweise Wetterdaten mit Verkaufsdaten zu kombinieren wie in vielen Verkaufsprospekten von Datenlösungen beworben wird. Außerdem steckt bei Quellen dieser Art der Teufel häufig im Detail – Stichwort Datenformate, die auch von NoSQL-Datenbanken nicht ohne entsprechende Aufbereitung und fachlichem Hintergrundwissen aufgelöst werden können.

Mythos 3: Relationale Datenbanken sterben aus

Wahrheitsgehalt: 0%

Nie und nimmer! Es ist davon auszugehen, dass relationale Datenbanken auch in ferner Zukunft noch ihre Berechtigung haben. Gerade im Bereich der transaktionalen Datenverarbeitung sind und bleiben RDBMS tonangebend. Auch in Sachen Nutzerfreundlichkeit, Stabilität und Sicherheit haben sie den NoSQL-Datenbanken einiges voraus. Der Trend deutet stark in die Richtung polyglotter Architekturen. Hier muss für jeden Fall individuell evaluiert werden, welche Technologie aus dem Zoo der Datenbanken Sinn macht. „The right tool for the right job“, so lautet die Devise.

Mythos 4: Datenbankskalierung ist jetzt ganz einfach

Wahrheitsgehalt: 80%

Ja, das ist grundsätzlich so richtig, denn Partitionierung und Replikation sind in vielen NoSQL-Datenbanken fest integriert. Dennoch muss sich der Entwickler für die richtige Architektur und den korrekten Verbund eines Clusters entscheiden. Verschiedene Master/Slave-Replikationsformen, Cross-Datacenter Lösungen und der richtige performante Partitionierungsalgorithmus, der bestimmt wo die Daten abgelegt werden, sind immer noch wichtige Entscheidungen „von Hand“. Best Practices für den jeweiligen Fall existieren meist nur vereinzelt.

Mythos 5: NoSQL-Datenbanken sind unmittelbar und bedenkenlos einsatzbereit

Wahrheitsgehalt: 30%

Tatsächlich stehen einige NoSQL-Datenbanken auf einem Level, das sie mit der richtigen Konfiguration und mit Bedacht auf u.a. Redundanz und Sicherheit für ein Unternehmen unmittelbar einsetzbar macht. Gerade im Bereich der Lese- und Schreibgeschwindigkeit zeigen zudem Benchmarks, dass sie relationalen Systemen überlegen sind. Dennoch sind gerade diese Leistungsvergleiche von den Herstellern selbst erstellt und mit Vorsicht zu genießen. Wahr ist aber auch, dass NoSQL-Speicherlösungen oft Features fehlen, die für ihre relationalen Pendants als selbstverständlich gelten. Das betrifft besonders Bereiche wie Betrieb, umfangreiche Dokumentation, DevOps-Instrumente, Sicherheitskonzepte und ihre Integration sowie der Funktionsumfang der verwendeten Abfragesprache. Unternehmen brauchen daher eine klare Herangehensweise und einen umfangreichen Kriterienkatalog, um zu beurteilen ob die angebotenen Leistungen einer Datenbank allen Anforderungen im Anwendungsfall gerecht werden.

NoSQL-Datenbanken haben viele Vorteile und können in den richtigen Anwendungsfällen relationalen Systemen gerade in den Punkten Leistungsfähigkeit, Skalierbarkeit und den genannten Datenschemata überlegen sein. Kombiniert mit den passenden Betriebskonzepten und Experten können die Systeme so zum Erfolg werden.

Welche Erfahrungen haben Sie mit NoSQL-Datenbanken und ihren Bewertungsmaßstäben gemacht? Ich freue mich auf Ihre Kommentare oder Diskussionen auf der TDWI 2016. Dort können Sie auch unseren Vortrag am 22. Juni 2016 in München besuchen.

Über den Autor

Julian Endres
Julian Endres
Julian Endres ist Applications Consultant bei Capgemini im Bereich Big Data & Analytics. Er ist dabei im gesamten BI-Stack mit derzeitigem Fokus auf Technologien wie Qlik, Tableau, Hadoop und NoSQL-Datenbanken tätig. Im Bereich der nicht-relationalen Datenbanken widmet er sich besonders der Marktreife und Einsetzbarkeit von einzelnen Lösungen im Unternehmenskontext sowie Architekturen im Big-Data-Kontext.
2 Kommentare Kommentar hinterlassen
Hallo Julian, netter Blog! Bei Mythos 5 hätte ich einige Anmerkungen: MarkLogic ist da als einzige "Enterprise NoSQL" Datenbank in einer besonderen Rolle, da sie alle Deine Punkte direkt adressiert.
Hallo Stefan, vielen Dank für dein Interesse und das persönliche Gespräch auf der TDWI Europe 2016. Gerade im NoSQL Bereich ist es wichtig, eine Datenbank vollumfänglich nach vielen Seiten hin zu beurteilen. Die Produkte am Markt adressieren die Aufgabenstellungen sehr individuell.

Kommentar hinterlassen

Ihre E-Mail-Adresse wird nicht veröffentlicht. Pflichtfelder sind mit einem * gekennzeichnet.