IT-Trends-Blog

IT-Trends-Blog

Opinions expressed on this blog reflect the writer’s views and not the position of the Capgemini Group

Lagern Sie Ihre Daten noch in Hadoop oder verändern Sie schon die Welt?

Kategorie: Trends des Monats
Viele CIO’s und IT-Leiter denken bei Big Data immer noch zuallererst an Hadoop, In-Memory und spaltenorientierte Datenbanken. Meistens müssen sie dann doch erkennen, dass sich mit diesem Ansatz die Welt nicht verändern lässt. Der Anfang von Big Data sind Datenquellen. Und zwar solche, die bislang wenig bis gar nicht analytisch betrachtet wurden.
In der Mitte muss man sich über Datenschutz Gedanken machen und benötigt die richtigen Fachleute für die Analyse. Und am Ende braucht man einen überzeugenden Business Use Case, um die Finanzierung zu sichern. Diese Zutatenliste ist zwar nicht besonders lang, aber sie hat es in sich, denn jede kommt mit einer anderen Herausforderung daher, die gemeistert werden will.

Kann man diesen Daten trauen?

Neuartige Datenquellen lassen sich in die folgende Bereiche clustern:
•    Internet: unter anderem soziale Netzwerke, Foren von Konsumenten, Blogs
•    Internet der Dinge: zum Beispiel vernetztes Fahrzeug, Smart-Meter, RFID
•    Logfiles: unter anderem Server Logs, Maschinen-Logs
•    Unstrukturierte Daten wie Dokumente, E-Mails, Sprache und Bilder

Gegenüber der Qualität dieser Daten gibt es allerdings Bedenken. Die neuartigen Datenquellen sind uns einerseits neu, andererseits häufig von extern, also fremdbestimmt. Das ist naturgemäß wenig vertrauenswürdig. Deshalb muss das Big Data-Projektteam, idealerweise in Verbindung mit einer bereits existierenden Data Governance-Organisation, die Qualität der Daten ermitteln, ihre Verwendbarkeit für Analyse bewerten und fortlaufend überwachen. Diese Verantwortung lässt sich meist nicht auf den Datenlieferanten abwälzen.

Vorsicht Privatsphäre

Insbesondere hierzulande ist der Schutz der Privatdaten des Einzelnen, also des Kunden oder des Einwohners, geschichtlich bedingt sehr wichtig. Und ehrlich gesagt ist das in Deutschland der primäre Showblocker für Big Data. Um Vorbehalte abzubauen, kann man zum Beispiel folgendes tun:
•    Business Use Cases finden, die personenbezogene Daten nicht verarbeiten (zum Beispiel Predictive Asset Maintenance) oder zumindest nicht auf der Ebene des Einzelnen (zum Beispiel Sentiment-Analyse mit Bezug auf die Produkte und Services des Unternehmens ohne Blick auf den einzelnen Kunden)
•    Experten für die hiesige Rechtslage beim Thema Datenschutz involvieren und herausfinden, was möglich ist und was nicht und anschließend die entsprechenden Vereinbarungen mit den Kunden hinsichtlich Datennutzung im Kontext der angebotenen Services treffen.

Data Scientists: begehrt und leider rar

Und schließlich gibt es auch ein Problem mit den Kenntnissen und Fertigkeiten. Big Data-Vorhaben schöpfen in den meisten Fällen ihren Erfolg aus dem Einsatz von Business Analytics, also statistischen Verfahren von Sentiment-Analyse über Text Mining bis hin zu klassischen Data Mining-Ansätzen. Um Big Data-Projekte erfolgreich und hinreichend schnell anzugehen, braucht es die Rolle des Data Scientists, der sowohl Verständnis für die Geschäftsprozesse des Unternehmens, die internen wie externen Datenquellen als auch für klassische und neuartige Analytics-Ansätze mitbringt. Diese Spezies ist rar.

Kein Sponsoring ohne Business Use Case

Darüber hinaus wird bei vielen Big Data-Projekten versucht die Technologie zu implementieren, bevor wirklich klar ist, welche geschäftlichen Ziele man damit erreichen will. Dementsprechend scheitert häufig die Finanzierung. Die Frage nach dem Business Use Case kann aber meistens nicht die IT-Seite, sondern nur Fachabteilungen wie Marketing, Vertrieb, Service und Qualitätsmanagement, Maintenance oder Supply Chain beantworten. Sie können mit Big Data zum Beispiel folgendes erreichen:
•    Vorhersage von Wartungsintervallen von Maschinen, Anlagen, Netzwerkkomponenten und ähnlichem
•    Erkennen von Missbrauch und Risiken
•    Identifizierung von Meinungsbildern und -trends oder Qualitätsproblemen bei Produkten und Services
•    Ganzheitliche Sicht auf Kunden
•    Erkennen von Problemen in Lieferketten
Sobald Bereiche identifiziert sind, in denen Big Data dem Unternehmen Wettbewerbsvorteile verschafft, die Kosten senkt oder Geschäftsprozesse vereinfacht, ist die wichtigste Hürde auf dem Weg zur Finanzierung bereits genommen. Manchmal werden auch Business Use Cases identifiziert, die dazu beitragen, neue Geschäftsmodelle zu etablieren oder vorhandene umzuwälzen. Das Konzept des vernetzten Fahrzeugs zum Beispiel bietet für Automobilhersteller unzählige Business Cases powered by Big Data. Welche Use Cases können Sie sich vorstellen?

Weitere Informationen rund um Big Data finden Sie auch hier:
- http://www.capgemini.com/experts/business-information-management/manuel-sevilla
- http://www.capgemini.com/technology-blog/author/msevilla/

Über den Autor

Rüdiger Eberlein
Rüdiger Eberlein

Kommentar hinterlassen

Ihre E-Mail-Adresse wird nicht veröffentlicht. Pflichtfelder sind mit einem * gekennzeichnet.