Artikel

Data Lake Technologie: Lösungen für Versicherungen

23.10.2018

Die IT der meisten Versicherer in Deutschland wird heute von zwei grundsätzlichen Herausforderungen geprägt: Zum einen eine spartenübergreifende Sicht auf Kunden zu ermöglichen und zum anderen Daten aus Legacysystemen abgleichen zu können. Die spartenübergreifende Sicht erweist sich beim Abgleich von Leben-, Kranken- und Sachdaten als besonders problematisch. Bei Legacysystemen ist man damit konfrontiert, dass Veränderungen des bestehenden Systems sehr aufwändig sind und der gesamte IT-Datenhaushalt oft nicht in der Lage ist, in angemessener Verarbeitungszeit Ergebnisse zu liefern. Im Bereich der Auswertung und des Abgleichs von Daten werden zwar schon heute Mechanismen aus dem Umfeld des Datawarehousings eingesetzt. Dieser Einsatz ist in der Regel von den gleichen Problemen geprägt wie die Legacysysteme selbst: Sehr lange Time-to-Market-Zyklen für Lösungen und eine ganze Reihe von Folgeproblemen bei Änderungen von Datenstrukturen, da diese in der Regel über relationale Modelle abgebildet werden. Außer diesen Phänomenen eignen sich Datawarehouselösungen aufgrund ihres Aufbaus in der Regel nicht für Near-Time- oder Real-Time-Verarbeitungsanforderungen, wie sie im Vertrieb oder bei Kundenkontakt entstehen.

 

Data Lake Eigenschaften

Data Lake Technologien bieten hier einen Ausweg, denn die Aufgabe eines Data Lakes ist es, alle Daten einer Versicherung unabhängig vom Format oder der Quelle zentral zu speichern. Dies ist in einem Data Lake möglich, ohne vorher die Datenmodelle exakt festzulegen. Die Interpretation der Daten kann hier ad-hoc erfolgen. So wird neben den aktuellen Daten auch die Historie einfach im Data Lake gebildet. Die Daten werden einfach fortgeschrieben. Dabei ist es egal, ob es sich um strukturierte oder unstrukturierte Daten, z.B. Bilder, Videos etc., handelt. In dem Data Lake werden alle Daten in ihrer Ursprungsform gespeichert und es wird keine oder nur eine sehr geringe Verarbeitung an ihnen vorgenommen. Dadurch stehen diese Daten allen zur Verfügung, die Auswertungen auf ihnen vornehmen möchten. Der Transformationsaufwand wird auf die Seite der Auswertung verlagert und findet nicht wie bei einem Datawarehouse bei der Übernahme statt. Dieser Aufbau hat den Vorteil, dass zum einen multiple Datenmodelle auf denselben Daten zur Interpretation genutzt werden können und zum anderen, dass der Gesamtdatenhaushalt sehr flexibel auf neue Anforderungen oder Änderungen reagieren kann.

Die Vorteile eines solchen Data Lakes sind:

  • nicht alle Fragestellungen müssen von Anfang an beantwortet werden
  • es existieren keine Restriktionen durch Datentypen
  • Möglichkeit des explorativen Vorgehens bei der Auswertung von Daten, da die Quelldaten stets vorhanden sind
  • Daten sind beliebig auswertbar, d.h. multiple Semantik auf denselben Daten ist erreichbar
  • Datensilos werden aufgebrochen

Neben diesen Vorteilen liefert ein Data Lake eine ganze Reihe von Werkzeugen, welche einen Workflow, ausgelöst durch Datenveränderungen oder Events ermöglicht. Dabei kann dieser Workflow so ausgestaltet werden, dass er Near-Time abläuft. In Summe betrachtet können durch den Einsatz eines Data Lakes beide grundsätzlichen Problematiken angegangen werden.

 

Architektur eines Data Lakes

PDF
Abbildung 1: Die Hortonworks Plattform (Copyright Hortonworks)

In Abbildung 1 ist die State-of-the-Art Data Lake Plattform Hortonworks dargestellt. Alle Elemente dieser Plattform sind Apache-Projekte und damit als Open Source frei zugänglich.

 

Einsatzszenarien

Typische Einsatzszenarien bei Versicherern sind neben einer aktuellen 360° Kundensicht eine Koppelung zwischen CRM-System und dem Mainframebackend. Wie kann hier die Data Lake Technologie eingesetzt werden?

  • 360° Kundensicht: Eine solche Kundensicht lässt sich relativ einfach produzieren. Im Idealfall werden die Daten aus den diversen Sparten in eine flexible Struktur geladen.
  • CRM-Backend-Verbindung: Eine solche Verbindung wird dadurch sichergestellt, dass das CRM-System neue Kontakte oder andere Events in eine Queue schreibt, welche auf der Data Lake Seite abgerufen wird. Das Legacysystem hat somit zeitnah einen aktuellen Stand über die Kundenkontakte.

Diese beiden Beispiele zeigen wie einfach Data Lake Technologien auf bestehende Problemfelder bei Versicherer angewendet werden können. Problemlösungen sind jedoch nicht auf die beiden aufgezeigten Fallbeispiele beschränkt, denn die Technologie bietet noch viel mehr: Dataminining, Machine Learning, Fraud Detection, Legacysystemablösung und vieles mehr.

  • Analytics
  • Big Data
  • Digitale Transformation
  • Kundenmanagement
  • Versicherungen

Ihr Ansprechpartner

Dieter Masak, Senior Manager

Dieter Masak
Senior Manager

+49 (0)175 5713557
Dieter.Masak@plenum.de

Lothar Brozy, Managing Partner

Lothar Brozy
Managing Partner

+49 (0)151 12167553
Lothar.Brozy@plenum.de

Newsletter
abonnieren