Big Data, NoSQL, Hadoop

Big Data, NoSQL, Hadoop – das sind die derzeit wohl bekanntesten Begriffe wenn es um das Öl von heute geht – Informationen. Der Begriff Big Data wirkt momentan wie ein aufgeblasener Hype, der konkrete Entwicklungen eher überdeckt. Dabei sind die Anforderungen real und fördern bei Unternehmen wie Amazon, Zalando aber auch kleinen Startups, die diese Technologie gewinnbringend einsetzen, das teils rasante Wachstum.

Volume, Variety and Velocity – VVV

Die meisten Unternehmen analysieren externe und interne Daten schon lange und ausgiebig. Zur Bewältigung der Herausforderungen, die sich mit Big Data ergeben, muss jedoch in vielen Bereichen die nächste Evolutionsstufe betreten werden. Denn mit Big Data ist nicht nur eine andere Dimension von Datenmengen gemeint. Big Data steht für Volumen, Vielfalt und Geschwindigkeit (Volume, Variety and Velocity – VVV).

Volumen

Laut Wikipedia gibt es auf der Erde (Stand 2011) 1,8 Zettabytes (1021 Bytes = 1,8 Billionen Gigabytes) an digitalen Informationen, die allein im Jahr 2009 um 62 Prozent gewachsen sind. Wollte man die gesamte Datenmenge auf DVD brennen, so benötigte man einen Stapel DVDs, der von der Erde zum Mond und wieder zurück reichen würde.

Klassische und viel zitierte Beispiele für Big Data sind die Informationen aus dem Bereich SocialMedia, wie z.B. Facebook und Twitter. Mögen diese Daten auch noch so relevant sein, so gibt es doch im Regelfall eine Vielzahl interner und externer Datentöpfe, die viel naheliegender sind.  Detaillierung, Kombination und Historisierung führen auch hier oftmals zu Datenmengen, die mit klassischen Ansätzen nur schwer zufriedenstellend bewältigt werden können. Die Segmentierung/Partitionierung und Priorisierung der Datenbestände ist ein entscheidender Schritt zur Lösung dieses Problems.

Insbesondere durch  Industrie 4.0 und IoT steigt die Datenmenge noch einmal deutlich.

Vielfalt

Die Vielzahl informationstechnischer Lösungen, die Globalisierung und die Geschwindigkeit, in der sich Systeme ändern, führt zu häufigen Änderungen im Bereich der Informationsquellen. Klassische Datenbanksysteme, die Grundlage vieler Datawarehouse-Systeme, erwarten jedoch vorstrukturierte Daten. Im Ergebnis explodieren die Aufwände für die Umsetzung neuer Anforderungen. NoSQL-Lösungen hingegen strukturieren die Daten im Regelfall erst zum Zeitpunkt der Abfrage / Analyse.

Geschwindigkeit (Velocity)

Innerhalb weniger Sekunden erhalten Sie das Ergebnis umfangreicher Analysen, die Ihnen genau zeigen, wo sich Investionen lohnen, welche Kundgengruppen für eine Kampagne relevant sind oder wie Sie Prozesse optimieren können. Ein Versprechen, dass klassische Datawarehouse-Systeme bis zu einer gewissen Datenmenge erfüllen können. Die Datenmengen, die es nun jedoch in Sekunden zu bewältigen gilt, überfordern diese Systeme. Die Kombination aus klassischen Datawarehouse-Lösungen, hauptspeicherbasierten und batchverabeitenden Systemen löst jedoch auch dieses Problem. Allerdings gilt es auch, den Blickwinkel auf relevante Aspekte der bereitzustellenden Informationen zu verändern. Unser Spezialisten-Team steht Ihnen bei der Umetzung und Etablierung dieser Änderungen in Ihrem Unternehmen gerne zur Seite.

Zweckmäßigkeit

Die Erwartungen gegenüber Big Data, die sich aus den Versprechungen der verschiedenen Anbieter ergeben, sind hoch. Gerne führen wir mit Ihnen zusammen Machbarkeitsstudien und kostenlose Beratungsgespräche zum Thema Big Data und verwandte Themen wie z.B. DataMining durch. So stellen Sie sicher, dass die Zweckmäßigkeit Ihrer geplanten Lösung gewahrt bleibt.

Lösungen und Consulting

Open Logic Systems ist Ihr Dienstleister für Big Data-Lösungen. Wir unterstützen Sie bei der Auswahl geeigneter Tools und Methoden, sowie der technologischen Umsetzung. Beispiele für die für uns verwendeten Technologien sind:

  • Hadoop
  • Impala
  • Oracle Exadata
  • IBM Watson
  • Talend ETL
  • Kafka
  • Parquet
  • Spark
  • Apache Drill
  • Hive

Auch die Darstellung / Visualisierung der Informationen in einer verständlichen Art und Weise bedarf, aufgrund der vielfältigen Ausprägungen, neuer Denkansätze. Wir beschäftigen uns seit geraumer Zeit mit diesen Fragestellungen (Visual Analytics), die mit dem Thema Big Data Hand in Hand gehen. Gerne stellen wir Ihnen Lösungen vor, die wir bei namhaften Kunden bereits erfolgreich implementiert haben.

Selbstverständlich unterstützen wir Sie auch bei der Analyse der Daten mittels mathematischer Verfahren (Statistik, lineare Methoden, etc.) und Werkzeugen wie R oder IBM SPSS.

Sie verfügen bereits über eine Big Data-Lösung oder planen Hadoop einzuführen? Von der Planung über die Entwicklung bis hin zur Prozessoptimierung, unterstützen wir Sie mit innovativen Lösungen und Expertise. Besonderen Wert legen wir dabei auf die Potenziale der Optimierung und Komplexitätsreduktion.

Gerne möchten wir Sie persönlich von unseren Leistungen und Fähigkeiten als Navigator für Ihre Datengalaxis überzeugen. Unser Spezialisten-Team steht Ihnen bei der Umsetzung Ihrer Big Data-Strategie mit Rat und Tat zur Seite.

Rufen Sie am besten gleich an unter (+49) 2547 93998 – 0 oder schicken Sie eine E-Mail an info@open-ls.de.