Data Science – Übersicht
Das Rückgrat erfolgreicher Unternehmen sind Produkte, Services und Daten. Ohne eine intelligente Analyse entfalten diese Daten jedoch keinen Wert – wie ein ungenutzter Rohstoff, mit Verfallsdatum. Die intelligente Analyse der Daten ist der Kern einer jeden Digitalisierungsstrategie.
Der Nutzen von Data Science
Mittels Data Science lassen sich Muster verständlich in Regeln abbilden und durch lernende Verfahren kontinuierlich weiterentwickeln – zum Beispiel mit den Zielen:
- Umsatzsteigerung oder Kostensenkung
- Kunden besser zu verstehen
- Die internen Prozesse oder Produkte zu optimieren
- Planungen und Prognosen zu verbessern
- Neue Geschäftsmodelle zu entwickeln oder bestehende Geschäftsmodelle weiterzuentwickeln
Vorgehensmodelle, Methoden und Tools
Wir setzen auf das agile Prozessmodell CRISP-DM und Vorgehensmodell Scrum. Unser erfahrenes Team von Beratern und Spezialisten berät namhafte Klienten in allen Schritten eines Data Science-Projektes:
- Konzeption, Festlegen der Geschäfts- und Projekt-Ziele
- Aufwandschätzung und Projektplanung
- Auswahl der relevanten Attribute
- Beschreibung und Exploration der Daten
- Datenbereinigung, Datenselektion und ggf. Anonymisierung / Pseudonymisierung
- Auswahl geeigneter Methoden und Tools
- Modellbildung und Parametrisierung
- Bewertung der Modelle
- Berichtserstellung und Präsentation der Ergebnisse
- Anwendung und Training des Modells im operativen Prozess
- Administration, Performance Tuning und Betrieb Ihrer Data Science-Systeme
- Automatisierung administrativer Aufgaben
- Integration der Prognosen in Planungslösungen
- Integration von Data Warehouse-, Big Data– und Dritt-Systemen
- Performance Tuning der Algorithmen
- Design und Entwicklung von Reports
- Entwicklung von Datenmodellen
- Visual Analytics
- Konsolidierung und Migration Ihrer Data Science und Data Mining-Landschaft
- IT-Servicemanagement
- Systemarchitektur
- Projektmanagement
- Berechtigungskonzepte, datenschutzkonforme Analysen
- Entwicklung von ETL / ELT-Prozessen und Algorithmen
Die von uns dabei eingesetzten Tools sind z.B.:
- Python (Tensorflow, usw.)
- R (Standalone, SQL-Server, Azure, SAP-Hana)
- D3.js
- analytische Lösungen innerhalb der Datenbanken Oracle, DB2, Informix
- Hadoop / Spark und Mahout
- SPSS
Typische Data Mining-Methoden
Die verwendeten Data Mining-Methoden stammen dabei sowohl aus dem Bereich der Statistik als auch des maschinellen Lernens. Dazu zählen, oftmals in einem Ensemble kombiniert, z.B.:
- deskriptive und multivariate Verfahren
- Entscheidungsbäume / Random Forrest
- Assoziationsanalysen
- künstliche neuronale Netze
- Deep Learning
Algorithmen, die auch mit großen, polystrukturierten Datemengen (Big Data) umgehen können, sind von besonderem Interesse. Oftmals liegen in den Unternehmen bereits wahre Datenschätze kleinerem Umfangs vor – ungenutzt. Die Weiterentwicklung Ihrer Strategien, Prozesse und Systeme ist unser Kerngeschäft.
Lösungen und Consulting
Möchten Sie mehr über die Möglichkeiten im Bereich Data Science erfahren? Rufen Sie uns unter (+49) 2547 93998 – 0 an oder schreiben Sie uns eine Nachricht. Wir beraten Sie gerne persönlich.