Stammdaten und Dubletten

Ein unerfreuliches Ereignis beim Verwalten der Stammdaten sind mehrfache Datensätze zum selben Objekt (Dubletten), oftmals mit unterschiedlichen Informationen. Jeden Tag erreichen Adressdaten über zahlreiche Kanäle Ihr Unternehmen. Per Telefon, E-Mail, Post oder online. Regelmäßig werden dabei Dubletten angelegt. Ohne die Bereinigung von Dubletten­ werden z.B. Kunden doppelt angeschrieben, Artikel falsch klassifiziert, fehlerhaft bestellt oder gelagert. Beispiel:

Artikelnummer
Artikelname
Materialgruppe

290616
Belgische Pralinen
Sugary snacks

290617
Belgische Pralinnen
Desserts

290618
Unkown
Belgische Pralinen

Dubletten können einen erheblichen Kosten- und Risikofaktor darstellen. Bei Migrationen oder Unternehmenszukäufen stellt die Bereinigung von Dubletten einen wichtigen Schritt und gleichzeitig oftmals ein größeres Hindernis dar.

Dubletten erkennen mittels künstlicher Intelligenz (KI)

Die klassische Dublettenerkennung verwendet oftmals Methoden zum Vergleich einzelner Felder. Geprüft wird z.B. die vollständige oder teilweise Übereinstimmung mittels regulärer Ausdrücke oder Fuzzy-Logiken. Werden jedoch Feldinhalte in den unterschiedlichen Datensätzen vertauscht, nicht in gleichem Umfang ausgefüllt oder Datensätze aufgrund unterschiedlicher Rollen mehrfach angelegt, so ist ein feldbasierter Vergleich relativ komplex.

Der MDM Booster löst diese Herausforderung durch eine intelligente Abbildung und Interpretation der Daten. Mögliche Dubletten werden mittels KI zu Ähnlichkeitsgruppen (Clustern) zusammengefasst. Die sprichwörtliche Suche nach der Nadel im Heuhaufen entfällt. Der Aufwand zur Bestimmung und Definition eines „golden Records“ wird deutlich reduziert. Diese Methode kann sowohl für Texte, Flags, Datumsangaben, numerische Werte und Bildern verwendet werden.

Beispiel: Mitarbeiter- und Lieferanten-Stammdaten

Für Mitarbeiter und Lieferanten verwendet unser Partner GIS Consulting diesen Algorithmus z.B. beim Onboarding-Prozess für die Erstellung von Unternehmensausweisen. Die Ähnlichkeit der Stammdaten wird pro Information (Attribut / Bild) mit Wahrscheinlichkeiten ausgewiesen. Selbstverständlich lässt sich diese Technologie auch für Artikelstammdaten und viele weitere Stammdaten verwenden.

Dublikatserkennung Foto App - Onboarding

Identifikation von Dubletten bei der Stammdatenverwaltung

Die Algorithmen des MDM Boosters können problemlos grosse Datenmengen und komplexe Strukturen verarbeiten. Sowohl die Batchverarbeitung / Dunkelverarbeitung, als auch interaktive Anwendungsfälle aus dem Bereich der Stammdatenverwaltung – und Optimierung werden durch die Architektur und Algorithmen des MDM Boosters optimal unterstützt.

Fragen zum Thema Master Data Management und künstliche Intelligenz

Möchten Sie mehr über die Möglichkeiten des MDM Boosters erfahren? Rufen Sie uns unter +49 2547 93998 0 an oder schreiben Sie uns eine Nachricht. Wir beraten Sie gerne persönlich.

    Ich erkläre mich mit der Erhebung, Verarbeitung und Speicherung meiner hier gemachten Angaben gemäß Ihrer Datenschutzerklärung einverstanden. Meine Einwilligung kann ich jederzeit durch formlose Mitteilung an Sie widerrufen.