Datenschutzkonforme Anonymisierung?

Die datenschutzkonforme (DSGVO, etc.) Bereitstellung von produktiven Daten für Datawarehouse, Big Data (Data Lakes) und Testumgebungen verursacht relativ viel Aufwand. Dieser organisatorische und technische Aufwand, Daten immer wieder aufs neue anonymisiert bereitzustellen, zu archivieren oder kontiniuerlich zu aktualisieren, verzögert die Umsetzung der zu testenden Projekte. Unsere quelloffene Anonymisierungslösung Knoxxer ist die optimale Lösung für diese Herausforderung.

Anonymisierung Testsysteme

Viele Kunden setzen ETL-Tools ein, um Testsysteme zu befüllen oder Anoynmsierungsaufgaben abzubilden. Dafür werden oftmals Spezialisten benötigt, die entsprechende ETL-Jobs entwickeln und pflegen. Die Anonymisierungslösung Knoxxer erlaubt es auch weniger erfahren und nicht technisch nicht versierten Anwendern schnell und einfach Testszenarien zu erstellen und Daten zu anonymisieren. Im Regelfall können schon nach wenigen Minuten anonymisierte Daten und Testszenarien bereitgestellt werden. Knoxxer minimiert die Komplexität der Datenbeschaffungs- und Anonymisierungsprozesse auf ein Minimum.

Unternehmensweite Anonymisierungs-Lösung

Im Gegensatz zu vielen anderen Lösungen kann Knoxxer mit nur einer Lizenz konzern- / unternehmensweit eingesetzt werden:
  • Beliebig viele Instanzen verwendbar
  • Keine nutzungsabhängigen Lizenzkosten
  • Der Quellcode wird zur Verfügung gestellt
Die Kombination aus minimaler Komplexiität und optimalem Lizenzmodell erlaubt es, die Anonymiserungslösung Knoxxer als zentrale Lösung für Ihre Datawarehouse, Big Data und Testumgebungen, sowie Produktivsysteme einzusetzen.

Eine Anonymisierungs-Software für alle IT-Systeme

Anstelle einer Anonymisierungslösung für jede Datenbank, ist die Anonymisierungslösung Knoxxer in der Lage, aus einer Vielzahl von Quellen und Zielen zu lesen und in diese zu schreiben. Z.B. aus einem SQL-Server in eine CSV-Datei, oder einfach nur Oracle-Datenbank zu Oracle-Datenbank. So lassen sich eine Vielzahl von Datenquellen, wie sie in Datawarehouse- und Big Data-Projekten, sowie in der gesamten Unternehmenswelt üblich sind, mit nur einer Lösung bedienen. Ihr CIO und Einkauf wird es Ihnen danken.
ETL und Anonymisierung
ETL und Anonymisierung

Performance der Anonymisierung

Die Anonymisierungs-Lösung Knoxxer ist in der Lage, auch sehr große Datenmengen aus einer Vielzahl von Datenquellen in hoher Geschwindigkeit zu lesen, bei Bedarf zu transformieren und zu anonymisieren, sowie in eine Vielzahl von Zielen zu schreiben (ETL / ELT & Anonymisierung). Es stehen unterschiedliche, unumkehrbare Verschlüsselungsverfahren zur Verfügung. Auch für die Anonymisierung von Kundendaten in Produktionsumgebungen wie z.B. in SAP- oder CRM-Systemen, die aufgrund gesetzlicher Vorgaben nach einer gewissen Zeit ansonsten gelöscht werden müssten, stellt Knoxxer die optimale Lösung dar.

Big Data, Datenschutz und Business Intelligence sind kein Widerspruch, sondern gehören eng zusammen. Die Anonymisierung mittels Knoxxer ist der vermutlich schnellste Weg dortin.

Name

Vorname

Umsatz

Bestelldatum

Müller

Max

2000

1.8.1999

Biermann

Bernd

1500

3.1.2010

Schmitt

Sabine

3000

9.6.2012

[…]

[…]

[…]

[…]

Name

Vorname

Umsatz

Bestelldatum

2dRYNmFgJenRvdeQdqYfzQ

zyfcE2KTdzyL/HNLXR/q9A

2000

1.6.2013

hZLoat39tpgCyS3M5CHsxw

8JfmUCxIgLQHcugzYszwwQ

1500

1.1.2018

VtIbNTrfyOFznrA/rtA0bQ

lMuPfAlC/fDHnhM+bOc2bA

3000

1.1.1980

[…]

[…]

[…]

[…]

Optimierung Testdatenmanagement durch künstliche Intelligenz

Anstatt Aufwand für die manuelle Anonymisierung oder die Löschung zu betreiben, haben wir eine Lösung entwickelt, die:

  • Daten extrem schnell aus einer Quelle liest, unumkehrbar verschlüsselt und in das Ziel schreibt oder innerhalb des Ziels zur Laufzeit verschlüsselt (ETL / ELT mit Verschlüsselung)
  • Sämtliche Strukturen (Metadaten) aus der jeweiligen Quelle ausliest und in einem Repository ablegt
  • Primär- und Fremdschlüsselbeziehungen systemübergreifend erhält (systemübergreifende referentielle Integrität)
  • Muster (z.B. Verteilung der Daten, Gültigkeit von e-mail Adressen oder Datumsfeldern), Datentypen und Datenlängen erhält
  • mittels einer künstlichen Intelligenz (KI) Vorschläge für zu verschlüsselnde Felder und die zu verwendende Methode erstellt

Weitere Funktionen für das professionelle Testing

  • Data Aging
  • Bedingte Aktualisierung (z.B. nur Niederlassung Nord) und inkrementeller Abgleich (z.B. letztes Update > 31.12.2017)
  • Datentyp-Prüfung – Abbruch oder Eintrag ins Logfile
  • Inhaltliche Prüfung (regelbasierte Validierung / Constraints) – Abbruch oder Eintrag ins Logfile
  • Prüfung von Null-Feldern

Weitere Vorteile der Lösung Knoxxer

  • Multiple Algorithmen und PlugIns für die Datenanonymisierung – der richtige Algorithmus für jeden Einsatzzweck
  • Echtdaten aus produktiven Systemen dauerhaft rechtskonform in Testumgebungen nutzen
  • Hochperformante Anonymisierung strukturierter und polystrukturierter Massen- oder Einzeldaten
  • Unterstützung der fachlichen Definition/Selektion durch künstliche Intelligen
  • Automatisierte Erstellung eines Datenschutzkataloges auf Feld- und Tabellenebene

PDF Reports für Data Governance Manager, Tester und Datenschutzbeauftragte

PDF-Reports über die Metadaten, die sich schnell und einfach über Templates anpassen lassen, werden automatisch erstellt. Die Verwendung Ihrer BI-Lösung ist ebenfalls problemlos möglich. Sämtliche Metadaten liegen wahlweise in einem Datenbank-Repository oder einer CSV-Datei vor.
data protection report
data protection report – details
Insbesondere agile Projekte profitieren von der hohen Flexibilität und Geschwindigkeit. Zur Selektion wichtiger Segmente, z.B. für demografische Testszenarien, bieten wir optionale KI-Module zur automatisierten Segmentierung und Klassifikation. Eine vollständige Datenbereitstellung kann so oftmals vermieden werden, Aufwand und Kosten sinken spürbar.

Datenquellen für die Anonymisierung

Wir unterstützen eine Vielzahl von Datenquellen und Zielen, wie z.B.:
  • CSV-/Text-Dateien
  • XML-Dateien
  • relationaler Datenbanksysteme mittels JDBC (wie z.B. Oracle, SAP Hana, DB2, Microsoft SQL-Server, MySQL, PostgreSQL,…)
  • Unterstützung des Hadoop-Ökosystems (Hive, Impala, usw.)
  • Apache Drill
  • Streams (z.B. Kafka)

Test operativer Systeme, Datawarehouse und künstliche Intelligenz

Knoxxer bietet Ihnen die Möglichkeit, Feldtypen und Feldlängen auch nach der Anonymisierung des Inhaltes unverändert zu belassen. Alternativ läßt sich der Dat.entyp aus der Quelle gezielt auf einen anderen Datentyp transformieren. Änderungen in operativen Systemen lassen sich so optimal testen. Cubes, künstliche Intelligenz, usw., die für den Test eine gewisse Verteilung der Daten / Muster benötigen, funktionieren nach der Anonymisierung ebenfalls noch problemlos, da relevante Muster erhalten bleiben.

Testdaten-Automatisierung durch Bots

Der Aufwand zur Inbetriebnahme ist minimal – im Regelfall kann das System nach kurzer Zeit (weniger als eine Stunde) verwendet werden. Knoxxer unterscheidet sich von den meisten Lösungen durch die einfache Bedienung ohne Abstriche an die Leistungsfähigkeit. Anwender können die Lösung im Regelfall nach wenigen Minuten bedienen. Bots übernehmen viele wiederkehrende, triviale Aufgaben. Langwierige Testvorbereitung war gestern.

Automatisierung – Cloud oder On-Premise

Die Bedienung erfolgt entweder per Kommandozeile oder Webinterface. So lassen sich Aufgaben einfach und schnell automatisieren und durchführen. Knoxxer lässt sich in der Cloud oder on-premise im eigenen Rechenzetrum betreiben. Das ermöglicht Ihnen eine bedarfsgerechte Skalierung.

Lösungen und Consulting

Möchten Sie mehr über die Möglichkeiten unserer quelloffenen Anonymisierungslösung Knoxxer erfahren oder eine Testversion einsetzen? Rufen Sie uns unter +49 2547 93998 0 an oder schreiben Sie uns eine Nachricht. Wir beraten Sie gerne persönlich.