Was ist Datenbereinigung?

Vor der Datenbereinigung ist das Verständnis der Daten und ihrer Qualität sehr wichtig. Dies wird gewöhnlich durch eine vorangehende Daten Profilanalyse erreicht.

Datenbereinigung ist der Prozess, defekte oder ungenaue Datensätze zu korrigieren. Dies beinhaltet auch Datenharmonisierung und -standardisierung oder sogar Datenanreicherung. Die bereinigten Daten werden dann in das originäre System re-importiert. Im Falle einer Datenmigration erfolgt der Import in das oder die neuen Zielsysteme.

Beispiel einer Datenbereinigung

Data_Cleansing

Trennung von Strasse und Hausnummer (Quelle: Altova Mapforce screenshot)

Das linke Bild zeigt die Bereinigungsaufgabe der Trennung von Strassennamen und Hausnummer.

Abhängig von Ihren IT Sicherheitsanforderungen kann die Datenbereinigung als „Lesen – bereinigen schreiben“ Aktion direkt im System erfolgen. Falls das nicht möglich ist, tut es auch ein flat-file export. Die bereinigten Daten können dann ebenfalls als flat-file wieder zurückgeladen werden, z.B. mit SAP LSMW.

Unser Beitrag

Holistic Analytics hat sehr viel Erfahrung mit Datenbereinigung und Datenanreicherung. Speziell für die Adressenbereinigung können wir uns auf unsere guten Beziehungen zu spezialisierten Firmen verlassen, die weltweite Postdatenbanken verwenden.

Da immer alle acht Datenqualitäts-Dimensionen adressiert werden müssen, ist es wichtig, dass alle Beteiligten an dieser komplexen Aufgabenstellung aktiv mitarbeiten.