Was ist Daten-Profilanalyse?

Daten Profilanalyse ist die Analyse der Datenquellen um Struktur, Inhalt und Datenqualität entlang der acht Datenqualitäts Dimensionen:

Genauigkeit – die Genauigkeit der Daten
Vollständigkeit – die Verfügbarkeit aller Attribute (z.B. Kontakt exklusive email Adresse)
Verfügbarkeit – die Verfügbarkeit der Daten (z.B. fehlende Übersetzungen)
Konformität – die Einhaltung von Standards (z.B. Standardformat von Telefonnummern für automatische Wahl)
Konsistenz – Datenkonsistenz (z.B. PLZ passt nicht zum Ort)
Dubletten – Redundanz (z.B. mehrere Datensätze pro Person)
Integrität – Datensatzbeziehungen (z.B. Verweis auf Firma ist falsch)
Aktualität – Up-to-date-Informationen (z.B. nicht mehr gültige Adressen)

Es geht dabei um ein besseres Verständnis der Daten und die Ableitung von präzisen Anforderungen an die Datenbereinigung. Es ermöglicht bereits sehr früh im Projekt, den Anteil an richtigen Daten im gewünschten Detailgrad zu erkennen. Die Daten-Profilanalyse reduziert Projektrisiken durch schnelle Identifikation und Adressierung potenzieller Datenprobleme.

Obwohl die Daten-Profilanalyse bis zu einem gewissen Grad auch mit Excel oder SQL Skripts möglich ist, führt der Einsatz professioneller Werkzeuge zu schnellen und zuverlässigen Ergebnissen. Die Mischung aus technischer Expertise und gutem Geschäftsverständnis des Datenprofilers ist die Grundlage des Gesamterfolgs.

Profiling Beispiel

Data_Profiling_Sample

Datenprofil Startbildschirm (Quelle: Experian X88 screenshot)

Das linke Bild zeigt ein Beispiel von SAP Material Master Daten. Dies ist der Startbildschirm von Experian´s X88 Profiling Software unmittelbar nach dem Laden der Datenquelle.

Die „completeness“ Spalte zeigt, zu welchem Prozentsatz die entsprechende Spalte überhaupt Werte enthält (z.B. Spalte „F“ ist nur zu 93,68% gefüllt).

Die „uniqueness“ Spalte zeigt, zu welchem Prozentsatz die Feldinhalte einmalig sind (z.B. Spalte „B“ ist nur zu 26,73% einmalig. Das bedeutet, dass von 407.315 Datensätzen nur 108.862 einmalig sind, der Rest sind Dubletten).

Unser Beitrag

Holistic Analytics nutzt mehrere professionelle Werkzeuge, wie z.B. Talend Open Studio, X88 Profiler von Experian oder Altova Mapforce – je nach Anwendungssituation.

Aufgrund unserer langjährigen Geschäftserfahrung können wir die Auswirkungen Ihrer Datenqualität auf Ihr Geschäft schnell und präzise abschätzen.

Das führt zu einem klaren Bild Ihrer Datenqualität und dem nötigen Arbeitsaufwand zur Erreichung der geforderten Qualität. Daten Profilanalyse ist eine notwendige Voraussetzung für die nachfolgende Datenbereinigung oder Datenanreicherung bzw. Datenmigration.