Data Quality

Die Data Quality bestimmt, wie gut sich Datenbestände für vorgesehene Aufgaben eignen. Das können beispielsweise Anwendungen aus dem Business-Intelligence-Umfeld sein. Zur Bewertung der Daten Qualität existieren zahlreiche Kriterien.

In Hublify können alle Daten mit konfigurierbaren Check Sets überprüft werden. Wann und wie das genau geschehen soll, kann ebenso individuell eingestellt werden.


Was ist Daten Qualität?

Die Datenqualität bezieht sich auf den Zustand qualitativer oder quantitativer Informationen. 

Data Quality gibt Auskunft darüber, wie gut sich vorhandene Daten für bestimmte Anwendungen oder Aufgaben eignen. Mithilfe von Kriterien kann die Datenqualität eines Datenbestands bestimmt werden. Neben der Korrektheit und Verlässlichkeit der Daten spielen zahlreiche weitere Kriterien wie Relevanz und Verfügbarkeit eine bedeutsame Rolle für die Datenqualität. 

Die Qualität von Analyseergebnissen hängt immer von der Qualität der zugrundeliegenden Daten ab. Das heißt unsaubere Daten führen in der Regel zu unbrauchbaren Erkenntnissen. Somit ist eine hohe Data Quality ein entscheidender Erfolgsfaktor für Unternehmen, um konkrete Geschäftswerte zu generieren, digitale Prozesse zu beschleunigen und somit die Produktivität zu erhöhen und den Unternehmenserfolg zu steigern.

Wenn die Datenqualität gegeben ist, lassen sich operative Prozesse zuverlässig steuern, relevante Berichte erstellen oder BI-Anwendungen effizient ausführen.

Durch fehlerhafte Datenbestände oder mangelnde Datenqualität können einem Unternehmen erhebliche Kosten entstehen. Beispielsweise verursachen Adressdubletten einen erhöhten finanziellen und zeitlichen Aufwand beim Versand von Mailings.

Je höher die Data Quality, desto besser lassen sich beispielsweise Marketingaktionen an die Erwartungshaltung potenzieller Kunden anpassen, kritische Unternehmensentscheidungen treffen oder personalisierte Dienstleistungen erbringen.

Woran lässt sich Data Quality festmachen?

Anhand folgender Kriterien können Unternehmen die Qualität ihrer Daten individuell bewerten:

  • Konsistenz - Die Daten müssen widerspruchs- und Dubletten frei sein.
    Bsp.: Eventuell darf eine Email-Adresse nur jeweils einmal in den Kundenstammdaten vorkommen. Groß- und Kleinschreibung ggfs. zu ignorieren!
  • Vollständigkeit - Ein Datensatz muss alle notwendigen Attribute enthalten. Die Attribute müssen alle notwendigen Daten enthalten.
    Bsp.: Sind "Vorname" und "Nachname" bei dem Kundenstamm-Datensatz vorhanden?
  • Validität - Die Daten müssen aus glaubwürdigen Quellen stammen.
  • Genauigkeit - Die Daten müssen im geeigneten Format vorliegen.
    Bsp.: erforderliche Zahl an Nachkommastellen
  • Aktualität - Alle Datensätze müssen jeweils dem aktuellen Zustand der abgebildeten Realität entsprechen.
    Bsp.: Ist die URL noch erreichbar?

Je nach Branche und Geschäftsprozess gibt es Kriterien die wichtiger sind als andere. Beispielsweise sind in der Gewinn- und Verlustrechnung exakte Daten unverzichtbar. Für eine bedürfnisbezogene Kundenansprache müssen die Daten vollkommen widerspruchsfrei sein. Daher kann sich die Wichtigkeit der Kennzahlen mit wechselnden Geschäftsordnungen auch verschieben.

Einzelne Datenfelder prüfen...

Mit Hublify besteht die Möglichkeit ganz einfach Datenfelder genau zu überprüfen. Dazu gibt es eine Vielzahl an Checks, die vorgefertigt angelegt sind, oder die du dir auch selber konfigurieren kannst. Von ganz einfachen bis hin zu tiefgreifenden Checks ist alles möglich.

Hier eine Liste von möglichen Beispiel Checks (kleiner Auszug):

  • Feld leer?
  • Text Mindest- / Maximallänge
  • Wort Anzahl
  • Zahl im Wertebereich?
  • Gültiges HTML?
  • Gültige Telefonnummer-Schreibweise?
  • Gültige URL / Link ? Ist dieser noch aufrufbar?
  • Bilder vorhanden?
  • Aufzählungen im Text?
  • "Bad-Words" im Text? (-> eigenes Dictionary)
  • ... viele viele mehr!