Ausgangssituation: Gewachsene Datenstrukturen als Herausforderung
Viele mittelständische Versandhandelsunternehmen kennen das Problem: Über Jahre wurden Kundendaten in verschiedenen Systemen gepflegt – dem ursprünglichen Warenwirtschaftssystem, einem neu eingeführten CRM, einem Onlineshop und mehreren Excel-Listen aus dem Außendienst. Das Ergebnis ist eine heterogene Datenlandschaft mit erheblichen Qualitätsmängeln.
In einem typischen Szenario dieser Art könnten von insgesamt rund 85.000 Kundendatensätzen beim ersten Audit mehr als 18 % als potenzielle Dubletten identifiziert werden. Hinzu kommen zahlreiche veraltete oder unvollständige Adressen sowie inkonsistente Schreibweisen bei Firmennamen und Ansprechpartnern.
Phase 1: Bestandsaufnahme und Analyse
Zu Beginn eines solchen Projekts steht immer eine gründliche Analyse des Ist-Zustands. Dabei werden typischerweise folgende Fragen beantwortet:
- Welche Systeme enthalten Kundendaten, und wer ist für welches System verantwortlich?
- Welches System soll als führendes System (Single Source of Truth) gelten?
- Wie groß ist der Anteil fehlerhafter oder unvollständiger Datensätze?
- Welche Datenfelder sind für den Geschäftsbetrieb besonders kritisch?
Im Versandhandelsbereich sind Lieferadressen naturgemäß besonders kritisch: Eine falsche Adresse bedeutet eine Rücksendung, zusätzliche Kosten und im schlimmsten Fall einen verlorenen Kunden.
Phase 2: Datenstandardisierung
Vor dem eigentlichen Abgleich müssen alle Daten in ein einheitliches Format gebracht werden. Dazu gehören:
- Vereinheitlichung der Anredefelder (z. B. „Hr.", „Herr", „herr" → „Herr")
- Normalisierung der Straßenangaben (z. B. „Str.", „Strasse", „Straße" → „Straße")
- Bereinigung der Telefonnummernformate
- Vereinheitlichung von Länderkennzeichen und Postleitzahlen
Phase 3: Dublettenerkennung mit priorisierten Regeln
Für den eigentlichen Dublettenabgleich werden üblicherweise mehrere Matching-Regeln mit unterschiedlicher Priorität definiert. Ein bewährtes Regelset für den B2C-Bereich sieht beispielsweise so aus:
- Harte Regel: Gleiche E-Mail-Adresse → sofortige Zusammenführung
- Mittlere Regel: Gleicher Nachname + Straße + PLZ → Vorschlag zur Prüfung
- Weiche Regel: Ähnlicher Name (Fuzzy Match > 85 %) + gleiche PLZ → manuelle Sichtung
Phase 4: Merge-Strategie und Zusammenführung
Bei der Zusammenführung von Dubletten stellt sich immer die Frage: Welcher Datensatz „gewinnt"? Eine sinnvolle Merge-Strategie lautet: Der Datensatz mit dem jüngeren letzten Kaufdatum wird als Hauptdatensatz behalten. Fehlende Felder werden aus dem älteren Datensatz ergänzt. Die Kaufhistorie beider Datensätze wird vollständig zusammengeführt.
Erzielte Verbesserungen
Nach Abschluss eines solchen Projekts lassen sich in der Praxis typischerweise folgende Verbesserungen messen:
- Deutliche Reduzierung von Rücksendequoten bei Katalog- und Paketversand
- Sinkende Kosten durch Vermeidung doppelter Mailings
- Höhere E-Mail-Zustellraten durch Bereinigung ungültiger Adressen
- Verbessertes Bild der echten Kundenzahl für Reporting und Planung
Phase 5: Prävention – Damit das Problem nicht wiederkommt
Die eigentliche Arbeit beginnt nach dem Projekt: Damit die Datenqualität dauerhaft hoch bleibt, sind präventive Maßnahmen unverzichtbar:
- Dublettenprüfung direkt bei der Neuanlage eines Kunden im CRM
- Echtzeit-Adressvalidierung in allen Online-Formularen
- Quartalsweise Mini-Audits zur Früherkennung neuer Qualitätsprobleme
- Schulung der Mitarbeiter, die Kundendaten erfassen
Fazit
Das Beispiel zeigt: Ein systematisch durchgeführter Kundenabgleich zahlt sich aus – finanziell durch sinkende Versandkosten und operativ durch verlässlichere Daten für alle Geschäftsbereiche. Entscheidend ist, nicht nur einmalig zu bereinigen, sondern anschließend dauerhaft in die Datenqualität zu investieren.