Kundenabgleich in der Praxis: Wie ein Versandhandelsunternehmen seine Kundendatenbank sanierte

Ausgangssituation: Gewachsene Datenstrukturen als Herausforderung

Viele mittelständische Versandhandelsunternehmen kennen das Problem: Über Jahre wurden Kundendaten in verschiedenen Systemen gepflegt – dem ursprünglichen Warenwirtschaftssystem, einem neu eingeführten CRM, einem Onlineshop und mehreren Excel-Listen aus dem Außendienst. Das Ergebnis ist eine heterogene Datenlandschaft mit erheblichen Qualitätsmängeln.

In einem typischen Szenario dieser Art könnten von insgesamt rund 85.000 Kundendatensätzen beim ersten Audit mehr als 18 % als potenzielle Dubletten identifiziert werden. Hinzu kommen zahlreiche veraltete oder unvollständige Adressen sowie inkonsistente Schreibweisen bei Firmennamen und Ansprechpartnern.

Phase 1: Bestandsaufnahme und Analyse

Zu Beginn eines solchen Projekts steht immer eine gründliche Analyse des Ist-Zustands. Dabei werden typischerweise folgende Fragen beantwortet:

Welche Systeme enthalten Kundendaten, und wer ist für welches System verantwortlich?
Welches System soll als führendes System (Single Source of Truth) gelten?
Wie groß ist der Anteil fehlerhafter oder unvollständiger Datensätze?
Welche Datenfelder sind für den Geschäftsbetrieb besonders kritisch?

Im Versandhandelsbereich sind Lieferadressen naturgemäß besonders kritisch: Eine falsche Adresse bedeutet eine Rücksendung, zusätzliche Kosten und im schlimmsten Fall einen verlorenen Kunden.

Phase 2: Datenstandardisierung

Vor dem eigentlichen Abgleich müssen alle Daten in ein einheitliches Format gebracht werden. Dazu gehören:

Vereinheitlichung der Anredefelder (z. B. „Hr.", „Herr", „herr" → „Herr")
Normalisierung der Straßenangaben (z. B. „Str.", „Strasse", „Straße" → „Straße")
Bereinigung der Telefonnummernformate
Vereinheitlichung von Länderkennzeichen und Postleitzahlen

Phase 3: Dublettenerkennung mit priorisierten Regeln

Für den eigentlichen Dublettenabgleich werden üblicherweise mehrere Matching-Regeln mit unterschiedlicher Priorität definiert. Ein bewährtes Regelset für den B2C-Bereich sieht beispielsweise so aus:

Harte Regel: Gleiche E-Mail-Adresse → sofortige Zusammenführung
Mittlere Regel: Gleicher Nachname + Straße + PLZ → Vorschlag zur Prüfung
Weiche Regel: Ähnlicher Name (Fuzzy Match > 85 %) + gleiche PLZ → manuelle Sichtung

Phase 4: Merge-Strategie und Zusammenführung

Bei der Zusammenführung von Dubletten stellt sich immer die Frage: Welcher Datensatz „gewinnt"? Eine sinnvolle Merge-Strategie lautet: Der Datensatz mit dem jüngeren letzten Kaufdatum wird als Hauptdatensatz behalten. Fehlende Felder werden aus dem älteren Datensatz ergänzt. Die Kaufhistorie beider Datensätze wird vollständig zusammengeführt.

Erzielte Verbesserungen

Nach Abschluss eines solchen Projekts lassen sich in der Praxis typischerweise folgende Verbesserungen messen:

Deutliche Reduzierung von Rücksendequoten bei Katalog- und Paketversand
Sinkende Kosten durch Vermeidung doppelter Mailings
Höhere E-Mail-Zustellraten durch Bereinigung ungültiger Adressen
Verbessertes Bild der echten Kundenzahl für Reporting und Planung

Phase 5: Prävention – Damit das Problem nicht wiederkommt

Die eigentliche Arbeit beginnt nach dem Projekt: Damit die Datenqualität dauerhaft hoch bleibt, sind präventive Maßnahmen unverzichtbar:

Dublettenprüfung direkt bei der Neuanlage eines Kunden im CRM
Echtzeit-Adressvalidierung in allen Online-Formularen
Quartalsweise Mini-Audits zur Früherkennung neuer Qualitätsprobleme
Schulung der Mitarbeiter, die Kundendaten erfassen

Fazit

Das Beispiel zeigt: Ein systematisch durchgeführter Kundenabgleich zahlt sich aus – finanziell durch sinkende Versandkosten und operativ durch verlässlichere Daten für alle Geschäftsbereiche. Entscheidend ist, nicht nur einmalig zu bereinigen, sondern anschließend dauerhaft in die Datenqualität zu investieren.