KI im Mittelstand Datenqualität KI-Einstieg CRM Praxis

Unsere Daten sind nicht perfekt – können wir trotzdem mit KI starten?

Die häufigste Ausrede gegen KI: 'Unsere Daten sind noch nicht bereit.' Warum das selten stimmt und wie Sie trotzdem starten.

Can Tewes

29. März 2026 · 6 min Lesezeit

Auf einen Blick

Perfekte Daten sind keine Voraussetzung für KI – sie sind oft das Ergebnis. Viele erfolgreiche Projekte beginnen gerade mit der Datenbereinigung als ersten Use Case. Entscheidend ist nicht die Qualität aller Daten, sondern ob für den konkreten Prozess genug brauchbare Daten vorliegen.

Die beliebteste Ausrede gegen KI

“Unsere Daten sind noch nicht bereit.” Diesen Satz höre ich in fast jedem Erstgespräch. Er klingt vernünftig – ist aber meistens eine Ausrede, kein Argument.

Natürlich: Manche KI-Anwendungen brauchen gute Daten. Aber die Vorstellung, dass zuerst ein unternehmensweites Datenprojekt abgeschlossen sein muss, bevor überhaupt an KI gedacht werden kann, ist falsch. Sie führt dazu, dass Unternehmen jahrelang an der Datengrundlage arbeiten und nie zum eigentlichen Projekt kommen.

Perfekte Daten sind das Ergebnis, nicht die Voraussetzung

Einer der besten Einstiegspunkte für KI ist die Datenbereinigung selbst. Klingt paradox? Ist es nicht.

Ein konkretes Beispiel: Ein Dienstleistungsunternehmen hatte 30% fehlerhafte CRM-Daten – Dubletten, veraltete Adressen, inkonsistente Felder. Statt monatelang manuell zu bereinigen, wurde KI eingesetzt, um:

Dubletten zu erkennen, auch bei unterschiedlicher Schreibweise
Fehlende Felder zu ergänzen auf Basis vorhandener Daten
Veraltete Einträge zu identifizieren und zur Prüfung vorzuschlagen

Ergebnis: Datenqualität von 68% auf 96%, 12.000 Dubletten bereinigt, Kampagnen-Response um 40% gestiegen. Die KI hat die Datenqualität geschaffen, nicht vorausgesetzt.

Welche Datenqualität brauchen Sie wirklich?

Die Anforderungen hängen vom Projekt ab:

Niedrige Anforderungen (sofort starten)

Reporting-Automatisierung – Daten aus bestehenden Systemen (SAP, Excel, CRM) zusammenführen. Die Daten müssen nur zugänglich sein, nicht perfekt
Prozessautomatisierung – Regeln definieren, Daten weiterleiten. Keine KI-spezifischen Datenanforderungen
Datenbereinigung – Gerade der Zustand “chaotische Daten” ist hier der Ausgangspunkt

Mittlere Anforderungen (mit Vorbereitung machbar)

Dokumentenklassifikation – Einige hundert Beispieldokumente zum Training
Anomalie-Erkennung – Historische Daten über 3–6 Monate
Empfehlungssysteme – Transaktionsdaten als Grundlage

Hohe Anforderungen (Vorbereitung nötig)

Prognosemodelle – Historische Daten über 12+ Monate, konsistent erfasst
Computer Vision – Große Mengen gelabelter Bilddaten
NLP auf Fachdaten – Domänenspezifisches Trainingsmaterial

Die gute Nachricht: Die meisten Mittelstandsprojekte fallen in die erste oder zweite Kategorie. Und selbst Projekte mit höheren Anforderungen lassen sich mit einem Piloten testen, bevor große Datenaufbereitungen nötig werden.

Die typischen Datenprobleme – und ihre Lösungen

”Unsere Daten liegen in verschiedenen Systemen”

Das ist normal, nicht problematisch. ETL-Prozesse (Extract, Transform, Load) führen Daten aus SAP, Excel, CRM und anderen Quellen zusammen. Das ist klassische Prozessautomatisierung – kein KI-Problem.

”Wir haben Dubletten und Inkonsistenzen”

Genau dafür gibt es KI-basierte Datenbereinigung. Fuzzy Matching, regelbasierte Validierung und ML-gestützte Deduplizierung lösen das Problem systematisch.

”Wir wissen nicht, welche Daten wir haben”

Ein KI-Potenzial-Audit beginnt genau hier: Bestandsaufnahme der verfügbaren Daten, Bewertung der Qualität und Identifikation der vielversprechendsten Anwendungsfälle.

”Unsere Daten sind zu wenig”

Oft eine Fehleinschätzung. Manchmal reicht regelbasierte Automatisierung, die gar keine KI braucht. Und für einfache Klassifikation genügen oft wenige hundert Beispiele.

Der pragmatische Startpunkt

Statt auf perfekte Daten zu warten:

Einen konkreten Prozess wählen – Wo anfangen?
Daten für diesen Prozess prüfen – Nicht alle Daten, nur die relevanten
Mit einem Piloten starten – So planen Sie ihn
Datenqualität als Nebeneffekt verbessern – Das Projekt selbst macht die Daten besser

Fazit

Die Frage ist nicht “Sind unsere Daten gut genug?” – sondern “Für welchen konkreten Prozess haben wir genug brauchbare Daten?” Die Antwort ist fast immer: für mindestens einen.

Und wenn die Datenbereinigung selbst der größte Schmerzpunkt ist? Dann ist das Ihr erster KI-Anwendungsfall.

Sie möchten wissen, ob Ihre Datengrundlage für ein KI-Projekt ausreicht? Im KI-Potenzial-Audit bewerten wir das konkret – für Ihre Prozesse, mit Ihren Daten.

Häufig gestellte Fragen

Wie gut müssen Daten sein, damit KI funktioniert?

Das hängt vom Anwendungsfall ab. Für ein automatisiertes Reporting reichen strukturierte Daten aus einer Datenbank. Für ein KI-Modell zur Prognose brauchen Sie historische Daten über mindestens 6–12 Monate. Perfekt müssen sie nie sein – aber repräsentativ und in ausreichender Menge.

Kann KI selbst Datenqualität verbessern?

Ja – und das ist einer der besten Einstiegsprojekte. KI kann Dubletten erkennen, fehlende Felder ergänzen, Inkonsistenzen aufdecken und Datensätze anreichern. Ein Dienstleister konnte so die CRM-Datenqualität von 68% auf 96% steigern.

Wie viele Daten brauche ich für ein KI-Projekt?

Für regelbasierte Automatisierung: fast keine. Für einfache Klassifikation: einige hundert Beispiele. Für komplexe Prognosemodelle: mehrere tausend Datenpunkte über einen längeren Zeitraum. Die meisten Mittelständler haben mehr verwertbare Daten als sie denken.

Soll ich erst die Daten bereinigen und dann mit KI starten?

Nicht unbedingt. Oft ist die Datenbereinigung selbst der beste erste KI-Use-Case. Sie lösen zwei Probleme gleichzeitig: bessere Datenqualität und einen bewiesenen KI-Nutzen.

Can Tewes

KI-Berater mit Fokus auf pragmatische Automatisierung im Mittelstand. Strategie-Background, Tech-Verständnis, Umsetzungsfokus.

Mehr erfahren →

Weiterlesen

KI im Mittelstand