Unsere Daten sind nicht perfekt – können wir trotzdem mit KI starten?
Die häufigste Ausrede gegen KI: 'Unsere Daten sind noch nicht bereit.' Warum das selten stimmt und wie Sie trotzdem starten.
Perfekte Daten sind keine Voraussetzung für KI – sie sind oft das Ergebnis. Viele erfolgreiche Projekte beginnen gerade mit der Datenbereinigung als ersten Use Case. Entscheidend ist nicht die Qualität aller Daten, sondern ob für den konkreten Prozess genug brauchbare Daten vorliegen.
Die beliebteste Ausrede gegen KI
“Unsere Daten sind noch nicht bereit.” Diesen Satz höre ich in fast jedem Erstgespräch. Er klingt vernünftig – ist aber meistens eine Ausrede, kein Argument.
Natürlich: Manche KI-Anwendungen brauchen gute Daten. Aber die Vorstellung, dass zuerst ein unternehmensweites Datenprojekt abgeschlossen sein muss, bevor überhaupt an KI gedacht werden kann, ist falsch. Sie führt dazu, dass Unternehmen jahrelang an der Datengrundlage arbeiten und nie zum eigentlichen Projekt kommen.
Perfekte Daten sind das Ergebnis, nicht die Voraussetzung
Einer der besten Einstiegspunkte für KI ist die Datenbereinigung selbst. Klingt paradox? Ist es nicht.
Ein konkretes Beispiel: Ein Dienstleistungsunternehmen hatte 30% fehlerhafte CRM-Daten – Dubletten, veraltete Adressen, inkonsistente Felder. Statt monatelang manuell zu bereinigen, wurde KI eingesetzt, um:
- Dubletten zu erkennen, auch bei unterschiedlicher Schreibweise
- Fehlende Felder zu ergänzen auf Basis vorhandener Daten
- Veraltete Einträge zu identifizieren und zur Prüfung vorzuschlagen
Ergebnis: Datenqualität von 68% auf 96%, 12.000 Dubletten bereinigt, Kampagnen-Response um 40% gestiegen. Die KI hat die Datenqualität geschaffen, nicht vorausgesetzt.
Welche Datenqualität brauchen Sie wirklich?
Die Anforderungen hängen vom Projekt ab:
Niedrige Anforderungen (sofort starten)
- Reporting-Automatisierung – Daten aus bestehenden Systemen (SAP, Excel, CRM) zusammenführen. Die Daten müssen nur zugänglich sein, nicht perfekt
- Prozessautomatisierung – Regeln definieren, Daten weiterleiten. Keine KI-spezifischen Datenanforderungen
- Datenbereinigung – Gerade der Zustand “chaotische Daten” ist hier der Ausgangspunkt
Mittlere Anforderungen (mit Vorbereitung machbar)
- Dokumentenklassifikation – Einige hundert Beispieldokumente zum Training
- Anomalie-Erkennung – Historische Daten über 3–6 Monate
- Empfehlungssysteme – Transaktionsdaten als Grundlage
Hohe Anforderungen (Vorbereitung nötig)
- Prognosemodelle – Historische Daten über 12+ Monate, konsistent erfasst
- Computer Vision – Große Mengen gelabelter Bilddaten
- NLP auf Fachdaten – Domänenspezifisches Trainingsmaterial
Die gute Nachricht: Die meisten Mittelstandsprojekte fallen in die erste oder zweite Kategorie. Und selbst Projekte mit höheren Anforderungen lassen sich mit einem Piloten testen, bevor große Datenaufbereitungen nötig werden.
Die typischen Datenprobleme – und ihre Lösungen
”Unsere Daten liegen in verschiedenen Systemen”
Das ist normal, nicht problematisch. ETL-Prozesse (Extract, Transform, Load) führen Daten aus SAP, Excel, CRM und anderen Quellen zusammen. Das ist klassische Prozessautomatisierung – kein KI-Problem.
”Wir haben Dubletten und Inkonsistenzen”
Genau dafür gibt es KI-basierte Datenbereinigung. Fuzzy Matching, regelbasierte Validierung und ML-gestützte Deduplizierung lösen das Problem systematisch.
”Wir wissen nicht, welche Daten wir haben”
Ein KI-Potenzial-Audit beginnt genau hier: Bestandsaufnahme der verfügbaren Daten, Bewertung der Qualität und Identifikation der vielversprechendsten Anwendungsfälle.
”Unsere Daten sind zu wenig”
Oft eine Fehleinschätzung. Manchmal reicht regelbasierte Automatisierung, die gar keine KI braucht. Und für einfache Klassifikation genügen oft wenige hundert Beispiele.
Der pragmatische Startpunkt
Statt auf perfekte Daten zu warten:
- Einen konkreten Prozess wählen – Wo anfangen?
- Daten für diesen Prozess prüfen – Nicht alle Daten, nur die relevanten
- Mit einem Piloten starten – So planen Sie ihn
- Datenqualität als Nebeneffekt verbessern – Das Projekt selbst macht die Daten besser
Fazit
Die Frage ist nicht “Sind unsere Daten gut genug?” – sondern “Für welchen konkreten Prozess haben wir genug brauchbare Daten?” Die Antwort ist fast immer: für mindestens einen.
Und wenn die Datenbereinigung selbst der größte Schmerzpunkt ist? Dann ist das Ihr erster KI-Anwendungsfall.
Sie möchten wissen, ob Ihre Datengrundlage für ein KI-Projekt ausreicht? Im KI-Potenzial-Audit bewerten wir das konkret – für Ihre Prozesse, mit Ihren Daten.
Häufig gestellte Fragen
Wie gut müssen Daten sein, damit KI funktioniert?
Kann KI selbst Datenqualität verbessern?
Wie viele Daten brauche ich für ein KI-Projekt?
Soll ich erst die Daten bereinigen und dann mit KI starten?
Can Tewes
KI-Berater mit Fokus auf pragmatische Automatisierung im Mittelstand. Strategie-Background, Tech-Verständnis, Umsetzungsfokus.
Mehr erfahren →Weiterlesen
KI-Pilotprojekt planen: Schritt-für-Schritt-Anleitung für den Mittelstand
Von der Idee zum ersten KI-Ergebnis in 8 Wochen. Eine praxiserprobte Anleitung für Ihr erstes Pilotprojekt.
KI im Mittelstand5 KI-Projekte, die sich in unter 3 Monaten amortisieren
Kein Budget für Experimente? Diese fünf Projekttypen liefern messbare Ergebnisse in Wochen, nicht Monaten – mit konkreten Zahlen aus der Praxis.
KI im MittelstandWas kostet KI im Mittelstand? Ein ehrlicher Überblick
Zwischen 'KI ist unbezahlbar' und 'KI kostet fast nichts' liegt die Realität. Konkrete Zahlen und ehrliche Einordnung für Entscheider.