Was ist Datenvalidierung?
Der Unterschied zwischen Datenvalidierung und Plausibilitätsprüfung liegt darin, dass Validierung einzelne Werte prüft, während Plausibilitätsprüfungen Zusammenhänge und logische Konsistenz sicherstellen.
Datenvalidierung prüft, ob ein einzelner Wert formal korrekt ist.
👉 Datenvalidierungen sind damit ein grundlegender Bestandteil strukturierter Produktdaten im PIM und bilden die Basis für zuverlässige Datenqualität.
Typische Prüfungen sind:
- Ist ein Feld ausgefüllt?
- Hat ein Wert das richtige Format?
- Liegt ein Wert im erlaubten Bereich?
Wie wir Datenvalidierung im PIM umsetzen
In Contene werden Datenvalidierungen u. a. durch unsere Decision Engine ausgeführt. Sie prüft Werte automatisch anhand definierter Regeln und sorgt dafür, dass technische Fehler sofort erkannt werden.
Dublettenkontrolle auf Attribut‑Ebene (UNIQUE‑Felder)
Neben klassischen Datenvalidierungen unterstützt Contene auch eine technische Dublettenkontrolle, die bereits auf Datenbankebene ausgeführt wird. Für jedes Attribut kann in der Konfigurationsoberfläche festgelegt werden, ob ein Wert einzigartig sein muss.
Typische Anwendungsfälle:
- keine doppelten SKUs bzw. Artikelnummern
- keine doppelten Bildnamen
- keine mehrfach vergebenen externen IDs
- keine mehrfach verwendeten Dateinamen
Diese Prüfung erfolgt nicht über die Decision Engine, sondern direkt durch einen UNIQUE‑Constraint in der Datenbank. Wird ein Wert gespeichert, der bereits existiert, verhindert das System den Eintrag automatisch.
Kombination mit der Decision Engine
Die Dublettenkontrolle kann mit der Decision Engine kombiniert werden, um komplexere Szenarien abzudecken. Ein typisches Beispiel ist die Doppelbildkontrolle:
- Die Decision Engine berechnet beim Upload einen Hash‑Wert des Bildes.
- Dieser Hash wird in einem Attribut gespeichert.
- Das Attribut ist als UNIQUE markiert.
- Wird ein Bild mit identischem Hash erneut hochgeladen, verhindert das System das Speichern.
So lassen sich doppelte Bilder, redundante Medien oder identische Dateien zuverlässig ausschließen – ohne manuelle Kontrolle.
Beispiele für Datenvalidierung
- Ein Preisfeld darf nur Zahlen enthalten
- Eine E-Mail-Adresse muss ein gültiges Format haben
- Ein Pflichtfeld darf nicht leer sein
- Ein numerisches Feld darf keine Buchstaben enthalten
👉 Ziel:
Datenvalidierung stellt sicher, dass Daten technisch korrekt sind.
Weitere typische Validierungen betreffen strukturierte Inhalte und formale Einschränkungen.
👉 Beispiel: HTML-Validierung
Bei einem HTML-Attribut kann geprüft werden, ob der eingegebene Inhalt syntaktisch korrekt ist:
- sind alle Tags korrekt geschlossen?
- entspricht der Inhalt den HTML-Regeln?
- dürfen bestimmte Tags verwendet werden?
Solche Prüfungen stellen sicher, dass Inhalte technisch gültig sind und fehlerfrei verarbeitet werden können.
👉 Beispiel: Längenbegrenzung
Für ein Textfeld kann eine maximale Zeichenanzahl definiert werden.
- ein Verkaufsmerkmal darf z. B. maximal 150 Zeichen enthalten
- längere Eingaben werden direkt erkannt
- das System gibt eine entsprechende Fehlermeldung aus
Der Benutzer sieht dabei sofort:
- wie viele Zeichen erlaubt sind
- wie viele Zeichen aktuell eingegeben wurden
- dass der Wert angepasst werden muss
Solche Regeln stellen sicher, dass Inhalte in vorgegebene Strukturen passen – etwa für Datenblätter, Shops oder Ausgabekanäle.
Wie das System auf Validierungsfehler reagiert
Ein weiterer wichtiger Aspekt von Datenvalidierung ist, wie das System auf Fehler reagiert.
👉 Bei Validierungen kann festgelegt werden:
- ob ein Speichern vollständig verhindert wird
- oder ob lediglich eine Fehlermeldung angezeigt wird
In der Praxis bedeutet das:
- kritische Fehler blockieren das Speichern vollständig
- weniger kritische Hinweise werden angezeigt, ohne den Prozess zu unterbrechen
👉 Der Benutzer wird auf Probleme hingewiesen, kann Daten aber – je nach Konfiguration – trotzdem speichern und später korrigieren.
👉 Entscheidend:
Alle diese Prüfungen stellen sicher, dass Daten formal korrekt sind – sagen jedoch nichts darüber aus, ob sie inhaltlich sinnvoll oder logisch konsistent sind.
Der Unterschied zwischen Datenvalidierung und Plausibilitätsprüfung lässt sich am einfachsten in einer Gegenüberstellung erkennen:
| Datenvalidierung | Plausibilitätsprüfung |
|---|---|
| prüft einzelne Werte | prüft Zusammenhänge zwischen Werten |
| Fokus: Format und Regeln | Fokus: Logik und Kontext |
| stellt technische Korrektheit sicher | stellt inhaltliche Konsistenz sicher |
| z. B. Pflichtfelder, Formate, Längen | z. B. Abhängigkeiten, Kombinationen |
| Fehler sind oft eindeutig | Fehler entstehen durch falsche Zusammenhänge |
| prüft unabhängig von anderen Feldern | berücksichtigt Beziehungen zwischen Attributen |
| kann Speichern verhindern oder erlauben | steuert Daten aktiv anhand von Regeln |
| Beispiel: max. 150 Zeichen eingehalten | Beispiel: Attributkombination ist logisch korrekt |
| stellt sicher, dass Daten verarbeitet werden können | stellt sicher, dass Daten fachlich korrekt sind |
| Frage: „Ist der Wert gültig?“ | Frage: „Passt der Wert zum Kontext?“ |
👉 Datenvalidierung schützt einzelne Felder – Plausibilitätsprüfung schützt die Logik der Daten.
Wie funktioniert das in der Praxis?
Unsere Decision Engine automatisiert Validierungen, Plausibilitätsprüfungen und komplexe Datenlogik im PIM. In Contene übernimmt die Decision Engine die regelbasierte Ausführung aller Validierungen und sorgt dafür, dass technische Fehler sofort erkannt werden. In der Folge steigt die Datenqualität der Produktdaten im PIM.
