Was ist Datenvalidierung?

Der Unterschied zwischen Datenvalidierung und Plausibilitätsprüfung liegt darin, dass Validierung einzelne Werte prüft, während Plausibilitätsprüfungen Zusammenhänge und logische Konsistenz sicherstellen.

Datenvalidierung prüft, ob ein einzelner Wert formal korrekt ist.

👉 Datenvalidierungen sind damit ein grundlegender Bestandteil strukturierter Produktdaten im PIM und bilden die Basis für zuverlässige Datenqualität.

Typische Prüfungen sind:

Ist ein Feld ausgefüllt?
Hat ein Wert das richtige Format?
Liegt ein Wert im erlaubten Bereich?

Wie wir Datenvalidierung im PIM umsetzen

In Contene werden Datenvalidierungen u. a. durch unsere Decision Engine ausgeführt. Sie prüft Werte automatisch anhand definierter Regeln und sorgt dafür, dass technische Fehler sofort erkannt werden.

Dublettenkontrolle auf Attribut‑Ebene (UNIQUE‑Felder)

Neben klassischen Datenvalidierungen unterstützt Contene auch eine technische Dublettenkontrolle, die bereits auf Datenbankebene ausgeführt wird. Für jedes Attribut kann in der Konfigurationsoberfläche festgelegt werden, ob ein Wert einzigartig sein muss.

Typische Anwendungsfälle:

keine doppelten SKUs bzw. Artikelnummern
keine doppelten Bildnamen
keine mehrfach vergebenen externen IDs
keine mehrfach verwendeten Dateinamen

Diese Prüfung erfolgt nicht über die Decision Engine, sondern direkt durch einen UNIQUE‑Constraint in der Datenbank. Wird ein Wert gespeichert, der bereits existiert, verhindert das System den Eintrag automatisch.

Kombination mit der Decision Engine

Die Dublettenkontrolle kann mit der Decision Engine kombiniert werden, um komplexere Szenarien abzudecken. Ein typisches Beispiel ist die Doppelbildkontrolle:

Die Decision Engine berechnet beim Upload einen Hash‑Wert des Bildes.
Dieser Hash wird in einem Attribut gespeichert.
Das Attribut ist als UNIQUE markiert.
Wird ein Bild mit identischem Hash erneut hochgeladen, verhindert das System das Speichern.

So lassen sich doppelte Bilder, redundante Medien oder identische Dateien zuverlässig ausschließen – ohne manuelle Kontrolle.

Beispiele für Datenvalidierung

Ein Preisfeld darf nur Zahlen enthalten
Eine E-Mail-Adresse muss ein gültiges Format haben
Ein Pflichtfeld darf nicht leer sein
Ein numerisches Feld darf keine Buchstaben enthalten

👉 Ziel:

Datenvalidierung stellt sicher, dass Daten technisch korrekt sind.

Weitere typische Validierungen betreffen strukturierte Inhalte und formale Einschränkungen.

👉 Beispiel: HTML-Validierung

Bei einem HTML-Attribut kann geprüft werden, ob der eingegebene Inhalt syntaktisch korrekt ist:

sind alle Tags korrekt geschlossen?
entspricht der Inhalt den HTML-Regeln?
dürfen bestimmte Tags verwendet werden?

Solche Prüfungen stellen sicher, dass Inhalte technisch gültig sind und fehlerfrei verarbeitet werden können.

👉 Beispiel: Längenbegrenzung

Für ein Textfeld kann eine maximale Zeichenanzahl definiert werden.

ein Verkaufsmerkmal darf z. B. maximal 150 Zeichen enthalten
längere Eingaben werden direkt erkannt
das System gibt eine entsprechende Fehlermeldung aus

Der Benutzer sieht dabei sofort:

wie viele Zeichen erlaubt sind
wie viele Zeichen aktuell eingegeben wurden
dass der Wert angepasst werden muss

Solche Regeln stellen sicher, dass Inhalte in vorgegebene Strukturen passen – etwa für Datenblätter, Shops oder Ausgabekanäle.

Wie das System auf Validierungsfehler reagiert

Ein weiterer wichtiger Aspekt von Datenvalidierung ist, wie das System auf Fehler reagiert.

👉 Bei Validierungen kann festgelegt werden:

ob ein Speichern vollständig verhindert wird
oder ob lediglich eine Fehlermeldung angezeigt wird

In der Praxis bedeutet das:

kritische Fehler blockieren das Speichern vollständig
weniger kritische Hinweise werden angezeigt, ohne den Prozess zu unterbrechen

👉 Der Benutzer wird auf Probleme hingewiesen, kann Daten aber – je nach Konfiguration – trotzdem speichern und später korrigieren.

👉 Entscheidend:

Alle diese Prüfungen stellen sicher, dass Daten formal korrekt sind – sagen jedoch nichts darüber aus, ob sie inhaltlich sinnvoll oder logisch konsistent sind.

Der Unterschied zwischen Datenvalidierung und Plausibilitätsprüfung lässt sich am einfachsten in einer Gegenüberstellung erkennen:

Datenvalidierung	Plausibilitätsprüfung
prüft einzelne Werte	prüft Zusammenhänge zwischen Werten
Fokus: Format und Regeln	Fokus: Logik und Kontext
stellt technische Korrektheit sicher	stellt inhaltliche Konsistenz sicher
z. B. Pflichtfelder, Formate, Längen	z. B. Abhängigkeiten, Kombinationen
Fehler sind oft eindeutig	Fehler entstehen durch falsche Zusammenhänge
prüft unabhängig von anderen Feldern	berücksichtigt Beziehungen zwischen Attributen
kann Speichern verhindern oder erlauben	steuert Daten aktiv anhand von Regeln
Beispiel: max. 150 Zeichen eingehalten	Beispiel: Attributkombination ist logisch korrekt
stellt sicher, dass Daten verarbeitet werden können	stellt sicher, dass Daten fachlich korrekt sind
Frage: „Ist der Wert gültig?“	Frage: „Passt der Wert zum Kontext?“

👉 Datenvalidierung schützt einzelne Felder – Plausibilitätsprüfung schützt die Logik der Daten.

Wie funktioniert das in der Praxis?

Unsere Decision Engine automatisiert Validierungen, Plausibilitätsprüfungen und komplexe Datenlogik im PIM. In Contene übernimmt die Decision Engine die regelbasierte Ausführung aller Validierungen und sorgt dafür, dass technische Fehler sofort erkannt werden. In der Folge steigt die Datenqualität der Produktdaten im PIM.