Synthetische Testdaten

Für viele Zwecke benötigt man heutzutage Daten, die nicht verfügbar sind. Wir bieten Ihnen für die Evaluierung eines neuen CRM’s , Ihrer Datenbank oder ihres Produkts/Applikation Daten nach Ihren Vorgaben zu generieren. Diese können nach Ihren Präferenzen Namen, valide Adresse, Numerische Attribute wie Alter, binäre Variablen und vieles mehr beinhalten. Zudem ist es häufig auch notwendig, gezielt Ausreisser in solchen Daten zu platzieren, um Systeme korrekt zu testen. Bei einem Testing sollte immer analysiert werden, wie das System mit korrekten und inkorrekten Eingaben umgeht. Dies kann nach Absprache in einen generierten Datensatz integriert werden.

Imputation

Imputation umfasst alle statistischen Methoden, um fehlende Werte in einem Datensatz künstlich aufzufüllen. Diese Methoden können nicht für alle Arten von Daten verwendet werden, jedoch sollte Imputation vor jeder Analyse und Modellierung geprüft und angewendet werden.

Bei unseren Imputations-Methoden setzen wir viel Wert auf eine enge Zusammenarbeit mit Ihnen, da nur ein fundiertes Verständnis der Daten zu enwandfrei aufgefüllten Daten führt.

 

Einfaches Beispiel einer Imputation

Input Daten

Name

Alter

( Weitere Attribute )

Hat Interesse

Wenger

55

Ja

Müller

34

 

Meier

18

Nein

Bauer

27

 

Imputierte Daten

Name

Alter

( Weitere Attribute )

Hat Interesse

Wenger

55

Ja

Müller

34

Ja

Meier

18

Nein

Bauer

27

Nein