Synthetische Testdaten
Für viele Zwecke benötigt man heutzutage Daten, die nicht verfügbar sind. Wir bieten Ihnen für die Evaluierung eines neuen CRM’s , Ihrer Datenbank oder ihres Produkts/Applikation Daten nach Ihren Vorgaben zu generieren. Diese können nach Ihren Präferenzen Namen, valide Adresse, Numerische Attribute wie Alter, binäre Variablen und vieles mehr beinhalten. Zudem ist es häufig auch notwendig, gezielt Ausreisser in solchen Daten zu platzieren, um Systeme korrekt zu testen. Bei einem Testing sollte immer analysiert werden, wie das System mit korrekten und inkorrekten Eingaben umgeht. Dies kann nach Absprache in einen generierten Datensatz integriert werden.
Imputation
Imputation umfasst alle statistischen Methoden, um fehlende Werte in einem Datensatz künstlich aufzufüllen. Diese Methoden können nicht für alle Arten von Daten verwendet werden, jedoch sollte Imputation vor jeder Analyse und Modellierung geprüft und angewendet werden.
Bei unseren Imputations-Methoden setzen wir viel Wert auf eine enge Zusammenarbeit mit Ihnen, da nur ein fundiertes Verständnis der Daten zu enwandfrei aufgefüllten Daten führt.
Einfaches Beispiel einer Imputation
Input Daten
Name | Alter | ( Weitere Attribute ) | Hat Interesse |
Wenger | 55 | … | Ja |
Müller | 34 | … |
|
Meier | 18 | … | Nein |
Bauer | 27 | … |
|
Imputierte Daten
Name | Alter | ( Weitere Attribute ) | Hat Interesse |
Wenger | 55 | … | Ja |
Müller | 34 | … | Ja |
Meier | 18 | … | Nein |
Bauer | 27 | … | Nein |