Hot-Deck-Verfahren zur Imputation fehlender Daten : Ergebnisse einer Simulationsstudie zur Untersuchung der Auswirkungen einer wiederholten Verwendung des Spenderobjekts

Bankhofer, Udo GND; Joenssen, Dieter W. GND

Ilmenauer Beiträge zur Wirtschaftsinformatik Nr. 2011-05 / Technische Universität Ilmenau, Fakultät für Wirtschaftswissenschaften, Institut für Wirtschaftsinformatik ISSN 1861-9223 ISBN 978-3-938940-37-2

Zusammenfassung: Hot-Deck-Verfahren sind spezielle, auf Imputationsklassen basierende Imputationsverfahren. Sie zeichnen sich dadurch aus, dass fehlende Daten durch vorhan-dene Werte der vorliegenden Datenmatrix imputiert werden. Das Objekt, das dabei die vorhandenen Daten zur Imputation liefert, wird als Spenderobjekt bezeichnet. Da die Er-setzung der fehlenden Daten eines Objekts durch die Ausprägungen eines ähnlichen Spen-derobjekts sinnvoller ist die Ersetzung durch die Ausprägungen eines beliebig ausgewählten Spenderobjekts, erfolgt dieser Verdopplungsprozess innerhalb der zuvor gebildeten Imputationsklassen. Durch diese grundsätzliche Vordopplungseigenschaft der Hot-Deck-Verfahren stellt sich damit das Problem, dass ein Spenderobjekt wiederholt zur Imputation ausgewählt werden kann. Im Extremfall könnten somit alle fehlenden Werte bei einem Merkmal durch ein und dieselbe Ausprägung eines einzigen Spenderobjekts ersetzt werden. Aus diesem Grund erfolgt bei einigen Varianten der Hot-Deck-Verfahren eine Begrenzung der Anzahl, wie häufig ein Objekt als Spenderobjekt verwendet werden darf. Damit stellt sich zwangsläufig die Frage, unter welchen Bedingungen eine derartige Begrenzung überhaupt sinnvoll ist. Im Rahmen dieser Arbeit wird daher eine umfangreiche Simulationsstudie zur Beantwortung dieser Frage durchgeführt. Dabei zeigt sich, dass es deutliche Unterschiede zwischen Hot-Deck-Imputationen gibt, bei denen die Spenderver-wendungshäufigkeit variiert wird. Darüber hinaus können auch einige Einflussfaktoren identifiziert werden, die für oder gegen eine Begrenzung der Spenderobjekte sprechen.

Zitieren

Zitierform:

Bankhofer, Udo / Joenssen, Dieter W.: Hot-Deck-Verfahren zur Imputation fehlender Daten. Ergebnisse einer Simulationsstudie zur Untersuchung der Auswirkungen einer wiederholten Verwendung des Spenderobjekts. Ilmenau 2011. ISSN: 1861-9223.

Zugriffsstatistik

Gesamt:
Volltextzugriffe:
Metadatenansicht:
12 Monate:
Volltextzugriffe:
Metadatenansicht:

Grafik öffnen

Rechte

Nutzung und Vervielfältigung:
Alle Rechte vorbehalten

Export