Fehlende Daten in Additiven Modellen
von Thomas NittnerIm Mittelpunkt der Betrachtung steht das einfache additive Modell g = ƒ(x) + Î mit fehlenden Werten in x. Das Ziel besteht im Vergleich von aus der linearen Regressionsrechnung bekannten Verfahren mit der nearest neighbor imputation. Neben einer ausführlichen Einführung in die Problematik fehlender Daten, in die Schätzung nichtparametrischer Regressionsmodelle und in einige Imputationsverfahren werden die Struktur und die Resultate der Simulationsexperimente ausführlich diskutiert. Dabei stehen insbesondere die Ergebnisse unter missing at random (MAR) im Vordergrund, was hier einer Abhängigkeit des Fehlens vom Response g entspricht. Während unter missing completely at random (MCAR) die Analyse der vollständigen Fälle noch als geeignet anzusehen ist, sind unter MAR die deutlichen Vorteile der nearest neighbor imputation bzw. einer neu entwickelten Version ersichtlich. Dieser Zusammenhang ist sowohl bei nichtmonotonem ƒ(x) wie auch bei einer monotonen Funktion ƒ zu erkennen.