Fusion et greffes de données
Fischer, Nicolas ; Saporta, Gilbert
HAL, hal-01124592 / Harvested from HAL
La fusion statistique de fichiers a pour but de compléter un fichier « receveur » où certaines variables ne sont pas renseignées (questions non posées) à l'aide d'un ou plusieurs fichiers « donneurs » portant sur d'autres individus. Le fichier donneur comprend bien sûr des variables communes ainsi que les variables d'intérêt renseignées pour tous les individus. Les remplacements de données manquantes se font soit par des méthodes d'imputation basées sur des proches voisins (injection) soit à l'aide de méthodes explicites de type régression.Les greffes d'enquêtes poursuivent des objectifs proches, en ce sens qu'il s'agit par exemple de positionner des résultats d'un sondage (une analyse factorielle) sur ceux d'un autre en utilisant des variables passerelles, mais sans nécessairement chercher à estimer les données manquantes. Cet exposé présentera la problématique, les principales techniques utilisées, les critères de validation, ainsi que les dangers potentiels ...
Publié le : 2000-01-01
Classification:  [INFO]Computer Science [cs],  [MATH.MATH-ST]Mathematics [math]/Statistics [math.ST]
@article{hal-01124592,
     author = {Fischer, Nicolas and Saporta, Gilbert},
     title = {Fusion et greffes de donn\'ees},
     journal = {HAL},
     volume = {2000},
     number = {0},
     year = {2000},
     language = {en},
     url = {http://dml.mathdoc.fr/item/hal-01124592}
}
Fischer, Nicolas; Saporta, Gilbert. Fusion et greffes de données. HAL, Tome 2000 (2000) no. 0, . http://gdmltest.u-ga.fr/item/hal-01124592/