Models and estimation algorithms for nonparametric finite mixtures with conditionally independent multivariate component densities
HOANG, Vy-Thuy-Lynh
HAL, NNT: 2017ORLE2012 / Harvested from HAL
Plusieurs auteurs ont proposé récemment des modèles et des algorithmes pour l'estimation nonparamétrique de mélanges multivariés finis dont l'identifiabilité n'est pas toujours assurée. Entre les modèles considérés, l'hypothèse des coordonnées indépendantes conditionnelles à la sous-population de provenance des individus fait l'objet d'une attention croissante, en raison des développements théoriques et pratiques envisageables, particulièrement avec la multiplicité des variables qui entrent en jeu dans le framework statistique moderne. Dans ce travail, nous considérons d'abord un modèle plus général supposant l'indépendance, conditionnellement à la composante, de blocs multivariés de coordonnées au lieu de coordonnées univariées, permettant toute structure de dépendance à l'intérieur de ces blocs. Par conséquent, les fonctions de densité des blocs sont complètement multivariées et non paramétriques. Nous présentons des arguments d'identifiabilité et introduisons pour l'estimation dans ce modèle deux algorithmes méthodologiques dont les procédures de calcul ressemblent à un véritable algorithme EM mais incluent une étape additionnelle d'estimation de densité: un algorithme rapide montrant l'efficacité empirique sans justification théorique, et un algorithme lissé possédant une propriété de monotonie comme certain algorithme EM, mais plus exigeant en terme de calcul. Nous discutons également les méthodes efficaces en temps de calcul pour l'estimation et proposons quelques stratégies. Ensuite, nous considérons une extension multivariée des modèles de mélange utilisés dans le cadre de tests d'hypothèses multiples, permettant une nouvelle version multivariée de contrôle du False Discovery Rate. Nous proposons une version contrainte de notre algorithme précédent, adaptée spécialement à ce modèle. Le comportement des algorithmes de type EM que nous proposons est étudié numériquement dans plusieurs expérimentations de Monte Carlo et sur des données réelles de grande dimension et comparé avec les méthodes existantes dans la littérature. En n, les codes de nos nouveaux algorithmes sont progressivement ajoutés sous forme de nouvelles fonctions dans le package en libre accès mixtools pour le logiciel de statistique R.
Publié le : 2017-04-20
Classification:  EM algorithm,  Nonparametric mixture models,  Multivariate component densities,  Algorithme EM,  Estimation non-paramétrique de densité multivariées,  Mélanges nonparam étriques multivariés,  [MATH.MATH-GM]Mathematics [math]/General Mathematics [math.GM]
@article{NNT: 2017ORLE2012,
     author = {HOANG, Vy-Thuy-Lynh},
     title = {Models and estimation algorithms for nonparametric finite mixtures with conditionally independent multivariate component densities},
     journal = {HAL},
     volume = {2017},
     number = {0},
     year = {2017},
     language = {en},
     url = {http://dml.mathdoc.fr/item/NNT: 2017ORLE2012}
}
HOANG, Vy-Thuy-Lynh. Models and estimation algorithms for nonparametric finite mixtures with conditionally independent multivariate component densities. HAL, Tome 2017 (2017) no. 0, . http://gdmltest.u-ga.fr/item/NNT:%202017ORLE2012/