Analyse d'un grand jeu de données en épidémiologie : problématiques et perspectives méthodologiques

作者: Yohann Mansiaux

DOI:

关键词: HumanitiesSociology

摘要: L'augmentation de la taille des jeux donnees est une problematique croissante en epidemiologie. La cohorte CoPanFlu-France (1450 sujets), proposant etude du risque d'infection par grippe H1N1pdm comme combinaison facteurs tres divers un exemple. Les methodes statistiques usuelles (e.g. les regressions) pour explorer associations sont limitees dans ce contexte. Nous comparons l'apport exploratoires data-driven a celui hypothesis-driven.Une premiere approche ete utilisee, evaluant capacite detecter l'infection deux data mining, forets aleatoires et arbres regression boostes, methodologie " regressions univariees/regression multivariee" logistique LASSO, effectuant selection variables importantes. Une simulation permis d'evaluer taux vrais faux positifs ces methodes. avons ensuite realise causale hypothesis-driven d'infection, avec modele d'equations structurelles (SEM) latentes, etudier divers, leur impact relatif sur ainsi que leurs relations eventuelles. Cette these montre necessite considerer nouvelles approches l'analyse grands Le mining le LASSO alternatives credibles aux outils conventionnels recherche d'associations. SEM permettent l'integration decrivant differentes dimensions modelisation explicite relations, lors d'un interet majeur multidisciplinaire CoPanFlu.

参考文章(6)
Christian Geiser, Data Analysis with Mplus ,(2012)
Tanya N Beran, Claudio Violato, Structural equation modeling in medical research: a primer. BMC Research Notes. ,vol. 3, pp. 267- 267 ,(2010) , 10.1186/1756-0500-3-267
Jorge González, Paul De Boeck, Francis Tuerlinckx, None, A double-structure structural equation model for three-mode data. Psychological Methods. ,vol. 13, pp. 337- 353 ,(2008) , 10.1037/A0013269
K. A. Bollen, M. D. Noble, Structural equation models and the quantification of behavior. Proceedings of the National Academy of Sciences of the United States of America. ,vol. 108, pp. 15639- 15646 ,(2011) , 10.1073/PNAS.1010661108