作者: Yohann Mansiaux
DOI:
关键词: Humanities 、 Sociology
摘要: L'augmentation de la taille des jeux donnees est une problematique croissante en epidemiologie. La cohorte CoPanFlu-France (1450 sujets), proposant etude du risque d'infection par grippe H1N1pdm comme combinaison facteurs tres divers un exemple. Les methodes statistiques usuelles (e.g. les regressions) pour explorer associations sont limitees dans ce contexte. Nous comparons l'apport exploratoires data-driven a celui hypothesis-driven.Une premiere approche ete utilisee, evaluant capacite detecter l'infection deux data mining, forets aleatoires et arbres regression boostes, methodologie " regressions univariees/regression multivariee" logistique LASSO, effectuant selection variables importantes. Une simulation permis d'evaluer taux vrais faux positifs ces methodes. avons ensuite realise causale hypothesis-driven d'infection, avec modele d'equations structurelles (SEM) latentes, etudier divers, leur impact relatif sur ainsi que leurs relations eventuelles. Cette these montre necessite considerer nouvelles approches l'analyse grands Le mining le LASSO alternatives credibles aux outils conventionnels recherche d'associations. SEM permettent l'integration decrivant differentes dimensions modelisation explicite relations, lors d'un interet majeur multidisciplinaire CoPanFlu.