Méthodes Statistiques pour l'Analyse de Données Génétiques d'Association à Grande Echelle

作者: Mickael Guedj

DOI:

关键词:

摘要: Les avancees en Biologie Moleculaire ont accelere le developpement de techniques genotypage haut-debit et ainsi permis lancement des premieres etudes genetiques d'association a grande echelle. La dimension la complexite donnees issues ce nouveau type d'etude posent aujourd'hui nouvelles perspectives statistiques informatiques necessaires leur analyse, constituant principal axe recherche cette these. Apres une description introductive principales problematiques liees aux echelle, nous abordons plus particulierement les approches simple-marqueur avec etude puissance principaux tests d'association, que combinaisons. Nous considerons ensuite l'utilisation d'approches multi-marqueurs d'une methode d'analyse fondee partir statistique du Score Local. Celle-ci permet d'identifier associations regions genomiques completes, non marqueurs pris individuellement. Il s'agit simple, rapide flexible pour laquelle evaluons performances sur echelle simulees reelles. Enfin travail traite egalement probleme test-multiple, lie nombre realiser lors l'analyse ou haut-debit. proposons Local prend compte probleme. evoquons par ailleurs l'estimation False Discovery Rate travers un simple modele melange gaussien. L'ensemble methodes decrites dans manuscrit ete implementees trois logiciels disponibles site laboratoire Statistique Genome : fueatest, LHiSA kerfdr.

参考文章(102)
Mark J. Daly, John D. Rioux, Stephen F. Schaffner, Thomas J. Hudson, Eric S. Lander, High-resolution haplotype structure in the human genome. Nature Genetics. ,vol. 29, pp. 229- 232 ,(2001) , 10.1038/NG1001-229
Peter McCullagh, John Ashworth Nelder, Generalized Linear Models ,(1983)
Systems of Mating John Wiley & Sons, Inc.. pp. 48- 81 ,(2006) , 10.1002/0470047356.CH3
L Brooke Hayward, Jonathan Segal, Paul Van Eerdewegh, Kathryn L Lunetta, Screening large-scale association study data: exploiting interactions using random forests BMC Genetics. ,vol. 5, pp. 32- 32 ,(2004) , 10.1186/1471-2156-5-32
Lancelot Hogben, The genetic analysis of familial traits Journal of Genetics. ,vol. 25, pp. 97- 112 ,(1931) , 10.1007/BF02983936
W J Ewens, R S Spielman, The TDT and other family-based tests for linkage disequilibrium and association. American Journal of Human Genetics. ,vol. 59, pp. 983- 989 ,(1996)
J McLachlan, G, D. Peel, Finite Mixture Models ,(2000)
Mikko J. Sillanpää, Kari Auranen, Replication in genetic studies of complex traits. Annals of Human Genetics. ,vol. 68, pp. 646- 657 ,(2004) , 10.1046/J.1529-8817.2004.00122.X
W C Knowler, A G Steinberg, R C Williams, D J Pettitt, Gm3;5,13,14 and type 2 diabetes mellitus: an association in American Indians with genetic admixture. American Journal of Human Genetics. ,vol. 43, pp. 520- 526 ,(1988)
J. D. Storey, R. Tibshirani, Statistical significance for genomewide studies Proceedings of the National Academy of Sciences of the United States of America. ,vol. 100, pp. 9440- 9445 ,(2003) , 10.1073/PNAS.1530509100