Optimisation multi-niveau d’une application de traitement d’images sur machines parallèles

作者: Tarik Saidani

DOI:

关键词:

摘要: Cette these vise a definir une methodologie de mise en œuvre d’applications performantes sur les processeurs embarques du futur. Ces architectures necessitent notamment d’exploiter au mieux differents niveaux parallelisme (grain fin, gros grain) et gerer communications acces la memoire. Pour etudier cette methodologie, nous avons utilise un processeur cible representatif ces emergentes, le CELL. Le detecteurde points d’interet Harris est exemple traitement regulier necessitant des unites calcul intensif. En etudiant plusieurs schemas oeuvre CELL, ainsi pu mettre evidence methodes d’optimisation calculs adaptant programmes aux specifiques SIMD L’utilisation efficace memoire necessite par ailleurs, fois bonne exploitation transferts arrangement optimal donnees Nous developpe outil d’abstraction permettant simplifier d’automatiser synchronisation, CELL MPI. expertise permis developper parallele optimisee algorithmes. concu programmation base squelettes algorithmiques : SKELL BE. Ce modele propose solution originale generation metaprogrammation. Il permet, maniere automatisee, d’obtenir tres bonnes performances permettre utilisation l’architecture, comme montre comparaison pour ensemble test avec autres outils dedies ce processeur.

参考文章(85)
Denis Caromel, Mario Leyton, Fine tuning algorithmic skeletons european conference on parallel processing. pp. 72- 81 ,(2007) , 10.1007/978-3-540-74466-5_9
Jocelyn Sérot, Joel Falcou, Formal Semantics Applied to the Implementation of a Skeleton-Based Parallel Programming Library. parallel computing. pp. 243- 252 ,(2007)
Peter M. Dew, John R. Davey, Abstract machine models for highly parallel computers Oxford University Press. ,(1995)
Nicolai M. Josuttis, David Vandevoorde, Douglas Gregor, C++ Templates: The Complete Guide ,(2002)
Philipp Ciechanowicz, Michael Poldner, Herbert Kuchen, None, The Münster Skeleton Library Muesli - A Comprehensive Overview Research Papers in Economics. ,(2009)
Tarik Saidani, Lionel Lacassagne, Samir Bouaziz, Taj Muhammad Khan, Parallelization strategies for the points of interests algorithm on the cell processor international symposium on parallel and distributed processing and applications. pp. 104- 112 ,(2007) , 10.1007/978-3-540-74742-0_12
Tarik Saidani, Lionel Lacassagne, Joel Falcou, Claude Tadonki, Samir Bouaziz, Parallelization Schemes for Memory Optimization on the Cell Processor: A Case Study on the Harris Corner Detector Transactions on High-Performance Embedded Architectures and Compilers III. ,vol. 3, pp. 177- 200 ,(2011) , 10.1007/978-3-642-19448-1_10