Adaptation des communications MPI intra-nœud aux architectures multicœurs modernes

作者: Stéphanie Moreaud

DOI:

关键词:

摘要: L'emergence des processeurs multicœurs accroit les besoins en transferts de donnees entre processus a l'interieur machines. Comme la plupart implementations portables MPI, MPICH2 utilise un schema communication intra-nœud reposant sur plusieurs recopies memoire. Ce modele souffre d'une utilisation intensive et forte pollution cache limitant significativement performances. Grâce l'interface programmation Large Message Transfer MPICH2, concue pour supporter vaste panel mecanismes transfert, il est cependant possible modifier cette strategie. La mise place strategie copie directe basee l'appel systeme vmsplice Linux permet d'ameliorer performances dans certains cas. Nous presentons une seconde directe, module noyau dedie nomme KNEM. Il tire profit capacites materielles deport memoire, activant dynamiquement selon caracteristiques physiques caches taille messages. Cette nouvelle solution surpasse methodes transfert habituelles vmsplice, lorsque cœurs lesquels s'executent ne partagent aucun cache, ou tres larges Les operations collectives montrent quant elles amelioration spectaculaire, le test NAS IS obtient acceleration 25% meilleure caches.

参考文章(5)
Shirley Browne, Jack Dongarra, Nathan Garner, George Ho, Philip Mucci, A Portable Programming Interface for Performance Evaluation on Modern Processors ieee international conference on high performance computing data and analytics. ,vol. 14, pp. 189- 204 ,(2000) , 10.1177/109434200001400303
Hyun-Wook Jin, Sayantan Sur, Lei Chai, Dhabaleswar K. Panda, Lightweight kernel-level primitives for high-performance MPI intra-node communication over multi-core systems international conference on cluster computing. pp. 446- 451 ,(2007) , 10.1109/CLUSTR.2007.4629263
D. Buntinas, G. Mercier, W. Gropp, Data Transfers between Processes in an SMP System: Performance Study and Application to MPI international conference on parallel processing. pp. 487- 496 ,(2006) , 10.1109/ICPP.2006.31
Patrick Geoffray, Loïc Prylli, Bernard Tourancheau, BIP-SMP : High Performance Message Passing over a Cluster of Commodity SMPs conference on high performance computing (supercomputing). pp. 20- 20 ,(1999) , 10.1145/331532.331552
Brice Goglin, High Throughput Intra-Node MPI Communication with Open-MX parallel, distributed and network-based processing. pp. 173- 180 ,(2009) , 10.1109/PDP.2009.20