MORFETIK: une ressource lexicale pour le TAL

作者: Michel Mathieu-Colas

DOI: 10.15122/ISBN.978-2-8124-4141-7.P.0141

关键词:

摘要: Le traitement automatique des langues exige au prealable un recensement lexical aussi rigoureux et complet que possible. Dans ce but, nous avons elabore dictionnaire morphologique du francais qui sert de point depart a ensemble modulaire (Morfetik) incluant moteur flexion, interfaces consultation outils d'exploitation. C'est le base est ici decrit (le lexique mots simples). Les donnees, etablies partir nombreuses sources lexicographiques, sont structurees sous forme tables. Pour les plus complexes – noms, adjectifs verbes –, deux grilles complementaires ont ete elaborees : d'une part tables flexion permettant d'identifier coder tous types formation (pluriels, conjugaisons, etc.), d'autre attribuant chaque lemme code flexionnel correspondant. A cette double representation, peut produire l'ensemble toutes formes flechies. La ressource lexicale la Morfetik se caracterise par son ampleur (plus 100 000 lemmes recenses codes), precision informations evolutivite. Selon meme principe, terminons mise d'un composes.

参考文章(1)
Laurent Romary, Susanne Salmon-Alt, Gil Francopoulo, Standards going concrete: from LMF to Morphalou international conference on computational linguistics. pp. 22- 28 ,(2004) , 10.3115/1610042.1610047