作者: Denis Maurel
DOI:
关键词: Proper noun 、 Art 、 Humanities 、 Linguistics
摘要: The voluminous textual data parsing is confronted with a specific class of words, the proper names, above all in case business and strategic intelligence or information retrieval. names are not often found electronic dictionaries one makes no distinction between them unknown words. Meanwhile, instead just declare to lump together we present this paper result tagging experiment every name word newspaper issue. Resume L’analyse de donnees textuelles volumineuses, surtout dans le cadre la veille strategique ou recherche d’information, est confrontee une categorie specifique mots, les noms propres, souvent absents des dictionnaires electroniques et, ce fait, assimiles « Mots inconnus ». Cependant, au lieu se contenter d’affirmations communes sur l’amalgame entre mots et nous presentons ici resultats d’une experience categorisation tous propres d’un numero du journal Le Monde.