作者: Bogdan Minescu
DOI:
关键词:
摘要: Cette these s’interesse aux reseaux de confusion comme representation compacte et structuree des hypotheses multiples produites par un moteur reconnaissance parole transmises a module post-traitement applicatif. Les (CN pour Confusion Networks) sont generes partir graphes mots structurent l’information sous la forme d’une sequence classes contenant en concurrence. Le cas d’usage etudie dans ces travaux est celui comprehension le cadre application dialogue deployee France Telecom. Deux problematiques inherentes ce contexte applicatif soulevees. De facon generale, systeme doit non seulement reconnaitre enonce prononce utilisateur, mais aussi l’interpreter afin deduire sons sens. Du point vue l’utilisateur, les performances percues plus proches celles chaine complete que vocale seule. Ce nous cherchons optimiser. particulier implique pouvoir traiter donnees reelles donc tres variees. Un peut etre ou moins bruite, domaine hors-domaine, couvert modele semantique l’application non, etc. Etant donnee cette grande variabilite, posons question savoir si fait d’appliquer memes traitements sur l’ensemble donnees, c’est approches classiques, une solution adaptee. Avec double perspective, s’attache fois enrichir l’algorithme construction CNs but d’optimiser globalement processus proposer strategie adequate d’utilisation reelle. Apres analyse proprietes deux corpus reelles, retenu du "pivot". Nous proposons version modifiee adaptee au introduisant notamment traitement differencie graphe qui privilegie porteurs En reponse variabilite enonces deployee, decision plusieurs niveaux vise mieux prendre compte specificites differents types d’enonces. montrons qu’il preferable n’exploiter richesse sorties reellement permet temps calcul d’ameliorer