作者: Thomas Pellegrini
DOI:
关键词:
摘要: Les technologies liees a la parole, et en particulier reconnaissance de suscitent un grand interet pour nombre croissant langues. La tres grande majorite des langues du monde ne possedent pas grands corpus donnees necessaires l'elaboration systemes l'etat l'art, fondes sur paradigmes probabilistes plupart. travaux menes au cours cette these ont consiste, dans premier temps, identifier les difficultes rencontrees lors d'un systeme une langue peu dotee. Nous avons travaille principalement le probleme forts taux mots hors-vocabulaire dus manque textes, qui est nos yeux plus important ces defendons l'idee que l'utilisation sous-unites lexicales correctement selectionnees, peuvent etre petites mots, peut amener gains significatifs performances. utilise modifie algorithme probabiliste propose frontieres morphe, introduisant proprietes caracterisent confusion acoustico-phonetique eventuelle entre unites reconnaissance. experiences ete menees deux differentes : l'amharique turc, collaboration avec equipe chercheurs turcs, l'universite stambouliote Bogazici. permis d'obtenir modestes mais significatifs, autour 5% relatifs eleves, reductions relatives d'OOV comprises 30% 50%, etudiees.