Kontextabhängige Segmentmodelle für fließende Sprache

作者: Hans Kalveram

DOI: 10.1007/978-3-642-76062-4_9

关键词:

摘要: Sprachsignale erfordern eine sehr differenzierte stochastische Modellbildung, die insbesondere Variationen der momentanen spektralen Leistungsdichte einbeziehen mus. Hidden- Markov-Modelle leisten dies, indem von den beobachtbaren Signaleigenschaften eines Analysefensters angenommen wird, das sie einer verdeckten, dem Beobachter nicht zuganglichen Markov-Zustandsfolge abhangen. In geschatzten Modellparametern spiegeln sich akustisch-phonetische Strukturen Sprachsignalen wider [4]. Spracherkennung haben Hidden-Markov-Modelle gerade aus diesem Grunde bewahrt, denn es braucht bei ihnen nur wenig Wissen uber Struktur Sprache explizit eingebracht zu werden.

参考文章(7)
Mei-Yuh Hwang, Hsiao-Wuen Hon, Kai-Fu Lee, Modeling between-word coarticulation in continuous speech recognition. conference of the international speech communication association. pp. 1005- 1008 ,(1989)
Lalit R. Bahl, Frederick Jelinek, Robert L. Mercer, A Maximum Likelihood Approach to Continuous Speech Recognition IEEE Transactions on Pattern Analysis and Machine Intelligence. ,vol. PAMI-5, pp. 179- 190 ,(1983) , 10.1109/TPAMI.1983.4767370
K.-F. Lee, H.-W. Hon, Speaker-independent phone recognition using hidden Markov models IEEE Transactions on Acoustics, Speech, and Signal Processing. ,vol. 37, pp. 1641- 1648 ,(1989) , 10.1109/29.46546
L.R. Rabiner, A tutorial on hidden Markov models and selected applications in speech recognition Proceedings of the IEEE. ,vol. 77, pp. 267- 296 ,(1989) , 10.1109/5.18626
J. Baker, The DRAGON system--An overview IEEE Transactions on Acoustics, Speech, and Signal Processing. ,vol. 23, pp. 24- 29 ,(1975) , 10.1109/TASSP.1975.1162650