Штучний інтелект

Науковий журнал

ISSN 2710-1673

ONLINE: ISSN 2710-1681

Виберіть свою мову


Моделювання багаторівневого поскладового розпізнавання мовленнєвого сигналу

Васильєва Н.Б.1, Сажок М.М.2
1 Міжнародний науково-навчальний центр інформаційних технологій та систем
2 Міжнародний науково-навчальний центр інформаційних технологій та систем

Повний текст (PDF)

УДК: 004.934
Мова публікації: Українська
Stuc. intelekt. 2008; 13; (3):801-807

Анотація: В статті проводиться поширення багаторівневої багатозначної моделі автоматичного розпізнавання злитого мовлення на випадок поскладового розпізнавання. Розглядаються два рівні з трьох. На першому рівні проводиться розпізнавання в умовах поскладової граматики, на другому рівні проводиться оброблення (постпроцесинг) вихідних даних першого рівня з метою отримання відповідних послідовностей слів. В описаній моделі постпроцесингу беруться до уваги отримані оцінки акустичних складових мовленнєвого сигналу, а послідовність і фонетичні особливості разом з лексиконом. Аналізуються шляхи вибору множини одиниць на складовому рівні мовленнєвих образів. Описується багатодикторний мовленнєвий корпус і лексикон, що використані в експериментальному дослідженні. Обговорюються результати експериментів, проблеми та майбутні дослідження.

Ключові слова:

Посилання:

  1. Taras K. Vintsiuk, Mykola M. Sazhok. Multi-Level Multi-Decision Models in ASR // Proc. of the 10thInternational Workshop «Speech and Computer», SPECOM’2005. – Patras. – 2005. – Р. 69-76.
  2. Gérard Chollet, Kevin McTait, Dijana Petrovska-Delacrétaz. Data Driven Approaches to Speech andLanguage Processing // G. Chollet et al. (Eds.): Nonlinear Speech Modeling, LNAI 3445. – 2005. –Р. 164-198.
  3. Lee, T. Kawahara and K. Shikano. Julius – an open source real-time large vocabulary recognition engine // In Proc.European Conference on Speech Communication and Technology (EUROSPEECH). – 2001. – Р. 1691-1694.
  4. Mykola Sazhok. Generative Model for Decoding a Phoneme Recognizer Output // Proc. of the 8thInternational Conference «Text, Speech and Dialogue», TSD’2005. – Karlovy Vary. – 2005. – Р. 288-293.
  5. Nina Vasylyeva, Mykola Sazhok. Text Selection for Training Procedures under Phoneme Units Variety //Proc. of the 10th International Workshop «Speech and Computer», SPECOM’2005. – Patras. – 2005. –Р. 629-632.
  6. Широков В., Монако В. Організація національної лексикографічної мережі // Мовознавство. –№ 5. – 2001.
  7. Young S.J. et al., HTK Book, version 3.1. – Cambridge University, 2002. – 355 p.

Переглянути повний текст статті (PDF)