Штучний інтелект

Науковий журнал

ISSN 2710-1673

ONLINE: ISSN 2710-1681

Виберіть свою мову


Адаптація акустичних моделей фонем до голосу диктора для пофонемного розпізнавання ізольованих слів української мови

Сажок М.М.1, Селюх Р.А.1, Юхименко О.А.1
1 Міжнародний науково-навчальний центр інформаційних технологій та систем

Повний текст (PDF)

УДК: 004.934
Мова публікації: Українська
Stuc. intelekt. 2009; 14; (4): 230-233

Анотація: У статті розглядаються проблеми адаптації моделей фонем до голосу диктора для пофонемного розпізнавання ізольованих слів української мови. Описується метод адаптації під назвою «лінійна регресія максимальної правдоподібності» (MLLR). У рамках цього методу шляхом оптимізації значення критерію розпізнавання отримуються матриці лінійних перетворень, за якими адаптуються акустичні моделі фонем. Наводяться результати експериментальних досліджень розпізнавання мовлення адаптованої системи. Аналізуються дані розпізнавання адаптованих моделей у залежності від кількості слів в адаптаційній вибірці.

Ключові слова:

Посилання:

  1. Vintsiuk Taras. Speaker Voice Passport for a Spoken Dialogue System / Taras Vintsiuk, Mykola Sazhok //Proceedings of the 3rd International Workshop «Speech and Computer» – Specom'98. – St.-Petersburg, 1998. –P. 275-278.
  2. Vasylieva N. Text Selection for Training Procedures under Phoneme Units Variety / N. Vasylieva, M. Sazhok //Proceedings of the 10th International Conference on Speech and Computer – SpeCom’2005. – Patras, 2005, P. 69-76.
  3. Винцюк Т.К. Анализ, распознавание и смысловая интерпретация речевых сигналов / Т.К. Винцюк. – Киев :Наукова думка, 1987.
  4. Young S.J. HTK Book, version 3.1 / Young S.J. [et al]. – Cambridge University, 2002. – 355 p.
  5. Červa P. Map Based Speaker Adaptation in Large Vocabulary Speech Recognition of Czech Language / P. Červa,J. Nouza // Proc. of Radioelektronika 2004, (April 2004, Bratislava). – Slovak Republic. – P. 108-111.

Переглянути повний текст статті (PDF)