Штучний інтелект

Науковий журнал

ISSN 2710-1673

ONLINE: ISSN 2710-1681

Виберіть свою мову


Багаторівнева багатозначна модель перетворення орфографічного тексту на фонемний

Робейко В.В.1, Сажок М.М.2
1 Міжнародний науково-навчальний центр інформаційних технологій та систем «КіберМова»
2 Міжнародний науково-навчальний центр інформаційних технологій та систем

Повний текст (PDF)

УДК: 004.934
Мова публікації: Українська
Stuc. intelekt. 2011; 16; (4):117-125

Анотація: У статті розглядається актуальне питання породження послідовностей фонем за орфографічним текстом і зворотне перетворення. Пропонується модель, у якій закладені закономірності зв’язку між фонетичними й орфографічними символами. Багатозначні перетворення, що здійснюються згідно з моделлю, еквівалентні побудові направленого графа. Параметри моделі задаються таблично у вигляді контекстно-залежних правил, які формує експерт. У моделі передбачено введення додаткових рівнів транскрибування, що дає змогу експертові будувати складніші перетворення, працюючи з відносно простими правилами. Розроблено систему, на вхід якої подається орфографічний текст із позначеннями наголосу, а на виході отримуємо послідовності фонем, які відповідають різним варіантам вимови вхідного тексту. Наводяться приклади практичного застосування системи для автоматичного розпізнавання українського спонтанного мовлення.

Ключові слова:

Посилання:

  1. Винцюк Т.К. Анализ, распознавание и смысловая интерпретация речевых сигналов / Винцюк Т.К. –Киев : Наукова думка, 1987. – 264 с.
  2. HTK Book, version 3.1 / [Young S.J. et al.]. – Cambridge University, 2002.
  3. Lee. Julius – an open source real-time large vocabulary recognition engine / Lee, T. Kawahara, K. Shikano //In Proc. European Conference on Speech Communication and Technology (EUROSPEECH), 2001. –Р. 1691-1694.
  4. Taras Vintsiuk. Multi-Level Multi-Decision Models for ASR / Taras Vintsiuk Mykola Sazhok //Proceedings of the 10th Int. Conference on Speech and Computer – SpeCom’2005, Patras, 2005. –Р. 69-76.
  5. Автоматичний озвучувач українських текстів на основі фонемно-трифонної моделі з використанням природного мовного сигналу / [Тарас Вінцюк, Тетяна Людовик, Микола Сажок, РусланСелюх] // Праці 6-ї Всеукраїнської міжнародної конференції : «Оброблення сигналів і зображеньта розпізнавання образів» –Київ : УкрОбраз’2002,2002.
  6. Bisani M. Joint-sequence models for grapheme-to-phoneme conversion / M. Bisani, H. Ney // JournalSpeech Communication. – Elsevier, 2008. – № 50. – Р. 434-451.
  7. Робейко В.В. Графічна омонімія як специфічна проблема синтезу мовлення за текстом / В.В. Робейко // Українське мовознавство. – Вип. 39/1. – Київ, 2009. – С. 429-433.
  8. Пилипенко В.В. Автоматизированный стенограф украинской речи / В.В. Пилипенко, В.В. Робейко // Штучний інтелект. – № 4. – 2008. – С. 768-775.
  9. Людовик Т.В. Автоматическое распознавание спонтанной украинской речи (на материале корпусаукраинской эфирной речи) / Т.В. Людовик, В.В. Пилипенко , В.В. Робейко // Компьютернаялингвистика и интеллектуальные технологи : по материалам ежегодной Международнойконференции «Диалог». –. М.: РГГУ, 2011. – Вип. 10 (17). – С. 478-488.
  10. Сучасна українська літературна мова. Фонетика : [навч. посібник для студентів-філологів]. – К. :Видавничо-поліграфічний центр «Київський університет», 2002. – С. 60.
  11. Створення акустичного корпусу українського ефірного мовлення / [Н.Б. Васильєва В.В. Пилипенко, О.М. Радуцький та інш.] // Обробка сигналів і зображень та розпізнавання образів :Десята Всеукраїнська міжнародна конференція. – Київ, 2010. – С. 55-58.
  12. Робейко В.В. Генерування індивідуалізованих транскрипцій для злитого мовлення / В.В. Робейко // Мовні і концептуальні картини світу. – Вип. 26, Ч. 3. – Київ, 2009. – С. 38-42.

Переглянути повний текст статті (PDF)