Штучний інтелект

Науковий журнал

ISSN 2710-1673

ONLINE: ISSN 2710-1681

Виберіть свою мову


Сегментація мовних голосових сигналів за ознакою зміни диктора

Кривонос Ю.Г.1, Крак Ю.В.2, Загваздін О.С.3, Єфімов Г.М.4
1 Інститут кібернетики НАН України ім. В.М. Глушкова
2 Taras Shevchenko National University of Kyiv
3 Інститут кібернетики ім. В.М. Глушкова НАН України
4 Інститут кібернетики імені В.М. Глушкова НАН України

Повний текст (PDF)

УДК: 004.8
Мова публікації: Українська
Stuc. intelekt. 2011; 16; (3):167-173

Анотація: Запропоновано підхід до сегментації голосових мовних сигналів за ознакою зміни диктора та способи визначення позицій зміни диктора в голосовому мовному сигналі. Позиції зміни диктора визначаються за допомогою аналізу множин характеристичних векторів в околі паузи на основі Байєсівського інформаційного критерію. Покращення якості характеристичних векторів досягається за допомогою використання сегментів з рівнем енергії не нижче певного порогу. Також пропонується адаптивний підхід для автоматичного визначення пауз у мовному сигналі.

Ключові слова:

Посилання:

  1. Автоматизированная система стенографирования / Ю.Г. Кривонос, Ю.В. Крак, А.В. Бармак, А.С. Загваздин // Штучний інтелект. – 2009. – № 3. – С. 228-233.
  2. Kotti M. Automatic Speaker Change Detection with the Bayesian Information Criterion using MPEG-7Features and a Fusion Scheme [Електронний ресурс] / M. Kotti, E. Benetos, C. Kotropoulos // Proc. ofISCAS-2006. – Режим доступу : http://poseidon.csd.auth.gr/papers/PUBLISHED/CONFERENCE/pdf/Kotti06b.pdf
  3. Lu L. Speaker change detection and tracking in real-time news broadcasting analysis / L. Lu, H.-J. Zhang //Proceedings of the tenth ACM international conference on Multimedia. – 2002. – Р. 602-610.
  4. Universal background models for real-time speaker change detection [Електронний ресурс] / T.Y. Wu,L. Lu, K. Chen, H.-J. Zhang // Microsoft Research. – Режим доступу : http://research.microsoft.com/users/llu/publications/mmm03_ubmforspkseg.pdf.
  5. Kwon S. Speaker change detection using a new weighted distance measure / S. Kwon, S. Narayanan //Proc. of International conference on spoken language processing. – 2002. – Vol. 4. – P. 2537-2540.
  6. Кривонос Ю.Г. Определение позиций изменения диктора в речевом сигнале / Ю.Г. Кривонос,Ю.В. Крак, А.С. Загваздин // Штучний інтелект. – 2010. – № 3. – C. 220-226.
  7. Ajmera J. Robust Speaker Change Detection / J. Ajmera, I. McCowan, H. Bourlard // IEEE SignalProcessing Letters. – 2004. – № 8, vol. 11. – P. 649-651.
  8. Rabiner L. Application of LPC Distance Measure to Voiced-Unvoiced-Silence Detection Problem / L. Rabiner, M. Sambur // IEEE Transaction on Acoustics, Speech and Signal Processing. – 1977. – № 7, vol. 25. –P. 338-343.
  9. Tanyer G.S. Voice Activity Detection in Non-stationary Noise / G.S. Tanyer, H. Ozer // IEEE Transactions on Speech and Audio Processing. – 2000. – № 4, vol. 8. – P. 478-482.
  10. Загваздін О.С. Автоматичне визначення пауз та зменшення рівня шуму в системі автоматизованогостенографування / О.С. Загваздін // Журнал обчислювальної та прикладної математики. – 2010. –№ 2. – C. 35-43.
  11. Rabiner L. Applications of non-linear smoothing algorithm to speech processing / L. Rabiner, M. Sambur,C. Schmidt // IEEE Transactions on Acoustics, Speech and Signal Processing. – 1975. – Vol. 23. –P. 552-557.

Переглянути повний текст статті (PDF)