Шукати за:
Роком видання
Автором
Назвою статті
Сегментація мовних голосових сигналів за ознакою зміни диктора
Повний текст (PDF)
УДК: 004.8
Мова публікації: Українська
Stuc. intelekt. 2011; 16; (3):167-173
Анотація: Запропоновано підхід до сегментації голосових мовних сигналів за ознакою зміни диктора та способи визначення позицій зміни диктора в голосовому мовному сигналі. Позиції зміни диктора визначаються за допомогою аналізу множин характеристичних векторів в околі паузи на основі Байєсівського інформаційного критерію. Покращення якості характеристичних векторів досягається за допомогою використання сегментів з рівнем енергії не нижче певного порогу. Також пропонується адаптивний підхід для автоматичного визначення пауз у мовному сигналі.
Ключові слова:
Посилання:
- Автоматизированная система стенографирования / Ю.Г. Кривонос, Ю.В. Крак, А.В. Бармак, А.С. Загваздин // Штучний інтелект. – 2009. – № 3. – С. 228-233.
- Kotti M. Automatic Speaker Change Detection with the Bayesian Information Criterion using MPEG-7Features and a Fusion Scheme [Електронний ресурс] / M. Kotti, E. Benetos, C. Kotropoulos // Proc. ofISCAS-2006. – Режим доступу : http://poseidon.csd.auth.gr/papers/PUBLISHED/CONFERENCE/pdf/Kotti06b.pdf
- Lu L. Speaker change detection and tracking in real-time news broadcasting analysis / L. Lu, H.-J. Zhang //Proceedings of the tenth ACM international conference on Multimedia. – 2002. – Р. 602-610.
- Universal background models for real-time speaker change detection [Електронний ресурс] / T.Y. Wu,L. Lu, K. Chen, H.-J. Zhang // Microsoft Research. – Режим доступу : http://research.microsoft.com/users/llu/publications/mmm03_ubmforspkseg.pdf.
- Kwon S. Speaker change detection using a new weighted distance measure / S. Kwon, S. Narayanan //Proc. of International conference on spoken language processing. – 2002. – Vol. 4. – P. 2537-2540.
- Кривонос Ю.Г. Определение позиций изменения диктора в речевом сигнале / Ю.Г. Кривонос,Ю.В. Крак, А.С. Загваздин // Штучний інтелект. – 2010. – № 3. – C. 220-226.
- Ajmera J. Robust Speaker Change Detection / J. Ajmera, I. McCowan, H. Bourlard // IEEE SignalProcessing Letters. – 2004. – № 8, vol. 11. – P. 649-651.
- Rabiner L. Application of LPC Distance Measure to Voiced-Unvoiced-Silence Detection Problem / L. Rabiner, M. Sambur // IEEE Transaction on Acoustics, Speech and Signal Processing. – 1977. – № 7, vol. 25. –P. 338-343.
- Tanyer G.S. Voice Activity Detection in Non-stationary Noise / G.S. Tanyer, H. Ozer // IEEE Transactions on Speech and Audio Processing. – 2000. – № 4, vol. 8. – P. 478-482.
- Загваздін О.С. Автоматичне визначення пауз та зменшення рівня шуму в системі автоматизованогостенографування / О.С. Загваздін // Журнал обчислювальної та прикладної математики. – 2010. –№ 2. – C. 35-43.
- Rabiner L. Applications of non-linear smoothing algorithm to speech processing / L. Rabiner, M. Sambur,C. Schmidt // IEEE Transactions on Acoustics, Speech and Signal Processing. – 1975. – Vol. 23. –P. 552-557.