Шукати за:
Роком видання
Автором
Назвою статті
Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних
Повний текст (PDF)
УДК: 004.9:371.261
Мова публікації: Українська
Stuc. intelekt. 2017; 22; (2):60-69
Анотація: 80% світових даних є неструктурованими або слабоструктурованими. У зв’язку з цим, актуальною є проблема екстракції інформації та її подальше збереження у зручній для опрацювання формі. Для зручності екстракції даних у роботі запропоновано використання текстових шаблонів на основі словника ключових слів. Основною метою є розроблення методу виділення складових елементів для побудови текстового шаблону, а також розроблення методу кластеризації текстового шаблону. Проведено аналіз розроблених методів на прикладі роботи бібліотечної системи.
Ключові слова: слабоструктуровани дані, екстранкція даних, текстові шаблони, методи кластеризації
Посилання:
- Shakhovska, N.B., Noha, R.Y. 2015 . Methods and Tools for Text Analysis of Publications to Study theFunctioning of Scientific Schools. Journal of Automation and Information Sciences, p. 47.
- Захарчук Т.В. Научные школы в библиографоведении: особенности формирования /Т.В. Захарчук // Научно-техническая информация. Сер. 1. Организация и методикаинформационной работы.– 2011. – № 1. – С. 19–25.
- Сhappin E.J.L. Transition and transformation: A bibliometric analysis of two scientific networksresearching socio-technical change / Emile J.L. Chappin, Andreas Ligtvoet // Renewable and SustainableEnergy Reviews. –2014. – Vol. 30. –P. 715–723.
- Ланде Д.В. Наукометричні дослідження мереж співавторства по базі даних«Україніка наукова» /Д.В. Ланде, І.В. Балагура // Реєстрація, зберігання і обробка даних. – 2012, – Т.14, No4 –С.41-51.
- Berry M., Kogan J. Text Mining. Applications and Theory. West Sussex: Wiley, 2010. - 222 p.
- Park S.-T. Analysis of Lexical Signatures for Finding Lost or Related Documents / S.-T. Park,D. Pennock, C. Lee Giles, R. Krovetz. ˗ Finland, 2002. ˗ 8p