Штучний інтелект

Науковий журнал

ISSN 2710-1673

ONLINE: ISSN 2710-1681

Виберіть свою мову


Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних

Шаховська Н.Б.1, Швороб І.Б.1
1 Національний університет «Львівська політехніка»

Повний текст (PDF)

УДК: 004.9:371.261
Мова публікації: Українська
Stuc. intelekt. 2017; 22; (2):60-69

Анотація: 80% світових даних є неструктурованими або слабоструктурованими. У зв’язку з цим, актуальною є проблема екстракції інформації та її подальше збереження у зручній для опрацювання формі. Для зручності екстракції даних у роботі запропоновано використання текстових шаблонів на основі словника ключових слів. Основною метою є розроблення методу виділення складових елементів для побудови текстового шаблону, а також розроблення методу кластеризації текстового шаблону. Проведено аналіз розроблених методів на прикладі роботи бібліотечної системи.

Ключові слова: слабоструктуровани дані, екстранкція даних, текстові шаблони, методи кластеризації

Посилання:

  1. Shakhovska, N.B., Noha, R.Y. 2015 . Methods and Tools for Text Analysis of Publications to Study theFunctioning of Scientific Schools. Journal of Automation and Information Sciences, p. 47.
  2. Захарчук Т.В. Научные школы в библиографоведении: особенности формирования /Т.В. Захарчук // Научно-техническая информация. Сер. 1. Организация и методикаинформационной работы.– 2011. – № 1. – С. 19–25.
  3. Сhappin E.J.L. Transition and transformation: A bibliometric analysis of two scientific networksresearching socio-technical change / Emile J.L. Chappin, Andreas Ligtvoet // Renewable and SustainableEnergy Reviews. –2014. – Vol. 30. –P. 715–723.
  4. Ланде Д.В. Наукометричні дослідження мереж співавторства по базі даних«Україніка наукова» /Д.В. Ланде, І.В. Балагура // Реєстрація, зберігання і обробка даних. – 2012, – Т.14, No4 –С.41-51.
  5. Berry M., Kogan J. Text Mining. Applications and Theory. West Sussex: Wiley, 2010. - 222 p.
  6. Park S.-T. Analysis of Lexical Signatures for Finding Lost or Related Documents / S.-T. Park,D. Pennock, C. Lee Giles, R. Krovetz. ˗ Finland, 2002. ˗ 8p

Переглянути повний текст статті (PDF)