Штучний інтелект

Науковий журнал

ISSN 2710-1673

ONLINE: ISSN 2710-1681

Виберіть свою мову


Використання великих мовних моделей в освітній, науковій та дослідницькій діяльності

Сімченко С.В.1, Лиходєєва Г.В.2, Левченко В.В.3, Морозова С.В.4, Демченко Н.Н.5
1 Інститут проблем штучного інтелекту МОН України і НАН України
2 Державний університет інформаційно-комунікаційних технологій
3 Національний університет біоресурсів і природокористування України
4 Державний університет інформаційно-комунікаційних технологій
5 Центр дитячо-юнацької творчості імені Євгенії Максимівни Руднєвої відділу освіти виконавчого комітету Бердянської міської ради Запорізької області
sstehnology85@gmail.com

Повний текст (PDF)

УДК: 534.21:537.226.86
Мова публікації: Українська
Stuc. intelekt. 2025; 30; (1):69-75

Анотація: У статті розглянуто роль великих мовних моделей у сфері освіти, науки та досліджень. Проаналізовано переваги використання штучного інтелекту для персоналізованого навчання, автоматизації оцінювання, підтримки викладачів і дослідників. Особливу увагу приділено можливостям аналізу великих масивів даних, класифікації наукової інформації та створенню навчальних матеріалів. Визначено основні виклики та обмеження використання мовних моделей в академічній діяльності. Дослідження підкреслює потенціал технологій, керованих ШІ, для підвищення ефективності та доступності освіти та досліджень. Крім того, обговорюються етичні наслідки та ризики використання штучного інтелекту для генерування знань. У статті досліджується вплив великих мовних моделей на наукові відкриття, наголошується на їхній ролі в сприянні перегляду літератури, створенні гіпотез і академічному пошуку. Незважаючи на значні переваги великих мовних моделей, занепокоєння щодо використання штучного інтелекту, конфіденційності даних і необхідності людського контролю залишаються критичними. Отримані результати свідчать про те, що збалансований підхід, який об’єднує інструменти штучного інтелекту з досвідом людини, може максимізувати ефективність мовних моделей в освіті та науковій діяльності.

Ключові слова: великі мовні моделі, штучний інтелект, освіта, наука, дослідження, автоматизація.

Посилання:

  1. Браун Т. Б., Манн Б., Райдер Н. та ін. Language Models are Few-Shot Learners // NeurIPS 2020. 2020. URL: https://arxiv.org/abs/2005.14165.
  2. Девлін Дж., Чанг М.-В., Лі К., Таутанова К. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding // NAACL-HLT 2019. 2019. URL: https://arxiv.org/abs/1810.04805.
  3. Пітерс М. Е., Нейман М., Іви М. та ін. Deep contextualized word representations // NAACL-HLT 2018. 2018. URL: https://arxiv.org/abs/1802.05365.
  4. Васвані А., Шоейр Н., Пармар Н. та ін. Attention is All You Need // NeurIPS 2017. 2017. URL: https://arxiv.org/abs/1706.03762.
  5. OpenAI. GPT-3: Language Models are Few-Shot Learners // ArXiv. 2020. URL: https://arxiv.org/abs/2005.14165.
  6. Ферручі Д., Браун Е., Чавес Дж. та ін. Building Watson: An overview of the DeepQA project // AI Magazine. 2010. URL:https://aaai.org/ojs/index.php/aimagazine/article/view/2303.
  7. Саттон Р. С., Барто А. Дж. Підкріплювальне навчання: Вступ. Бостон: MIT Press, 2018.
  8. Гудфеллоу І., Бенгіо Й., Курвілль А. Глибинне навчання. Бостон: MIT Press, 2016.
  9. Лекун Й., Бенгіо Й., Хінтон Г. Глибинне навчання // Nature. 2015. Т. 521, № 7553. С. 436-444.
  10. Лі Дж., Хові Е. Огляд вбудованих слів // Neural Networks. 2014. Т. 64, № 2. С. 345-367.
  11. Редфорд А., Ву Дж., Чайлд Р. та ін. Мовні моделі — це багатозадачні учні // OpenAI Blog. 2019. URL: https://openai.com/research/language-models.
  12. Вульф Т., Дебю Л., Сань В. та ін. Транс-формери: передові методи обробки природної мови // Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing: System Demonstrations. 2020. URL: https://aclanthology.org/2020.emnlp-demos.3.
  13. Лю Й., Отакар К., Гарсія П. та ін. RoBERTa: Надійний оптимізований підхід до попереднього тренування BERT // ArXiv. 2019. URL: https://arxiv.org/abs/1907.11692.
  14. Кларк К., Негрі К., Ламберт Н., Гоулдін Б. ELECTRA: Попереднє навчання текстових енкодерів як дискримінаторів // ArXiv. 2020. URL: https://arxiv.org/abs/2003.10555.
  15. Дас Р., Коен В. Використання транс-форматорів для аналізу біомедичних даних // Journal of Bioinformatics. 2019. Т. 44, № 5. С. 201-215.
  16. Шиу Д., Лай М., Нгуєн Т. Застосування GPT-3 у психологічних дослідженнях // Psychology Review. 2021. Т. 58, № 4. С. 214-233.
  17. Мазур Ю. О. Автоматизація обробки наукових текстів на основі GPT-3 // Інформаційні технології в науці. 2022. Т. 12, № 3. С. 140-154.

Переглянути повний текст статті (PDF)