Використання великих мовних моделей в освітній, науковій та дослідницькій діяльності

Шукати за:

Роком видання

Автором

Назвою статті

https://doi.org/10.15407/jai2025.01.069

Використання великих мовних моделей в освітній, науковій та дослідницькій діяльності

Сімченко С.В.¹, Лиходєєва Г.В.², Левченко В.В.³, Морозова С.В.⁴, Демченко Н.Н.⁵

¹ Інститут проблем штучного інтелекту МОН України і НАН України

² Державний університет інформаційно-комунікаційних технологій

³ Національний університет біоресурсів і природокористування України

⁴ Державний університет інформаційно-комунікаційних технологій

⁵ Центр дитячо-юнацької творчості імені Євгенії Максимівни Руднєвої відділу освіти виконавчого комітету Бердянської міської ради Запорізької області

sstehnology85@gmail.com

https://orcid.org/0009-0005-5280-7564 https://orcid.org/0000-0002-2065-0217 https://orcid.org/0000-0003-1225-5844 https://orcid.org/0000-0002-6257-0450

Повний текст (PDF)

УДК: 534.21:537.226.86
Мова публікації: Українська
Stuc. intelekt. 2025; 30; (1):69-75

Анотація: У статті розглянуто роль великих мовних моделей у сфері освіти, науки та досліджень. Проаналізовано переваги використання штучного інтелекту для персоналізованого навчання, автоматизації оцінювання, підтримки викладачів і дослідників. Особливу увагу приділено можливостям аналізу великих масивів даних, класифікації наукової інформації та створенню навчальних матеріалів. Визначено основні виклики та обмеження використання мовних моделей в академічній діяльності. Дослідження підкреслює потенціал технологій, керованих ШІ, для підвищення ефективності та доступності освіти та досліджень. Крім того, обговорюються етичні наслідки та ризики використання штучного інтелекту для генерування знань. У статті досліджується вплив великих мовних моделей на наукові відкриття, наголошується на їхній ролі в сприянні перегляду літератури, створенні гіпотез і академічному пошуку. Незважаючи на значні переваги великих мовних моделей, занепокоєння щодо використання штучного інтелекту, конфіденційності даних і необхідності людського контролю залишаються критичними. Отримані результати свідчать про те, що збалансований підхід, який об’єднує інструменти штучного інтелекту з досвідом людини, може максимізувати ефективність мовних моделей в освіті та науковій діяльності.

Ключові слова: великі мовні моделі, штучний інтелект, освіта, наука, дослідження, автоматизація.

Посилання:

Браун Т. Б., Манн Б., Райдер Н. та ін. Language Models are Few-Shot Learners // NeurIPS 2020. 2020. URL: https://arxiv.org/abs/2005.14165.
Девлін Дж., Чанг М.-В., Лі К., Таутанова К. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding // NAACL-HLT 2019. 2019. URL: https://arxiv.org/abs/1810.04805.
Пітерс М. Е., Нейман М., Іви М. та ін. Deep contextualized word representations // NAACL-HLT 2018. 2018. URL: https://arxiv.org/abs/1802.05365.
Васвані А., Шоейр Н., Пармар Н. та ін. Attention is All You Need // NeurIPS 2017. 2017. URL: https://arxiv.org/abs/1706.03762.
OpenAI. GPT-3: Language Models are Few-Shot Learners // ArXiv. 2020. URL: https://arxiv.org/abs/2005.14165.
Ферручі Д., Браун Е., Чавес Дж. та ін. Building Watson: An overview of the DeepQA project // AI Magazine. 2010. URL:https://aaai.org/ojs/index.php/aimagazine/article/view/2303.
Саттон Р. С., Барто А. Дж. Підкріплювальне навчання: Вступ. Бостон: MIT Press, 2018.
Гудфеллоу І., Бенгіо Й., Курвілль А. Глибинне навчання. Бостон: MIT Press, 2016.
Лекун Й., Бенгіо Й., Хінтон Г. Глибинне навчання // Nature. 2015. Т. 521, № 7553. С. 436-444.
Лі Дж., Хові Е. Огляд вбудованих слів // Neural Networks. 2014. Т. 64, № 2. С. 345-367.
Редфорд А., Ву Дж., Чайлд Р. та ін. Мовні моделі — це багатозадачні учні // OpenAI Blog. 2019. URL: https://openai.com/research/language-models.
Вульф Т., Дебю Л., Сань В. та ін. Транс-формери: передові методи обробки природної мови // Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing: System Demonstrations. 2020. URL: https://aclanthology.org/2020.emnlp-demos.3.
Лю Й., Отакар К., Гарсія П. та ін. RoBERTa: Надійний оптимізований підхід до попереднього тренування BERT // ArXiv. 2019. URL: https://arxiv.org/abs/1907.11692.
Кларк К., Негрі К., Ламберт Н., Гоулдін Б. ELECTRA: Попереднє навчання текстових енкодерів як дискримінаторів // ArXiv. 2020. URL: https://arxiv.org/abs/2003.10555.
Дас Р., Коен В. Використання транс-форматорів для аналізу біомедичних даних // Journal of Bioinformatics. 2019. Т. 44, № 5. С. 201-215.
Шиу Д., Лай М., Нгуєн Т. Застосування GPT-3 у психологічних дослідженнях // Psychology Review. 2021. Т. 58, № 4. С. 214-233.
Мазур Ю. О. Автоматизація обробки наукових текстів на основі GPT-3 // Інформаційні технології в науці. 2022. Т. 12, № 3. С. 140-154.

Переглянути повний текст статті (PDF)

Штучний інтелект

Науковий журнал

Шукати за:

Використання великих мовних моделей в освітній, науковій та дослідницькій діяльності