Шукати за:
Використання великих мовних моделей в освітній, науковій та дослідницькій діяльності
Повний текст (PDF)
УДК: 534.21:537.226.86
Мова публікації: Українська
Stuc. intelekt. 2025; 30; (1):69-75
Анотація: У статті розглянуто роль великих мовних моделей у сфері освіти, науки та досліджень. Проаналізовано переваги використання штучного інтелекту для персоналізованого навчання, автоматизації оцінювання, підтримки викладачів і дослідників. Особливу увагу приділено можливостям аналізу великих масивів даних, класифікації наукової інформації та створенню навчальних матеріалів. Визначено основні виклики та обмеження використання мовних моделей в академічній діяльності. Дослідження підкреслює потенціал технологій, керованих ШІ, для підвищення ефективності та доступності освіти та досліджень. Крім того, обговорюються етичні наслідки та ризики використання штучного інтелекту для генерування знань. У статті досліджується вплив великих мовних моделей на наукові відкриття, наголошується на їхній ролі в сприянні перегляду літератури, створенні гіпотез і академічному пошуку. Незважаючи на значні переваги великих мовних моделей, занепокоєння щодо використання штучного інтелекту, конфіденційності даних і необхідності людського контролю залишаються критичними. Отримані результати свідчать про те, що збалансований підхід, який об’єднує інструменти штучного інтелекту з досвідом людини, може максимізувати ефективність мовних моделей в освіті та науковій діяльності.
Ключові слова: великі мовні моделі, штучний інтелект, освіта, наука, дослідження, автоматизація.
Посилання:
- Браун Т. Б., Манн Б., Райдер Н. та ін. Language Models are Few-Shot Learners // NeurIPS 2020. 2020. URL: https://arxiv.org/abs/2005.14165.
- Девлін Дж., Чанг М.-В., Лі К., Таутанова К. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding // NAACL-HLT 2019. 2019. URL: https://arxiv.org/abs/1810.04805.
- Пітерс М. Е., Нейман М., Іви М. та ін. Deep contextualized word representations // NAACL-HLT 2018. 2018. URL: https://arxiv.org/abs/1802.05365.
- Васвані А., Шоейр Н., Пармар Н. та ін. Attention is All You Need // NeurIPS 2017. 2017. URL: https://arxiv.org/abs/1706.03762.
- OpenAI. GPT-3: Language Models are Few-Shot Learners // ArXiv. 2020. URL: https://arxiv.org/abs/2005.14165.
- Ферручі Д., Браун Е., Чавес Дж. та ін. Building Watson: An overview of the DeepQA project // AI Magazine. 2010. URL:https://aaai.org/ojs/index.php/aimagazine/article/view/2303.
- Саттон Р. С., Барто А. Дж. Підкріплювальне навчання: Вступ. Бостон: MIT Press, 2018.
- Гудфеллоу І., Бенгіо Й., Курвілль А. Глибинне навчання. Бостон: MIT Press, 2016.
- Лекун Й., Бенгіо Й., Хінтон Г. Глибинне навчання // Nature. 2015. Т. 521, № 7553. С. 436-444.
- Лі Дж., Хові Е. Огляд вбудованих слів // Neural Networks. 2014. Т. 64, № 2. С. 345-367.
- Редфорд А., Ву Дж., Чайлд Р. та ін. Мовні моделі — це багатозадачні учні // OpenAI Blog. 2019. URL: https://openai.com/research/language-models.
- Вульф Т., Дебю Л., Сань В. та ін. Транс-формери: передові методи обробки природної мови // Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing: System Demonstrations. 2020. URL: https://aclanthology.org/2020.emnlp-demos.3.
- Лю Й., Отакар К., Гарсія П. та ін. RoBERTa: Надійний оптимізований підхід до попереднього тренування BERT // ArXiv. 2019. URL: https://arxiv.org/abs/1907.11692.
- Кларк К., Негрі К., Ламберт Н., Гоулдін Б. ELECTRA: Попереднє навчання текстових енкодерів як дискримінаторів // ArXiv. 2020. URL: https://arxiv.org/abs/2003.10555.
- Дас Р., Коен В. Використання транс-форматорів для аналізу біомедичних даних // Journal of Bioinformatics. 2019. Т. 44, № 5. С. 201-215.
- Шиу Д., Лай М., Нгуєн Т. Застосування GPT-3 у психологічних дослідженнях // Psychology Review. 2021. Т. 58, № 4. С. 214-233.
- Мазур Ю. О. Автоматизація обробки наукових текстів на основі GPT-3 // Інформаційні технології в науці. 2022. Т. 12, № 3. С. 140-154.