了解大型语言模型如何改变研究

快速阅读: 据《社会科学空间》称，生成式AI为学术研究带来机遇与挑战，LLM可辅助研究各阶段，但需注意伦理与准确性。加拿大推动AI素养教育，加强跨学科合作与政策指导。

生成式人工智能，尤其是大型语言模型（LLMs），为学术研究和学术发展带来了令人兴奋且前所未有的机遇，同时也带来了复杂的挑战。随着不同版本的LLM（如ChatGPT、Gemini、Claude、Perplexity.ai和Grok）不断涌现，学术研究正开始经历重大变革。高校中的学生、研究人员和教师需要具备AI素养知识、能力和技能，以应对这些挑战和风险。在快速变化的时代，学生和学者被建议向所在机构、项目或部门寻求针对本学科的AI使用政策或指导。

本文由阿里·希里（Ali Shiri）最初发表于《对话》（The Conversation），该网站是社会科学空间（Social Science Space）的合作伙伴，标题为“大学中的AI：大型语言模型如何改变研究”。

研究人员使用AI的情况

一项最近的研究由一位数据科学研究员领导，发现去年至少有13.5%的生物医学摘要显示出AI生成文本的痕迹。如今，大型语言模型可以支持几乎每一个研究过程的阶段，尽管在判断何时使用AI是适当、道德或值得的时，总是需要谨慎和人工监督——并需要考虑质量控制和准确性等问题。LLM可以：

– 帮助构思、生成和完善研究想法并提出假设；
– 设计实验并进行文献综述；
– 编写和调试代码；
– 分析和可视化定性和定量数据；
– 开发跨学科的理论和方法框架；
– 建议相关来源和引用，总结复杂文本并撰写摘要；
– 以通俗易懂的方式进行研究成果的传播和展示。

然而，在研究、写作和研究传播中，生成式AI工具的适当、伦理、负责任和有效使用存在显著的担忧和挑战。这些问题包括：

– 数据误用和署名问题；
– 研究结果难以复制；
– 数据和算法偏见与误差；
– 用户隐私与保密；
– 输出质量、数据造假和引用伪造；
– 以及版权和知识产权侵犯。

AI研究助手，“深度研究”AI代理

目前有两种新兴的LLM增强型工具，用于支持学术研究：

1. AI研究助手
支持研究过程中不同方面和步骤的AI研究助手数量正以指数级速度增长。这些技术有潜力增强和扩展学术工作中的传统研究方法。例如，包括以下功能的AI助手：

– 概念图绘制（Kumu、GitMind、MindMeister）；
– 文献和系统综述（Elicit、Undermind、NotebookLM、SciSpace）；
– 文献检索（Consensus、ResearchRabbit、Connected Papers、Scite）；
– 文献分析和摘要（Scholarcy、Paper Digest、Keenious）；
– 研究主题和趋势检测与分析（Scinapse、tlooto、Dimension AI）。

2. “深度研究”AI代理
随着“深度研究”AI代理的兴起，人工智能领域正快速发展。这些新一代代理结合了LLM、检索增强生成和复杂的推理框架，以进行深入的多步骤分析。

目前正在进行研究，以评估深度研究工具的质量和效果。正在制定新的评估标准来评估它们的表现和质量。这些标准包括成本、速度、编辑便捷性和整体用户体验等要素，以及这些深度研究工具是否符合提示要求。深度研究工具的目的在于仔细提取、分析和综合来自各种在线和社交媒体来源的学术信息、实证数据和多样化的观点。输出是一份详细的报告，附有引用，提供对复杂主题的深入见解。

在短短四个月内（2024年12月至2025年2月），几家公司（如Google Gemini、Perplexity.ai和ChatGPT）发布了他们的“深度研究”平台。位于西雅图的非营利人工智能研究机构——艾伦人工智能研究所（Allen Institute for Artificial Intelligence），正在试用一种名为Ai2 ScholarQA的新开放获取研究工具，该工具通过提供更深入的答案，帮助研究人员更高效地进行文献综述。

新兴的指导方针

已经制定了一些指导方针，鼓励在研究和写作中负责任和伦理地使用生成式AI。加拿大的例子包括：

– 加拿大政府关于使用生成式人工智能的指南文件。该指南建议联邦机构和学者探索生成式AI工具的潜在用途，并遵循一个推荐的决策框架，包括负责任的沟通和透明度。
– 来自公共资助的联邦机构——统称为三院联合机构（Tri-Council Agency）——提供的指导，这些机构提供覆盖不同研究领域的研究经费和项目。
– 由Higher Education Strategy Associates公司运营的加拿大高等教育AI政策观察中心，列出了超过30所加拿大高等教育机构制定的AI政策和指南。

LLMs有助于跨学科研究

LLMs也是支持跨学科研究的强大工具。最近出现的研究（尚未经过同行评议）表明，它们在生物学、化学、工程、环境以及社会科学等领域具有巨大潜力。它还表明，LLMs可以通过整合不同领域的数据和方法，并自动化数据收集和生成，构建跨学科的数据集。

LLMs有助于跨学科研究
帮助分析和总结跨多个学科领域的大量研究，有助于促进跨学科合作。“专家查找”AI驱动的平台可以分析研究人员的资料和出版网络，以识别专业领域，识别跨领域的潜在合作者，并揭示意想不到的跨学科联系。这一新兴知识表明，这些模型将能够通过结合来自不同领域的见解——如流行病学和物理学、气候科学和经济学或社会科学和气候数据——来帮助研究人员实现突破，以解决复杂问题。

以研究为导向的AI素养

加拿大大学和研究合作正在为大学内外的人员提供AI素养教育。阿尔伯塔机器智能研究所提供K-12阶段的AI素养课程和其他资源。该研究所是一家非营利机构，属于加拿大全国人工智能战略计划的一部分。许多大学正在提供专注于使用生成式AI工具支持研究活动的AI素养教育机会。

阿尔伯塔机器智能研究所提供K-12阶段的AI素养课程和其他资源。该研究所是一家非营利机构，属于加拿大全国人工智能战略计划的一部分。

大学间的协作工作也在进行中。例如，作为阿尔伯塔大学研究生与博士后研究学院的副院长（同时也是信息科学教授），我与曼尼托巴大学、温尼伯大学和温哥华岛大学的院长合作，制定了关于生成式AI与研究生和博士后研究及指导的指南和建议。

考虑到大型语言模型日益增长的力量和能力，迫切需要为学术研究人员量身定制AI素养培训。这种培训应关注这些工具在研究过程和写作的不同阶段的潜力和局限性。

阿里·希里（Ali Shiri）
信息科学教授，研究生与博士后研究学院副院长，阿尔伯塔大学

(以上内容均由Ai生成)