在经济学中利用大型语言模型进行大规模信息检索
快速阅读: 据《VoxEU.org》称,政策制定者和研究人员面临海量新经济学研究成果的压力。利用大型语言模型(LLM),我们开发了一种方法,通过解析和总结数万篇论文,构建“因果知识图”,识别经济概念间的因果关系。这种方法不仅限于经济学,还可扩展至其他领域,但需注意LLM输出的偏见。该图谱有助于决策者、研究人员和学生更好地理解学术研究,提高信息处理效率。
注:详细方法和验证练习请参阅我们的研究论文及网站 www.causal.claims。
政策制定者、研究人员和从业者每年面对越来越多的新经济学研究成果。试图定位相关的发现,甚至只是跟上发表的速度,可能会让人感到不堪重负。在诸如谷歌学术等平台上的关键词搜索可以帮助,但这些搜索往往无法准确捕捉论文因果设计的细节或变量之间的互动。随着人工智能(AI)尤其是大型语言模型(LLM)的发展,人们越来越乐观地认为这些工具能够通过高效解析、总结和大规模映射学术工作中的关键发现来帮助研究人员(阿什和汉森 2023年,德尔 2024年,科林尼克 2023年)。本专栏介绍了一种利用LLM处理并综合数万篇经济学论文的方法。通过关注每篇论文中的因果陈述,我们展示了如何构建“因果知识图”。这是一种结构化表示方法,它识别哪些经济概念是相互关联的,并且是否严格的因果推断方法(如随机对照试验或差异-差异法)支持这些联系。我们还反思了这些方法如何可以扩展到其他领域,如专利、财务文件或政策报告,同时需要注意LLM输出中可能存在的偏见和“幻觉”。通过将大规模语言模型应用于大量经济学工作论文,我们构建了一个全球范围内的因果主张图谱,这有助于决策者、研究人员和学生导航学术研究。这一流程凸显了经济学中严谨的经验方法的兴起,展示了该领域在过去几十年间如何转向基于证据的因果关系主张。更为普遍而言,大规模语言模型提供了一种新颖的方式来处理信息过载问题,使我们能够迅速定位相关研究,追踪变量如何通过可信的因果路径相互连接,并发现值得探讨的被忽视的问题。作者注:我们的完整方法和验证练习可以在我们的配套研究论文(加格和费策尔 2025年)以及网站 www.causal.claims 上找到,在那里读者可以探索互动式搜索工具和因果主张研究助手(CClaRA)聊天机器人。随着人工智能技术的不断进步,大规模自动化证据综合将成为现代研究实践中的标准部分,从而让经济学家专注于创造性的理论构建和政策见解。
(以上内容均由Ai生成)