AI 如何缩小我们的世界观

发布时间:2025年2月18日    来源:szf
AI 如何缩小我们的世界观

快速阅读: 据《黑客 Noon》最新报道,本文提出了一种理论框架,定义了“知识崩溃”现象,即过度依赖生成式人工智能可能导致知识长尾的减少。研究指出,应避免AI系统间的递归依赖,确保数据多样性,并提倡人类监督以纠正模型的局限性。这些建议有助于管理和减轻AI应用带来的负面影响。

我们提供了一个理论框架来定义“知识崩溃”,即对生成式人工智能(如大型语言模型)的依赖可能导致知识长尾的减少。我们的模拟研究表明,这种危害可以在一定程度上得到缓解,具体来说:(a) 我们认识到AI生成数据可能忽视的利基、专业和古怪视角的价值,并继续寻找这些视角;(b) AI系统之间不应递归相互依赖,就像当它们使用其他AI生成的内容作为输入或受到其他世代效应影响时那样;(c) AI生成的内容尽可能代表知识分布的全部。以上每个方面都为如何管理AI的应用提供了实际指导。首先,虽然我们的研究并不支持全面禁止AI模型,但应采取措施确保防止广泛或完全依赖于AI模型。对于每一百个只读一本书一两段摘要的人,应该有人花时间完整地阅读这本书,希望她能够提供有关其他地方出现的扭曲或简化的反馈。模型的一个扩展可能是允许世代变化,但内生化公共补贴以保护“长尾”知识的选择。这类似于政府通过支持学术和艺术项目来实现,否则这些项目可能因私人市场提供的不足而被忽视。保护信息多样性还意味着要关注AI应用对记者收入流的影响,他们不仅传播信息,还创造信息(例如,Cage,2016年)。其次,显然需要避免构建递归依赖的AI系统(例如,一个LLM或代理基于另一个AI生成的摘要提供答案等),从而玩LLM中介的“电话游戏”。至少,这要求有意识地区分人类生成的数据和AI生成的数据。通过精心设计的检索增强生成方法来保持对“未经过滤”的文本的访问,可以保留知识的长尾(Delile等人,2024年),也可以通过生成多个结果并重新排序(Li等人,2023年)来实现。最后,尽管最近很多关注集中在LLM误导性地将虚构内容呈现为事实的问题(幻觉),但这可能不如问题中的代表性重要。可验证的具体事实的幻觉通常很容易纠正。然而,许多现实世界的问题并没有明确的、可验证的真伪答案。如果用户询问例如,“通货膨胀是什么原因造成的?”而LLM回答“货币政策”,问题不在于幻觉,而在于未能反映对该问题所有可能答案的全貌,或者至少提供主要经济思想流派的概述。这可以在强化学习框架中从人类反馈中考虑相关方法,以塑造模型输出,因为人类倾向于更喜欢简单的单一答案而非那些代表多种观点的答案。在教育中使用AI时,尤其需要注意这一点,以确保学生不仅考虑AI生成答案的真实性,还要考虑其变异性、代表性和偏见,也就是说,它们在多大程度上代表了问题的所有可能答案的分布。

道格拉斯,S.J. 2002年。大众媒体:从1945年到现在。《后1945年美国伴侣》第78至95页。

艾森斯坦,E.L. 1980年。印刷机作为变革的媒介。剑桥大学出版社。

费斯廷格,L.;施赫特,S.;和巴克,K. 1950年。非正式群体中的社会压力;住房中的人类因素研究。英国牛津:哈珀出版社。页数:240。

菲舍尔,L. 2024年。英国政府将试行‘红盒’AI工具以提高部长效率。

高,C.;王,S.;李,S.;陈,J.;何,X.;雷,W.;李,B.;张,Y.;和江,P. 2023年。CIRS:通过反事实交互推荐系统打破过滤气泡。《ACM信息系统交易》42(1):14:1至14:27。

双子座团队,G.;阿尼尔,R.;博热奥德,S.;吴,Y.;阿莱亚克,J.-B.;余,J.;索里库特,R.;沙尔克维克,J.;戴,A.M.;豪斯,A.等。2023年。双子座:一组高度多功能的模型。arXiv预印本arXiv:2312.11805。

格西,J.;沈,X.;耿,Y.;陈,Q.;和艾哈迈德,I. 2023年。利用特征偏差解释机器学习模型的可扩展误预测。在2023年IEEE/ACM第45届软件工程国际会议上,1559至1570页。ISSN:1558-1225。

戈登伯格,J.;利拜,B.;和穆勒,E. 2001年。网络上的谈话:复杂系统视角下的口碑传播过程。《营销通讯》12(3):211至223。

古德费洛,I. 2016年。NIPS 2016教程:生成对抗网络。arXiv预印本arXiv:1701.00160。

格雷厄姆,R. 2023年。谷歌自动填充的伦理维度。《大数据与社会》10(1):20539517231156518。出版商:SAGE出版社有限公司。

格赖斯,H.P. 1975年。逻辑与对话。在《言语行为》中。布里尔。41至58页。

格鲁希尔,D.;顾哈,R.;利本诺威尔,D.;和汤金斯,A. 2004年。博客空间中的信息扩散。世界万维网大会第13届国际会议论文集,491至501页。会议名称:WWW04:2004年世界万维网会议(与ACM电子商务会议[EC’04]联合举行)。

郭,Y.;尚,G.;瓦齐里吉安尼斯,M.;和克拉维尔,C. 2023年。语言模型训练合成文本的奇怪下降:语言多样性的减少。arXiv:2311.09807 [cs]。

哈克福德,R. 1972年。柏拉图:斐德若篇。剑桥大学出版社。

黑尔科普夫,E.A. 2019年。希腊的文字革命及其文化后果。普林斯顿大学出版社。

黑格尔,G.W.F. 2018年。黑格尔:精神现象学。牛津大学出版社。

海达里,A.;贾法里·纳维米波尔,N.;达格,H.;和乌纳尔,M. 2023年。使用深度学习方法检测深度伪造:一个系统的综合回顾。《学科交叉审查:数据挖掘和知识发现》e1520。

亨里奇,J. 2004年。人口统计学与文化进化:适应性文化进程如何产生非适应性损失——塔斯马尼亚案例。《美国考古学杂志》69(2):197至214。

赫尔德,J.G. 2024年。人类历史哲学的思想。普林斯顿大学出版社。

霍夫曼,J.;博热奥德,S.;门施,A.;布卡茨卡娅,E.;蔡,T.;鲁瑟福德,E.;卡萨斯,D.d.L.;亨德里克斯,L.A.;韦尔布尔,J.;克拉克,A.等。2022年。训练计算最优的大语言模型。arXiv预印本arXiv:2203.15556。

霍尔茨曼,A.;布伊,J.;杜,L.;福布斯,M.;和崔,Y. 2020年。神经文本退化的奇怪案例。arXiv:1904.09751 [cs]。

贾米森,K.H.,和卡佩拉,J.N. 2008年。回声室:拉什·林鲍和保守媒体机构。牛津大学出版社。

姜,R.;基帕,S.;拉蒂莫尔,T.;格约尔,A.;和科利,P. 2019年。推荐系统中的退化反馈循环。在2019年AAAI/ACM人工智能、伦理和社会会议上,383至390页。

坎德拉尔,N.;邓,H.;罗伯茨,A.;华莱士,E.;和拉菲尔,C. 2023年。大型语言模型难以学习长尾知识。在第40届国际机器学习会议论文集中,15696至15707页。PMLR。ISSN:2640-3498。

康德,I. 1933年。纯粹理性批判(诺曼·肯普·史密斯译)。纽约:现代图书馆。

卡普兰,J.;麦坎德利什,S.;海尼根,T.;布朗,T.B.;棋,B.;儿童,R.;格雷,S.;拉德福德,A.;吴,J.;和阿莫迪,D. 2020年。神经语言模型的缩放定律。arXiv预印本arXiv:2001.08361。

卡尔拉斯,B.;道,D.;因特兰迪,M.;李,B.;舍特尔,S.;吴,W.;和张,C. 2022年。数据调试与端到端机器学习管道中的夏普重要性。arXiv:2204.11131 [cs]。

凯泽尔,M.A.,和马斯,M. 2022年。过滤气泡与意见极化的复杂联系。《数据科学》5(2):139至166。

凯马克,W.O.,和麦克肯德里克,A.G. 1927年。对流行病数学理论的贡献。伦敦皇家学会会刊。系列A,包含数学和物理性质的论文115(772):700至721。

霍达迪,M.;阿拉亚里,A.;瓦格诺兹齐,S.;和莫塔,D.F. 2020年。黑洞在事件视界望远镜下的标量毛发。《宇宙学与天体粒子物理学杂志》2020(09):026。

克卢格,D.;秦,Y.;埃文斯,M.;和考夫曼,G. 2021年。欺骗与取悦。一项关于用户对TikTok算法假设的混合方法研究。在第13届ACM网络科学会议上,84至92页。

克拉玛,J.;利伯姆,T.;沙,R.;和南达,N. 2024年。AtP*:一种高效且可扩展的方法,用于将LLM行为定位到组件。arXiv:2403.00745 [cs]。

库恩,T.S. 1997年。科学革命的结构,第962卷。芝加哥大学出版社。

库恩斯特纳,P.;威尔姆斯,M.B.;魏希特,A.;高尔特,B.;雅格尔,E.A.;和拉贝,D. 2020年。通过增材制造制造高强度大马士革钢。《自然》582(7813):515至519。出版商:自然出版集团。

莱顿,B. 1989年。巴西亚德斯在古代基督教思想中的意义。《代表》28:135至151。

李,H.;宁,Y.;廖,Z.;王,S.;李,X.L.;陆,X.;布拉曼,F.;赵,W.;崔,Y.;和任,X. 2023年。寻找长尾:通过逻辑规则引导搜索系统生成长尾知识。arXiv:2311.07237 [cs]。

林,A.;王,J.;朱,Z.;和卡弗利,J. 2022年。量化和减轻对话推荐系统中的流行度偏差。在第31届ACM信息与知识管理国际会议上,CIKM ’22,1238至1247页。纽约,美国:美国计算机协会。

曼海姆,K. 1952年。代际问题的社会学问题。《知识社会学论文集》306:163至195。

梅利斯,G.;格约尔,A.;和布鲁松,P. 2022年。互信息约束蒙特卡洛目标,以防止后验崩溃,特别是在语言建模中。《机器学习研究杂志》23(1):75:3266至75:3301。

梅苏迪,A.,和怀特,A. 2008年。文化传递实验在理解人类文化进化中的多重作用。《皇家学会生物学科学哲学汇刊》363(1509):3489。出版商:皇家学会。

莫克里,J. 2011年。雅典娜的礼物:知识经济的历史起源。《雅典娜的礼物》。普林斯顿大学出版社。

纳什,L.L. 1978年。存在的概念:希腊的世代思想起源。《代达罗斯》107(4):1至21。出版商:麻省理工学院出版社。

纳泽尔,L.H.;扎塔拉,R.;瓦尔德里普,S.;柯,J.X.C.;莫克希贝尔,M.;汗纳,A.K.;希克伦,R.S.;莫克希贝尔,L.;莫克希贝尔,D.;马,H.;和马图尔,P. 2023年。人工智能算法中的偏见及缓解建议。《数字健康公共图书馆》2(6):e0000278。出版商:公共科学图书馆。

内特尔,D.,和罗曼尼,S. 2000年。消失的声音:世界语言的灭绝。牛津大学出版社。

诺瓦克,A.;萨姆雷伊,J.;和拉坦,B. 1990年。从私人态度到公众舆论:社会影响的动态理论。《心理学评论》97(3):362至376。地点:美国 出版商:美国心理学会。

昂,W.J. 2013年。口头性和文字性:第30周年纪念版。劳特利奇。

奥普达尔,A.L.;特斯塞姆,B.;当-丁,D.-T.;莫塔,E.;赛蒂,V.;特龙德森,E.;特韦伯格,A.;和特拉特纳,C. 2023年。通过人工智能实现可信新闻报道。《数据与知识工程》146:102182。

奥赖利,T. 2005年。什么是Web 2.0。

帕里瑟,E. 2011年。过滤气泡:互联网向你隐藏了什么。企鹅英国。

皮夫斯特,D. S. 2011。博客圈的逻各斯:占领区域、发明和注意力在洛特丑闻中的作用。《论证与辩护》47(3):141–162。

罗素,L. 等。2003。被遗忘的革命:科学如何在公元前300年诞生,并且为什么需要重新复兴。斯普林格科学与商业媒体。

西摩,L. M.;马拉格,J.;萨巴蒂尼,P.;迪·托马索,M.;韦弗,J. C.;和马西奇,A. 2023。热搅拌:对古罗马混凝土耐久性的机理见解。《科学进展》9(1):eadd1602。出版商:美国科学促进会。

沙玛,N.;廖,Q. V.;和肖,Z. 2024。生成回声室效应?LLM驱动的搜索系统对多样化信息检索的影响。arXiv:2402.05880 [cs]。

舒迈洛夫,I.;舒迈洛夫,Z.;赵,Y.;加尔,Y.;帕珀诺特,N.;和安德森,R. 2023。递归的诅咒:基于生成数据的训练使模型遗忘。

史密斯,L. 和索伦森,P. 2000。观察学习的不良后果。《计量经济学》68(2):371–398。在线版本链接:https://onlinelibrary.wiley.com/doi/pdf/10.1111/1468-0262.00113。

苏,Y.;兰,T.;王,Y.;优加塔马,D.;孔,L.;和科利尔,N. 2022。神经文本生成的对比框架。在Koyejo, S.;Mohamed, S.;Agarwal, A.;Belgrave, D.;Cho, K.;和Oh, A. 编辑,《神经信息处理系统进展》,第35卷,21548–21561页。库伦协会公司。

塔勒布,N. N. 2007。黑天鹅与统计学领域。《美国统计学家》。出版商:泰勒与弗朗西斯。

特沃斯基,A. 和卡尼曼,D. 1973。可用性:判断频率和概率的一种启发式方法。《认知心理学》5(2):207–232。

韦尔,P. 2008。重叠世代:第一个庆典。《经济展望杂志》22(4):115–134。

温德勒,C.;韦塞洛夫斯基,V.;莫内亚,G.;和韦斯特,R. 2024。美洲驼在英语中表现如何?多语言转换器的潜在语言。arXiv:2402.10588 [cs]。

吴,Z.;盖格,A.;伊卡德,T.;波茨,C.;和古德曼,N. 2023。可解释性规模化:识别阿帕卡模型中的因果机制。《神经信息处理系统进展》36:78205–78226。

吴,T. 2011。《大师开关:信息帝国的兴衰》。Vintage出版社。

萨莫拉·博纳利亚,J. P. 2006。科学观点与博弈论。《科学观点》14(4):525–557。

萨莫拉-博纳里亚,J. 2010。科学家玩什么游戏?博弈论方法下的理性和客观性在科学知识的社会建构中的应用。在苏亚雷斯,M.;多拉托,M.;和雷迪,M. 编辑,《EPSA科学哲学与方法论:欧洲科学哲学协会的成立》。多德雷赫特:斯普林格荷兰出版社。323–332。

萨莫拉·博纳利亚,J. P. 2006。科学观点与博弈论。《科学观点》14(4):525–557。

本文可在arXiv上以CC BY-NC-SA 4.0许可证获得。

(以上内容均由Ai生成)

关键词: Ai世界观缩小

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日