AI 和社交媒体如何通过回声室和过滤气泡塑造知识
快速阅读: 据《黑客 Noon》称,长期以来,技术对知识获取方式的影响引发担忧。互联网搜索算法和社交媒体的兴起导致信息分布和极化问题。回声室和过滤气泡现象加剧了这一问题,使用户接触到有限的观点。推荐算法的流行度偏差进一步限制了多样化信息的获取。本文探讨这些因素如何影响知识传播,并提出解决方案。
作者:安德鲁·J·彼得森,普瓦捷大学([email protected])。链接表摘要和引言相关工作媒体、过滤气泡和回声室网络效应与信息级联模型崩溃已知的LLM偏差知识崩溃模型结果讨论与参考文献附录比较尾部宽度定义知识崩溃
相关工作
长期以来,技术影响了我们获取知识的方式,引发了对其在知识传播和创造中的影响的担忧。例如,叶梦特(Yeh Meng-te)在十二世纪就认为书籍的兴起导致了记忆和校对文本实践的衰落,从而导致学术水平下降和错误重复(切尔尼亚克,1994年,第48-49页)。更早之前,柏拉图在《斐德罗篇》中的一段讨论考虑了从口述传统转向阅读文本是否会对记忆、反思和智慧有害(黑福德,1972年)。我们重点关注数字平台和社会互动的作用,并简要提及有关历史创新和知识的文献(如奥恩格,2013;莫基尔,2011;哈维尔夫,2019),以及关于印刷机的大量文献(如迪特马尔,2011;埃森斯坦,1980)。
与其他媒体转型一样(吴,2011),互联网搜索算法和社会媒体的兴起引发了人们对人们接触到的信息性质和分布的关注,以及这些信息对态度和政治极化的下游影响(辛尼利等,2021;巴雷拉,2020)。以下部分将探讨推荐算法和社交媒体上的自我选择对社会的影响研究,以及这如何可能产生扭曲和极化的观点,作为理解依赖AI带来的转变的类比。我们考虑信息级联的游戏理论模型作为社会学习失败的替代模型,在该模型中公众未能根据个人的私人信号进行理性更新。接下来,我们将回顾社交网络中信息流动的主要网络分析发现,这些发现也识别出扭曲知识形成机制的因素。然后,我们考察生成式AI算法的具体性质,重点是模型崩溃问题和已知的AI输出偏差。
媒体、过滤气泡和回声室
对社交媒体的一个常见批评是,它们允许用户进入“回声室”(特定社区或交流实践),在那里他们只能接触到狭窄范围的话题或观点。例如,用户没有咨询提供相对平衡视角的“主流”新闻,而是接触到只反映其已有信念的选择性内容。在意识形态版本的回声室假设中,处于潜在意识形态空间(例如一维左右光谱)内的个体接触到与其观点相似的同龄人和内容。如果是这样,他们的信念会因社会强化和从有限观察中得出的概括而得到加强,从而导致政治极化(辛尼利等,2022;贾米森和卡佩拉,2008;帕里泽,2011)。一个简单的模型假设在一个网络增长模型中存在同质性,其中相似个体选择互动。这种方法隐含地假定这种情况在社交媒体上很普遍,但在传统媒体上不常见,后者由于技术原因被限制为向具有可能异质偏好的广大人群提供相同内容。即使传统媒体和报纸本身也是动态系统,与消费者、市场和广告商互动,并根据特定社区和偏好调整其内容(如安杰卢奇、凯奇和辛金斯基即将发表;凯奇,2020;波恩、卡罗尔和范·威特洛斯蒂延,2002)。
第二个主要分析线关注“过滤气泡”,即用户接触到的内容是基于推荐系统的筛选。姜等人(2019)将其建模为用户兴趣和行为(如点击链接、视频或文本)与旨在最大化用户预期效用的推荐系统之间的动态过程。在其灵感来自强化学习的框架中,目标是让用户探索项目或主题的空间,而不让算法为这些项目分配极端(非常高或零)概率。同样,一个关键问题是推荐内容的政治或意识形态内容及其与极化的关系(凯耶尔和马斯,2022)。最近的一个转折点是夏尔马、廖和肖(2024)发现LLM驱动的搜索可能会通过强化用户查询中的细粒度线索来产生更多的选择性接触偏差和极化。特别适用于我们的背景的是推荐系统中的“流行度偏差”问题,即一小部分内容获得了广泛的曝光,而来自较小群体或有罕见偏好的用户(分布在长尾分布中,如话题)则被边缘化。一方面,用户可能希望接触到流行内容,以了解趋势想法或时尚。但过于偏爱流行项目可能导致用户脱节,因为它忽略了他们的独特兴趣,缺乏多样性等(如克卢格等,2021)。推荐系统通常存在偏差,即使某些用户想要访问非流行项目,他们也很难获得这样的推荐(阿卜杜拉普尔等,2021)。已经提出了一些方法来对抗这种倾向(如林等,2022;高等,2023)。
鉴于互联网的独特贡献之一是能够提供以前被忽视或无法获得的长尾产品和服务(布林约夫松等,2006;布林约夫松、胡和史密斯,2003),流行度偏差的问题显得有些讽刺。由此推断,我们预计社交媒体和互联网将使更多样化和丰富的信息环境成为可能。自我选择进入社区和推荐算法的作用解释了为什么情况可能并非如此。在下一节中,我们将考虑一组更广泛的模型,这些模型考察网络中的信息流动和信息级联的概念。
本文在arxiv上以CC BY-NC-SA 4.0许可协议发布。
(以上内容均由Ai生成)