DOGE 威胁:政府数据如何赋予 AI 公司非凡的权力
快速阅读: 据《今日日本》称,美国政府效率部门(DOGE)获得了访问多个敏感联邦数据库的权限,引发隐私和数据滥用担忧。这些数据可用于训练AI系统,可能对私营公司如马斯克的xAI带来巨大优势。政府数据的独特性和完整性使其在AI训练中极为宝贵,但也可能导致权力集中和潜在的政治操控风险。
政府效率部门(DOGE),即美国政府效率部门,已获得前所未有的权限,至少可以访问七个敏感的联邦数据库,包括国税局和社保局的数据库。这种访问引发了对网络安全漏洞和隐私侵犯的担忧,另一个较少受到关注的问题是:这些数据可能被用于训练一家私营公司的AI系统。白宫新闻秘书表示,DOGE收集的政府数据并未用于训练马斯克的AI模型,尽管马斯克控制着DOGE。然而,有证据表明,DOGE人员同时在马斯克的一家公司中担任职务。在联邦航空管理局,SpaceX员工拥有政府电子邮件地址。这种双重就业为联邦数据可能被转移到马斯克拥有的企业,包括xAI,创造了途径。该公司的最新Grok AI聊天机器人模型明显拒绝明确否认使用此类数据。作为一名政治科学家和技术专家,我熟悉政府数据的公共来源,我认为这种潜在的数据传输给私营公司带来的隐私和权力影响比大多数报道所指出的要大得多。
政府数据对于AI的价值对于AI开发者而言,政府数据库相当于找到了圣杯。虽然OpenAI、谷歌和xAI等公司目前依赖于从公共互联网上抓取的信息,但非公开的政府资源提供了更有价值的东西:整个群体实际行为的真实记录。政府数据对于AI的价值这不仅仅是更多的数据——这是根本不同的数据。社交媒体帖子和网络浏览历史显示的是经过筛选或有意的行为,而政府数据库捕捉的是真实决策及其后果。例如,医疗保险记录揭示了医疗保健选择和结果。国税局和财政部的数据揭示了金融决策及其长期影响。联邦就业和教育统计数据则揭示了教育路径和职业轨迹。使这些数据对AI训练特别有价值的是其纵向性质和可靠性。与互联网上的无序信息不同,政府记录遵循标准化协议,定期接受审计,并且必须符合准确性法律要求。每一份社会保障支付、医疗保险索赔和联邦拨款都创建了一个关于现实行为的真实数据点。在美国,这样的数据在广度和真实性方面是独一无二的。
最重要的是,政府数据库追踪的是整个群体随时间的变化,而不仅仅是数字活跃用户。它们包括那些从不使用社交媒体、不在线购物或主动避免数字服务的人。对于AI公司而言,这意味着训练系统时将涵盖人类经验的实际多样性,而不仅仅是人们在网上投射的数字映像。
技术优势
当前的AI系统面临的基本限制是无法通过从互联网上抓取的数据来克服的。当ChatGPT或谷歌的Gemini出错时,通常是因为它们被训练的信息可能是流行的,但不一定准确。它们可以告诉你人们对一项政策效果的看法,但却无法跟踪这些效果在人群和多年中的变化。政府数据可以改变这一局面。想象一下,不仅基于人们对医疗保健的意见进行训练,而是基于数百万患者的实际治疗结果进行训练。考虑从社交媒体讨论经济政策到分析其在几十年间对不同社区和人口统计学的实际影响之间的区别。如果一个大型、最先进的前沿模型基于全面的政府数据进行训练,它能够理解政策和结果之间的实际关系。它可以跨不同人口群体追踪意外后果,用现实世界验证复杂的社会系统模型,并根据历史证据预测拟议变更的影响。
对于寻求构建下一代AI系统的公司来说,访问这些数据将创造几乎不可逾越的优势。
关键系统的控制
像xAI这样的公司可以利用基于政府数据训练的模型做更多的事情,而不仅仅是建立更好的聊天机器人或内容生成器。这样的系统可以从根本上改变——甚至可能控制——人们理解和管理复杂社会系统的方式。虽然其中一些能力在负责任的公共机构控制下可能是有益的,但我认为它们在单一私营公司手中构成威胁。
医疗保险和医疗补助数据库包含了几十年间多样人群中治疗、结果和成本的记录。一个基于新政府数据的前沿模型可以识别成功的地方,从而主导医疗保健行业。这样的模型可以理解不同干预措施如何随时间影响不同人群,考虑到地理位置、社会经济状况和并发条件等因素。掌握该模型的公司可以通过展示卓越的预测能力和市场层面的见解,影响医疗保健政策,向制药公司和保险公司提供信息。
财政部数据可能是最有价值的奖品。政府财务数据库包含了关于资金如何流经经济的详细信息。这包括联邦支付系统的实时交易数据、完整的税收支付和退款记录、详细的福利分配模式以及带有绩效指标的政府承包商付款。拥有访问这些数据的AI公司可以发展非凡的经济预测和市场预测能力。它可以模拟监管变化的连锁反应,预测经济脆弱性并在危机前成为问题之前,优化投资策略,精度远超传统方法。
基础设施和城市系统
政府数据库包含有关关键基础设施使用模式、维护历史、应急响应时间和开发影响的信息。每一项联邦拨款、基础设施检查和应急响应都会创建一个数据点,有助于训练AI更好地理解城市和地区如何运作。数据的潜力在于其潜在的相互关联性。一个基于政府基础设施记录训练的AI系统将理解交通模式如何影响能源使用,住房政策如何影响应急响应时间,以及基础设施投资如何影响区域经济发展。一家独占这些数据的私营公司可以获得对美国社会物理和经济动脉的独特洞察力。这可能允许该公司开发“智慧城市”系统,使城市政府变得依赖,从而有效地私有化城市治理的部分内容。结合来自私人来源的实时数据,其预测能力将远远超过任何现有系统所能达到的水平。
绝对数据导致绝对腐败
像xAI这样拥有马斯克资源并通过DOGE获得优先访问权的公司,可以比竞争对手更容易地克服技术和政治障碍。最近机器学习的进步也降低了为算法处理准备数据的负担,使得政府数据成为真正的金矿——一个真正属于美国人民的金矿。私营公司访问政府数据的威胁超越了个人隐私问题。即使去除了个人标识符,一个分析数百万政府记录模式的AI系统也可能具备令人惊讶的能力,用于在人口层面上做出预测和影响行为。威胁在于利用政府数据影响社会的AI系统,包括选举结果。由于信息就是力量,将前所未有的数据集中在具有明确政治议程的私营实体手中,对共和国构成了深刻的挑战。
(以上内容均由Ai生成)