提示:隐私风险“困扰”AI 代理
快速阅读: 据《福布斯》最新报道,研究显示AI搜索引擎在引用新闻来源方面表现不佳,错误率高,且引用的链接很少被点击,谷歌传统搜索引导的流量远高于AI搜索引擎。
欢迎回到《The Prompt》。信号公司总裁梅雷迪思·惠塔克在奥斯汀举行的西南偏南(SXSW)2025大会上指出,人工智能代理存在“深远”的安全风险。(苏珊娜·科尔德罗/法新社/盖蒂图片社摄)尽管它们备受关注,但人工智能代理——能够浏览网络、在设备上操作多个应用并代表用户执行任务的软件——确实面临真实的安全和隐私风险。信号公司总裁梅雷迪思·惠塔克本周在奥斯汀的西南偏南技术会议上表示,这些系统就像把你的“大脑装进罐子”一样,因为人工智能代理需要访问敏感数据,如信用卡信息或电话联系人,并且还需要访问应用程序。她说,目前没有加密模型可以发送和接收这些数据,这些数据必须在云端处理。现在让我们进入头条新闻。
重大进展在深度搜索公司在一月份引起轰动后,另一家名为蝴蝶效应的中国人工智能创业公司在周末因展示其称为曼努斯的人工智能代理而成为社交媒体上的热门话题。该代理据称可以自主完成筛选简历、寻找房产和分析股票等任务。据报道,该人工智能系统是基于其他公司开发的现有人工智能模型构建的,例如旧金山的Anthropic公司,而不是从零开始训练。似乎并没有太多实质内容支撑这种炒作,因为许多尝试过该工具的人都报告了在简单任务如点外卖快餐或预订航班时出现问题。
芯片大战据路透社报道,社交媒体巨头Meta已经开始测试一款专为训练人工智能模型设计的新内部芯片,旨在减少对Nvidia硬件的依赖。Meta旗下的Llama系列人工智能模型去年每月用户数已超过六亿,但这远不是唯一一家设计自己硅片的公司。OpenAI、微软和谷歌都投入了数十亿美元用于自己的芯片。
数据困境很容易忽视开发人工智能模型所需的大量人力劳动。随着模型本身变得更好,能够更高效地完成高级任务,那些培训它们的人也需要更高的资质。价值一百四十亿美元的数据标注公司Scale AI帮助OpenAI、谷歌和Meta训练模型,现在越来越多地在美国寻找领域专家,包括拥有博士学位的人,而不是外包给海外承包商。这一转变体现了首席执行官兼亿万富翁亚历克斯·王在特朗普政府时期的“美国优先”理念。
每周人工智能交易据《纽约时报》报道,总部位于马萨诸塞州的科学发现人工智能系统初创公司Lila Sciences完成了二亿美元的种子轮融资。这项技术已被用于在各个领域运行实验和创造创新。值得注意的是,ServiceNow以约三十亿美元的价格收购了企业级人工智能软件公司Moveworks,据路透社报道。
深入探讨特斯拉不应再被视为电动汽车制造商。如果相信CEO埃隆·马斯克的话,它是一家人工智能公司。他的信心源于一个独特的数据集:从公司汽车中收集的拍字节视频,特斯拉客户在全球范围内记录了数百万英里的驾驶里程。理论上,所有这些现实世界的数据正是特斯拉需要用来训练其车辆无需任何人类协助就能运行的目标,这也是马斯克对未来特斯拉愿景的核心。但是有一个问题:这些数据并不一定像马斯克声称的那样有用。其中一些数据根本没有任何用处。建立能够像人类一样驾驶汽车的人工智能是一项与建立像ChatGPT这样的自然语言处理聊天机器人完全不同挑战,后者是在互联网上抓取了数十亿个单词后训练的。虽然目标是使用模式识别来提供可靠的信息和答案,但结果往往会在尴尬的方式下失败。但如果控制车辆的人工智能出错,人们可能会死亡。驾驶汽车是一个非常不同的命题,涉及更多变量——驾驶条件、天气、施工、交通模式的变化以及如何移动其他车辆。成功驾驭所有这些变量,并准备好应对意外情况,是自动驾驶AI的核心所在。仅靠高速公路驾驶视频无法有效帮助AI学习如何应对关键边缘情况,这些情况会导致碰撞或其他危险场景。Meta首席AI科学家、纽约大学计算机科学教授扬·乐昆也不认为特斯拉的数据能为其带来竞争优势。“数据的影响通常被夸大了:随着数据量增加,性能提高,但收益递减。”他说,“数据量加倍带来的边际提升仍远未达到人类水平的可靠性。”即使拥有海量数据,也没有公司开发出所谓的五级自主性,即车辆能够在所有人类能够驾驶的情况下自行驾驶。“然而,任何十七岁的青少年只需要大约二十小时的练习就可以学会开车,”乐昆说。“这告诉你,当前的人工智能架构在理解世界和从有限的数据或试验中学习方面缺少了一些重要的东西。”大量的摄像头数据是有帮助的,但它不足以让特斯拉立刻成为人工智能市场的领导者。“拥有独特数据流肯定是一种优势,”计算机科学家、Snorkel AI公司的首席执行官亚历克斯·拉特纳说,该公司制作软件以帮助自动化原始数据的标记。请参阅《福布斯》完整报道。
模型行为根据哥伦比亚新闻评论(CJR)的一项新研究,人工智能搜索引擎在引用新闻报道方面表现欠佳。该研究将十篇随机文章中的专家摘录粘贴到聊天机器人中,要求它们识别出版者、文章和发布日期。CJR在八个包括Perplexity、ChatGPT、Gemini等在内的AI系统上进行了十六百次查询。Grok的表现尤其差,错误回答了九十四%的问题。即使它们确实引用了来源,人们也不会真正点击它们。与传统非AI的谷歌相比,人工智能搜索引擎引导的流量少了九十六%。
(以上内容均由Ai生成)