AI 是泡沫还是革命?Human[X] 问道:为什么不两者兼而有之?

发布时间:2025年3月18日    来源:szf
AI 是泡沫还是革命?Human[X] 问道:为什么不两者兼而有之?

快速阅读: 据《新堆栈》称,首届Human[X]会议探讨了AI代理治理、个性化模型及投资趋势。尽管AI繁荣存在泡沫迹象,但有望引发社会变革。会议强调AI代理的治理挑战,展示相关技术和平台进展,同时提醒避免炒作超越实际工程能力。

人工智能(AI)/ AI代理/AI工程/大型语言模型
人工智能是泡沫还是革命?Human[X]提问:为什么不能两者兼备?
首届Human[X]活动展示了人工智能的未来方向:迈向AI代理治理、更定制化的模型以及更多的投资。

2025年3月17日中午12点,Heather Joslyn撰写
Human[X]联合创始人Stefan Weitz在3月10日的AI大会开幕式上发言。所有照片均由Heather Joslyn拍摄。

编辑注:
作者在Human[X]会议上主持了一场小组讨论。

拉斯维加斯——首届Human[X]会议的主要亮点:

AI代理无处不在,需要协调与治理。
模型正在迅速改进——但信任仍在发展中。

而且,如今AI领域资金流动非常活跃:根据Statista的数据,该行业在2024年增长到全球市场规模1840亿美元,而前一年约为1340亿美元。

由Stefan Weitz和Jonathan Weiner创立的Human[X]致力于展示组织如何使用AI,并帮助投资者和商业决策者更多地了解这个快速增长的行业。

Human[X]去年春天启动时获得了Primary Venture Partners、Foundation Capital、FPV Ventures和Andreessen Horowitz等风险投资公司的600万美元初始投资,在拉斯维加斯首次活动吸引了超过6500人注册。

在上周一的欢迎致辞中,Weitz告诉观众他和Weiner为何创办Human[X]:专注于现实世界的应用及其带来的好处和挑战。

“Weitz说:‘对我来说,这场对话令人沮丧地二元化。要么是乌托邦,要么是反乌托邦。要么是善良的机器人主宰,要么是具备LinkedIn档案的天网。乌托邦与审判日之间似乎没有明显的中间地带。
‘我们知道,现实更加复杂。这就是为什么我们试图建立Human[X],不是为了助长炒作,也不是为了制造更多恐惧,而是为了参与关于实际发生的事情、哪些有效、哪些无效以及下一步该做什么的对话。’”

周三,会议公布了由民意调查公司HarrisX对超过1000名美国商业领袖进行的一项调查结果。75%的受访者表示他们的组织有专门的AI战略。

大多数受访的领导者表示,他们将预算的10%至25%用于AI项目;37%的调查参与者表示,他们预计在未来三年内其AI投资将显著增长。

与此同时,该领域的最大玩家继续推出新的进展。周二,OpenAI推出了其新的AI代理框架;周三,Google发布了Gemma 3,这是一组轻量级、开源的模型。

在周一的开幕演讲中,Weitz谈到了AI繁荣是否是一个泡沫或即将到来的工作和生活革命的开端。

虽然他承认“泡沫迹象正在显现”,但他指出,尽管如此,之前的泡沫仍然带来了持久的社会变革;例如,在20世纪初,大约有2000家公司生产汽车。虽然其中绝大多数制造商都失败了,但汽车仍然改变了社会。同样,1990年代的数字初创企业大多倒闭了。

Weitz说,AI繁荣可能“有点过热”,但它仍有可能是一场潜在的革命。

然而,他警告说:“炒作正在左右决策,而追赶潮流的压力正促使企业和政府快速行动,无论他们是否真正理解自己在构建什么。因此,问题不仅仅是AI被过度炒作,而是炒作本身让我们变得不负责任。这有点像有了更好算法的Fyre音乐节。”

Weitz周二宣布,下一届Human[X]将于2026年4月7日至9日在旧金山举行——这是对湾区主导行业的认可。

AI代理和治理

由于Human[X]吸引了大量投资者和商业领袖,它比通常的技术活动人群更为外向。例如,在Human[X]会议上,午餐和早餐时,同桌的人会互相提问,而不是埋头玩手机。

通过这些对话,以及会议中的讨论,一些关键主题浮现出来。其中之一是,当前热门的代理型AI正带来治理挑战。

Yash Sheth,Galileo公司(一家生成式AI评估公司)的联合创始人兼首席运营官告诉The New Stack,代理崛起的原因至少与利润一样多与生产力有关。

Sheth说:“迄今为止,人们对AI软件的兴趣主要在于辅助方式。”“但是RAG和聊天机器人生成文件和简报仍然需要人类在循环中。AI真正的投资回报率只有通过自动化实现,你可以自动化大规模的工作流并使后端流程更加高效。

Galileo的Yash Sheth说,AI代理起飞的原因并不神秘:“那就是AI的真实投资回报率。”

Sheth说:“迄今为止,人们对AI软件的兴趣主要在于辅助方式。”“但是RAG和聊天机器人生成文件和简报仍然需要人类在循环中。AI真正的投资回报率只有通过自动化实现,你可以自动化大规模的工作流并使后端流程更加高效。

他补充道:“AI带来的东西是在那个自动化过程中对规则的一般化。所以从根本上来说,如果你明白为什么人们如此热衷于代理,那是因为它们将完成端到端的任务。”

Sheth说:“迄今为止,人们对AI软件的兴趣主要在于辅助方式。”“但是RAG和聊天机器人生成文件和简报仍然需要人类在循环中。AI真正的投资回报率只有通过自动化实现,你可以自动化大规模的工作流并使后端流程更加高效。

本质上,Sheth说,AI代理将AI融入机器人流程自动化,‘以自动化一些硬编码的过程并使其更强大。’

Sheth说:“迄今为止,人们对AI软件的兴趣主要在于辅助方式。”“但是RAG和聊天机器人生成文件和简报仍然需要人类在循环中。AI真正的投资回报率只有通过自动化实现,你可以自动化大规模的工作流并使后端流程更加高效。

他补充道:“AI带来的东西是在那个自动化过程中对规则的一般化。所以从根本上来说,如果你明白为什么人们如此热衷于代理,那是因为它们将完成端到端的任务。”

治理所有这些AI代理是一项艰巨的任务——也是供应商的一个机会。周一,专注于集成即服务的Boomi宣布了其AI Studio平台的测试版试验,计划在5月份将其推向一般可用性。

Boomi的客户已部署超过25,000个代理,Boomi的产品副总裁Mani Gill告诉The New Stack。“我们让客户思考代理并使用代理,自然他们会问,‘我如何更好地理解这些代理可以访问的数据?’

Boomi的Mani Gill表示,AI代理将像应用程序、API和数据一样,在现代企业系统中扩展。“所以我们开始与客户交谈,‘当你考虑你的代理之旅时,管理所有这些代理对你来说是否有价值?’这个概念与API管理非常相似,我有这么多API,我如何在我的环境中理解它们?”

Boomi的客户已部署超过25,000个代理,Boomi的产品副总裁Mani Gill告诉The New Stack。“我们让客户思考代理并使用代理,自然他们会问,‘我如何更好地理解这些代理可以访问的数据?’

他补充道:“我们引导了客户,但这也在他们眼前展开。”

Boomi AI Studio提供了一个平台来设计、治理和编排AI代理。它有四个组件:

– 代理设计器:让用户通过生成式AI提示、无代码模板、可信数据和安全护栏创建和部署AI代理。
– 代理控制塔:据Gill称,这是AI Studio的核心部分,控制塔“提供治理,同时也提供合规性和审计功能”,在中央位置监控Boomi和第三方AI代理。
– 代理花园:一个允许用户使用自然语言与其AI代理互动的空间。代理花园支持设计、测试、部署和工具开发。“它们可以学习,持续学习并培养这种能力,”Gill说。
– 代理市场:我们正在与合作伙伴合作,利用这种设计能力创建代理,然后我们的客户可以直接用作模板。”代理市场位于Boomi市场(以前称为Boomi Discover)。

其他参与者也涌入了AI治理领域。

Holistic AI是一家提供端到端AI部署管理的软件即服务公司。成立仅五年,每年的增长率为50%至60%,客户包括联合利华,Holistic AI的AI转型负责人Raj Patel告诉The New Stack。

Patel说,Holistic AI平台包括“作为业务决策依据的可观察性和基于证据的支持——你是否应该部署AI,以及当你部署时,你是否具备负责任的AI护栏、伦理和可观察性。”

目标不仅是治理AI应用和代理,还要确定是否应该构建这些应用和代理。

Patel说:“数据科学团队花费数十万美元组建团队并花六个月时间测试和部署。”“你希望尽早知道这是否是你想要探索的东西,以及你需要采取哪些缓解措施才能实现这一目标。”

Patel说,随着越来越多的组织采用生成式AI,治理是一个亟待填补的空白。

“市场上一个关键的不足之处是他们将治理视为一项检查表任务。”他说。“目前,这应该是一次性的任务。现在不再是这样了。

‘如果你想在你的业务中有效地部署AI,有一系列的检查需要完成,你需要有一个支持AI治理策略的系统来实现这一点。’

让LLM更人性化

周三上午,Inflection AI的首席执行官Sean White在Human[X]会议上向听众介绍了他的公司为使基于LLM的聊天机器人更具对话性所做的持续努力。

Inflection AI的Pi.ai是一款个人助理聊天机器人,已拥有3500万用户,最初是为了发布其前沿模型而创建的,这是一个用于尖端模型的术语。White曾担任Mozilla基金会的首席研究与发展总监,一年前加入Inflection。“当我加入时,很大一部分转变是将所有这些内容整合起来,看看我们是否能将其应用于企业。”

Inflection AI的Sean White说,许多语言模型导致的用户体验要么是从书本报告开始,要么就是根本不好交流。

Pi.ai有意开发为具有情感智能的在线助手。这是Inflection使命的核心,White说。

“我们真的相信这是新一代的用户界面和体验,”他告诉TNS。“不仅仅是计算系统或UX系统——我们不想构建糟糕的用户体验。许多这些系统要么是从书本报告开始,要么实际上根本不好交流。”

Inflection AI在这方面投入了大量精力,使其模型不像“书本报告”那样,而是更人性化,注重细微差别和上下文。

“我们收集了超过1000万个这些良好对话的例子,具有情感智能。我们在一个非常大的维度空间中,想要的是,对话是否能持续?那个陈述是否带有讽刺意味?”

与Inflection AI等较新的初创公司一起出现在Human[X]上的还有那些在2022年后需求爆炸之前就开始的公司。

Unbabel成立于2013年,从事机器翻译。“我们得到了来自世界各地的一群译者,他们会校对这些机器翻译,”Unbabel的产品主管Gil Coelho告诉The New Stack。

现在,由于机器翻译取得了显著进步,Coelho说,“我们有一代模型,我们称之为power LLMs,它们目前是大多数语言机器翻译的最佳状态。”

Unbabel的Gil Coelho说,他的公司希望开发者开始在其最近开源的翻译技术Widn.ai之上构建。

此外,Unbabel还可以进行质量估计——使用另一个AI模型来预测公司对特定翻译的信心。“基本上,一个模型负责翻译,另一个模型会说,‘我对这个翻译很有信心’,或者‘我对这个翻译信心不足’。如果我信心不足,我会把这个发送给人类检查翻译,”Coelho说。

几个月前,Unbabel在Widn.ai下开源了一些其专有的“秘方”翻译技术,并鼓励开发者在其组件上构建。

Coelho说:“这是我们战略上的一个重要转变。”“我们认为这样做是有意义的。我们一直在构建这些东西,我们希望让更多人、更多开发者、更多建设者使用它们,而不仅仅局限于Unbabel平台。”

超越“提示和祈祷”的方法

在Human[X]会议之前,八年的AI21 Labs公司推出了Jamba 1.6,这是基于混合Transformer-Mamba专家混合架构的最新开放LLM迭代。

并且,与Human[X]的主题一致,AI编排,它在周二推出了Maestro,这是一个AI规划和编排系统。

Maestro旨在解决的问题:帮助克服阻碍AI在企业生产中采用的信任问题。

虽然消费者对AI工具的采用正在上升,但在企业中却是另一回事,AI21联合创始人兼联席首席执行官Ori Goshen在接受The New Stack采访时说。“你看到很多实验,很多迷人的演示,但很少的工作负载真正进入生产。”

Goshen说,也许企业市场还没有足够的教育,但这里有一个更根本的问题:要使这些工具在关键任务工作流中发挥作用,必须围绕这些系统建立信任。它们必须是健壮的。

“这是基本的部分。我们一直在与客户合作;我们看到了他们的痛苦。从炫目的演示到实际在生产中运行的工作流,这真的很痛苦。”

Goshen说,目前构建AI应用程序的方法是罪魁祸首。通常,企业内部的AI开发者会采用一种代理框架,如React、Cloudchain、CrewAI、AutoGen等,然后使用语言模型或推理模型来决定系统将要做什么。

“它让语言模型基本上规划和操作工作流,这在演示中确实有效,但在现实中却会破裂。我们称之为‘提示和祈祷’方法。”

AI21 Labs的Ori Goshen:“这还处于初期阶段。我认为有许多问题需要解答,例如如何治理?如何创造更多控制?”

虽然可以找到变通方法,但随着系统的增长和变得更加复杂,这种方法不可持续。Goshen说,在硬编码中,开发者可能会“在其中放入明确的检查点,调用LLM获取动态处理的部分。这种方法确实给了你更多控制权,但它很僵化,脆弱,难以扩展。”

Goshen说,Maestro是一个模型不可知的系统:“它学习特定的企业环境。所以它学习API、工具、数据源……它理解环境,然后通过离线模拟进行训练。当系统收到任务时,它会创建一个明确的结构化计划,这样你就可以实际追踪它。”

Goshen说,Maestro系统目前处于私人预览阶段,预计将在2025年第二季度推出一般可用性。

至于会议,Goshen告诫不要让炒作跑在现实工程团队前面。

“这尚处于初期阶段,”他说。“我认为有许多问题需要解答,例如如何治理?如何创造更多控制?但我认为最根本的部分,也是真正核心的问题是,我们如何信任这些系统?”

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日