AI 是泡沫还是革命?Human[X] 问道:为什么不两者兼而有之?
快速阅读: 据《新堆栈》称,首届Human[X]会议探讨了AI代理治理、个性化模型及投资趋势。尽管AI繁荣存在泡沫迹象,但有望引发社会变革。会议强调AI代理的治理挑战,展示相关技术和平台进展,同时提醒避免炒作超越实际工程能力。
人工智能(AI)/ AI代理/AI工程/大型语言模型
人工智能是泡沫还是革命?Human[X]提问:为什么不能两者兼备?
首届Human[X]活动展示了人工智能的未来方向:迈向AI代理治理、更定制化的模型以及更多的投资。
2025年3月17日中午12点,Heather Joslyn撰写
Human[X]联合创始人Stefan Weitz在3月10日的AI大会开幕式上发言。所有照片均由Heather Joslyn拍摄。
编辑注:
作者在Human[X]会议上主持了一场小组讨论。
拉斯维加斯——首届Human[X]会议的主要亮点:
AI代理无处不在,需要协调与治理。
模型正在迅速改进——但信任仍在发展中。
而且,如今AI领域资金流动非常活跃:根据Statista的数据,该行业在2024年增长到全球市场规模1840亿美元,而前一年约为1340亿美元。
由Stefan Weitz和Jonathan Weiner创立的Human[X]致力于展示组织如何使用AI,并帮助投资者和商业决策者更多地了解这个快速增长的行业。
Human[X]去年春天启动时获得了Primary Venture Partners、Foundation Capital、FPV Ventures和Andreessen Horowitz等风险投资公司的600万美元初始投资,在拉斯维加斯首次活动吸引了超过6500人注册。
在上周一的欢迎致辞中,Weitz告诉观众他和Weiner为何创办Human[X]:专注于现实世界的应用及其带来的好处和挑战。
“Weitz说:‘对我来说,这场对话令人沮丧地二元化。要么是乌托邦,要么是反乌托邦。要么是善良的机器人主宰,要么是具备LinkedIn档案的天网。乌托邦与审判日之间似乎没有明显的中间地带。
‘我们知道,现实更加复杂。这就是为什么我们试图建立Human[X],不是为了助长炒作,也不是为了制造更多恐惧,而是为了参与关于实际发生的事情、哪些有效、哪些无效以及下一步该做什么的对话。’”
周三,会议公布了由民意调查公司HarrisX对超过1000名美国商业领袖进行的一项调查结果。75%的受访者表示他们的组织有专门的AI战略。
大多数受访的领导者表示,他们将预算的10%至25%用于AI项目;37%的调查参与者表示,他们预计在未来三年内其AI投资将显著增长。
与此同时,该领域的最大玩家继续推出新的进展。周二,OpenAI推出了其新的AI代理框架;周三,Google发布了Gemma 3,这是一组轻量级、开源的模型。
在周一的开幕演讲中,Weitz谈到了AI繁荣是否是一个泡沫或即将到来的工作和生活革命的开端。
虽然他承认“泡沫迹象正在显现”,但他指出,尽管如此,之前的泡沫仍然带来了持久的社会变革;例如,在20世纪初,大约有2000家公司生产汽车。虽然其中绝大多数制造商都失败了,但汽车仍然改变了社会。同样,1990年代的数字初创企业大多倒闭了。
Weitz说,AI繁荣可能“有点过热”,但它仍有可能是一场潜在的革命。
然而,他警告说:“炒作正在左右决策,而追赶潮流的压力正促使企业和政府快速行动,无论他们是否真正理解自己在构建什么。因此,问题不仅仅是AI被过度炒作,而是炒作本身让我们变得不负责任。这有点像有了更好算法的Fyre音乐节。”
Weitz周二宣布,下一届Human[X]将于2026年4月7日至9日在旧金山举行——这是对湾区主导行业的认可。
AI代理和治理
由于Human[X]吸引了大量投资者和商业领袖,它比通常的技术活动人群更为外向。例如,在Human[X]会议上,午餐和早餐时,同桌的人会互相提问,而不是埋头玩手机。
通过这些对话,以及会议中的讨论,一些关键主题浮现出来。其中之一是,当前热门的代理型AI正带来治理挑战。
Yash Sheth,Galileo公司(一家生成式AI评估公司)的联合创始人兼首席运营官告诉The New Stack,代理崛起的原因至少与利润一样多与生产力有关。
Sheth说:“迄今为止,人们对AI软件的兴趣主要在于辅助方式。”“但是RAG和聊天机器人生成文件和简报仍然需要人类在循环中。AI真正的投资回报率只有通过自动化实现,你可以自动化大规模的工作流并使后端流程更加高效。
Galileo的Yash Sheth说,AI代理起飞的原因并不神秘:“那就是AI的真实投资回报率。”
Sheth说:“迄今为止,人们对AI软件的兴趣主要在于辅助方式。”“但是RAG和聊天机器人生成文件和简报仍然需要人类在循环中。AI真正的投资回报率只有通过自动化实现,你可以自动化大规模的工作流并使后端流程更加高效。
他补充道:“AI带来的东西是在那个自动化过程中对规则的一般化。所以从根本上来说,如果你明白为什么人们如此热衷于代理,那是因为它们将完成端到端的任务。”
Sheth说:“迄今为止,人们对AI软件的兴趣主要在于辅助方式。”“但是RAG和聊天机器人生成文件和简报仍然需要人类在循环中。AI真正的投资回报率只有通过自动化实现,你可以自动化大规模的工作流并使后端流程更加高效。
本质上,Sheth说,AI代理将AI融入机器人流程自动化,‘以自动化一些硬编码的过程并使其更强大。’
Sheth说:“迄今为止,人们对AI软件的兴趣主要在于辅助方式。”“但是RAG和聊天机器人生成文件和简报仍然需要人类在循环中。AI真正的投资回报率只有通过自动化实现,你可以自动化大规模的工作流并使后端流程更加高效。
他补充道:“AI带来的东西是在那个自动化过程中对规则的一般化。所以从根本上来说,如果你明白为什么人们如此热衷于代理,那是因为它们将完成端到端的任务。”
治理所有这些AI代理是一项艰巨的任务——也是供应商的一个机会。周一,专注于集成即服务的Boomi宣布了其AI Studio平台的测试版试验,计划在5月份将其推向一般可用性。
Boomi的客户已部署超过25,000个代理,Boomi的产品副总裁Mani Gill告诉The New Stack。“我们让客户思考代理并使用代理,自然他们会问,‘我如何更好地理解这些代理可以访问的数据?’
Boomi的Mani Gill表示,AI代理将像应用程序、API和数据一样,在现代企业系统中扩展。“所以我们开始与客户交谈,‘当你考虑你的代理之旅时,管理所有这些代理对你来说是否有价值?’这个概念与API管理非常相似,我有这么多API,我如何在我的环境中理解它们?”
Boomi的客户已部署超过25,000个代理,Boomi的产品副总裁Mani Gill告诉The New Stack。“我们让客户思考代理并使用代理,自然他们会问,‘我如何更好地理解这些代理可以访问的数据?’
他补充道:“我们引导了客户,但这也在他们眼前展开。”
Boomi AI Studio提供了一个平台来设计、治理和编排AI代理。它有四个组件:
– 代理设计器:让用户通过生成式AI提示、无代码模板、可信数据和安全护栏创建和部署AI代理。
– 代理控制塔:据Gill称,这是AI Studio的核心部分,控制塔“提供治理,同时也提供合规性和审计功能”,在中央位置监控Boomi和第三方AI代理。
– 代理花园:一个允许用户使用自然语言与其AI代理互动的空间。代理花园支持设计、测试、部署和工具开发。“它们可以学习,持续学习并培养这种能力,”Gill说。
– 代理市场:我们正在与合作伙伴合作,利用这种设计能力创建代理,然后我们的客户可以直接用作模板。”代理市场位于Boomi市场(以前称为Boomi Discover)。
其他参与者也涌入了AI治理领域。
Holistic AI是一家提供端到端AI部署管理的软件即服务公司。成立仅五年,每年的增长率为50%至60%,客户包括联合利华,Holistic AI的AI转型负责人Raj Patel告诉The New Stack。
Patel说,Holistic AI平台包括“作为业务决策依据的可观察性和基于证据的支持——你是否应该部署AI,以及当你部署时,你是否具备负责任的AI护栏、伦理和可观察性。”
目标不仅是治理AI应用和代理,还要确定是否应该构建这些应用和代理。
Patel说:“数据科学团队花费数十万美元组建团队并花六个月时间测试和部署。”“你希望尽早知道这是否是你想要探索的东西,以及你需要采取哪些缓解措施才能实现这一目标。”
Patel说,随着越来越多的组织采用生成式AI,治理是一个亟待填补的空白。
“市场上一个关键的不足之处是他们将治理视为一项检查表任务。”他说。“目前,这应该是一次性的任务。现在不再是这样了。
‘如果你想在你的业务中有效地部署AI,有一系列的检查需要完成,你需要有一个支持AI治理策略的系统来实现这一点。’
让LLM更人性化
周三上午,Inflection AI的首席执行官Sean White在Human[X]会议上向听众介绍了他的公司为使基于LLM的聊天机器人更具对话性所做的持续努力。
Inflection AI的Pi.ai是一款个人助理聊天机器人,已拥有3500万用户,最初是为了发布其前沿模型而创建的,这是一个用于尖端模型的术语。White曾担任Mozilla基金会的首席研究与发展总监,一年前加入Inflection。“当我加入时,很大一部分转变是将所有这些内容整合起来,看看我们是否能将其应用于企业。”
Inflection AI的Sean White说,许多语言模型导致的用户体验要么是从书本报告开始,要么就是根本不好交流。
Pi.ai有意开发为具有情感智能的在线助手。这是Inflection使命的核心,White说。
“我们真的相信这是新一代的用户界面和体验,”他告诉TNS。“不仅仅是计算系统或UX系统——我们不想构建糟糕的用户体验。许多这些系统要么是从书本报告开始,要么实际上根本不好交流。”
Inflection AI在这方面投入了大量精力,使其模型不像“书本报告”那样,而是更人性化,注重细微差别和上下文。
“我们收集了超过1000万个这些良好对话的例子,具有情感智能。我们在一个非常大的维度空间中,想要的是,对话是否能持续?那个陈述是否带有讽刺意味?”
与Inflection AI等较新的初创公司一起出现在Human[X]上的还有那些在2022年后需求爆炸之前就开始的公司。
Unbabel成立于2013年,从事机器翻译。“我们得到了来自世界各地的一群译者,他们会校对这些机器翻译,”Unbabel的产品主管Gil Coelho告诉The New Stack。
现在,由于机器翻译取得了显著进步,Coelho说,“我们有一代模型,我们称之为power LLMs,它们目前是大多数语言机器翻译的最佳状态。”
Unbabel的Gil Coelho说,他的公司希望开发者开始在其最近开源的翻译技术Widn.ai之上构建。
此外,Unbabel还可以进行质量估计——使用另一个AI模型来预测公司对特定翻译的信心。“基本上,一个模型负责翻译,另一个模型会说,‘我对这个翻译很有信心’,或者‘我对这个翻译信心不足’。如果我信心不足,我会把这个发送给人类检查翻译,”Coelho说。
几个月前,Unbabel在Widn.ai下开源了一些其专有的“秘方”翻译技术,并鼓励开发者在其组件上构建。
Coelho说:“这是我们战略上的一个重要转变。”“我们认为这样做是有意义的。我们一直在构建这些东西,我们希望让更多人、更多开发者、更多建设者使用它们,而不仅仅局限于Unbabel平台。”
超越“提示和祈祷”的方法
在Human[X]会议之前,八年的AI21 Labs公司推出了Jamba 1.6,这是基于混合Transformer-Mamba专家混合架构的最新开放LLM迭代。
并且,与Human[X]的主题一致,AI编排,它在周二推出了Maestro,这是一个AI规划和编排系统。
Maestro旨在解决的问题:帮助克服阻碍AI在企业生产中采用的信任问题。
虽然消费者对AI工具的采用正在上升,但在企业中却是另一回事,AI21联合创始人兼联席首席执行官Ori Goshen在接受The New Stack采访时说。“你看到很多实验,很多迷人的演示,但很少的工作负载真正进入生产。”
Goshen说,也许企业市场还没有足够的教育,但这里有一个更根本的问题:要使这些工具在关键任务工作流中发挥作用,必须围绕这些系统建立信任。它们必须是健壮的。
“这是基本的部分。我们一直在与客户合作;我们看到了他们的痛苦。从炫目的演示到实际在生产中运行的工作流,这真的很痛苦。”
Goshen说,目前构建AI应用程序的方法是罪魁祸首。通常,企业内部的AI开发者会采用一种代理框架,如React、Cloudchain、CrewAI、AutoGen等,然后使用语言模型或推理模型来决定系统将要做什么。
“它让语言模型基本上规划和操作工作流,这在演示中确实有效,但在现实中却会破裂。我们称之为‘提示和祈祷’方法。”
AI21 Labs的Ori Goshen:“这还处于初期阶段。我认为有许多问题需要解答,例如如何治理?如何创造更多控制?”
虽然可以找到变通方法,但随着系统的增长和变得更加复杂,这种方法不可持续。Goshen说,在硬编码中,开发者可能会“在其中放入明确的检查点,调用LLM获取动态处理的部分。这种方法确实给了你更多控制权,但它很僵化,脆弱,难以扩展。”
Goshen说,Maestro是一个模型不可知的系统:“它学习特定的企业环境。所以它学习API、工具、数据源……它理解环境,然后通过离线模拟进行训练。当系统收到任务时,它会创建一个明确的结构化计划,这样你就可以实际追踪它。”
Goshen说,Maestro系统目前处于私人预览阶段,预计将在2025年第二季度推出一般可用性。
至于会议,Goshen告诫不要让炒作跑在现实工程团队前面。
“这尚处于初期阶段,”他说。“我认为有许多问题需要解答,例如如何治理?如何创造更多控制?但我认为最根本的部分,也是真正核心的问题是,我们如何信任这些系统?”
(以上内容均由Ai生成)