认识具有多重个性的 AI 代理
快速阅读: 《有线》消息,研究表明,AI助手在复杂任务中的表现仍有局限,仅能完成少数任务。结合人类智慧可显著提升效率,如CowPilot插件所示,人机协作能完成95%的任务,且仅需人类参与15%的步骤。这表明人机合作是未来发展方向。
OSWorld基准测试表明,为何人工智能助手目前仍更多是炒作而非现实。尽管人类能够完成72%的OSWorld任务,但人工智能助手在复杂任务中的失败率却高达38%。即便如此,在2024年4月引入基准测试时,最先进的人工智能助手也只能完成12%的任务。钟先生指出,可用的训练数据量或许限制了这些人工智能助手的能力上限。或许一个解决办法是将人类智慧融入其中。
在研究Simular的过程中,我发现了一个研究项目,它展示了将人类技能与人工智能助手技能相结合的有效性。卡内基梅隆大学的研究团队开发了一款名为CowPilot的Chrome扩展插件,该插件允许人类在人工智能助手遇到困难时进行干预。使用CowPilot,当人工智能助手表现出犹豫时,我可以选择介入并点击或输入内容。这个项目由CMU教授杰弗里·布莱厄姆指导,并由他的学生法利亚·胡克开发,他表示让人类与人工智能助手共同工作“这个想法太显而易见了,简直让人难以置信这不是大多数人在考虑的方向”。
最令人感兴趣的是,布莱厄姆和胡克提到,人类与人工智能助手的合作能够完成比单方更多任务。在有限的测试中,人机协作完成了95%的任务,且只需人类执行全部步骤的15%。布莱厄姆补充道:“网页通常非常复杂,特别是当你对某个页面不熟悉的时候,有时代理可以帮助你找到一条更优的路径,而这条路径可能是你自己花费更长时间也难以想到的。”
我不知道你是否也有同感,但我喜欢这样一个人工智能助手,它能让我更高效、更少出错。
(以上内容均由Ai生成)