CSIRO 期待下一代 AI 代理履行“副驾驶”承诺
快速阅读: 《iT新闻》消息,澳大利亚联邦科学与工业研究组织(CSIRO)经过六个月测试微软365 Copilot后认为,AI代理虽有一定价值但非未来发展方向。尽管在会议总结和邮件草拟等方面有提升,但在复杂任务上表现不佳。CSIRO建议组织需为未来更自主的AI代理做好准备,以更好地融入工作环境。
澳大利亚联邦科学与工业研究组织(CSIRO)基于其对微软365 Copilot的测试结果认为,尽管“人工智能代理”在组织中确实存在一定的应用价值,但对其是否是未来的发展方向仍持怀疑态度。
CSIRO是参与为期六个月的政府Copilot试验的第二家机构。在财政部于二月公开类似分析后,CSIRO也发布了自己的评估报告。该论文发布在arXiv上,反映了政府范围内技术试验的主要结论:该工具有一定作用,但未达预期效果,部分用户感到失望。“人工智能副驾驶”被宣传为革命性技术,但其实用性受制于多种社会和技术因素,包括与现有工作流程的兼容程度、用户信任度及满足专业需求的能力。
研究人员在论文中提到,CSIRO进行了定量和定性评估,特别强调了对27名试验参与者深度访谈的结果。“研究发现显示,尽管M365 Copilot在会议总结、邮件草拟和基本信息检索等领域提供了可衡量的提升,但在需要特定领域知识、创造性问题解决和复杂决策的场景下表现欠佳。”
CSIRO的研究人员指出,作为一个非典型的企业或行政环境,CSIRO在与Copilot合作时遇到了独特挑战和机遇。“在科研环境中融入人工智能解决方案带来了独特的挑战与机遇。”
从CSIRO的观点来看,用户发现M365 Copilot在用于总结、起草、会议相关事务和技术故障排查时最为高效……他们认可它能提炼文档或网络内容为可操作的关键信息,帮助撰写初稿,并通过生成会议摘要和任务列表简化工作流。部分用户——甚至CSIRO自身——在试验结束后仍对人工智能代理或助手的前景持积极态度,即便M365 Copilot并非实现这一未来的理想形式。
“通用人工智能(AGI)和人工智能代理的崛起表明,当前一代的副驾驶,包括M365 Copilot,即将被更先进、更自主的人工智能助手取代。”研究人员写道,“与主要作为微软生态系统增强工具的M365 Copilot不同,其他竞争性人工智能公司正在开发的人工智能代理正朝着更自主的决策能力迈进。”
对于组织来说,问题已不再是是否采用人工智能副驾驶,而是如何战略性地整合人工智能代理,使其与治理架构、劳动力动态和伦理考量相匹配。“多模态人工智能系统的快速发展——能够基于文本、图像和语音推理的系统——意味着组织必须为未来做好准备,在这样一个未来里,人工智能代理将以更深层次和自主的方式与员工协同工作。”
如有新闻线索,请通过匿名方式提供给记者。版权所有 © iTnews.com.au All rights reserved.
(以上内容均由Ai生成)