AI委员会通过美国医师执照考试,表现超人类平均水平

发布时间:2025年10月11日    来源:szf
AI委员会通过美国医师执照考试,表现超人类平均水平

快速阅读: 人工智能委员会在325个美国医学执照考试问题测试中,准确率达97%、93%和94%,超越单独GPT-4及人类平均水平。研究表明,AI通过结构化对话自我纠正,集体表现更优,未来有望应用于教育和临床护理。

在对325个公开的美国医学执照考试问题进行测试时,人工智能委员会分别达到了97%、93%和94%的准确率。这些成绩不仅超过了任何单独GPT-4实例的表现,也超越了人类通过相同测试的平均及格线。“我们的研究首次明确证明,人工智能系统可以通过结构化的对话自我纠正,集体表现优于任何单个AI。”Shaikh表示。

这一方法的有效性得到了验证,当模型最初意见不一时,讨论过程修正了超过一半的早期错误。总体而言,在没有一致初始答案的情况下,委员会最终有83%的时间得出了正确的结论。

该研究的共同作者Zishan Siddiqui指出:“这项研究并不是为了评估人工智能在美国医学执照考试中的答题能力。”他来自约翰霍普金斯大学,在新闻发布会上说,“我们描述了一种方法,通过将AI的自然反应差异视为优势来提高准确性。这种方法允许系统多次尝试,对比结果,自我纠正,应该被整合到未来的教育工具中,以及在适当的情况下用于临床护理。”

团队指出,他们的结果来自受控测试,而非实际临床环境,因此在人工智能委员会能够实际部署之前还有很长的路要走。但他们认为,这种方法也可能在其他领域发挥作用。

看来,古老的谚语“两人智慧胜一人”即使在非人类的‘头脑’之间也依然成立。

(以上内容均由Ai生成)

你可能还想读

联合国支持阿塞拜疆推进包容性绿色AI发展

联合国支持阿塞拜疆推进包容性绿色AI发展

快速阅读: 联合国驻阿塞拜疆协调员安德烈娃表示,联合国将支持阿塞拜疆利用人工智能促进包容性和可持续绿色发展。10月24日巴库会议强调,人工智能应助力社会服务、教育及就业,需警惕数字鸿沟和歧视问题。来自近20国的350名专家参会。 联合国驻阿 […]

发布时间:2025年10月24日
AI泡沫:能力与局限引发质疑

AI泡沫:能力与局限引发质疑

快速阅读: AI初创公司迅速发展,吸引大量投资,但AI能力的真实性和局限性引发担忧。研究显示AI生成虚假信息比例高,且在实际应用中效率低于预期,存在“幻觉”和“对齐欺骗”等问题,引发关于AI泡沫的讨论。 在当今的技术领域,人工智能(AI)初 […]

发布时间:2025年10月24日
三机构合作开发健康保险概念,AI助力老年人健康管理

三机构合作开发健康保险概念,AI助力老年人健康管理

快速阅读: 国际体操联合会、富士通和宏碁医疗合作开发基于积分的健康保险概念,利用AI技术促进老年人健康,计划在2025年艺术体操世锦赛期间测试相关应用。 瑞士洛桑、日本川崎和中国台湾新北市,2025年10月24日 — 国际体操联合会(FIG […]

发布时间:2025年10月24日
谷歌升级地球AI,集成Gemini模型助力灾害应对

谷歌升级地球AI,集成Gemini模型助力灾害应对

快速阅读: 谷歌升级地球AI系统,集成Gemini模型,提升环境和灾害应对能力。系统整合多源数据,提供全面风险分析,已在加州野火中助1500万人撤离。非营利组织利用其识别洪水高风险区,实现精准救援。新功能将向特定用户开放,支持多领域应用。 […]

发布时间:2025年10月24日
AI重塑行业版图,部分岗位或将消失

AI重塑行业版图,部分岗位或将消失

快速阅读: 未来十年,人工智能和自动化将使部分行业消失,如金融和零售领域的职位面临重大变革。据研究,到2030年,美国30%的工作可能完全自动化,60%的工作将经历显著变化,但同时也会创造新的工作机会。 未来十年,一些行业可能萎缩至成为“鬼 […]

发布时间:2025年10月24日
三星与软银合作开发6G及AI无线网络技术

三星与软银合作开发6G及AI无线网络技术

快速阅读: 三星电子与软银签署谅解备忘录,共同探索6G和AI-RAN等下一代通信技术,旨在开发先进解决方案,提升网络性能与效率,合作涉及新应用场景识别及核心技术联合开发。 三星电子与软银签署谅解备忘录(MoU),共同探索下一代通信技术,包括 […]

发布时间:2025年10月24日
AI助力法律工作者提升效率与价值

AI助力法律工作者提升效率与价值

快速阅读: AI融入法律工作流程,提升律师等专业人士效率,不损害职业道德。AI加速法律研究、简化文件审查、提高起草能力、改进知识管理和支持合规,但仍需谨慎对待伦理和安全问题。 法律职业建立在知识之上——这些知识深厚、复杂且往往充满细微差别。 […]

发布时间:2025年10月24日
Anthropic扩展Claude记忆功能至Pro和Max用户

Anthropic扩展Claude记忆功能至Pro和Max用户

快速阅读: Anthropic为Claude AI的Pro和Max用户推出记忆功能,增强用户体验,提供隐私模式保护用户数据,功能现已在多平台上线,但免费用户暂不可用。 Anthropic 正在为 Claude AI 的 Pro 和 Max […]

发布时间:2025年10月24日