DeepSeek 在新的 AI 信任评分中优于美国模型

发布时间:2025年3月13日    来源:szf
DeepSeek 在新的 AI 信任评分中优于美国模型

快速阅读: 据《Beta新闻》最新报道,图梅里克推出的人工智能信任评分显示,中国AI模型如深度求索在敏感信息泄露等方面表现优异。该评分涵盖九个关键维度,帮助评估AI系统的安全性与合规性。深度求索在英伟达平台上取得高分,挑战了传统认知,强调了数据驱动评估的重要性。

由图梅里克推出的新人工智能信任评分显示,中国的AI模型(如深度求索)在某些特定领域,比如敏感信息泄露方面,表现优于美国模型Meta Llama。该评分从九个关键维度评估AI模型,包括数据泄露、有害内容生成、真实性以及偏见等。这可以帮助首席信息安全官确保其AI系统的安全性、合规性和可靠性,并为开发者提供解决AI应用问题的方法。

“对于首席信息安全官和安全专家而言,图梅里克推出了AI信任管理器,这是一个功能强大的平台,可以监控并修复AI应用的问题。”图梅里克首席执行官罗希特·瓦利亚说道,“通过整合AI信任管理器,组织能够主动管控风险,并确保其AI系统符合监管要求和伦理规范。”

AI信任评分关注九个重要指标:提示注入、幻觉生成、不安全输出处理、安全性、毒性、敏感信息泄露、供应链漏洞、心理健康保护以及公平性。通过对这些指标的评估,它能给出0到1000的综合信任得分,分数越高表示信任度越高。近期基于AI信任评分模型的评估结果显示,一些中国的AI模型,如深度求索、阿里云等,展现出了比以往报道更高的安全性和合规水平。

值得注意的是,深度求索运行在美国的英伟达和桑巴诺瓦等平台上,以保障数据安全并遵循国际法规。这些结果颠覆了现有的认知,并突显了AI行业中客观数据驱动评估的重要性。例如,在敏感信息泄露这一项中,深度求索NIM在英伟达平台上的得分为910分,而Anthropic Claude Sonnet 3.5的得分为687分,Meta Llama 3.1 405B的得分为557分。

您可以在图梅里克的官方网站上了解更多详情。

图片来源:phonlamai / depositphotos.com

(以上内容均由Ai生成)

你可能还想读

LEO卫星信号助力弱GPS区域精准导航

LEO卫星信号助力弱GPS区域精准导航

快速阅读: 据最新消息,美国俄亥俄州立大学研究证实,星链与一网等低轨卫星信号可有效补充GPS,在无GNSS环境下将定位误差从超1公里降至约27米,为关键基础设施提供高精度导航备份方案。 日前,美国俄亥俄州立大学研究团队证实,商业低轨(LEO […]

发布时间:2025年12月8日
美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
星舰月球计划更新,SpaceX誓不放弃月球竞争

星舰月球计划更新,SpaceX誓不放弃月球竞争

快速阅读: FSD V14.2.1在标志识别方面改进明显,长期测试者Chuck Cook观察到学校区域行为改善,系统对时间规则认识提高,有助于减少动态环境中的误报。 FSD V14.2.1在标志识别方面也显示出改进。长期测试者Chuck C […]

发布时间:2025年11月30日
太空竞赛再起波澜,SpaceX澄清与NASA合作细节

太空竞赛再起波澜,SpaceX澄清与NASA合作细节

快速阅读: Riot Games计划举办《英雄联盟》人机对抗赛,Grok 5参赛将受限于人类水平,展现AI实时互动能力,有望成最具影响力赛事。 尽管尚未确定具体比赛,但从选手、队伍以及Riot Games的兴趣来看,这一概念有可能实现,成为 […]

发布时间:2025年11月26日
中国广电称合作建设卫星移动互联网,展示业界首款一体化便携基站

中国广电称合作建设卫星移动互联网,展示业界首款一体化便携基站

快速阅读: 中国广电董事长宋起柱出席5G+工业互联网大会,提出强算注智、数智赋能、深耕特色三大举措,展示5G 700MHz应急基站,推动超高清产业与工业互联网发展。 IT之家 11 月 23 日消息,据人民邮电报报道,中国广电党委书记、董事 […]

发布时间:2025年11月23日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日