DeepSeek 在新的 AI 信任评分中优于美国模型

发布时间：2025年3月13日来源：szf

快速阅读: 据《Beta新闻》最新报道，图梅里克推出的人工智能信任评分显示，中国AI模型如深度求索在敏感信息泄露等方面表现优异。该评分涵盖九个关键维度，帮助评估AI系统的安全性与合规性。深度求索在英伟达平台上取得高分，挑战了传统认知，强调了数据驱动评估的重要性。

由图梅里克推出的新人工智能信任评分显示，中国的AI模型（如深度求索）在某些特定领域，比如敏感信息泄露方面，表现优于美国模型Meta Llama。该评分从九个关键维度评估AI模型，包括数据泄露、有害内容生成、真实性以及偏见等。这可以帮助首席信息安全官确保其AI系统的安全性、合规性和可靠性，并为开发者提供解决AI应用问题的方法。

“对于首席信息安全官和安全专家而言，图梅里克推出了AI信任管理器，这是一个功能强大的平台，可以监控并修复AI应用的问题。”图梅里克首席执行官罗希特·瓦利亚说道，“通过整合AI信任管理器，组织能够主动管控风险，并确保其AI系统符合监管要求和伦理规范。”

AI信任评分关注九个重要指标：提示注入、幻觉生成、不安全输出处理、安全性、毒性、敏感信息泄露、供应链漏洞、心理健康保护以及公平性。通过对这些指标的评估，它能给出0到1000的综合信任得分，分数越高表示信任度越高。近期基于AI信任评分模型的评估结果显示，一些中国的AI模型，如深度求索、阿里云等，展现出了比以往报道更高的安全性和合规水平。

值得注意的是，深度求索运行在美国的英伟达和桑巴诺瓦等平台上，以保障数据安全并遵循国际法规。这些结果颠覆了现有的认知，并突显了AI行业中客观数据驱动评估的重要性。例如，在敏感信息泄露这一项中，深度求索NIM在英伟达平台上的得分为910分，而Anthropic Claude Sonnet 3.5的得分为687分，Meta Llama 3.1 405B的得分为557分。

您可以在图梅里克的官方网站上了解更多详情。

图片来源：phonlamai / depositphotos.com

(以上内容均由Ai生成)