DeepSeek 在新的 AI 信任评分中优于美国模型
快速阅读: 据《Beta新闻》最新报道,图梅里克推出的人工智能信任评分显示,中国AI模型如深度求索在敏感信息泄露等方面表现优异。该评分涵盖九个关键维度,帮助评估AI系统的安全性与合规性。深度求索在英伟达平台上取得高分,挑战了传统认知,强调了数据驱动评估的重要性。
由图梅里克推出的新人工智能信任评分显示,中国的AI模型(如深度求索)在某些特定领域,比如敏感信息泄露方面,表现优于美国模型Meta Llama。该评分从九个关键维度评估AI模型,包括数据泄露、有害内容生成、真实性以及偏见等。这可以帮助首席信息安全官确保其AI系统的安全性、合规性和可靠性,并为开发者提供解决AI应用问题的方法。
“对于首席信息安全官和安全专家而言,图梅里克推出了AI信任管理器,这是一个功能强大的平台,可以监控并修复AI应用的问题。”图梅里克首席执行官罗希特·瓦利亚说道,“通过整合AI信任管理器,组织能够主动管控风险,并确保其AI系统符合监管要求和伦理规范。”
AI信任评分关注九个重要指标:提示注入、幻觉生成、不安全输出处理、安全性、毒性、敏感信息泄露、供应链漏洞、心理健康保护以及公平性。通过对这些指标的评估,它能给出0到1000的综合信任得分,分数越高表示信任度越高。近期基于AI信任评分模型的评估结果显示,一些中国的AI模型,如深度求索、阿里云等,展现出了比以往报道更高的安全性和合规水平。
值得注意的是,深度求索运行在美国的英伟达和桑巴诺瓦等平台上,以保障数据安全并遵循国际法规。这些结果颠覆了现有的认知,并突显了AI行业中客观数据驱动评估的重要性。例如,在敏感信息泄露这一项中,深度求索NIM在英伟达平台上的得分为910分,而Anthropic Claude Sonnet 3.5的得分为687分,Meta Llama 3.1 405B的得分为557分。
您可以在图梅里克的官方网站上了解更多详情。
图片来源:phonlamai / depositphotos.com
(以上内容均由Ai生成)