Anthropic 推出新方法评估 Claude 政治中立性
快速阅读: Anthropic发布新方法评估聊天机器人Claude的政治中立性,避免无证据主张,强调中立回答。Claude Opus4.1中立评分为95%,仅次于Gemini2.5Pro。测试方法开源,助力行业标准建立。
近日,Anthropic公司发布了一种新方法,用于评估其聊天机器人Claude在政治问题上回应的公正中立性。该公司表示,Claude在回答政治相关问题时应避免无证据的政治主张,以防止被视作偏向保守或自由派。
Claude的表现受到系统提示和奖励机制的影响,尤其是奖励那些被认为是中立的回答。这些中立回答可能包含关于尊重“传统价值观和制度重要性”的内容,表明该公司努力使Claude更加符合美国当前的政治需求。
据报告显示,Gemini2.5Pro被评为最中立的AI,得分为97%,而Claude Opus4.1则以95%的得分紧随其后。其他模型如Sonnet4.5、GPT-5、Grok4和Llama4的评分也相对较高,但仍然低于Claude。尽管Anthropic在其博客中未明确提及,但这一测试方法的推出很可能与特朗普政府的政策有关,该政策要求聊天机器人不得展示“觉醒”(woke)现象。同时,OpenAI也在调整其GPT-5模型,以达到类似方向,满足美国政府的要求。
值得注意的是,Anthropic将其测试方法以开源形式发布在GitHub上,便于其他开发者和研究人员使用和评估。
(以上内容均由Ai生成)