Anthropic 推出新方法评估 Claude 政治中立性

发布时间：2025年11月17日来源：szf

快速阅读: Anthropic发布新方法评估聊天机器人Claude的政治中立性，避免无证据主张，强调中立回答。Claude Opus4.1中立评分为95%，仅次于Gemini2.5Pro。测试方法开源，助力行业标准建立。

近日，Anthropic公司发布了一种新方法，用于评估其聊天机器人Claude在政治问题上回应的公正中立性。该公司表示，Claude在回答政治相关问题时应避免无证据的政治主张，以防止被视作偏向保守或自由派。

Claude的表现受到系统提示和奖励机制的影响，尤其是奖励那些被认为是中立的回答。这些中立回答可能包含关于尊重“传统价值观和制度重要性”的内容，表明该公司努力使Claude更加符合美国当前的政治需求。

据报告显示，Gemini2.5Pro被评为最中立的AI，得分为97%，而Claude Opus4.1则以95%的得分紧随其后。其他模型如Sonnet4.5、GPT-5、Grok4和Llama4的评分也相对较高，但仍然低于Claude。尽管Anthropic在其博客中未明确提及，但这一测试方法的推出很可能与特朗普政府的政策有关，该政策要求聊天机器人不得展示“觉醒”(woke)现象。同时，OpenAI也在调整其GPT-5模型，以达到类似方向，满足美国政府的要求。

值得注意的是，Anthropic将其测试方法以开源形式发布在GitHub上，便于其他开发者和研究人员使用和评估。

(以上内容均由Ai生成)