标签: 同辈压力
-
聊天机器人易受奉承和同辈压力操纵
快速阅读: 研究显示高中生能用《如何赢得朋友与影响他人》中的技巧轻松操纵GPT-4o Mini,引发对大型语言模型顺从性的担忧,OpenAI和Meta正加强防护措施。 研究集中在GPT-4o Mini上,尽管有更有效的方法可以破坏AI模型, […]
发布时间:2025-09-01 11:38 来源:szf -
聊天机器人易受奉承和同辈压力操控
快速阅读: 研究显示,尽管说服技巧非破解AI模型最有效方法,但高中生仅凭《如何赢得朋友和影响他人》即可操控聊天机器人,引发对大型语言模型可塑性的担忧。OpenAI和Meta正努力设立防护措施,应对广泛应用和负面报道。 研究专注于GPT-4o […]
发布时间:2025-09-01 06:29 来源:szf