AI 创造力可能已经达到顶峰,并且可能会变得更糟
快速阅读: 据《埃塞克斯大学》最新报道,研究显示,生成式AI虽能提升新颖性,但原创力有限,更倾向于组合式创造力。埃塞克斯大学等机构测试14种AI模型后发现,ChatGPT-4表现下滑,而未公开的GPT4.5表现最佳。AI在创意任务中是有力助手,但缺乏人类指导易固守旧有模式,真正的创新需人类灵感引导。
埃塞克斯大学、柏林洪堡大学以及柏林楚泽研究所的研究者们表示,生成式模型“可能鼓励一定程度的新颖性,但很少产生彻底原创的想法”。这可能会“强化组合式创造力,而非概念性创造力”。这项研究以预印本论文形式发表,通过让不同的程序互相竞争来进行测试。
思维突破:埃塞克斯大学心理学系的保罗·黑内尔博士与魏茨曼研究所及柏林洪堡大学的珍妮弗·哈斯博士,以及柏林楚泽研究所和柏林工业大学的塞巴斯蒂安·波库塔教授共同参与了这一项目。这种能力的下降与发散性思维任务相关,例如“跳出框框思考”。
研究人员发现,过去18至24个月内,ChatGPT-4的表现下降了43%-49%,这一下降发生在2024年5月ChatGPT-4o发布之后。研究人员测量了人工智能在面对开放式问题时产生多种、多样且新颖想法的能力。
计算机依然难以超越最优秀的人类,研究表明,尽管计算机在生成原创想法方面仍然难以与最优秀的人类相媲美,但它们的表现仍优于60%-80%的人类。尽管ChatGPT-4的表现有所下滑,但尚未公开的GPT4.5研究预览版却表现最佳。
黑内尔博士指出,这种答案的多样性体现了人工智能的不可预测性。“有人认为大型语言模型(LLMs)优于多数人,而另一些人则认为LLMs只是在生产人工智能的‘垃圾’,”他说。“我们的研究显示,LLMs既能产出富有创意的答案,也能给出缺乏创意的答案。它们相当难以预测。”
对人类而言稀有的东西,对于LLMs来说更为罕见,即高度不可能且极具原创性的想法。但凭借易得性和无穷动力,LLMs无疑是日常创造性任务中的出色头脑风暴伙伴。
这项研究考察了包括中国DeepSeek、谷歌Gemini、X公司Grok以及ChatGPT在内的14种不同LLMs。真正的创新离不开人类的灵感。
该研究使用了两种广为人知的发散性思维测量方法。替代用途任务要求参与者尽可能多地想出某个特定对象的不同用途,而发散联想任务则要求参与者想出10个彼此尽可能不同的词。
研究人员表示,这项研究“涉及关于人工创造力的更大哲学辩论”。他们建议,如果不加以深思熟虑地使用,AI可能会无意中限制创造性多样性并强化现有模式。
黑内尔博士补充道:“AI可以是一个不知疲倦的创造性伴侣——但如果没有人类的指导,它往往会围绕着熟悉的事物打转。真正的创新离不开人类的灵感,它不仅会问‘接下来是什么?’还会问‘如果呢?’”
(以上内容均由Ai生成)