OpenAI 的 GPT-4.5 “不会碾压基准测试”,但可能是更好的朋友
快速阅读: 据《Cointelegraph 公司》称,OpenAI即将推出的GPT-4.5模型成本将是前代的二十倍,但在创意对话方面更为出色。尽管GPT-4.5在逻辑推理上不如O系列模型,但它在医学影像诊断等方面表现出色。OpenAI CEO萨姆·奥特曼表示,未来模型的成本将大幅下降。OpenAI计划在未来几个月发布整合多版本的GPT-5,并提供免费的无限聊天访问。
ChatGPT的开发者OpenAI即将推出的模型成本可能是其前身的二十倍,但其对话风格将更加富有创意且更为自然。据OpenAI和早期测试者表示。OpenAI于二月二十七日发布了GPT-4.5的研究预览版,这是其最先进的AI模型,能够识别模式、建立联系并以优于早期版本的方式进行创造性的洞察。OpenAI表示,GPT-4.5更广泛的知识库和改进的“情商”使其在创意任务和解决实际问题方面更有用。OpenAI在二月二十七日的一份声明中表示。
GPT-4.5增强的创造力和更自然的对话风格意味着它不太适合执行详细的逐步逻辑推理,至少与OpenAI的O系列模型相比,情况如此。这种权衡在于它缺乏“思维链推理”能力,并且由于其规模较大,可能会较慢。此外,它不生成多模态输出,如音频或视频。GPT-4.5在遵循指令方面有时表现较差。AI和商业通讯《每日常识》的CEO丹·希珀也给出了类似的评价:“它不会让你感到惊讶,但可能会成为你的朋友。”他说他的公司已经测试了这个最新版本几天。AI研究员荒津崎也指出,访问GPT-4.5的API成本大约是GPT-4O的十五至二十倍。AI罗盘通讯的创始人阿舒托什·夏尔瓦斯塔瓦补充道。
来源:托马斯·保罗·曼二月二十七日,在X平台上,OpenAI首席执行官萨姆·奥特曼承认新推理模型“不会碾压基准”,而是一个“庞大且昂贵的模型”。来源:萨姆·奥特曼
生物医学科学家、杰克逊实验室教授德里亚·尤努穆扎称,GPT-4.5在医学影像诊断方面表现出色——准确识别出输卵管异位妊娠。其他AI模型,如Grok 3、克劳德 3.7 儿子网、杰米尼 2.0 以及早期的ChatGPT模型,错误地将一张医学影像识别为正常妊娠。尤努穆扎教授表示。来源:德里亚·尤努穆扎
相关:加密AI代理看到“显著增长”,但价值仍不明确:西格努姆
当中国本土竞争对手High Flyer在一月份推出开源大型语言模型DeepSeek R1时,OpenAI的最新ChatGPT迭代也随之发布。该模型的开发成本仅为OpenAI模型的一小部分。然而,OpenAI首席执行官萨姆·奥特曼声称,这些AI模型的构建成本每年下降十倍甚至更多。“你可以从二〇二三年初的GPT-4到二〇二四年中期的GPT-4O的每个令牌成本中看出这一点,”奥特曼在二月十日的帖子中说,“在那段时间内,每个令牌的价格下降了约一百五十倍。”
二月十二日,奥特曼表示GPT-5将在数月内发布,该模型将整合多个版本,包括O3,成为一个整体。OpenAI在二月十三日表示。ChatGPT的免费层级将获得对GPT-5的无限聊天访问权限。
杂志:关于DeepSeek R1的九个有趣的事情:AI之眼
(以上内容均由Ai生成)