OpenAI推GPT Image1.5强化图像编辑一致性
快速阅读: 据OpenAI消息,该公司提前推出GPT Image1.5图像生成模型,以应对谷歌Gemini3的竞争压力;新模型生成速度提升四倍,强化编辑一致性,并在ChatGPT侧边栏增设创作入口,优化用户创意体验。
OpenAI近日推出新一代图像生成模型GPT Image1.5,以应对谷歌在人工智能领域的快速崛起。该模型已于本周二向所有ChatGPT用户及API用户开放,具备更精准的指令遵循能力、更精细的编辑控制,并将图像生成速度最高提升至原来的四倍。
此次发布是OpenAI首席执行官萨姆·阿尔特曼宣布公司进入“红色警戒”状态后,为重夺技术领先地位采取的关键举措。此前,谷歌推出的Gemini3模型及其图像生成工具Nano Banana Pro表现强劲,在LMArena排行榜上位居前列,并持续扩大市场份额。尽管OpenAI上周已发布号称“迄今最先进”的GPT-5.2模型,但谷歌仍保持领先。受竞争压力影响,原定于明年1月初发布的GPT Image1.5被提前上线。
GPT Image1.5是今年4月发布的GPT Image1的升级版本,重点强化了后期制作功能。新模型在调整面部表情、光照或色调等细节时,能有效维持图像整体的视觉一致性,解决了当前多数生成式AI在迭代编辑中反复重构画面、导致结果失真的问题。
此外,OpenAI应用首席执行官菲吉·西莫表示,ChatGPT已在侧边栏增设专用入口,打造“更像创意工作室”的图像创作体验。用户可通过优化后的界面访问热门提示与预设滤镜,提升创作效率。未来,ChatGPT还将整合更多带有明确来源的视觉元素,以支持单位换算、体育比分查询等实用场景。
西莫强调,缩小用户构想与实现能力之间的差距,是产品持续优化的核心目标。
(以上内容均由Ai生成)
引用自:AIbase人工智能资讯平台