苹果发布秒级2D转3D图像AI模型

发布时间:2025年12月18日    来源:szf
苹果发布秒级2D转3D图像AI模型

快速阅读: 据苹果公司消息,该公司近期发布三项AI研究成果:推出GIE-Bench图像编辑评估框架、IMPACT多语言屈折形态测试体系及SHARP单图3D重建模型。相关技术将用于优化Apple Intelligence功能,新版上下文感知Siri预计随iOS 26.4上线。

苹果公司近期发布两项人工智能研究成果,分别聚焦图像编辑模型评估与多语言大模型的形态学能力测试。

在图像生成领域,该公司推出名为“GIE-Bench”的评估框架,从功能正确性与图像保真度两方面量化文本引导图像编辑的效果。功能正确性通过自动生成的多选题验证编辑指令是否准确执行;图像保真度则采用目标感知掩码技术,确保非编辑区域不受干扰,并辅以人工标注校验。测试涵盖千余样本、20类内容,评估对象包括MGIE、OmniGen及GPT-Image-1等主流模型。结果显示,GPT-Image-1整体表现最优,但在对象移除不彻底、布局理解偏差或背景保留不足等问题上仍有欠缺。相比之下,OneDiffusion与MagicBrush在各项保真指标中表现更稳定。该评估体系可为苹果测试自研模型或分析竞品提供有效工具。目前,苹果已推出名为“Image Playground”的端侧图像生成方案,作为其多语言支持的“Apple Intelligence”AI功能套件组成部分。

另一项研究针对大语言模型在屈折形态丰富语言中的表现。苹果研究人员开发了名为IMPACT的专用评估框架,重点考察模型对阿拉伯语、俄语、芬兰语、土耳其语和希伯来语等语言中屈折变化的掌握程度。屈折形态通过词缀表达语法功能,如名词数、动词时态等。IMPACT包含单元测试式用例,覆盖基本动词变位及特定语言现象,例如阿拉伯语的反向性一致、芬土语的元音和谐等。研究团队对八个多语言大模型进行测试,任务包括生成正确屈折形式与判断语句是否合乎语法。结果显示,当前模型普遍在非英语语言、尤其是罕见屈折模式上表现不佳,且对不合语法样本的识别能力有限。所有模型在所测语言中的表现均弱于英语。

此外,苹果此前还发布了名为“SHARP”的开源AI模型,可在不到一秒内将单张2D图像转化为具有深度感的3D场景。该模型基于3D高斯表示方法,通过神经网络单次前馈推理,在普通GPU上即可完成运算。与传统依赖多角度照片重建3D环境的方法不同,SHARP仅需一张图像即可预测场景深度并生成相应三维结构。研究团队通过大规模数据集训练,使模型能识别常见深度模式,但其在复杂反射、遮挡关系(如蜜蜂误置于花朵后方)及天空曲面误判等场景中仍存在局限。该模型仅重建图像可见区域,不进行环境外推。目前,SHARP已公开上线GitHub,为相关领域研究提供新工具。

2025年,苹果已推出基于AirPods的“实时翻译”功能。尽管公司AI负责人约翰·詹南德里亚近期退休,其AI研究步伐未减。据悉,具备上下文感知能力的新版Siri预计将在iOS 26.4更新中推出。

(以上内容均由Ai生成)

引用自:AppleInsider网站

关键词: 2D转3DAI模型苹果

你可能还想读

埃森哲停止披露AI收入但Q1增长强劲

埃森哲停止披露AI收入但Q1增长强劲

快速阅读: 埃森哲公司在声明中表示,其2026财年一季度新订单达209亿美元,先进AI相关订单同比激增76%至22亿美元,营收达187.4亿美元并触及指引上限。公司称AI已深度融入整体业务,将不再单独披露相关数据。 埃森哲公司于近日发布20 […]

发布时间:2025年12月19日
Coursera与Udemy合并加速AI人才培养

Coursera与Udemy合并加速AI人才培养

快速阅读: 据官方透露,受人工智能快速发展影响,企业正转向模块化培训以提升员工AI技能。优达学城与Coursera合并后将构建统一技能记录系统,助力企业动态追踪并培养人才,增强应对技术变革的能力。 近日,亚马逊旗下AWS培训与认证项目董事总 […]

发布时间:2025年12月19日
微软Copilot假日广告承诺落空

微软Copilot假日广告承诺落空

快速阅读: 截至发稿时,用户反映微软Copilot在将食谱份量扩增至14人份时计算中断,并误将网页上的整数倍按钮识别为精确调节控件,最终未能输出调整后的食材清单,暴露出其在连续数值处理与界面理解方面的不足。 近日,有用户反映在使用人工智能助 […]

发布时间:2025年12月19日
谷歌Home应用支持批量迁移Nest设备

谷歌Home应用支持批量迁移Nest设备

快速阅读: 据谷歌消息,Google Home应用现已支持一次性迁移多台旧版Nest设备,涵盖恒温器、摄像头、智能门锁及烟雾报警器,大幅简化此前繁琐的手动操作流程,以加速向统一平台整合并优化用户体验。 谷歌近日在更新日志中宣布,Google […]

发布时间:2025年12月19日
美光称存储芯片短缺将持续至2026年后

美光称存储芯片短缺将持续至2026年后

快速阅读: 据官方透露,亚马逊数字广告平台在美国月活广告受众超3亿,依托Prime Video原创内容及与Netflix等平台的合作,覆盖用户全链路场景,并通过互动广告与营销云AI技术提升品牌营销精准度。 亚马逊数字广告平台(Amazon […]

发布时间:2025年12月19日
Patronus AI推出智能体训练模拟器

Patronus AI推出智能体训练模拟器

快速阅读: 据Patronus AI消息,该公司本月推出“生成式模拟器”,通过动态创建任务与实时更新规则,构建“活态”训练场以提升AI智能体的任务执行能力,并提出“开放递归自改进”机制,支持智能体在无需重训练的情况下持续优化。 人工智能领域 […]

发布时间:2025年12月19日
联想AI战略的五大落地路径

联想AI战略的五大落地路径

快速阅读: 据官方透露,联想集团正系统推进AI规模化应用,已注册超1000个相关项目,并通过“组合式”策略覆盖从试点到全公司推广的全周期。为应对数据监管与技术不确定性,公司强化区域化部署,建立AI工具白名单机制,并将AI目标纳入高管考核,以 […]

发布时间:2025年12月19日
Lovable融资3.3亿美元估值达66亿

Lovable融资3.3亿美元估值达66亿

快速阅读: 截至报道时,据媒体消息,瑞典AI初创公司Lovable完成3.3亿美元B轮融资,估值达66亿美元。其“氛围编程”工具已吸引Uber等客户,日均新增项目超10万个,新资金将用于拓展企业功能与基础设施。 瑞典人工智能初创企业Lova […]

发布时间:2025年12月19日