苹果发布秒级2D转3D图像AI模型

发布时间:2025年12月18日    来源:szf
苹果发布秒级2D转3D图像AI模型

快速阅读: 据苹果公司消息,该公司近期发布三项AI研究成果:推出GIE-Bench图像编辑评估框架、IMPACT多语言屈折形态测试体系及SHARP单图3D重建模型。相关技术将用于优化Apple Intelligence功能,新版上下文感知Siri预计随iOS 26.4上线。

苹果公司近期发布两项人工智能研究成果,分别聚焦图像编辑模型评估与多语言大模型的形态学能力测试。

在图像生成领域,该公司推出名为“GIE-Bench”的评估框架,从功能正确性与图像保真度两方面量化文本引导图像编辑的效果。功能正确性通过自动生成的多选题验证编辑指令是否准确执行;图像保真度则采用目标感知掩码技术,确保非编辑区域不受干扰,并辅以人工标注校验。测试涵盖千余样本、20类内容,评估对象包括MGIE、OmniGen及GPT-Image-1等主流模型。结果显示,GPT-Image-1整体表现最优,但在对象移除不彻底、布局理解偏差或背景保留不足等问题上仍有欠缺。相比之下,OneDiffusion与MagicBrush在各项保真指标中表现更稳定。该评估体系可为苹果测试自研模型或分析竞品提供有效工具。目前,苹果已推出名为“Image Playground”的端侧图像生成方案,作为其多语言支持的“Apple Intelligence”AI功能套件组成部分。

另一项研究针对大语言模型在屈折形态丰富语言中的表现。苹果研究人员开发了名为IMPACT的专用评估框架,重点考察模型对阿拉伯语、俄语、芬兰语、土耳其语和希伯来语等语言中屈折变化的掌握程度。屈折形态通过词缀表达语法功能,如名词数、动词时态等。IMPACT包含单元测试式用例,覆盖基本动词变位及特定语言现象,例如阿拉伯语的反向性一致、芬土语的元音和谐等。研究团队对八个多语言大模型进行测试,任务包括生成正确屈折形式与判断语句是否合乎语法。结果显示,当前模型普遍在非英语语言、尤其是罕见屈折模式上表现不佳,且对不合语法样本的识别能力有限。所有模型在所测语言中的表现均弱于英语。

此外,苹果此前还发布了名为“SHARP”的开源AI模型,可在不到一秒内将单张2D图像转化为具有深度感的3D场景。该模型基于3D高斯表示方法,通过神经网络单次前馈推理,在普通GPU上即可完成运算。与传统依赖多角度照片重建3D环境的方法不同,SHARP仅需一张图像即可预测场景深度并生成相应三维结构。研究团队通过大规模数据集训练,使模型能识别常见深度模式,但其在复杂反射、遮挡关系(如蜜蜂误置于花朵后方)及天空曲面误判等场景中仍存在局限。该模型仅重建图像可见区域,不进行环境外推。目前,SHARP已公开上线GitHub,为相关领域研究提供新工具。

2025年,苹果已推出基于AirPods的“实时翻译”功能。尽管公司AI负责人约翰·詹南德里亚近期退休,其AI研究步伐未减。据悉,具备上下文感知能力的新版Siri预计将在iOS 26.4更新中推出。

(以上内容均由Ai生成)

引用自:AppleInsider网站

关键词: 2D转3DAI模型苹果

你可能还想读

中国AI芯片新贵崛起

中国AI芯片新贵崛起

快速阅读: 据彭博亿万富豪指数报道,受美国芯片出口管制及国产大模型推动,中国AI芯片企业密集上市造富,沐曦、摩尔线程等公司创始人身家跃升至数十亿美元,但新锐富豪财富仍远低于钟睒睒、马化腾等传统巨头。 中国房地产市场持续调整,部分传统富豪财富 […]

发布时间:2025年12月18日
48%制造企业用AI提升产出效率

48%制造企业用AI提升产出效率

快速阅读: 据PYMNTS Intelligence报告显示,60家制造、服务与科技企业正应对AI对工作模式的重塑:48%的制造企业聚焦提效,30%的服务企业优化决策,75%的科技公司自认已做好准备。半数企业将设立高阶新岗,技能缺口与运营复 […]

发布时间:2025年12月18日
Warhorse工作室回应Larian使用AI争议

Warhorse工作室回应Larian使用AI争议

快速阅读: 据彭博社报道,Warhorse Studios联合创始人丹尼尔·瓦夫拉呼吁理性看待AI在游戏开发中的应用,称其适用于非核心重复任务以提升效率,但强调《天国:拯救2》未使用AI创作内容,仅用于画质增强,并指出技术变革不可逆,行业应 […]

发布时间:2025年12月18日
Avnet Silica携手DeepX推边缘AI解决方案

Avnet Silica携手DeepX推边缘AI解决方案

快速阅读: 据安富利旗下Silica公司消息,该公司近日与DeepX达成合作,以满足欧洲、中东和非洲地区对高性能、超低功耗边缘AI解决方案的迫切需求。相关技术方案现已面向EMEA客户推出,重点应用于智慧城市、智能制造、自主移动机器人及机器视 […]

发布时间:2025年12月18日
OpenAI计划融资百亿美元估值达7500亿

OpenAI计划融资百亿美元估值达7500亿

快速阅读: 据The Information报道,OpenAI正与投资者磋商新一轮融资,计划募资最多1000亿美元,估值或达7500亿美元,为其2026年下半年潜在IPO铺路。资金将主要用于算力基础设施建设,亚马逊也在洽谈投资100亿美元, […]

发布时间:2025年12月18日
AI自动关停客户账户引发治理风险

AI自动关停客户账户引发治理风险

快速阅读: 据相关报道,Greyhound Research分析师戈吉亚警示,云与AI服务商“静默关停”企业账户正成为新型治理风险,主要源于自动化系统与合同自由裁量权。他指出,全球47%的首席信息官缺乏应对此类突发中断的预案,呼吁企业完善多 […]

发布时间:2025年12月18日
韩国政府2月起向机构分发英伟达GPU

韩国政府2月起向机构分发英伟达GPU

快速阅读: 据韩国科学和信息通信技术部消息,韩国将于2026年2月起分批发放英伟达GPU,支持企业、高校及国家级AI项目,推动国产NPU研发与6G网络建设,目标到2030年构建能效超进口GPU两倍的AI服务器生态,并在全球6G市场占据20% […]

发布时间:2025年12月18日
医院实施人工智能需建立统一标准

医院实施人工智能需建立统一标准

快速阅读: 据美国食品药品监督管理局消息,该机构正推动将特定人工智能软件作为医疗器械纳入上市前审批,以加强医疗AI的安全监管;同时,独立认证机构URAC于2025年推出首个医疗人工智能认证项目,通过全生命周期评估提升工具的公平性、透明度与临 […]

发布时间:2025年12月18日