苹果发布Pico-Banana-400K图像编辑数据集

发布时间:2025年10月29日    来源:szf
苹果发布Pico-Banana-400K图像编辑数据集

快速阅读: 苹果发布Pico-Banana-400K数据集,含40万张图像,支持非商业研究,利用Gemini-2.5模型构建,旨在改善文本引导图像编辑技术,涵盖多种编辑需求,为未来模型训练提供资源。

苹果发布了名为“Pico-Banana-400K”的大型研究数据集,该数据集包含400,000张图像,由谷歌的Gemini-2.5模型构建。以下是详细内容:

苹果研究团队发表了一篇题为《Pico-Banana-400K:面向文本引导图像编辑的大规模数据集》的研究报告。除了研究报告外,他们还公开了完整的400,000张图像数据集,该数据集具有非商业研究许可,这意味着任何人都可以用于学术工作或AI研究,但不能用于商业用途。

几个月前,谷歌发布了名为Gemini-2.5-Flash-Image(也称为Nanon-Banana)的图像编辑模型,被认为是当前最先进的图像编辑模型之一。尽管其他模型也有显著改进,但苹果的研究人员指出,这些模型在某些方面仍存在不足。因此,苹果决定采取行动。

### 构建Pico-Banana-400K

首先,苹果从OpenImages数据集中选取了若干真实照片,以确保涵盖人类、物体和文字场景。然后,研究人员列出35种用户可能要求模型进行的更改,分为8个类别,例如:

– **像素与光度**:添加胶片颗粒或复古滤镜

– **以人为中心**:将人物变成Funko-Pop风格的玩具形象

– **场景组成与多主体**:改变天气条件(晴天/雨天/雪天)

– **对象级语义**:重新定位对象(改变其位置或空间关系)

– **比例**:放大

接下来,研究人员将图像上传到Nanon-Banana,并附上其中一个提示。Nanon-Banana生成编辑后的图像后,Gemini-2.5-Pro会分析结果,根据指令合规性和视觉质量进行批准或拒绝。

最终,Pico-Banana-400K数据集包含了通过单次编辑(单个提示)、多次编辑序列(多个迭代提示)和偏好对(成功与失败结果的比较)生成的图像。尽管承认Nanon-Banana在精细空间编辑、布局推断和排版方面的局限性,研究人员希望Pico-Banana-400K能成为训练和评估下一代文本引导图像编辑模型的坚实基础。

你可以在这篇[arXiv](https://arxiv.org)上的研究论文中找到更多细节,数据集可在[GitHub](https://github.com)上免费获取。

(以上内容均由Ai生成)

你可能还想读

印军医系统启动首个人工智能糖尿病视网膜病变社区筛查项目

印军医系统启动首个人工智能糖尿病视网膜病变社区筛查项目

快速阅读: 据印度武装部队医疗局消息,12月16日,该机构联合全印医学科学研究所等单位在新德里启动全国首个AI糖尿病视网膜病变社区筛查项目,为6500万糖尿病患者提供早期眼病筛查。项目依托“MadhuNetrAI”平台,由基层医护人员使用手 […]

发布时间:2025年12月17日
印度初创Digantara融资5000万美元推进天基导弹防御

印度初创Digantara融资5000万美元推进天基导弹防御

快速阅读: 据多方确认,印度空间监视企业Digantara完成5000万美元B轮融资,将拓展导弹跟踪业务,以应对全球天基防御需求上升。该公司依托自研传感器技术,已获得美国太空司令部合同,并计划两年内发射15颗卫星,同时扩建在印度、美国和欧洲 […]

发布时间:2025年12月17日
Adobe发布Firefly精准AI视频编辑工具

Adobe发布Firefly精准AI视频编辑工具

快速阅读: 据消息指出,Adobe推出新一代AI视频编辑工具,依托Firefly平台整合多家模型,支持自然语言提示词编辑与跨模型调整,以解决AI生成内容“幻觉”问题,并开放介于基础剪辑与Premiere Pro之间的公开测试版,推动一站式创 […]

发布时间:2025年12月17日
12月值得买入的两只AI股票

12月值得买入的两只AI股票

快速阅读: 据行业统计,受甲骨文与博通财报疲软拖累,AI概念股普遍回调,部分优质标的估值回归合理区间。澳大利亚企业Iren股价较11月高点腰斩,但该公司已获得微软97亿美元合作订单,并聚焦可再生能源数据中心;Alphabet则凭借稳健现金流 […]

发布时间:2025年12月17日
CIO预测2026年AI将重塑企业 workforce 策略

CIO预测2026年AI将重塑企业 workforce 策略

快速阅读: 公开资料显示,受监管不统一与经济压力影响,2025年企业技术高管虽聚焦AI应用以推动增长,但CIO对投入持审慎态度。智能体AI虽引发关注,成功案例仍少,预计2026年将在部分场景从概念走向实践,但大规模落地仍面临部署复杂与效果不 […]

发布时间:2025年12月17日
迪拜千禧大酒店发布AI节日短片

迪拜千禧大酒店发布AI节日短片

快速阅读: 媒体注意到,迪拜Grand Millennium酒店近日推出AI生成节日短片《以孩童之眼观节庆》,通过儿童视角唤起节日温情,强化品牌亲和力。影片在多平台传播效果显著,Instagram获1.6万次曝光,领英达3.8万次曝光,并引 […]

发布时间:2025年12月17日
AI重建古罗马场景被曝充斥史实错误

AI重建古罗马场景被曝充斥史实错误

快速阅读: 消息人士透露,一段AI生成的古罗马视频因包含现代建筑和时代错置的装饰等史实错误,引发学者批评。法国波尔多蒙田大学教授库尔迪指出,该内容虽视觉逼真,却严重背离考古证据,恐误导公众对历史的认知。 近日,一段名为《古罗马|AI生成视频 […]

发布时间:2025年12月17日
Applied Digital股价暴跌17% 因AI数据中心债务风险

Applied Digital股价暴跌17% 因AI数据中心债务风险

快速阅读: 截至今日,受AI数据中心扩张推动,Applied Digital子公司于11月发行23.5亿美元高息票据,用于支持项目及偿债,但其偿债能力高度依赖核心租户CoreWeave,存在较大风险。 受人工智能数据中心业务快速扩张影响,A […]

发布时间:2025年12月17日