AI

智谱、达摩院、360智脑相继开源多项AI技术

发布时间:2025年8月12日    来源:szf
智谱、达摩院、360智脑相继开源多项AI技术

快速阅读: 7月14日,智谱发布全球100B级最佳开源视觉推理模型GLM-4.5V,具备全场景视觉推理能力,新增思考模式,API价格低廉,助力AI应用创新。

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品 点击了解 : https://www.aibase.cn/ 1、智谱GLM-4.5V开源发布:全球100B级 最佳 视觉推理模型 智谱宣布推出并开源了全球100B级效果 最佳 的开源视觉推理模型GLM-4.5V,这是该公司在通向通用人工智能(AGI)道路上的又一重要探索性成果。

【AiBase提要:】 🤖 GLM-4.5V总参数达到106B,在41个视觉多模态榜单中达到SOTA性能 🎯 具备全场景视觉推理能力,包括图像推理、视频理解、GUI任务等 💡 新增”思考模式”开关,平衡效率与效果 💰 API价格低至输入2元/M tokens,输出6元/M tokens 2、阿里达摩院开源三项具身智能核心技术 在世界机器人大会上,阿里达摩院宣布开源三项自研核心技术:VLA模型RynnVLA-001-7B、世界理解模型RynnEC以及机器人上下文协议RynnRCP。这一举措旨在推动数据、模型与机器人本体的兼容适配,打通具身智能开发的完整流程。

【AiBase提要:】 🚀 开源三项核心技术:VLA模型、世界理解模型、机器人上下文协议 🔗 RynnRCP实现从传感器数据到机器人动作执行的完整工作流程 👁️ RynnVLA-001从 第一 人称视角视频学习人类操作技能 🌍 RynnEC从11个维度全面解析场景物体,无需依赖3D模型 详情链接:https://github.com/alibaba-damo-academy/RynnRCP 3、苹果即将升级 Apple Intelligence 至 GPT-5,推动 Siri 与写作工具智能化 苹果公司近日宣布,计划在即将发布的 iOS26、iPadOS26和 macOS Tahoe26系统更新中,将其 Apple Intelligence 中的 ChatGPT 核心模型升级至 最新 的 GPT-5版本。

【AiBase提要:】 🚀苹果将在 iOS26等系统更新中将 ChatGPT 模型升级至 GPT-5,以提升 Siri、写作工具和视觉智能的性能。

🚀新版本将引入多语言实时翻译及屏幕内容分析功能,增强设备在跨语言交流和信息处理方面的能力。

🚀苹果还 首次 向开发者开放设备端 API,支持第三方应用接入,提供低延迟和高隐私的 AI 体验。

4、高德全面接入通义大模型 推出首个地图AI原生Agent 阿里巴巴集团高德地图联合通义实验室发布全球首个 AI 原生地图,推出“小高老师”智能体,实现全链路语音交互与复杂任务推理导航。

【AiBase提要:】 🎙️ 内置智能体“小高老师”,支持音频/文本等多模态交互,支持随时打断的全双工语音。

🧠 基于36万亿 token 预训练的 Qwen 大模型,实现空间语义深度理解与高效调度近百种内部工具。

🗂️ 联合推出复杂 POI 推理 Agent,可拆解多重约束并整合实时信息,提供精准推荐与导航。

🔍 依托自研 DeepResearch 框架,具备规划、反思、工具调用等完整 Agent 能力。

5、宇树科技将出征首届世界人形机器人运动会,硬件将被多队采用 宇树科技将于8月14日至17日参加首届世界人形机器人运动会。宇树透露,除其自有团队外,赛场上还将有多支队伍使用宇树机器人硬件参赛,但会搭配各自自研的算法。

【AiBase提要:】 🤖 除宇树自有团队外,赛场上还将有多个队伍使用宇树的机器人硬件参赛,但会搭配各自研发的算法 。

🏟️ 此次运动会汇聚了天工、加速进化、松延动力、傅利叶、星海图等国内头部人形机器人企业,以及来自美国、德国、澳大利亚、巴西、日本等16个国家的共计280支队伍 。

🔧 宇树科技的参与不仅展示了其在人形机器人硬件方面的实力,也体现了其设备在开放生态中的广泛应用和竞争力 。

6、Claude AI 推出历史对话记忆功能,支持多背景切换 Anthropic 为 Claude AI 上线“记忆功能”,可自动记忆并复用用户历史对话中的背景信息,实现跨会话无缝衔接,并支持多背景隔离切换,目前仅向付费用户开放。

【AiBase提要:】 🔄 支持为不同项目设定独立背景,工作/生活场景一键切换,保持上下文延续。

💰 先行面向 Claude Max、Team、Enterprise 付费用户,Pro 版后续跟进,免费用户暂未开放。

⚙️ 用户可在“设置—搜索和参考聊天”中手动启用或查看记忆内容。

🤖 与 ChatGPT 手动预设不同,Claude 采用自动提取机制,体验更“无感”但可控性稍弱。

7、360智脑推出Light-IF系列模型 显著提升复杂指令遵循能力 360智脑发布Light-IF系列模型,以“预览-自检式推理+信息熵控制”框架专治“懒惰推理”,在四大基准全面领先,小参数即可越级打大模型,并全部开源。

【AiBase提要:】 🎯 创新Light-IF框架:难度感知指令生成→Zero-RL强化→推理模式过滤→熵保持冷启动→熵自适应正则,显著抑制“只会复述不检查”的懒惰推理。

📈 权威 评测霸榜:Light-IF-32B在SuperCLUE拿下0.575,领先第二名13.9个百分点;Light-IF-1.7B小模型反超Qwen3-235B-A22B等超大模型。

🔓 全面开源:模型权重将陆续上线Hugging Face,冷启动数据集与训练代码同步发布GitHub,并联合SuperCLUE推出中文评测基准SuperCLUE-CPIFOpen。

8、字节跳动推出视频字幕无痕擦除方案 基于DiT大模型打造 字节跳动发布全球首个基于DiT大模型的“视频字幕无痕擦除”方案,实现像素级修复、多语言适配、一键“擦除-翻译-口型同步”,助力短剧出海与跨境电商全球化。

【AiBase提要:】 🎞️ 两大核心:DiT视频字幕擦除大模型+字体级分割模型,像素级精准修复,告别马赛克/模糊/闪烁。

🌐 多语言支持:突破中英限制,覆盖小语种,形成“擦除-翻译-口型同步”一站式闭环。

⚙️ 工程落地:万集数据验证,成功率100%;分布式分镜计算,效率提升数倍。

详情地址:https://console.volcengine.com/vod/ 9、昆仑万维发布开源世界模型Matrix-Game2.0:实时生成分钟级高连贯视频 昆仑万维发布全球首个开源交互式世界模型 Matrix-Game2.0,实时生成分钟级25fps 高连贯视频,支持无语言提示的纯视觉驱动交互,已在 GTA、Minecraft 等场景落地。

【AiBase提要】 🚀 开源首发:业内首个通用场景实时长序列开源世界模型,持续迭代全面开放。

📹 分钟级生成:25fps 连续视频,物理规律与场景语义理解大幅提升,可直接用于游戏/影视/VR。

🎮 视觉驱动交互:摒弃语言提示,3D 因果 VAE + 多模态扩散 Transformer 逐帧响应用户动作,跨域适应多风格场景。

10、昆仑万维开源 Matrix-3D 大模型:用单张图像可生成高质量全景视频 昆仑万维开源 Matrix-3D:单图即可生成360° 可漫游3D 全景视频,轨迹一致、几何精准,全面开放代码与数据集。

【AiBase提要】 🌐 单图生成3D 世界:打破多视角依赖,直接由单张图像产出高质量全景视频与可探索3D 场景。

🎥 轨迹引导一致性:用 Mesh 渲染图驱动扩散模型,保证相机轨迹下的时空一致,减少伪影与遮挡。

⚙️ 双路径重建:超分+结构优化慢工出细活;Transformer 前馈网络极速推理,兼顾质量与效率 详情:https://github.com/SkyworkAI/Matrix-3D

(以上内容均由Ai生成)

你可能还想读

印尼副部长呼吁谨慎使用AI进行公共沟通

印尼副部长呼吁谨慎使用AI进行公共沟通

快速阅读: 印度尼西亚通信和数字事务部副部长Nezar Patria呼吁公共关系专业人员谨慎、道德地使用AI,强调AI虽具潜力,但需人类监督与伦理责任,确保沟通质量与真实性。 雅加达(ANTARA)- 印度尼西亚通信和数字事务部副部长Nez […]

发布时间:2025年10月23日
名人及AI巨头呼吁停止追求超智能

名人及AI巨头呼吁停止追求超智能

快速阅读: 超过700名科学家、政治人物和名人呼吁暂停开发超人工智能,直至技术安全可控且获公众支持。未来生命研究所发布公开信,强调当前AI发展路径与公众期望、安全性及伦理标准脱节。 超过700名科学家、政治人物和名人,包括哈里王子、理查德· […]

发布时间:2025年10月23日
保守活动人士因谷歌AI生成虚假信息起诉谷歌

保守活动人士因谷歌AI生成虚假信息起诉谷歌

快速阅读: 保守活动人士罗比·斯塔巴克因谷歌AI系统生成关于他的虚假信息,将其诉至特拉华州法院,要求至少1500万美元赔偿。谷歌称此为Bard误判所致,已尽力处理。 保守活动人士罗比·斯塔巴克周三对谷歌提起诉讼,指控这家科技巨头的人工智能系 […]

发布时间:2025年10月23日
拉夫劳伦推出AI购物体验,个性化服务引领未来时尚

拉夫劳伦推出AI购物体验,个性化服务引领未来时尚

快速阅读: 拉尔夫劳伦与微软合作推出AI对话购物工具“Ask Ralph”,提供个性化风格灵感,强调技术应提升品牌体验而非目的本身,展现AI个性化体验趋势。 9月,拉尔夫劳伦(与微软合作)发布了“Ask Ralph”,这是一款被描述为“由人 […]

发布时间:2025年10月23日
荣耀转型AI终端生态公司,方飞详解1 x 3 x N战略

荣耀转型AI终端生态公司,方飞详解1 x 3 x N战略

快速阅读: 荣耀董事长吴晖宣布转型为AI终端生态公司,提出1 x 3 x N战略,涵盖HONOR AI Connect平台及多项赋能措施,推动AI场景化落地,涉及教育、家居、健康等多领域。 感谢IT之家网友 風見暉一 的线索投递! IT之家 […]

发布时间:2025年10月23日
微软Photos推AI绘图与智能重塑新功能

微软Photos推AI绘图与智能重塑新功能

快速阅读: 微软在其Photos应用中推出AI驱动的Restyle Image和Image Creator功能,前者可智能重塑照片风格,后者能根据描述生成高质量图像,均支持隐私保护,旨在提升图像创作体验。 微软近日在其 Photos(照片) […]

发布时间:2025年10月23日
2025新一代人工智能创业大赛启动 全球招募火热进行中

2025新一代人工智能创业大赛启动 全球招募火热进行中

快速阅读: 网易传媒启动2025新一代人工智能创业大赛,聚焦AI新技术与应用,设三大赛道,面向A轮前团队,奖金总额100万元,提供多维指导与资源支持。 2025年10月22日,网易传媒正式启动 “2025新一代人工智能创业大赛”,面向全球创 […]

发布时间:2025年10月23日
谷歌量子芯片Willow实现可验证量子优势,性能超13000倍

谷歌量子芯片Willow实现可验证量子优势,性能超13000倍

快速阅读: 谷歌发布量子芯片Willow,成功运行“量子回声”算法,实现首个可验证的量子优势,比超级计算机快13,000倍,为新药研发和材料科学开辟新途径。 继量子计算研究团队荣获诺贝尔物理学奖之后,谷歌再次取得突破性进展。当地时间10月2 […]

发布时间:2025年10月23日