高通联手AI初创,打造超快本地照片视频搜索技术

发布时间:2025年11月7日    来源:szf
高通联手AI初创,打造超快本地照片视频搜索技术

快速阅读: 高通与Memories.ai合作开发大型视觉记忆模型2.0,计划2026年发布,将提供闪电般快速的人工智能服务,优化本地照片和视频搜索,增强设备的情境感知能力和视觉信息保留,无需云连接。

高通与一家人工智能初创公司的合作,承诺在真正需要的地方提供闪电般的快速人工智能服务:在您的设备上本地存储的照片和视频中搜索和使用信息。目前,这一合作尚处于基础阶段,着眼于未来的发展。Memories.ai 正在与高通合作推出其大型视觉记忆模型 2.0 版,计划于 2026 年发布。届时,两家公司将开始向开发智能手机、头戴设备和 PC 应用程序的客户推广 LVMM。

理论上,我们可能会看到由 Memories 提供支持的三星图库出现在安卓手机上。人们往往记不住经历的细节,但一张图片可以触发周围细节的记忆。这正是 Memories.ai 使用的比喻,就像两周前吃过的汉堡图片能帮助回忆起所吃的食物、地点以及同谁一起吃的细节一样。Memories.ai 的联合创始人兼首席执行官沈晓东解释说,该公司试图解决的问题是机器在识别文字和数据之间的关系方面已经非常出色,但在处理图像方面却远不如人。

“最终,记忆会胜出。”沈晓东表示。

Memories.ai 开发了两项技术:编码器和搜索基础设施。Memories 并不直接处理您向朋友或家人展示的图片或视频,而是捕捉这些图片或视频中包含的信息优化版本。这些数据随后被传递给搜索基础设施,以便当查询“我和朋友们在韩国吃饭”时,能够返回正确的信息。

Memories 展示了他们的技术如何允许使用自然语言搜索和查询视频。

照片搜索和查询功能

Memories 的技术正在朝几个不同的方向发展。目前,这项合作似乎旨在提供一个更好的设备上的照片和视频搜索版本,基本上是开发一个比谷歌相册更优秀的私人版。一些内置的照片画廊应用程序会对照片进行位置或人物标记;Memories 实质上是在即时创建这些标签。

沈晓东提到,编码技术可以持续运行,从现实世界中提取信息。不过,这种持续记录并不适用于高通的智能眼镜等手持设备的 XR 平台或其他可穿戴设备。相反,它可能用于安全摄像头。Memories.ai 技术的第二大功能是能够通过自然语言与其互动,类似于 Otter.ai 的 AI 转录服务允许您询问特定转录的问题。

“上次披萨是什么时候送来的?我家附近发生了哪些可疑事件?我的狗是什么时候打翻了花瓶?您可以像自然语言聊天一样与所有个人媒体文件进行互动,这些文件是由摄像头录制的。”沈晓东说道。

当然,这些信息可以从不同来源获取;例如,您可以通过查看日历或搜索电子邮件中的旅行预订来了解上一次去日本的时间。但是,Memories.ai 认为,您会在照片或视频中找到更多上下文信息。

高通与 Memories.ai 的合作是后者首次公开与芯片公司合作,在设备上实现搜索功能。

“这次合作将使 AI 平台不仅反应迅速,而且具有情境感知能力,能够保留视觉信息,识别长期模式,并在网络边缘可靠运行,”高通产品管理副总裁兼生成式 AI 部门负责人 Vinesh Sukumar 在一份声明中表示。“我们共同加速实现将更智能、更直观的智能交付给实际应用的目标。”

高通内部员工表示,他们对此次合作感到“非常兴奋”,认为 Memories.ai 的技术可用于视频内的搜索,甚至最终编辑视频。此外,Memories 的模型足够小,可以在设备上本地运行,无需连接云端,从而减少了搜索时与云端往返所需的延迟。

尽管合作没有具体指出目标是哪些高通处理器,但沈晓东表示,编码过程在本地 NPU 上运行,检索则类似于使用 CPU 从数据库中提取查询。高通在今年秋季推出了 Snapdragon X2 Elite PC 处理器,以及针对智能手机和其他移动设备的 Snapdragon 8 Elite Gen 5。

沈表示,Memories计划未来自行设计应用程序。不过目前,Memories和高通打算从2026年起向设备制造商推介,将Memories.ai技术集成到可穿戴设备、手机和相机中。

作者:马克·哈奇曼

《PCWorld》资深编辑

马克在过去十年间一直为《PCWorld》撰稿,拥有30年科技报道经验。他为《PCWorld》撰写了超过3,500篇文章,涵盖PC微处理器、外设和微软Windows等多个领域。马克曾为《PC Magazine》、《Byte》、《eWEEK》、《Popular Science》和《Electronic Buyers’ News》等出版物撰稿,并因报道突发新闻获得Jesse H. Neal奖。最近,他交出了几十个Thunderbolt扩展坞和USB-C集线器,因为他的办公室已经没有更多空间。

马克·哈奇曼近期文章:

– 微软推出简易多应用批量安装,挑战Ninite

– Gemini现可搜索Gmail和Drive,紧随微软之后

– 三星将其热门移动浏览器引入Windows PC

(以上内容均由Ai生成)

你可能还想读

“新兴AI技能‘氛围编程’年薪高达22万美元”

“新兴AI技能‘氛围编程’年薪高达22万美元”

快速阅读: “氛围编程”成2025年度词汇,展现巨大职业潜力。沃尔玛用其快速开发AI代理,无需编写代码,预示未来开发趋势。2026年需掌握AI代理和氛围编程技能。 “氛围编程”这一术语虽于2025年才被创造出来,但已迅速成为年度词汇,并展现 […]

发布时间:2025年11月7日
AI高管称技术已在某些方面超越人类

AI高管称技术已在某些方面超越人类

快速阅读: PYMNTS讨论通用人工智能(AGI)对企业的影响,现有AI模型能处理欺诈检测、图像生成等任务,但不能执行不相关任务,如跟进销售或评估客户购买意愿。 PYMNTS早些时候曾撰文讨论了通用人工智能(AGI)对企业界的影响。目前的人 […]

发布时间:2025年11月7日
瑞士Motley获150万美元融资,推出AI商业报告平台

瑞士Motley获150万美元融资,推出AI商业报告平台

快速阅读: 瑞士莫特利获150万美元种子前轮投资,推出AI驱动商业报告平台,自动化数据收集与报告生成,缩短报告编制时间,提升决策效率。 总部位于瑞士的莫特利(Motley)已完成150万美元的种子前轮融资,并推出了其商业报告平台。本轮由Se […]

发布时间:2025年11月7日
GPU云市场激增,新挑战与风险并存

GPU云市场激增,新挑战与风险并存

快速阅读: 新一代GPU云和“新云”涌入市场,吸引投资者兴趣,但需警惕潜在风险。GPU短缺催生GPU即服务模式,形成复杂市场生态。超大规模云服务商与“新云”合作,加速基础设施建设,但债务融资增加金融风险。 新一代的人工智能服务云——GPU云 […]

发布时间:2025年11月7日
拜耳与Celonis合作,推进生命科学行业AI应用

拜耳与Celonis合作,推进生命科学行业AI应用

快速阅读: 拜耳与Celonis合作,利用流程智能和AI技术优化运营,应对复杂基础设施需求。彼得斯强调技术变革需重视文化适应,双方合作将推动生命科学发展。 流程智能正在改变企业的运营方式,从企业技术到生命科学行业。通过与Celonis SE […]

发布时间:2025年11月7日
Intuit推出全年财务管理AI平台

Intuit推出全年财务管理AI平台

快速阅读: Intuit推出集成Credit Karma与TurboTax的全方位平台,提供全年个人财务管理,包括信用、债务、财富积累及税务准备,依托先进AI技术及13,000名专家支持。 Intuit 推出了一款集成了 Credit Ka […]

发布时间:2025年11月7日
巴恩斯与阿姆斯特朗重聚,展示谷歌Pixel 10的Gemini AI关键时刻

巴恩斯与阿姆斯特朗重聚,展示谷歌Pixel 10的Gemini AI关键时刻

快速阅读: 谷歌加拿大与贝尔等合作推出“关键时刻像素”活动第三版,展示Pixel 10手机在Gemini AI支持下的关键时刻作用,通过新广告系列展现其解决日常难题的能力,活动覆盖多平台,强调创新与用户体验。 谷歌加拿大、贝尔和枫叶体育娱乐 […]

发布时间:2025年11月7日
谷歌地图升级Gemini AI,新增路线智能推荐功能

谷歌地图升级Gemini AI,新增路线智能推荐功能

快速阅读: 谷歌地图通过Gemini技术获重大升级,增强导航体验,支持自然语言查询、电动汽车充电站查找等功能。新功能将在未来几周内推出,部分功能仅限美国用户。 总结来说,谷歌地图将通过Gemini人工智能技术获得重大免费升级,以改善导航体验 […]

发布时间:2025年11月7日