OceanBase发布首款AI数据库seekdb,支持多模态混合搜索
快速阅读: 11月18日,OceanBase发布首款AI数据库SeekDB并宣布开源,支持向量、全文、标量及空间地理数据的统一混合搜索,兼容30余种AI框架,极大简化AI应用开发。
11月18日,在2025年OceanBase年度发布会上,OceanBase发布了其首款AI数据库——OceanBase SeekDB(简称SeekDB),并宣布开源。开发者只需三行代码,就能快速构建知识库、智能体等AI应用,轻松应对百亿级多模数据检索,真正实现“开箱即用”的AI数据基座。
该产品支持向量、全文、标量及空间地理数据的统一混合搜索,深度融合AI推理与数据处理,兼容Hugging Face、LangChain等30余种主流AI框架。这款产品的推出标志着数据库从传统的“业务支撑系统”迈向“AI原生数据入口”,也是OceanBase自启动“Data×AI”战略以来的重要成果。CEO杨冰表示:“希望OceanBase能够探索出一条数据库在AI时代的范式跃迁之路。”他认为,AI的真正挑战在于数据,特别是在金融、政务等高敏感度场景下,AI需要在毫秒级完成实时推理,并安全地融合私有数据。而传统架构依赖多系统拼接数据链路,不仅复杂低效,还容易引发权限混乱和延迟风险。
“SeekDB不是传统数据库功能的简单叠加,而是专为AI时代重新设计的AI原生数据库。”杨冰说,“它继承了OceanBase的代码和设计理念,更加轻量、敏捷,旨在成为大模型与私有数据融合计算的‘实时入口层’。我们期待与开发者共同在混合搜索、多模融合等方向加速迭代,大胆创新。”据Gartner预测,到2028年,支持生成式AI的数据库支出将达到2180亿美元,占市场的74%。然而,MIT的研究显示,超过95%的企业AI项目因多模态数据割裂、系统链路冗长、权限管理复杂等问题难以实施。SeekDB带来了三大核心突破:
一是AI原生混合搜索能力。SeekDB支持在一个查询中融合向量检索、全文搜索与标量过滤,采用“粗排+精排”多阶段检索机制,在保证低延迟的同时提高精度。它支持实时写入与ACID一致性,并兼容MySQL生态。此外,SeekDB支持标量、向量、文本、JSON和GIS等多模数据的统一存储与检索,例如在反欺诈场景中,可以直接查询“近7天交易额超过5万元、位置异常且行为类似历史欺诈样本”,无需跨系统调用,既保证了性能又确保了安全性。
二是极简部署,开箱即用。SeekDB最低配置仅需1核CPU、2GB内存,支持pip install一键安装、秒级启动,兼容嵌入式与客户端/服务器双部署模式,可以轻松集成到智能代理、开发工具链或本地应用中,大幅降低了AI应用的工程门槛。
三是更开发者友好。SeekDB以Apache2.0协议全球开源,开发者可以自由使用、修改和扩展。产品全面兼容HuggingFace、Dify、LangChain等30余种AI框架及MCP大模型协议,无缝融入AI生态系统;并提供SQL及Python SDK,适应不同的开发习惯。同期开源的PowerRAG智能文档解析框架与PowerMem分层记忆架构,在LOCOMO Benchmark上以73.70分位居榜首,Token消耗降低96%,大幅减少了推理成本。
作为OceanBase“Data×AI”战略的关键组成部分,SeekDB既可以独立使用,也可以平滑融入新发布的OceanBase 4.4一体化融合版本。该版本首次将TP、AP与AI能力集成于单一内核,具备分布式扩展、多云部署与金融级高可用性,帮助企业避免后期架构重构的风险。商用LTS版本将于2026年2月2日推出。
目前,OceanBase的混合搜索能力已经在多个行业中得到成功应用,充分证明了其技术价值:中国联通利用混合搜索构建统一AI知识库,有效解决了私有文档的权限管理和高效检索问题;蚂蚁百宝箱则通过混合搜索实现了智能体的实时在线搜索,显著提高了信息获取的准确性和响应速度。
“这不仅是技术产品,更是开发范式的转变。”杨冰表示,“传统数据库只是‘存储’数据,而SeekDB能够‘理解’数据的语义,混合搜索正是AI原生数据库的关键标志。”过去十五年,OceanBase在“双11”等极限场景中磨练出的工程化能力,正转化为AI时代的底层优势,在AI原生混合搜索、多模融合、TP/AP/AI一体化、多云原生等方向持续取得突破。
自2010年由蚂蚁集团自主研发以来,OceanBase已服务于全球4000多家企业,涵盖金融、政府、能源、通信、零售、制造、互联网等多个关键领域。其云服务OB Cloud是全球唯一同时支持阿里云、华为云、腾讯云、百度智能云、AWS、GCP、Azure七大主流云平台的数据库产品,业务遍布全球16个国家和地区、60多个地区、240多个可用区。
杨冰强调:“未来的数据库必须同时服务于‘人’和‘智能体’。在一个数据库中支持事务处理、数据分析与AI混合搜索,在数据源头驱动实时、可信的智能。”SeekDB现已在GitHub上开源,新域名oceanbase.ai同步启用,全球开发者可以免费下载使用。这是OceanBase践行AI战略的关键一步,旨在推动行业加速向“智能原生”架构发展,为全球智能化转型提供更加普惠、更具实践性的数据基础。
(以上内容均由Ai生成)