Redis 8 面向 AI 应用程序,具有新的向量相似性数据类型
快速阅读: 据《InfoQ 公司》称,Redis创始人Salvatore Sanfilippo回归后推出新数据类型“向量集”,优化向量相似性搜索,支持多线程和量化处理。该功能集成于Redis 8 RC1,适用于AI场景如推荐系统和人脸识别。同时推出的还有LangCache语义缓存服务。
Redis 最近宣布新增了**向量集**这一数据类型,它专为向量相似性设计,并为人工智能应用提供了新的选择。这一新数据类型标志着自 Salvatore Sanfilippo(即“antirez”)回归公司以来,他对 Redis 的首次重大贡献。作为 Redis 的创始人,他重新加入了公司。**向量集**是一种类似于有序集合的新数据类型,有序集合是一种带有排序功能的集合,但其元素是与向量关联的字符串,而不是分数。这使得可以添加项目,并检索与指定向量最相似的已添加项目的子集。此外,还支持过滤搜索功能,允许同时进行向量相似性和标量过滤。Sanfilippo 在其博客中解释道:向量集基于 HNSW 数据结构的 `hnsw.c` 实现,并进行了速度和功能上的扩展。Redis 首席执行官 Rowan Trollope 对 Sanfilippo 的贡献表示赞扬:向量数据库对于由生成式人工智能(GenAI)驱动的应用程序至关重要,它们能够检索语义相关的数据以丰富大型语言模型(LLM)的上下文(例如 RAG)。其他应用场景还包括聊天机器人的语义缓存、推荐系统以及人脸识别。Redis 的产品经理 Mirko Ortensi 在另一篇文章中解释了如何使用向量集进行人脸识别。Ortensi 写道:
> 来源:Mirko Ortensi
Sanfilippo 补充道:专注于高速性能,Sanfilippo 不仅对 HNSW 进行了修改,还为所有向量相似性请求引入了多线程处理,并支持 8 位和二进制量化。他强调了其实现的主要区别:向量集并非 Redis 唯一的新特性:**LangCache** 是一种面向人工智能应用程序和代理的语义缓存服务,旨在通过缓存响应来减少对 LLM 的高成本、延迟敏感调用。向量集目前在 Redis 8 RC1 版本中以预览形式提供,采用 RSALv2 或 SSPLv1 许可证。
作者:雷纳托·洛西奥
(以上内容均由Ai生成)