Timescale 通过 pgai 向量化工具来增强 PostgreSQL 的 AI 能力

发布时间:2025年11月3日    来源:szf

作者|MohitPalriwal
译者|刘雅梦
策划|丁晓昀
Timescale最近通过pgai向量化工具(pgaiVectorizer)扩展了其PostgreSQLAI产品。该更新使开发人员能够创建、存储和管理向量嵌入以及关系数据,而无需外部工具或额外的基础设施。
TimescaleDB是针对时间序列数据量身定制的PostgreSQL开源扩展,它首先通过实时分析功能增强了PostgreSQL。现在,Timescale正在增强与pgai套件的AI集成,并引入了pgai向量化工具(pgaiVectorizer),使开发人员能够在PostgreSQL中无缝地进行AI开发。
贡献者指出了开发过程中的一些挑战。一位贡献者Tostino强调了OpenAIAPI的合规性问题,并指出当前的实现缺乏在开源推理服务器上使用代理解决方案或自定义采样器所需的几个参数。此外,Tostino建议,在返回JSON而不是严格数据类型的原始函数之上构建提供”简单”包装器的函数,以增强灵活性。
构建搜索引擎和AI代理等人工智能系统通常需要复杂的工作流程。pgai向量化工具(pgaiVectorizer)通过将整个AI工作流程集成到PostgreSQL中来简化这一过程,使开发人员能够使用熟悉的SQL命令快速有效地创建高级AI应用程序。
来源
Timescale认为,将向量嵌入视为独立数据的标准方法会导致同步问题和数据过时。伦理人工智能与机器学习研究所评论道:
pgvector和pgvectorscale扩展允许我们在数据库中存储向量嵌入,并执行快速高效的向量搜索。pgai向量化工具(pgaiVectorizer)构建在这些扩展之上,可以自动创建和同步数据库中任何文本数据的嵌入。
只需一行代码,我们就可以定义一个向量化工具,为表中的数据创建嵌入。机器学习顾问SuvarnaKadam评论道:
SELECTai.create_vectorizer(::regclass,destination=>,embedding=>ai.embedding_openai(,),chunking=>ai.chunking_recursive_character_text_splitter());
在同一周,Neon数据库实验室(NeonDatabaseLabs)还推出了Pgrag,这是一个实验性的PostgreSQL扩展,旨在支持端到端的检索增强生成(RAG)管道,进一步扩展了他们自己的AI能力。
除了最近推出的pgai向量化工具(pgaiVectorizer)外,社区还对将支持的嵌入模型范围扩展到OpenAI之外感兴趣。贡献者claudeomusic询问了使嵌入模型选择可配置的可能性,强调了灵活性对用户的重要性。作为回应,Timescale的alejandrodnm证实,虽然目前的Vectorizer功能仅支持OpenAI模型,但计划在未来纳入其他提供商。该团队对社区的贡献持开放态度,以帮助实现这一目标。另一位撰稿人wang分享了他关于如何使用Openrouter的解决方案。
要使用预构建的Docker开发环境快速尝试嵌入,请参阅Vectorizer快速入门。有关更详细的技术规范,请参阅VectorizerAPI参考资料。
作者介绍
MohitPalriwal是Netflix的高级软件工程师,也是Netflix可观测性团队的重要成员。他是NetflixAtlas项目团队的一员,该项目是一个开源的多维时间序列数据库,旨在处理大规模需求。在加入Netflix之前,Mohit是Salesforce的首席软件工程师,在那里他与人合作构建了AWS上的可观测性云。Mohit的经验还延伸到了亚马逊网络服务(AWS),在那里他花了四年多的时间开发和推出了基于无服务器架构的AWSPinpoint。
原文链接:
https://www.infoq.com/news/2024/11/timescale-pgai-vectorizer/
声明:本文为InfoQ翻译,未经许可禁止转载。
今日好文推荐
Greenplum原班人马的”换皮”数据库加入孵化器,Apache力挺:PG内核升级,性能大幅提升
知名UP主被锤用开源项目”伪装原创”,原作者越南AI工程师愤怒维权,网友:把收益赔给他!
Chrome被强制出售?谷歌或将抛弃ChromeOS全面转向Android系统
一朝成名,一夜破产!这家谷歌前高管创立的AI公司突然宣布倒闭,专家:这个行业不适合AI
会议推荐
就在12月13日-14日,AICon将汇聚70+位AI及技术领域的专家,深入探讨大模型与推理、AIAgent、多模态、具身智能等前沿话题。此外,还有丰富的圆桌论坛、以及展区活动,满足你对大模型实践的好奇与想象。现在正值9折倒计时,名额有限,快扫码咨询了解详情,别错过这次绝佳的学习与交流机会!

你可能还想读

Default Image

欧美最顶尖的5家云厂商,都在押注什么?

大数据产业创新服务媒体 ——聚焦数据·改变商业 在数字时代的大潮中,人工智能技术如同一股强劲东风,正以前所未有的速度席卷全球云服务行业,推动其步入前所未有的智能升级阶段。随着计算能力的飞跃与数据量的爆炸性增长,AI技术在云服务领域的融合应用 […]

发布时间:2025年11月3日
Default Image

台积电表忠心的速度有点快

近期有消息称,美国已要求台积电从11月11日开始,停止向中国大陆客户运送常用于人工智能(AI)应用领域的先进芯片,专门针对我国的人工智能领域。此消息虽然没有官宣,不过据了解这条消息基本属实,目前国内公司如果想做高性能AI相关芯片,台积电大概 […]

发布时间:2025年11月3日
Default Image

AI行业存在泡沫吗?

观·察 泡沫的形成是技术发展吸引投资的必要过程,而泡沫的破灭则可以促使社会和制度进行调整,为新技术的全面应用和经济的可持续增长创造条件。 ——陈永伟 图片来源:东方IC AI行业存在泡沫吗? 文/陈永伟 前几天,AI(人工智能)圈出了一件大 […]

发布时间:2025年11月3日
Default Image

外媒:台积电停供大陆7纳米AI芯片

据路透社10日报道,美国商务部致函台积电,要求从11日开始停止向中国大陆客户供应7纳米及更先进工艺的AI芯片。这一出口限制措施主要针对用于人工智能加速器以及图形处理单元(GPU)的芯片。 报道称,美商务部的这封信函允许美国绕过相关规则制定过 […]

发布时间:2025年11月3日
Default Image

李彦宏:智能体是AI应用的最主流形态 即将迎来爆发点

“过去24个月,AI行业的最大变化是什么?是大模型基本消除了幻觉。” 11月12日,百度创始人李彦宏在百度世界2024大会上,发表了主题为《应用来了》的演讲,发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具”秒哒”。 […]

发布时间:2025年11月3日
Default Image

AI闯关双十一:受伤的还是人类

或许大家还没意识到今天才是双十一。因为当双十一这天真来了,人们的感觉却是”双十一购物节”已经结束了。 步入”16岁”的双十一,从”光棍节”到”购物节”。在经历了奥数般的计算、复杂的玩法、到点蹲点抢红包等等规则后,今年的消费者显得格外疲倦。 […]

发布时间:2025年11月3日
Default Image

NPU:真需求?假创新?

👆如果您希望可以时常见面,欢迎标星🌟收藏哦- 来源:内容编译自theregister,谢谢。 如果您现在还没有听说过神经处理单元(NPU),那么您一定错过了英特尔、AMD和高通一年的人工智能营销。 在过去的12个月中,这些专注于AI的处理器 […]

发布时间:2025年11月3日
Default Image

是时候重新认识To B圈的「双11」了

“双11″曾是一场商业与技术的伟力创造的”奇观”。但对于toB圈而言,只有当它造就的”奇观”成为寻常,下一个奇迹才会诞生。 11月11日,时针指向23点59分,杭州阿里巴巴云谷园区灯火通明。阿里云双11″作战指挥室”数据监控大屏上,销售额以 […]

发布时间:2025年11月3日