案例研究:AI Agent 将 API 连接器开发时间缩短到几分钟

发布时间:2025年4月16日    来源:szf
案例研究:AI Agent 将 API 连接器开发时间缩短到几分钟

快速阅读: 据《新堆栈》最新报道,Fractional AI为开源数据集成公司Airbyte开发的AI驱动API连接器构建器,大幅缩短了API集成连接器的开发时间,从几天减少到几分钟,提升了开发效率。

AI代理 / API管理 / 软件开发
案例研究:AI代理将API连接器开发时间缩短至几分钟

Fractional AI的AI驱动API连接器构建器使Airbyte客户的数仓集成工作从几天缩短到了几分钟。

**案例研究:AI代理将API连接器开发时间缩短至几分钟**
2025年4月15日 下午2:00 作者 洛兰·劳森
图片由盖蒂图片社通过Unsplash提供

软件开发公司Fractional AI认为,AI的最大受益者将是那些利用生成式AI提升运营效率并优化产品的非AI公司。

为此,Fractional AI为开源数据集成公司Airbyte开发了一款AI代理,用于构建API集成的连接器。但这些由AI创建的连接器无需几天的手动编码,只需几分钟即可完成。

“我们正处于快速发展的阶段,这非常有趣,”Fractional AI的首席执行官克里斯·泰勒在接受The New Stack采访时说道。“参与许多前沿领域的酷炫项目非常有趣。”

Airbyte是一款开源的数据集成引擎,用于将数据迁移到仓库、数据湖或数据库中。它通常用于从软件即服务(SaaS)产品中抽取数据,当然这需要与这些SaaS API建立连接。

例如,如果有人想将Shopify的销售数据与Zendesk的客户支持数据结合起来,Airbyte可以用来设置数据管道,从Shopify提取客户数据,并从Zendesk提取客户支持工单,然后将其全部加载到数据仓库中。

Airbyte已经有一套连接器库来支持这种集成工作——但该公司设想简化成千上万种连接器的创建,以连接更多的SaaS产品。

“他们的软件是从第三方SaaS工具中提取数据,并将数据导入数据仓库,”Fractional AI的首席技术官埃迪·西格尔告诉The New Stack。“他们需要与每一种可能存在的第三方SaaS工具建立集成。”

Airbyte称该解决方案为AI助手,效果很好。自该工具发布以来,其连接器库中添加了显著更多的连接器。

图片由Fractional AI提供

构建API之前的人工智能

构建Airbyte的解决方案并不像简单地将API文档交给AI工具那样容易。Airbyte想要一个自动化的解决方案,能够扫描API文档,而这些文档的结构往往有些随机。

“我们意识到这些面向开发者的API文档是非常复杂的网站,”西格尔说。“它们是那种Google索引得不好的页面;它们高度动态。它们并不是由希望被良好索引的人设计的。”

API文档没有标准化,而且常常是厚重且密集的阅读材料。爬取这些文档最终成为一个意外复杂的问题,Fractional必须在涉及AI之前解决这个问题。

“他们并没有让网络爬虫很容易读取,”西格尔说。

由于上下文窗口大小的原因,他补充道:“调优爬取的过程可能比我们预期的要困难一个数量级。”

一旦文档被处理完毕,开发者就会面临大量的手动编码工作。案例研究指出,这个耗时且复杂的过程使技术人才偏离了更高价值的工作。

AI/开发者工作流程

由此产生的工作流程允许用户输入他们试图集成的API的URL。AI连接器构建器会爬取这些API文档,然后预填充所有关于连接器的字段,如API URL基础和认证信息。

AI连接器构建器随后列出该API的所有流——例如,对于Shopify,流可能包括“订单”、“履行”和“折扣”。

用户然后选择感兴趣的流,并为每个选定的流,构建器会预填充这些流在Airbyte连接器构建器UI中的每个字段(分页、URL路径等)。用户可以查看AI的草稿并进行编辑或更正,然后完成连接器。

因此,基本上,AI工具的最终工作流程有五个部分:

– 抓取文档页面。
– 大型语言模型驱动的爬取引擎找到需要抓取的其他页面。
– 将HTML转换为Markdown并尽可能去除噪音。
– 从抓取的页面中提取适当的部分并包含在精心设计的目的明确的提示中。
– 将LLM输出翻译成连接器定义的适当部分。

AI助手背后的支持

在幕后,AI助手利用了GPT-4o。团队探索了4o-mini及其微调版本,但最终只使用了4o-mini进行集成测试。

Claude也被考虑过,但由于其严格的结构化输出能力,案例研究指出选择了GTP-4o。

Fractional AI使用OpenAI的软件开发工具包(SDK)来拼接提示。

第一步是阅读API文档。AI系统首先询问是否存在OpenAPI规范。如果是,可以直接从OpenAPI规范中提取认证参数。

但如果不存在OpenAPI规范,Fractional AI使用AI搜索工具Jina AI和Firecrawl(这是一个接受URL、爬取并将其转换为干净Markdown或结构化数据的API服务)来爬取API文档。

“最后,如果我们无法使用OpenAPI规范、Firecrawl或Jina提取信息,我们将结合各种服务,如Serper(一个网络爬虫)和Perplexity(AI搜索引擎),作为最后的努力,寻找相关的信息输入到后续的LLM中,”案例研究指出。

第二步是提取相关的API连接器部分。如果文档太大以至于超出上下文窗口,Fractional AI使用OpenAI内置的检索增强生成(RAG)功能来提取文档中与认证相关的部分。

对于较小的文档,Fractional构建了一个流程,首先从HTML中提取链接,然后让LLM判断哪些链接看起来与认证有关,接着将抓取页面的内容嵌入到未来的提示中。

最后,该过程涉及解析和提示HTML片段的确切细节。挑战在于迫使LLM输出符合连接器构建器规范的格式。Fractional的解决方案是“用结构化输出提示确定特定格式的认证方法,以填充连接器构建器。”

在最终解决方案中使用的其他工具包括Langsmith,这是一个帮助开发者构建、调试、测试和监控LLM应用程序的平台,用于观察性和实验。Fractional还利用了OpenAI内置的向量存储(当需要RAG时)以及Redis用于缓存和锁定。

“我们使用现有的Airbyte连接器目录作为基准,衡量AI驱动的连接器构建器的准确性并提高质量,”Fractional AI案例研究指出。

虽然案例研究没有详细说明测试数据,但它提到准备这些数据“花费了大量努力……应该是任何应用AI项目的重点。”

在最终分析中,Fractional AI的案例研究指出,“有许多高回报的地方,正确的AI应用可以极大地提高开发人员的生产力。”

“这是一个工程问题和AI问题:这个项目很好地提醒我们,将AI投入生产面临的挑战不仅仅是处理LLM的问题,”团队写道。“在这种情况下,高质量的爬取——一个与Google一样古老的挑战——构成了重大挑战。”

Tabnine的目标是在所有语言中从概念到完成为所有代码创作者提供端到端的AI辅助开发工作流程。

了解更多

来自Tabnine的最新消息

热门故事

YOUTUBE.COM/THENEWSTACK
科技发展迅速,不要错过任何一集。订阅我们的YouTube频道,观看所有的播客、访谈、演示等内容。

订阅


由Sketch创建

洛兰·劳森是一位资深的技术记者,她从事数据集成到安全等技术问题的报道已有25年。在加入The New Stack之前,她是银行技术网站Bank Automation News的编辑。她……

了解更多关于洛兰·劳森的信息

分享这个故事

热门故事分享这个故事

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日