Stack Overflow 如何在 AI 时代为人类答案增加价值

发布时间:2025年3月30日    来源:szf
Stack Overflow 如何在 AI 时代为人类答案增加价值

快速阅读: 据《ZDNet》称,Stack Overflow CEO查兰德拉卡尔谈及其公司如何应对AI自动化带来的挑战。随着ChatGPT的兴起,Stack Overflow面临流量下降的问题,因此决定与AI公司合作,通过授权内容和开发新服务(如知识解决方案和Teams集成)来多样化收入来源,同时增强社区功能。

Stack Overflow首席执行官查兰德拉卡尔。记者蒂尔南·雷采访问答网站Stack Overflow成立于17年前,旨在让程序员——人类程序员——发布关于编程问题的问题,并从志同道合的社区中获得答案。自成立以来,世界已经迷恋于ChatGPT和其他生成式AI程序,不仅能够提供答案,甚至还能自行完成工作,为你提供定制代码的能力。一个知识共享社区应该如何应对人工智能自动化带来的突然吸引力?Stack Overflow的首席执行官查兰德拉卡尔已经领导公司将近六年,并且他有一个计划。

另外:什么是Stack Overflow?所有程序员的论坛

“事情已经改变;我们想要与时俱进,”查兰德拉卡尔对我说。“我们想要顺应潮流的方向。”

ChatGPT的崛起

他并没有太多选择。自2022年开始,ChatGPT的崛起对Stack Overflow的公共网站流量产生了直接影响,而这些流量带来了公司收入的一大组成部分的广告。人们来到Stack Overflow的主要方式之一始终是通过Google搜索。查兰德拉卡尔说,付费搜索在Google上是“Stack Overflow的用户界面”。能够向聊天机器人提问而不是搜索迅速减少了那些Google查询,流量开始下降。

查兰德拉卡尔得出了一项广泛的哲学结论,不仅涉及AI和自动化,还涉及互联网。“我们的观点是,互联网的本质已经发生了变化,”他说。它不再主要是由人类查询驱动的付费搜索来推动网站流量。“用户界面已经变成了生成式AI工具,”他观察到。“因此,我们必须尽可能地对这一行业变化做出响应。我们还需要作为一项资产进行多样化发展。”

另外:Stack Overflow加入了Reddit和Twitter的行列,向AI公司收取训练数据费用。

查兰德拉卡尔和他的团队意识到,Stack Overflow的6000万个答案中有许多价值可以弥补生成式AI的不足之处。一种选择是起诉OpenAI和其他AI基础模型的制造商。这些“预训练”的大型语言模型包括Stack Overflow的对话内容,这些内容在法律上属于Stack Overflow的财产。“如果你正在构建一个聊天机器人或其他东西,你必须与我们合作。让我们达成一个公平的商业协议。”

“我们说,好吧,我们可以这样做,或者我们可以做点别的,比如说,相对于其他人在做的事情来说有点新颖的东西。”

Stack Overflow没有提起诉讼,而是安装了代码以阻止公开网站的抓取,“然后我们说,如果你正在构建一个聊天机器人或其他东西,你必须与我们合作。让我们达成一个公平的商业协议。”

知识即服务

除了广告和名为Teams的付费企业版Stack Overflow之外,查兰德拉卡尔正在建立第三种收入来源,称为知识解决方案——或者知识即服务。查兰德拉卡尔一直在签署许可Stack Overflow内容的协议,首先是与Google和OpenAI。在过去18个月里,他还忙着签署“所有的云超大规模供应商,我不能说出他们的名字,但你知道他们是谁,”他说。“我们正在进行更多的合作。”

这些交易包括与Microsoft的Visual Studio Code工具、GitHub CoPilot和Google Gemini Code Assist的集成——以便在编程环境中直接获取答案。“所有这些公司都在使用我们数据集的官方许可版本来训练他们的模型,用于预训练,例如在某些情况下进行RAG和索引。”

另外:AI机器人正在抓取你的数据?这款免费工具可以帮助那些讨厌的爬虫绕开它们。

答案会出现在ChatGPT或其他LLM上,并附有信用和链接回到Stack Overflow。“我们的目标是实际上重新捕获人们直接给我们的网站带来的流量,”他说。“我们正在成为一个无头网站:如果人们花费所有时间在生成式AI机器人上,那也没关系。”

当然,如果用户不在Stack Overflow站点上,就有可能没有直接与终端用户的联系。查兰德拉卡尔表示,该公司已与OpenAI等公司达成各种协议,以获取有关聊天机器人用户使用的提示等信息。“合作伙伴与我们之间的互动有很多微妙之处,”他告诉我。“我们在逐一处理每个场景,”他说,比如LLM的“上下文窗口”(最近的聊天记忆)有多少会与Stack Overflow共享。

AI的缺点

查兰德拉卡尔表示,Stack Overflow正在为OpenAI和其他巨头解决技术的三大主要缺陷。

另外:为什么扩展自主AI是一场马拉松,而不是短跑

一个缺点是他所说的信任点。“你不信任它所输出的内容,”暗指臭名昭著的LLM幻觉和虚构。第二个缺点是LLM的大脑流失。“如果你不生成新信息,这些LLM不会在智能水平上进步,”正如所谓的合成数据可能污染LLM的争议所显示的那样。“生成式AI输出的答案不是知识。这……确实需要拥有Stack Overflow丰富的上下文。”

最后,也是最重要的一点,“生成式AI输出的答案实际上不是知识,”查兰德拉卡尔说。“可能有答案,但由于情况过于复杂,它们可能已经耗尽了复杂性,因此确实需要拥有Stack Overflow丰富的上下文。”

“生成式AI输出的答案不是知识。这……确实需要拥有Stack Overflow丰富的上下文。”

Teams集成

在他与巨人签署了公共Stack Overflow的交易的同时,查兰德拉卡尔开始了知识解决方案业务的第二部分。Stack Overflow正在将其公共内容集成到Teams产品中,供希望扩展其内部知识资源以实现自主AI的企业使用。Teams产品被引入是因为公司表示他们想要自己的Stack Overflow版本,作为一个存储库,不是为了通用编程知识,而是为了特定的企业流程。

现在,查兰德拉卡尔说,同样的公司想要扩大这个信息池,因为他们想要开发能做更多事情的AI代理。“我们已经有像Uber这样的公司已经与我们合作,他们建立了一个名为助手的AI聊天机器人,或者在非常宽泛的意义上说是代理,因为它的全部目的是执行操作。但是这个代理利用Teams的数据来回答类似‘我们在Uber内部如何真正做到这一点’之类的问题?机器人会在企业聊天中提供自动答案。‘机器人拥有团队的所有知识,所以它能够在正确的时间提供正确的信息。’”

另外:Stack Overflow首席技术官:从自力更生到扩展Web上最大的资产之一

换句话说,自主AI自动化了员工传统上用Teams所做的工作。“我们注意到这一点,因为我们的API非常热门;我们的API不断被机器人访问。”

鉴于这种趋势,查兰德拉卡尔正在向Teams添加一个新的元素,将整个Stack Overflow公共站点数据授权给相同的Teams客户。“我们说,为什么不把我们的知识解决方案产品、我们的公共平台数据也呈现给公司,与Teams数据一起?那么,代理就可以拥有来自6000万个问题和答案的知识,以及所有特定于公司的知识,这样它在正确的时间就能更有把握地提供正确的答案。”

Teams产品,就像大型授权交易一样,被集成到各种产品中,如Atlassian的JIRA IT票务系统。Stack Overflow正在与企业Teams用户谈判许可条款。查兰德拉卡尔拒绝讨论定价细节,只是说,“这是一个基于价值的定价模型。”

另外:10位专业开发者对vibe编码的真实承诺与危险的看法

网站增强

在知识解决方案开发的同时,公共Stack Overflow网站也正在进行一些相当重要的增强。查兰德拉卡尔说,公司仍在“努力恢复”ChatGPT之前的流量水平,没有披露具体数字,补充说该网站“尚未完全”恢复到ChatGPT之前的水平。

查兰德拉卡尔正在扩展公共网站的功能,使其更加实时。传统的Stack Overflow模式是一个人发布一个问题,然后其他人发布他们的建议答案。埋藏在网站深处的两种交流形式是聊天和讨论。查兰德拉卡尔将这些描述为“泳道”式的交互模式,虽然不如主栈——溢出答案完美,但能更快地回应某人。

查兰德拉卡尔的理念是“我们想为不同类型的技术人员提供多种格式和项目类型。”“我们真的想从知识库转变为更多社区网站。”

公司还在考虑从用户那里添加教学视频内容。“有很多很棒的内容,”他观察到。“想象一下,有人正在测试DeepSeek,我们能够直播并捕捉它,其他人可以从这种经验中学习。我们真的想从知识库转变为更多社区网站。”

如果这听起来像是Reddit,查兰德拉卡尔说他常常听到这样的说法。不过,他指出区别在于“我们的受众显然非常专业化,我们并不试图满足所有人的需求。”他对这个规模更大的社交平台表示钦佩。“我非常了解他们,他们做得很好。他们是我们的重要伙伴,甚至可以说是我们的领路人。”他观察到,Reddit与OpenAI的授权交易为知识解决方案业务奠定了基础。

Stack Overflow如何做出选择?

他说:“我们希望选择那些最受用户欢迎的。”“我主要是与社区互动,以了解哪些需要加倍努力。我们实际上正在进行相关测试,以确定哪些确实有影响。”

此外:聊天机器人正在扭曲新闻——即使是付费用户。

内部与生成式人工智能的关系也发生了变化。早期,当ChatGPT公开发布时,一些Stack Overflow用户从机器人那里获取现成的答案。该网站对此做出了禁止复制粘贴回复的回应。

但他表示:“但我们说,让我们与社区沟通,看看他们想如何应对。”“很明显的一点是,人们依然觉得仅仅通过人类之间互动来提问相当困难。”

传统上,该网站的人类审核可能会导致版主批评重复或新手问题。“如果你问的是一个技术问题,如果之前有人回答过,就会有人告诉你这是个已经被解答过的问题。在提问前先去搜索一下。”

这里是一个难得的机会可以利用人工智能。该网站最近推出了“Gemini驱动”的答案。现在,“Gemini会给你建议,所有问题都已被问过并回答过”,并带你进入相关的列表,“都在你和人工智能的单独空间中”,这样你的新手提问就不会感到羞愧。

对Stack Overflow公共网站的近期一项重要举措是对授权交易和Teams的新增功能似乎已经帮助了业务发展。

展望未来

查兰德拉卡尔说:“我们公司正处于快速发展阶段”,同时拒绝透露财务细节。Stack Overflow隶属于荷兰欧洲投资巨头Prosus NV,四年前以18亿美元的价格收购了它。

“看,我们与其他任何网站都不一样,但我们不接受捐赠。”Prosus是上市公司,因此该公司可能在其每年六月底左右发布的全年财报中披露有关Stack Overflow的实际财务信息。

知识解决方案部分已成为Stack Overflow增长最快的业务,其次是Teams销售和广告业务,由于程序员花费时间的地方对广告的需求持续不断,广告业务是一项“非常稳定”的业务。

查兰德拉卡尔表示,这三者大约各占收入的三分之一。

也许其中最棘手的部分是如何让社区应对这种情况。当公司最初向Google和OpenAI提出数据授权时,引起了反弹——这并不奇怪,因为社区认为这6000万个问题在某种意义上是他们的社区财产,即使在法律上属于Stack Overflow公司。

反弹如此强烈,以至于有些用户表示,如果他们对授权交易造成争议,就会被禁止访问该网站。

查兰德拉卡尔没有详细说明过去的冲突,但表示目前Stack Overflow的用户已经意识到公司不是非营利组织,需要盈利来实现其目标。

此外:如果更改帖子抗议OpenAI的协议,Stack Overflow可能会暂停您的帐户

他回忆道:“两周前我做了一个AMA(Stack Overflow上的‘问我任何事’活动)。”“我说,看,我们与其他任何网站都不一样,但我们不接受捐赠。你们有一个支持网站的企业,推动企业发展的方法之一就是利用你们有用的东西为生态系统增加价值。”

他说,结果是“他们意识到这对Stack和他们来说都是好事,因为我们如果不这样做,实际上就无法捕捉到我们需要的投资回社区的资金,也无法建立他们所需的版主工具。所以,社区慢慢地理解了这一点。”

想要更多关于人工智能的故事吗?订阅我们的每周通讯《创新》。

人工智能

2025年最佳编程人工智能(以及不该用的——包括DeepSeek R1)

我测试了DeepSeek的R1和V3编码技能——我们还没有全完完蛋(至少目前还没有)

如何从Microsoft 365计划中移除Copilot

如何在MacOS上安装LLM(以及为什么应该这么做)

2025年最佳编程人工智能(以及不该用的——包括DeepSeek R1)

我测试了DeepSeek的R1和V3编码技能——我们还没有全完完蛋(至少目前还没有)

如何从Microsoft 365计划中移除Copilot

如何在MacOS上安装LLM(以及为什么应该这么做)

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日