Mumsnet 挺身而出对抗大型科技公司 – 我们发起 OpenAI 法律行动的原因
快速阅读: 据《i 新闻》最新报道,2000年创立妈妈网至今,网站已积累超60亿文字内容。近期,妈妈网因科技巨头OpenAI抓取网站内容训练AI而提起法律诉讼。妈妈网主张保护版权,认为科技公司应为使用内容付费。文章呼吁政府维护现有版权法,确保出版商获合理报酬,以支持可持续的AI生态系统。
2000年,我创办了妈妈网时,论坛上的大部分内容都是我用多个不同的身份与自己对话。我完全没想到将近25年后,会有数百万其他用户贡献了超过60亿个字的内容,讨论从停车到地缘政治,再到一位用户关于性行为后清洁程序的著名“阴茎杯”讨论。这个话题引发了大量流量,导致网站瘫痪了两周。如今,这60亿多字成为了我们这个时代最重要的问题之一的核心——我们如何在促进人工智能技术发展的同时保护出版商的版权?
去年,妈妈网成为英国第一家对科技巨头OpenAI提起法律诉讼的公司,该公司是ChatGPT的开发者。我们发现他们正在抓取我们的网站来训练他们的大型语言模型(LLM),我们认为这是对我们使用条款和版权法的侵犯。当我们建议他们或许可以授权使用我们的内容时,经过一番犹豫,他们告诉我们他们更感兴趣的是“不那么开放”的数据源。实际上,他们已经抓取了所有内容,在我们所有的交流中,他们并未否认这一点。
讽刺的是,我们愿意与像OpenAI这样的公司合作,并利用妈妈网上由女性主导的对话来帮助解决大多数AI模型中存在的性别歧视问题。我们在自己的MumsGPT中使用了OpenAI的LLM——这是一个基于妈妈网用户对话提供见解的问题工具。但不同的是,我们为此技术支付了费用并获得了许可。
妈妈网在应对AI聊天机器人的影响方面比大多数公司更有优势。我们的大部分流量直接来自用户,虽然一个LLM可以生成类似妈妈网风格的回答,但这无法与网站上丰富、充满同情心且常常令人捧腹的对话相比。当你的宝宝不肯睡觉时,标准的AI重复回答永远无法像一个在凌晨三点经历同样情况的人那样给出真实答案。AI也永远不会像人类一样有趣或坦诚。当然,它们也无法提供每年帮助大约1000名女性离开虐待关系的支持。
但如果科技巨头们可以肆无忌惮地剽窃出版商的内容,他们将摧毁许多这些出版商。这就是为什么政府似乎决心放弃我们长期坚持的版权法,这令人惊讶。他们的提议意味着出版商必须主动选择退出内容抓取,或者任由其被拿走而无需付费或同意——这就像说除非你在房子上挂一个标有他们名字的牌子告诉他们不要进来,否则就允许别人闯入你的家。这种做法不仅威胁到那些内容被抓取的公司,还可能削弱这些模型本身。如果出版商不再有经济动力生产被抓取的内容,最终将导致这些AI公司没有东西可供训练模型。
政府一直在强调围绕英国版权制度在AI方面的“不确定性”。但事实是,我们稳健的系统正是我们的最大优势之一。如果政府只是想引入更多的明确性,那么为什么它反对《数据法案》中引入的基德罗恩修正案,该修正案本可以使现行的版权制度适应AI时代?
AI有可能推动人类进步并改善我们的生活,当然我们也希望英国能够从中受益。但这并不意味着出版商应该免费向AI巨头提供他们的内容。科技公司不会期望为其数据中心供电的电力是无偿的,那么为什么不应该补偿那些生产他们用于训练模型的内容的创作者呢?
英国可以在这一领域引领世界。但为了做到这一点,我们需要建立一个可持续的生态系统,在这里创新与公平共存。贾斯汀·罗伯茨是妈妈网的创始人兼首席执行官。
(以上内容均由Ai生成)