存储在海外的训练数据,版权法不适用:OpenAI
快速阅读: 据《印度斯坦时报》称,美国公司开放AI否认抄袭印度ANI内容的指控,称其模型避免复制,并强调版权法仅适用于印度境内,其训练活动在境外合法。ANI起诉开放AI侵犯版权,多个行业团体支持ANI立场。下一次听证会将于4月2日举行。
美国公司开放AI周五否认了其ChatGPT软件抄袭新闻通讯社ANI内容的指控,并在德里高等法院辩称,其模型专门设计为避免此类复制行为。
资深律师阿米特·西巴尔(阿米特·希巴尔)代表开放AI在德里高等法院出庭,表示使用ANI的内容来训练软件并不构成印度版权法下的侵权行为。(美联社)
“任何逐字复制的情况都不存在。如今,该模型已经达到了如此高的成熟度,完全避免了逐字复制的情况,如果它重复内容,将违背开放AI的目的,”阿米特·西巴尔说道。
西巴尔辩称,使用ANI的内容来训练软件并不构成印度版权法下的侵权行为。其中原因之一是版权法只适用于印度全境,而ChatGPT的数据存储和软件训练是在印度境外进行的,这些活动在当地是合法的。
“预训练过程中使用的训练数据也不存储在印度,而是存储在印度境外的服务器上。没有一部分训练或所谓的存储发生在印度,而且这些行为并不违法。版权法只适用于印度全境,但不适用于印度境外,”西巴尔提交道。
西巴尔辩称,使用ANI的内容来训练软件并不构成印度版权法下的侵权行为。其中原因之一是版权法只适用于印度全境,而ChatGPT的数据存储和软件训练是在印度境外进行的,这些活动在当地是合法的。
他补充说,即使该行为适用,存储也不会构成版权侵权,因为该公司只是提取数据的“非表达性元素”用于“非表达性用途”,他认为这在法律上是允许的。
这些陈述是针对ANI对开放AI提起的版权侵权诉讼作出的回应,ANI声称该公司未经适当许可就利用其内容训练语言模型,并从中获取商业利益。
此案引起了广泛关注,包括印度音乐产业、印度出版商联合会和数字新闻出版商协会在内的多个行业团体支持ANI的立场。预计这一裁决将对如何在数字时代应用版权法以保护人工智能生成内容以及新闻机构原创作品产生重大影响。
去年11月,高等法院向开放AI发出传票,但在该公司告知法院其已于10月份屏蔽ANI域名后,法院未立即禁止其使用ANI的内容。法院还指派了法庭之友,承认此案涉及复杂的法律问题,考虑到新技术的进步。
在周五的听证会上,西巴尔进一步辩称,即使使用数据生成用户回复也不构成侵权,因为该行为并未禁止数据用于各种目的,新闻机构不能对“事实发现”主张“特殊权利”。
“一般使用并不被禁止。没有实质性复制,也没有因事实发现而产生的权利。仅仅因为事实相似,并不意味着‘实质性相似’,”西巴尔提交道。
下一次听证会定于4月2日举行,届时西巴尔将继续代表开放AI提交意见。
在一月份的回应中,开放AI敦促法院驳回案件,理由是加州法院拥有专属管辖权。它还重申,其使用数据的方式是非表达性的。然而,1月28日,高等法院拒绝单独裁定管辖权问题,并决定同时听取关于管辖权和实质问题的辩论。
此前,ANI曾请求高等法院对其版权侵权诉讼作出有利判决,声称尽管开放AI有所承诺,但该公司仍在抓取ANI订阅者网站上共享的内容,用于训练ChatGPT并生成回复。ANI的律师认为,这种行为构成版权侵权行为,因为其内容的分发并未剥夺ANI对该内容的控制权或版权归属。
(以上内容均由Ai生成)