2024-08-18 13:05来源:本站编辑
阿卜迪•纳兹米安、布莱恩•基恩和斯图尔特•奥南这三位作者,参与了一场针对英伟达的新版权侵权诉讼。这是针对生成式人工智能提供商依赖“合理使用”原则获取受版权保护的材料来训练大型语言模型的最新诉讼。
这起诉讼于上周晚些时候提起,与其他针对生成式人工智能创造者的诉讼类似,指控他们使用了受版权保护的材料——在本案中,是上述作者的小说作品——作为法学硕士的训练数据。在这种情况下,LLM是Nvidia的NeMo威震天系列,根据诉状,该系列使用了几个已知包含作者版权材料的数据集,并且未经许可使用。
具体来说,“Books3”数据集似乎是问题的核心。这包括108GB的数据,是Bibliotik私人跟踪器的一个副本,这是几个在法学硕士开发领域长期存在的“影子图书馆”网站之一,因为它们“托管和分发大量未经许可的版权材料”,根据起诉书。作者要求赔偿金钱损失,并“销毁(英伟达)制作或使用的所有侵犯原告专有权的副本”。
作者由Joseph Saveri律师事务所(Joseph Saveri Law Firm)代理,该事务所已经代表其他创意专业人士团体起诉主要人工智能提供商。喜剧演员兼作家莎拉·西尔弗曼参与了2023年7月对OpenAI和meta提起的一起诉讼,而另一起集体诉讼的主要原告是作家莫娜·阿沃德和保罗·特伦布莱。与其他诉讼一样,这起案件是在加州北区联邦地方法院提起的。(版权案件只受联邦法律管辖,总是由联邦法院审理。)
所有这些诉讼都取决于“合理使用”的概念,这是美国版权法的一系列例外,在某些情况下,允许未经许可复制或以其他方式使用受版权保护的作品。根据斯坦福大学版权与合理使用中心(Stanford Copyright and fair use Center)的说法,判断某一特定活动是否符合合理使用的法律标准要求法官考虑四个因素,即使用的目的和特征、受版权保护作品的性质、使用部分作品的数量和“实质性”,以及使用对版权所有者对该作品的市场产生的影响。
像英伟达这样的被告人工智能创作者可能会辩称,他们对受版权保护作品的使用具有变革性,与原始创作者的使用有很大不同,并且将这些书籍用于人工智能训练不太可能对潜在读者的市场产生太大影响。另一方面,原告可能会指出,英伟达完整地吸收了多部作品,以及英伟达使用这些书籍的商业性质,以此作为反对合理使用的理由。
英伟达没有立即回应置评请求。