最近GPT相关的公司的官司不断,都是围绕在training data 的版权问题。GettyImages 另辟蹊径。
今天宣布的这个生成式人工智能系统由Nvidia开发,仅使用盖蒂图像库中的图像进行训练,不包含未经授权从互联网上抓取的标志或图像。盖蒂图像的首席执行官克雷格·彼得斯表示:“从根本上说,它已经经过训练,是干净的,对于企业使用是可行的。我们将为这一说法提供支持。” 彼得斯表示,想要使用生成式人工智能的公司需要完全的法律确定性,以免面临昂贵的版权诉讼。
在过去的一年里,生成式人工智能系统迅速发展,可以生成图像和文本。然而,人工智能公司卷入了众多有关版权内容的法律纠纷。著名艺术家和作者,包括约翰·格里沙姆、乔迪·皮库特和乔治·R·R·马丁,最近起诉了OpenAI和Stability AI等人工智能公司侵犯版权。今年早些时候,盖蒂图像宣布起诉Stability AI,因其未经允许使用数百万张盖蒂图像来训练其开源图像生成人工智能模型Stable Diffusion。
这些法律挑战激发了许多人试图在使用生成式人工智能的同时保护知识产权。Adobe最近推出了Firefly,声称其也是基于无版权内容进行训练的。Shutterstock表示计划对那些将作品出售给人工智能公司来训练模型的艺术家进行赔偿。微软最近宣布将为使用其基于文本的生成模型的客户承担任何版权法律费用。
彼得斯表示,这些图像的创作者以及出现在其中的任何人都同意将其作品用于人工智能模型。盖蒂还为创意人提供了一种类似Spotify的补偿模型,以回报他们的作品使用。
英国杜伦大学的助理教授贾王专攻人工智能和知识产权法,她表示,创意人将以这种方式获得赔偿是一个好消息,但可能会很难确定哪些图像已经用于生成的人工智能图像,以确定应该为什么而获得赔偿。
盖蒂的模型只在该公司的创意内容上进行了训练,因此不包括可以被制作成深度伪造图像的真实人物或地点的图像。彼得斯指出:“这项服务不知道教皇是谁,也不知道巴黎世家是什么,它们无法将两者结合起来。它也不知道五角大楼是什么,你不能把它炸掉。” 彼得斯指的是最近由生成式人工智能模型制作的病毒性图像。
对于那些声称人工智能模型无法在没有版权内容的情况下构建的技术公司,彼得斯称这些论点是“胡说八道”。他说:“我认为有一些真诚的人在认真思考这个问题,但我也认为有一些人只是想要加入这场淘金热潮。”
内哥觉得这个很具有争议性。因为这个不是一般的剽窃。是否存在版权问题仍然有待商榷。但是,如果因为这个影响了产品的质量,可能得不偿失。你觉得呢?