人工智能和创造性:机器能写像简·奥斯丁?

林Vezina 布伦特莫兰

系列的第二部分,人工智能(AI)和创造力,我们沉浸在迷人的宇宙的人工智能,以确定它是否有能力创造作品享有版权保护。下面,我们就来展示一个AI系统生成的两个例子可以说是小说内容通过两种不同的方法:一个马尔可夫链和一个人工神经网络。然后,我们应用版权合格标准解释”人工智能和创造性:为什么我们反对AI-Generated输出版权保护“每一个例子。

这里的要点:通过下面的简·奥斯丁的例子,很明显,看似“创造性”的选择由人工智能系统并非归因于人类和结果之间有因果关系,也不是人类,它定义了最终形式或表达的工作。随机性元素整合在一个人工智能程序使创造力和幻觉的人越是接近表面的创造性工作由人类,相似度越高,因此创意越低。这一切使我们得出这样的结论:作者的版权保护要求和创意并不满意。

方法1 -马尔可夫链

假设你想开发一个人工智能系统,可以写喜欢英语小说家简·奥斯丁(1775 - 1817)。要做到这一点,可以写一个句子作为一个马尔可夫链模型。安德烈马尔可夫首次发现的马尔可夫链是一个随机模型描述一系列事件,可能下一个事件的分布仅依赖当前状态的序列。这些模型被首先应用于语言克劳德·香农在他开创性的论文,通信的数学理论

理智与情感最初的封面页
图片的标题页第一版简·奥斯丁的《理智与情感》(1811)”。这张照片是在公共领域通过礼来印第安纳大学图书馆。访问它在这里

例如,“夫人这个词。”(大写和标点符号)发生的2157倍完整的简·奥斯丁的作品夫人,和文字”。“是”Annesley”、“嘉丁纳”,“F。”等。AI系统会随机选择从下面的单词列表”夫人。“可能延续一个句子从“夫人。“把列表中的重复元素,从它均匀随机选择,倾向于选择更频繁地发生在“种子”(或初始)单词是保证。

假设人工智能系统随机选择从列表中遵循“Annesley夫人。”这个过程可以重复的单词列表,遵循“Annesley。Annesley“这个词是不太常见的(只发生两次),紧随其后的是“”和“。“这个过程可以重复多次创造越来越多的句子存根,并最终构建类似一个句子,如:

  • Annesley太太,是女主人的房间客厅最著名的密切明智的判断。

这个“句子”使用真正的话说,从奥斯丁的作品,但没有多大意义的语言或语法。为了让AI系统有更多的上下文选择文字时,一个标准的想法是试图找到单词,遵循多文字片段,而不是单个词。在本例中,您可能会看单词列表,按照两个单词片段。Annesley”,这包括“对”和“是”。“注:这是相同的词,一个词的片段,“Annesley。”

如果随机选择”到“跟随”夫人。Annesley”,那么你必须找到后的单词列表片段“Annesley,”等等。继续以这种方式,您可以构建一个句子:

  • Annesley索普小姐,然后只觉得!我发现,我相信你会觉得高,在这第二次面试,这样她不怀疑你的倾向。

虽然这句话是支离破碎的,比以前更有意义句子由一个词的片段。现在让我们看一个示例构造使用三字代码片段,从“夫人。Annesley”:

  • 太太Annesley达西小姐一直站在足够为她拒绝信函;这对我来说是不可能没有听见。

在这个级别的背景下,我们开始看到正确的语法。这句话几乎看起来可能是奥斯丁写的自己(在一个糟糕的一天)。然而,这句话完全是机器生成的。最长的片段的话这句话也连续出现在奥斯丁的作品是:

  • …为她拒绝信函;这是不可能的…

然而,片段周围的环境不同于奥斯丁的原创作品,实际上是由不同的部分她的一些作品。这里有一个例子使用四字代码片段,从“夫人。Annesley小姐”:

  • Annesley给达西小姐,夫人提醒她的焦虑;但是当她看到,她频繁和分钟的考试,每一个症状的持续复苏,六点钟,看到玛丽安陷入安静,稳定,外观和舒适,睡眠,她每天怀疑沉默。

在这种情况下,开始失去创意的方法。事实上,这句话是由两个片段直接从奥斯汀的原创作品:

  • Annesley给达西小姐,夫人提醒她…
  • …提醒她的焦虑;但是当她看到,她频繁和分钟的考试,每一个症状的持续复苏,六点钟,看到玛丽安陷入安静,稳定,外观和舒适,睡眠,她每天怀疑沉默。

这些片段被缝在一起“提醒她。“第一个片段来自奥斯丁的小说《傲慢与偏见》第二是来自理智与情感

从这些例子中,很明显,扩大“上下文”(即。,the snippet length) increases the probability that the AI system will produce something akin to proper English, but it also decreases the originality of the output. To increase originality, the system requires more text from the original author’s works to be given as input. Even with this simple method, a system can produce fairly realistic English prose. In fact, the actual limit on the quality of content generated by this method turns out to be processing power, computation time, and storage. Also, since the goal is to generate prose只有风格的简·奥斯丁,一组可能的输入文本是局限于她的作品。

上面描述的马尔可夫链是一个更一般的概念称为的一个例子语言模型。在技术方面,语言模型在序列的概率分布词汇的语言。在我们的例子中,我们感兴趣的一个词的概率会出现下一个单词,有顺序的词。在这个模型中,随机选择后可能的单词序列的概率分布到目前为止让我们产生“散文。“在撰写本文时,大多数的国家之一最近的大型语言模型称为GPT-3,是由一个组织OpenAI。

2 -人工神经网络方法

GPT-3是一个更复杂的比马尔可夫链模型。事实上,它的一个例子人工神经网络(安)。一个ANN模型非常复杂,但它基本上是一个计算模型基于人类大脑的神经网络。1就像我们的大脑是由相互连接的处理元素(即神经元)处理信息,这个人造系统还包括一个共同合作的神经网络来解决特定的问题。进一步,正如人类学习时得到更多的信息,随后改变他们的行为来解决一个问题,这个人造系统也学会根据其输入和输出。

例如,训练一个ANN模型来预测下一个单词序列,我们从不同的文本片段做出许多预测每秒和使用一个数学过程调整ANN模型在每一个不正确的预测。稍微的调整在形式改变不同的数值模型中参数的值。因为每个片段的使用相同的参数,我们需要很多人一般足够的模型,这样我们可以任意输入序列,并以此为根据做出推测。(GPT-3大约有175000000000的大版本参数!)经过若干次迭代的上面的过程改进模型,我们可以产生新的文本通过喂养模型现有文本,添加任何词它预测接下来,最后把结果送回模型。在现实中,这一过程比上面描述的更复杂但总的想法是,它允许我们在每次运行生成一个新颖的输出,而不是同样的事情一遍又一遍。

不幸的是,布兰特(CC)的数据工程师无法在他的笔记本电脑上运行的大型模型,所以他使用了GPT-3的前任GPT-2,只有有117000000个参数。模型来“训练”的,这意味着它已经经历了多次迭代过程的上述英语文本。用户可以通过执行“微调”模型进一步迭代的英语文本选择的样本。下面是一个示例的输出训练模型,大约10分钟后简·奥斯丁的作品:

  • “是的,我想,”艾玛回答说,“但我不认为她做了大量的好,当然,我敢说;她可能,但如果她可以我必须说,但她是一个伟大的女人,我不知道我们知道,埃利奥特先生是他的亲切的姐姐。”

注意,虽然它不是使意义作为一个故事,没有真正的语法错误,和“声音”似乎密切呼应简·奥斯丁的。一般来说,每个人工智能方法生成小说内容,书面或否则,包括开发一个(可能相当复杂)的数学模型,模拟一些聪明的行为。然后,内容可以通过选择随机生成的概率空间定义为模型。

版权理论应用到我们AI-generated简·奥斯丁的句子

简·奥斯汀肖像在电线
1870年的混音简·奥斯汀的雕刻在公共领域通过德克萨斯大学和拼贴题为“大脑的丑闻Kollage孩子许可CC BY-NC-SA

在理论层面,思想关于“作者”和“创意”作为我们检查了他们的本系列的第一篇文章似乎与任何人工智能的概念(即非人类)创造力。正如我们所看到的在我们的简·奥斯丁的例子中,看似“创造性”的选择由人工智能系统并非归因于人类和结果之间有因果关系,也不是人类,它定义了最终形式或表达的工作。在人类(如AI程序员或用户)确实是参与创建AI-generated输出在上述模型,这种参与是完全机械,而不是作者或创意。随机性元素整合在一个人工智能程序使创造力和幻觉的人越是接近表面的创造性工作由人类,相似度越高,因此创意越低。这一切使我们得出这样的结论:作者的版权保护要求和创意并不满意。

都说,人工智能已经在过去的几年中,先进的存在不清晰,更不用说共识,在如何定义AI技术的新兴的未知领域。任何试图监管还为时过早,特别是通过征税过高版权系统已经被征用目的扩展远远超出了原来的预期目的。AI需要适当的探索和理解版权或任何知识产权问题之前可以适当考虑。这就是为什么AI-generated输出应该在公共领域,至少等待一个清晰的理解这不断发展的技术。

笔记

1。安在更多的技术术语,一个可以被定义为一个类的函数,用从向量空间向量,向量映射到不同的向量空间。之间的转换函数在类定义通过经营者本身就是一种数学函数。操作员旨在“训练”ANN模型通过减少一些成本函数的输出。