最近出版了微软开发的聊天机器人冰创作的诗集《阳光失了玻璃窗》,引起了广泛的讨论。通过诗歌语料数据库的排列组合进行诗歌创作并不是什么新鲜事。机器人冰的超越在于,它似乎具有本体(ontology)知识,可以构建不同诗歌图像之间的本体论关系,并根据简单的相关分析进行组合。这种诗能称为“创作”吗?如果一时无法计算,机器人有一天能获得处理自然语言的能力吗?研究科学技术哲学的何永红老师认为,表达所有常识对机器人来说是荒谬的,海德格尔的意义上的“这里”只有拥有自己的历史、周围的世界和身体,承受和辛苦整个世界,才能专注于善恶、罪与罚、生与死等问题。

数据库时写入:

机器人冰诗离“创造”有多远?

英国伟大诗人拜伦有一个女儿,名叫奥古斯塔阿达拜伦,后来被称为罗夫莱斯夫人(Lady Lovelace)。但是她的天赋发展与父亲截然相反,没有成为诗人,而是喜欢数学,成为了人类历史上第一个程序员——,这是诗歌和计算机的第一次相遇。洛夫莱斯夫人在回忆录中记录了英国数学家查尔斯巴比齐设计的分析器——,被认为是现代通用计算机的鼻祖,设计了一个可以解伯努利方程的程序。同时,她对计算机的发展趋势有着非常准确的预言。电脑不仅可以用来解决数学问题,还可以用来制作复杂的音乐。

但是,作为诗人的女儿,为了维护艺术家的尊严,她主张,即使分析器能作曲,创造性也不能归于分析器,而应该归于工程师。这样,她在人工智能发明前100多年就提前提出了关于反人工智能的论证。“分析器无权说它创造了什么新东西。它能做的都是知道我们该如何命令它执行。(阿尔伯特爱因斯坦。)这个论证后来归纳为创造力论证。

1950年,图灵在他著名的论文《计算机器与智能》中提到罗夫莱斯夫人的论证,他提出了非常有力的反驳。我们可以利用学习机使机器具有真正的创造力,首先编程模仿孩子们心灵的程序,然后通过特定的训练手段逐渐学习,获得成人水平的智力。图灵所说的学习机,即以后的机器学习。2010年以后,机器学习迎来了前所未有的发展高潮。图灵预见到的学习机不仅尝试作曲,还试图模仿洛夫莱斯夫人的父亲拜伦的作品——写诗。诗和电脑又见面了。2016年Google发明了可以自动写诗的机器人,最近几天出版了微软开发的聊天机器人冰鹏《创造》诗集《阳光失了玻璃窗》。

那么,小冰的诗真的表现出创造力吗?首先阐明我的观点。小冰没有表现出任何创造力。

根据人工智能专家玛格丽特博登的观点,创造力可以定义为我们产生神奇观念或产品的能力,分为组合性、探索性和变革性三种类型。组合创造力,即不寻常的观念以不寻常的方式结合在一起。探索性创造性是通过对既定规则的细微改变来发展某种风格的潜力。变革性创造性可能更符合我们对直觉的创造力,试图打破现有的风格,创造以前不存在的风格。(约翰f肯尼迪,独创性,独创性,独创性,独创性,独创性)以写诗为例,如果诗人通过形象组合创造了前所未有的意向组合,我们可以说他的诗表达了创新。如果他在十四行诗的一般规则之内,通过调整韵律和改变节奏,能更好地适应他想表达的内容,这就表现为探索性的创造性,例如莎士比亚创造的十四行诗。如果他完全打破了传统律诗的规则,创造出完全不同的诗,就可以表达更复杂的内容。这就是惠特曼创造的自由尸体一样的变革性创新。

虽然我没有看过小冰的全部诗集,但根据网上流传的几部作品,小冰显然没有探索性的创造力和变革性的创造力。因为那首诗看不到想表达的任何内容,也不能说风格。但是小冰似乎学会了做前所未有的形象拼贴,比如“她嫁给了世界上很多颜色”,也许可以断定它具有组合的创造性?果真如此吗?

事实上,机器作诗并不是一件神奇的事。建立诗歌语料的数据库,对短语和短语进行关联分析,就可以随机“创作”一首诗。如果给某个图像或文章贴上某个标签,程序甚至可以做出特定“风格”的诗。这种组合式启动机多年来已经传到了网络上。赵丽华诗歌事件后,甚至引起了很多网民大量创作诗歌和模仿现代诗人的热情。

目前的报道没有描述小冰的具体技术细节,但根据零碎的消息,小冰似乎具有本体性。

logy)知识,这可能是与之前网络上流传的作诗机不同的地方。在人工智能中,为了表征世界的存在结构,需要建模一套本体论来刻画事物的类别、属性及其相互关系。比如,对于叶子,就需要明确它构成了树木的一部分,对于树木,需要明确它在种类上属于植物这个类别。这里就涉及到了两种不同的关系,一是物质上的组合-构成关系,二是逻辑上的归类关系。如果人工智能要恰当地表征树木,这些关系都需要在本体论构建中界定清楚。可以推测,小冰的本体论构建了不同诗歌意象之间的本体论关系,再根据简单的关联分析,将相关的意象组合排列,就可以创作一首诗来。

然而,并不是所有新奇的意向组合都可以被认定是创新的,只有那些符合人类文化语境的组合才是有意义的。将无意义的组合去除,保留有意义的,这里面就涉及到人工。虽然小冰诗集的宣传人员宣称原模原样地保留了小冰的诗作,没有做出任何更改。但我们注意到,小冰创作了一万多首诗歌,只选了130多首出版。从网络上流传的几首诗来看,机械拼接不合情理的创作比较多,而那些未入选诗集的诗作,是否会有更多不合情理的拼接组合呢?因此,小冰所表现的所谓组合创造力,只是一种随机组合加人工筛选,并不是真正的创造力;就算有创造力,那也只是人工筛选在其中发挥了作用。

计算机处理自然语言的不可能性:

语言的意义依赖于我们对常识和情境的理解

相比于计算机在作曲、绘画等方面的相对成功,计算机在文学创作方面的进展要缓慢得多,这源于自然语言处理的巨大困难。要让计算机理解自然语言已经非常困难的,让它自动生成自然语言就更加困难。现有的自然语言处理程序都无法完好地捕捉自然语言的这三个典型特征:句法、相关项和语境。

人工智能自然语言处理上的信念最初来自于乔姆斯基的转化生成语法理论。在乔姆斯基的语言学理论中,人类具有对语言的先天知识——一套原初的普遍语法规则,它就像一个自动引擎,可以驱动语言在特定条件下从这些规则中生成出来。因此,对自然语言的句法分析,曾经被视为自然语言处理的密匙。然而,非常不幸的是,人工智能中的句法分析被证明是非常困难的。在历史上,威诺格拉德(Terry Winograd)曾经设计过一款名为SHRDLU的人机对话系统,它可以接收人类的自然语言指令,通过对语言的句法分析和语义分析,在经过逻辑推理之后做出相应的操作,比如将桌上的一个红色的圆形积木叠到绿色的方形积木上。然而,这样的系统只能处理一个玩具世界(toy world)。对于复杂的现实世界和日常语言而言,它是无能为力的。后来威诺格拉德也对此心灰意冷,彻底改变了对句法分析的信念,读起了海格德尔的《存在与时间》,试图从实存主义现象学中寻找人工智能设计的灵感。而现在的大多数自然语言处理也都是基于统计的,不仅句法分析被认为是不相关的,甚至语义分析也是不重要的。比如在现在的机器翻译中,关注的焦点在于词语、短语和句子,而不是句法。

但自然语言理解面临的最大难题甚至还不是句法,而是如何处理语义的整体论特征,其中最重要的就是相关项(常识)和情境。根据人工智能哲学家豪格兰德(John Haugeland)的观点,句子的语义并非是原子语义的组合,而是和作者意图、日常知识、语言的情境以及实存者的生命等四重因素相关的。这里不讨论作者意图,我们先来看常识和情境。比如“李白在画里”,我们要理解这句话的意义,首先需要知道“画是图像的某种载体”,从而确定它所要表达的不是类似于“李白在房间里”这样的空间包含关系,而是“画里的人像是李白”。这里的“画是图像的某种载体”就是句子理解的相关项或常识。但有时候,要理解这句话的意义不仅依赖于常识,还依赖于情境。假设这样一段散文,描写小明漫步在一个风光旖旎的山巅,这句“李白在画里”表达的意思就与之前完全不同了,它是一种隐喻,表达的是“李白周围的风景美如画”。在绝大多数文学作品中,语言的意义正是如此这般地依赖于我们对常识和情境的理解。

由此,我们也就不难理解小冰为什么可以创作“诗歌”,但在创作小说时却完全失败了。诗歌虽然被视为最能展现人类创造力的艺术形式,但也恰恰最容易写作。因为诗歌对于语法并没有很高的要求,有的诗句为了创造出陌生化的效果,甚至要打破日常语法;对于日常常识的要求也不高,只需要对常用的意象建构一个简单的本体论就可以了;因为诗歌通常很短,也就不太需要把握整个文本的语境。而小说的写作,无论是对于句法,还是对于相关项和情境,要求都比诗歌要高得多。以常识为例,小说描述了人类的生活往往涉及到大量的常识,比如“摔下悬崖会受伤(但可能不会死)”、“被剑刺中会受伤(但可能不会死)”、“师傅的关门女弟子是我的小师妹”、“杀了我师傅的人是我的仇人”等等。要创作小说首先要构造出这些常识的本体论,而这是非常困难的。1984年开始的Cyc项目试图表征人类的全部常识,然而,三十多年过去了,这一项目虽然仍在运作,却远未看得到商用的前景。因为人类的常识实在太多,而且各个常量之间的关系异常复杂,要表征全部常识几乎是不可能的。可见,创作小说对于机器而言就是天方夜谭,它可能会机械地组合一些既有的故事情节,但要实现真正的创作,在现有技术条件下是不可能的。

但即便诗歌如此容易创作,小冰的“创作”也仍然不能称之为创作。AlphaGo虽然可以战胜世界上最优秀的围棋选手,但它却缺乏赢棋的理由(reason),同样,小冰的创作,暂且不论其水平如何,它也缺少创作的理由。人类之所以要赢棋,或者是为了获得名声和尊重,或者是为了赢得奖金,或是为了证明自身的力量;而人类的创作,往往是为了表达某种观念,表现某种情感。但无论是AlphaGo还是小冰,都缺乏对这些情感和观念的体悟,因为它们对这个世界根本上是“漠不关心”的。

文本的整体意义除了意图、常识和情境,在根本上依赖于实存者的生命。即便像东郭先生和狼这样简单的文学故事,要阅读或创作它,不仅要把握这个故事里的常识、情境,更要体悟“同情心泛滥”、“恩将仇报”这样一些微妙的情感。而只有海德格尔意义上的“此在”(dasein),即有着自己的历史、周围世界和身体,承受并操劳着整体的世界,才会关注类似善与恶、罪与罚、生与死这样的问题,才能体悟世间的情感,理解文本的意义,才可以真正地阅读和创作。根据豪格兰德的观点,这样一个实存者,只有通过具身的和嵌入的(embodied and embeded)人工智能才能实现。当计算机成为大地的栖居者,它就真的可以写诗了。

相关推荐