ChatGPT的叙事能力及其对文化创意产业的可能影响
葛红兵
上海大学中国创意写作中心
GPT(Generative Pretrained Transformer,生成式预训练计算机转换模型)模型源于2017 年由 Vaswani 等人提出一种计算机训练转换模型Transformer[ Transformer可以解释为“解码和编码系统”,本文后文依然使用英文原文,以表示对ChatGPT模型的“特指”。]模型[ 2017年6月,Google发布论文《Attention is all you need》,首次提出Transformer模型,成为GPT发展的基础。论文地址: https://arxiv.org/abs/1706.03762。],该模型是一种深度神经网络架构,能够高效地处理序列数据,尤其是处理文本类以上下文关系为特点的数据,它不依赖于循环网络,而是使用了无监督多任务自学习机制[ 2019年2月,OpenAI 发布论文《Language Models are Unsupervised Multitask Learners》(语言模型应该是一个无监督多任务学习者),提出GPT-2模型。论文地址: https://paperswithcode.com/method/gpt-2。]。以前的人工智能自然语义理解及自然语言生成处理长序列时会遇到梯度消失或爆炸的问题,Transformer 模型解决了这一问题[ 葛红兵:《人工智能写作:可能性及对人类文学生活的挑战》,《语文教学通讯》2020年第1期。],可以并行地计算所有序列位置。再次基础上,ChatGPT通过编码器把输入文本编码成一系列词嵌入,然后传递给解码器,通过一系列多头注意力层及自注意力层,逐步生成输出文本。这个模型在自训练的基础上,在加入人工强化训练之后,其效能更是突飞猛进[ 2022年2月底,OpenAI 发布论文《Training language models to follow instructions with human feedback》(使用人类反馈指令流来训练语言模型),公布Instruction GPT模型。论文地址: https://arxiv.org/abs/2203.02155。],能用用对话模式,通过上文推测下文并直接用符合人类自然语言的方式输出下文。一般理解ChatGPT的进步是计算机算力的成功,的确,2020年5月ChatGPT3的训练参数已经超过了1750亿个,而数据量达到了45TB[ ]。但知识迁移、信息统合生成乃至文学性创作(限于诗歌)生成等,这些其实都是之前计算机AI已经具备的功能,而ChatGPT的成功,首先是它作为“自然语言理解”“自然语言生成”的“处理模型”的成功,普通受众可以通过自然语言与计算机交流,是它最大的突破,其次它是一个“通用”AI模型,应用的广泛性和普适性是它最大的特征,这让它获得了超过区块链和元宇宙等新技术热点10倍的关注度。
ChatGPT可以让在大量文本数据上预训练后,生成各种各样的文本,不仅可以回答问题,还可以进行一般意义上的写作:它掌握了语言,而这正是人类和动物界区分的重要标志。20世纪世界哲学经历了一个由本体论哲学、认识论哲学向语言论哲学转向的过程,如果用维特根斯坦晚年倡导的语言哲学来理解人类思想,人类关于世界的本体论追问、认识论追问其实都是不可靠的,人类是思想到语言为止,而“一个词语的意义就是它在语言中的用法”,词汇的意义不是恒定的,词汇含义依赖于它在一定语境里的用法,因而语言其实没有确定性也没有本质,是一种“游戏”,一种基于“家族相似性”而产生的游戏。由上述观点,ChatGPT能生成自然语言文本(写作)也就等于生成了“思想”,当然,我们对此下一个确定性的论断还为时过早,我们还不能因ChatGPT具有“语言”能力就直接指认ChatGP已经具备人类“思想”主体性,但我们可以大致认为,ChatGPT的诞生,让人类和机器之间的体力替代关系,进入到了部分的智力替代关系阶段;这是机器智能的一次重大进步,甚至是革命性进步(尽管受制于人类的限制,机器人AI不可能拥有人类思想家可能拥有的异端思维权限,但除了这种断裂式思想创新,衍生性思想创新和集成性思想创新它是可能做到的)[ 也正是因此马斯克、盖茨等才会提出相关警告。最近前总裁盖茨、ChatGPT的早期投资人之一马斯克、360总裁周鸿炜都对此发表了警告性的看法,认为人工智能的发展可能给人来带来“主体性”危机,这种危险甚至可能超过核弹。]。
而之所以这样说,笔者还有一个基于创意写作学专业的理由。创意写作把本文创作分成工具性、生成性和欣赏性三类,者这里更要强调的是ChatGPT不仅可以进行一般意义上的工具性文本(公文等)、生产性文本(广告文案等),也可以进行欣赏类文本——创意写作文本的创作,之前微软小冰已经验证了计算创意写作在抒情诗方面的可能,而如今,ChatGPT则可以形成叙事能力,创作小说类创意写作欣赏作品文本。笔者非常重视的是ChatGPT带来的人工智能的叙事是能力的突破。创意叙事(无论是历史叙事还是未来叙事)作为一种“无中生有的故事创作”,本质上都可能演变为一种面向未来的人生筹划。当一个机器人能像人一样进行创意叙事,也就具备了人生筹划的能力,知道人生是一场有对手的博弈,能理解命运的偶然性及其与社会大环境的关系,也就是命数,它就向生命进化了一大步,这就离自主意识不远了,那就具有了具有某种类人主体性的可能。
自然语言的自上世纪中叶以来就一直是计算机学界和语言学界的热点研究方向,而计算机人工智能叙事能力的形成则是这一研究领域的珠穆朗玛峰(美国的创意写作学科一直有致力于这一方向的学者)。ChatGPT能识别和理解词义、句义、段义,进而识别语境,进入语境层面对语言中的语法、语义和语用等重要模式进行深度理解,从而达到完整理解“章义”的水平,能利用上文生成下文(目前对外开放的通用模型上文限于4000字),而且它还是自动进化的。
人类一直试图打开语义理解、语言能力习得及语言表达生成的密码魔盒,大脑是如何将语言进行理解、转化、存储进而生成表达的?乔姆斯基之前,人类对这些问题的其实并无理解,传统语法学可以解释既成语言现象,但不能解释语言的习得和生成。乔姆斯基上世纪50年代受聘于美国军方,研究计算机自然语言生成问题,1957年他的第一部专著《句法结构》出版,提出了生成语法(generative grammar,也称转换-生成语法)的概念,生成语法学以描写和解释语言能力为目标,提出了一系列语法假设和理论,用数学那样的符号和公式来规定概念、表达规则,他们用数学建模的方法进行研究,试图模拟大脑的语言认知系统-语法系统,在乔姆斯基这里语言学已经不在是一门社会科学,而是一门自然科学,乔姆斯基把他的生成语言学认定为是“一种特殊的心理学”“人脑机制的生物学”[ [美]诺姆·乔姆斯基:《乔姆斯基语言学文集》,宁春岩译注,湖南:湖南教育出版社, 2006年4月版。]。他用一套公式化的语法规则来描写语言能力,例如用 S→NP+VP来表示一个句子,句子(sentence)由一个名词词组 (noun phrase)加上一个动词词组(verb phrase)构成。这种精确的、形式化的语法被称为称为生成语法(也包括同一语义不同表达之间的转换语法,也可简称为转换—生成语法);1965年他建立起一个完整的生成语法系统,这套系统是一套“生成规则”,可以像数学公式一样,逐步推导出句子来,不同的分支规则推导出不同的句子。上世纪80年代,乔姆斯基的生成语言学又有了新的进展,他认为,语法能力不一定靠假设具体的规则来生成一切合格的句子,也可以靠假设更概括的原则来排除那些不合格的句子。由此乔姆斯基逐步建立了一套普遍语法的组合理论,用来揭示人脑语言思维规律。
如果说,作为语法学家的乔姆斯基及其生成语法学,主要研究的是句子层面的自然语言生成机制,在计算机如何生成合法自然语句的内在机制认识方面有很大进展,从而为计算机利用神经网络和预训练理解-生成模型工具形成自然语言下文生成能力提供了有效的理论假设和指引,那么笔者则认为,ChatGPT未来在叙事能力方面的能力提升则需要文学领域的研究,尤其是,在以“篇章”为基本单位的叙事类文学作品“叙事生成语法学”的进展来支撑。最近数十年来,中国学界“叙事生成语法学”方面的研究有了很大的进展。这方面,国内较早的研究者是陈平原,他基于对小说近代化的观察以及对武侠小说类型的研究,在本世纪初出版了《千古文人侠客梦》(后来经过了一系列再版和扩充)[ 陈平原:《千古文人侠客梦》(增订本),北京:北京大学出版社,2018年6月版。]中提出了“故事语法”的概念。他认为每个故事都可以缩减为一个句子,一个主谓宾结构的句子,这个句子就是故事语法,
而类型小说是一种故事语法现象,据此他总结了武侠小说的四种叙事语法:仗剑行侠、快意恩仇、笑傲江湖、浪迹天涯。陈平原也依据自己的故事语法研究,重新从类型学角度,解释了“什么是真正的艺术独创性”问题,他认为文学成规并不妨碍艺术独创性,相反是艺术独创性的有益前提,他把文学研究的目的设定为,寻找文学成规(故事语法),基本故事语法的文学及文化意义,倡导理解“表现程式”,发现程式里的“无意识内容”及民族文化精神。不过,陈平云并不是一个创意写作专家,他的所有研究都是基于文学解读的兴趣而产生的,他甚至反对创意写作培养作家,从写作角度认识作品的做法,因而不可能提出创意写作视角的、基于作者创意创作角度的“创意叙事-生成语法学”。
笔者曾经长期从事小说类型学基础理论研究和批评工作,并于2012年主持出版了上海大学小说类型理论与批评丛书[ 葛红兵主编:《上海大学小说类型理论与批评丛书》,上海:上海大学出版社,2012年8月版。],在笔者的《小说类型学理论的基本问题》[ 葛红兵:《小说类型学理论的基本问题》,上海:上海大学出版社,2012年8月版。]专书中,笔者从叙事(故事)语法(学)概念出发提出了创意创作角度的“叙事生成语法(学)”概念,这是一个基于中国现代小说类型学理论和实践,从创意创作者角度提出的“生成叙事语法学”理论框架,理论来源除了上述陈平原的直接启发,还有普罗普的小说形态学[ [俄罗斯]弗拉基米尔·雅可夫列维奇·普罗普:《神奇故事的历史根源》,贾放译,北京:北京联合出版有限公司,2022年6月版。]、格雷马斯的行动元和行动元符号矩阵理论、托多罗夫的句法理论和双层叙事语法结构法。普罗普故事形态学,对阿法纳西耶夫故事集里100个俄罗斯神奇故事做形态比较分析,从中发现了故事的结构要素(31个功能项),他阐释了这些功能项的组合规律。笔者认为它们之间的相互关系以及它们与整体的关系,实际上为故事生成语法提供了基础。格雷马斯提出了“行为者“概念,”行为者“是一种结构单位,分为六种,组成三对基本模式:欲望-追求(主体/客体);交流(发送者/接受者);帮助或阻碍(辅助者/反对者)。托多罗夫从“句法理论”侧重强调关键行为主体的连续动态过程的研究,他将故事比作一个陈述句,而故事的看点在于变化,他抓住变化的不同,创造了叙事转化公式,之后他发展出了行动模态理论将上一转化精细化,产生了行动的四个分段的行动模态理论:产生欲望——具备能力——实现目标——得到奖赏[ 研究者邱建丽在《雨花·中国作家研究》(2017年08月号)的《试析葛红兵小说类型学的理论构建、运用与意义》一文中对此做了概述性阐释,有兴趣的读者可以参阅。]。
结合近年的笔者创作、教学经验,笔者认为,故事是可以模态化的,例如“心有欠缺——产生欲望——锻炼能力——实现(未达)目标——奖惩”就一个基本模态,故事的基本模态可以整合成“基本叙事生成语法”,而基本模态是可以转化成不同类型模态,类型模态可以概括为故事“转换叙事语法”;二者共同构成了故事的故事的“生成-转化叙事语法”,“生成-转化叙事语法”的定型和成熟是判断各类型文学的主要标志;故事的“生成-转化叙事语法”不仅应该考虑故事本身叙事问题(“转化叙事语法”的研究应该以小说大类分蘖,跨类、兼类等,为研究通路),还应该考虑故事的地方文化语境考虑进去,故事应当被视为“地方知识”的一种叙事形态。基于故事的“生成-转化叙事语法”,成规即法则,法则并非源于自然,而是人类心灵的建构,它是集体意识一致性的体现。文本内的成规是文本外成规的投影,如果说透过结构的表层去寻求深层含义是科学理论应该追求的,那么通过结构表层研究深层类型小说的叙事生成-转化叙事语法,则是创意写作视野下的小说创作研究的根本方向。
基于上述叙事生成-转化叙事语法理论模型和观念,笔者认为ChatGPT经过特定的强化训练,可以形成超级创意叙事能力,而这种创意叙事能力的建构将使ChatGPT成为一款真正的具有创意创作能力的人工智能机器人。目前ChatGPT的运用主要是基于其信息统合能力、知识概括能力、观念整合能力。这些能力在自然语言生成和自然语义理解的加持下,被放大了。其实,这些能力,之前计算机也有,只是,算力算法限制,分散与各个局部专业领域,同时自然语言生成能力弱,没有能力通过自然语言来理解问题并输出结果(让计算机理解你的需求,需要用专业代码,反之计算机输出的信息大多数是科技图表,而不是自然语言,需要用专业知识来分析解读),这就限制了普通人对上述人工智能的运用,而ChatGPT的影响力,最大的方面是:基于自然语义理解的人机交互,这让普通人可以使用计算机智能,而且是高效率使用。需要重点提示读者的是:ChatGPT诞生的意义不仅仅是上述能力的提升,更加本质的意义还在与其所具有的创意能力,而这种能力的基础和体现,则在创意叙事上。笔者大胆地预言,ChatGPT可以基于我们前述故事的“生成-转化叙事语法”学习而进入真正的“创意创作”领域,如果说微软小冰基于现代汉诗的学习可以创作诗歌,那么未来在GTP模型下,基于现代类型小说的学习,例如基于现代武侠小说类型的学习,掌握其基本的故事类型叙事语法(转化生成语法),形成篇章级别的类型小说创意创作的能力,是完全可能的(目前已经可以创作短篇故事,但通用模型还不具备长篇小说创意叙事的能力,其上文token最长有4000字的长度限制)。
让我们接着来讨论机器创意能力的真正形成和方向问题。文化创意产业的底层是创意创作能力,而ChatGPT的诞生使机器AI形成了创意创作能力,或者说,为计算机人工智能真正实现创意创作能力打开了通路。汉语计算机AI创意创作能力,最早是体现在古典诗词创作上(全唐诗、全宋词等语料库比较健全,同时诗词本身就是模式-模态化的),之后,微软的小冰机器人,获得了汉语现代诗创作能力(通过了图灵测试),汉语创意写作抒情类诗歌创作得以实现;在过去的数年里,国际国内团队一直在致力于机器创意叙事能力(小说创作能力)的实现,但是都不尽人意,汉语创意写作及科技界更是成果寥寥:一是理论认识不足,没有建构叙事语法观念,对叙事生成-转化语法的认识几乎是零,二是算法(模型)限制、算力不足。日本一个团队曾经利用机器人创作短篇故事,笔者领导的一个团队曾经上线了一个童谣机器人,有一定的叙事能力,但,都是半成品。计算机AI训练词义理解、句义理解到段义理解的过程,急速进步,但是,到章义理解,还是ChatGPT以来的事情,基于故事类长篇小说章义的理解和生成训练理解对算法算力及语料集的要求肯定更为复杂、更为庞大,超过了科学论文(专著)和一般知识、信息类文献训练的要求,长篇小说都是数十万字起步,且章义是充斥着非逻辑、非线性的受偶然性和潜意识情绪影响的人生“命运”故事。但,ChatGPT的诞生为创意创作有抒情诗歌向故事(小说)进展打开了大门,我们可以预期:让机器AI通过对小说文本的大量学习,通过故事的“生成-转化叙事语法”习得,计算机AI不仅仅能理解故事中人类行为的表层逻辑,还能理解故事中人类行为的深层情绪逻辑,进而理解人类的“命运”,从而习得“生成-转化叙事语法”,创作出有意味的长篇创意叙事文本,我们的命理学一直是一门玄学,而在这里,可能在不打开其内部架构的基础上被当做故事的“生成-转化叙事语法”来得到理解。
机器创意能力的形成将改变创意产业的底层逻辑。1、基础信息的收集整理工作将变得自动化、智能化;而这在过去,这是创意产业活动的重头,创意产业活动的底层支撑有两个:一是创意经验源(收集以往案例及成功经验总结),二是社会实践源,现在创意经验源的源头对接工作几乎可以全部人工智能化了(曾经何时,创意产业业界的名牌公司其真正的核心竞争力就是它的规模化、格式化的创意经验源数据库)。2、创意写作学科把文本的创意创作分成:功能性、生产性和欣赏性三种,前两种基本可以被人工智能替代。基于此,创意文化产业的这些子行业将深受影响:信息服务业、现代传媒业、教育培训业、文化会展业等的行业运行逻辑可能变化,将产生大量基于人工智能基础的从业公司,由人工智能机器人担任的模拟主持人、虚拟记者、VR教师,基于虚拟现实会展等等会大量出现。3、一个更为重要的逻辑将在剩下的其他创意产业子行业发生:动漫游戏类、影视文学类、艺术品创作设计类等服务,将由过去的创意创作成品(完稿作品服务)向人工智能机器人的个性化创意创作过程服务转型,例如,文学作品,过去作家和出版商给你提供的是小说文本,而未来可能提供的是根据你的个性化、场景化、即时化需要而即时即刻的创作服务——换言之你享受的不是一部通用公开出版的成品作品,而是一部为你个人当即创作的个性化作品。
机器创意能力的形成将深刻地改变人类与机器AI之间的关系伦理。人和机器,过去是劳动力竞争,是体力的竞争,很明显在这场竞争中人类已经败下阵来,目前一台大型挖掘机的体力可以胜过一千人的体力,但是,下一步是人类和机器的智力竞争,无疑,这个时代已经到来。我们团队曾经发表过相关论文,提示“机器创意创作能力的形成,会对人类创意创作形成不正当竞争”[ 葛许越: 《写作机器人"作者"主体地位辨析》,《探索与争鸣》,2019年第 8期。]。创意创作可以分成衍生创新和原生创新两种;衍生创新是基于创意创作的“生成-转换语法”就可以进行的,而原生创新是针对“生成语法”的元创新(基于前者的创意创新写作者我们可以叫他类型小说作家,基于后者的创意创新写作者我们叫“他作家中的作家”“探索作家”),显然,在衍生创意创作方面,未来,人类是无法和机器竞争的,因此,需要对机器创作进行限制,强制标注机器创作是一个办法,所有利用了机器AI的创意创作作品,都应该做明确标识,并详细明示其利用的范围、方法。进而言之,笔者认为不仅仅是强制标注,而是要对机器创意创作进行供给侧量能和级别、方向限制(应该限制在教益目的方向、限制在最低限度供给、限制在低端供给)。基于机器具有强大的整合创意创新最新信息和作品进而进行衍生创新创作的能力,应该对人类原创作品的版权进行新的界定和保护,保留人类创作者拒绝被机器列入语料库、信息源的权利,如“人类原创作品在5年不得作为机器创新创作作品生成语料源”。