何平:機(jī)器制造文學(xué)? ——關(guān)于當(dāng)下AI寫(xiě)作的技術(shù)問(wèn)題
原標(biāo)題:目前的機(jī)器寫(xiě)作,不是文學(xué),更不能取代作家創(chuàng)作
人工智能技術(shù)會(huì)不會(huì)代替獨(dú)立的人,來(lái)完成文學(xué)寫(xiě)作?在本期“花城關(guān)注”中,作家陳楸帆、王元分別與AI寫(xiě)作軟件“創(chuàng)新工場(chǎng)”“彩云小夢(mèng)”合作完成小說(shuō)的寫(xiě)作。他們的實(shí)踐恰恰證明,AI寫(xiě)作目前還停留在簡(jiǎn)單模仿的層面。人類(lèi)靈魂的深度,尚不是當(dāng)前的機(jī)器算法所能測(cè)量。本文系專(zhuān)題引文。
——編者
這一期的兩篇小說(shuō)是人和機(jī)器共同完成的,雖然最后署的是人名,但我們以楷體字標(biāo)志出機(jī)器完成的部分。和陳楸帆合作的是創(chuàng)新工場(chǎng)的“AI科幻世界”。這款產(chǎn)品可學(xué)習(xí)和模仿陳楸帆的小說(shuō)句法和行文風(fēng)格。而與王元合作的則是網(wǎng)絡(luò)上很多人都用的寫(xiě)作軟件“彩云小夢(mèng)”。該軟件不是專(zhuān)門(mén)為特定寫(xiě)作者定制的,是一款公共的AI寫(xiě)作產(chǎn)品。機(jī)器(AI)參與到需要人類(lèi)高級(jí)思維和想象能力才能完成的文學(xué)、藝術(shù)及其他活動(dòng)在當(dāng)下不斷成為大眾傳媒的話題,像會(huì)唱歌的“洛天依”、會(huì)寫(xiě)詩(shī)的“小冰”、會(huì)下棋的機(jī)器人等。一些對(duì)風(fēng)潮敏感的研究者將這些目前只是依靠大數(shù)據(jù)、算法等計(jì)算機(jī)技術(shù)的初級(jí)文學(xué)藝術(shù)行為徑直解讀為機(jī)器(AI)寫(xiě)作正在取代人類(lèi)文學(xué)。而事實(shí)上卻不是如此。以“小冰”寫(xiě)詩(shī)為例,與文學(xué)界的熱捧不同,“小冰”的開(kāi)發(fā)者,微軟(亞洲)互聯(lián)網(wǎng)工程院小冰團(tuán)隊(duì)首席科學(xué)家宋睿華在2018年10月26日的CNCC技術(shù)論壇之“自然語(yǔ)言生成:讓機(jī)器掌握文字創(chuàng)作的本領(lǐng)”的演講中就明確表示,機(jī)器并不會(huì)取代人類(lèi)寫(xiě)詩(shī)。他在演講的最后以他上幼兒園的女兒的一首即興的小詩(shī)為例,認(rèn)為:“人類(lèi)在作詩(shī)的時(shí)候是非常奇妙的,是AI所不能企及的,因此我們的空間還很大?!蔽依斫馑晤HA所說(shuō)的“我們的空間還很大”應(yīng)該是兩個(gè)方面的:一方面是人類(lèi)的寫(xiě)作及其他審美藝術(shù)的潛力;另一個(gè)方面,則是機(jī)器(AI)介入審美藝術(shù)等領(lǐng)域的前景,這兩個(gè)方面都有著遼闊的空間。
普通人對(duì)AI的好奇,乃至焦慮和恐懼,和科技進(jìn)步,和人文社科研究者、大眾傳媒的宣傳有著密切關(guān)系;另外一股力量可能來(lái)自科幻文藝對(duì)未來(lái)世界的想象。這種想象典型地體現(xiàn)在宇宙旅行和人工智能上。其中,人工智能很容易讓人聯(lián)想到當(dāng)下的機(jī)器(AI)寫(xiě)作。電影工業(yè)產(chǎn)品從20世紀(jì)80年代的《銀翼殺手》到新世紀(jì)的《攻殼機(jī)動(dòng)隊(duì)》等,對(duì)人工智能的可能疆域作出了許多開(kāi)拓,而《銀翼殺手》則由賽博朋克風(fēng)格的開(kāi)創(chuàng)者菲利普·迪克的小說(shuō)《仿生人會(huì)夢(mèng)見(jiàn)電子羊嗎》改編。人工智能也是當(dāng)下中國(guó)文學(xué)的熱點(diǎn)話題之一,“花城關(guān)注”發(fā)表的年輕作者杜梨和周婉京的小說(shuō)都探索過(guò)這一主題。人工智能不局限在我們現(xiàn)在技術(shù)上已經(jīng)實(shí)現(xiàn)了并還在拓展的增強(qiáng)身體的領(lǐng)域,而是智能人從類(lèi)人、近人到“人”,乃至超人的成長(zhǎng)。這種生物體和機(jī)器的混合體,“既是社會(huì)現(xiàn)實(shí)的生物,也是虛構(gòu)的生物”(哈拉維),也就是所謂的“賽博格”。在科幻文藝描述的未來(lái)世界中,智能人從為人所用到逃逸出人的掌控和奴役,成為自足的“另一種人”?!八鼈儭迸c人類(lèi)一起分享、占有和競(jìng)爭(zhēng)生存空間,也實(shí)現(xiàn)著自身的成長(zhǎng)和進(jìn)化。而最令人憂慮的不只是人和“另一種人”之間交往的諸多倫理問(wèn)題,在對(duì)未來(lái)世界的想象中,“另一種人”可能會(huì)反噬,甚至轉(zhuǎn)而奴役人類(lèi)。
但至少目前的機(jī)器(AI)寫(xiě)作,無(wú)論是“小冰”,還是參與王元的《他殺》的“彩云小夢(mèng)”,還是陳楸帆合作的創(chuàng)新工場(chǎng),最終的成品并不是自足的文學(xué),只是技術(shù)輔助,而且只是初級(jí)的技術(shù)。說(shuō)到技術(shù),我們當(dāng)然要把技術(shù)的歸到技術(shù)。同時(shí),可以看陳楸帆的實(shí)踐和他是怎么說(shuō)的。
陳楸帆生于1981年,他出生的第二年,1982年,電影《銀翼殺手》上映。2017年陳楸帆開(kāi)始嘗試與AI共同寫(xiě)作,這就是《人生算法》這本關(guān)于人與AI之間共生的六個(gè)故事中的《出神狀態(tài)》。下面是陳楸帆自述機(jī)器寫(xiě)作的技術(shù):
GPT本質(zhì)是一個(gè)語(yǔ)言模型,如同物理模型是用來(lái)理解和描述這個(gè)物理世界的本質(zhì)一樣,語(yǔ)言模型用來(lái)理解和描述語(yǔ)言的本質(zhì)是什么。人類(lèi)有世界觀,也有語(yǔ)言觀,比如說(shuō)語(yǔ)言是什么,構(gòu)成語(yǔ)言的詞或短語(yǔ)之間的關(guān)系又是什么。
簡(jiǎn)單抽象來(lái)說(shuō),語(yǔ)言模型主要用來(lái)做兩件事:一是對(duì)自然語(yǔ)言做理解,比如給出兩個(gè)句子,語(yǔ)言模型會(huì)判斷哪個(gè)句子更像自然語(yǔ)言、句子里面的詞或短語(yǔ)的依賴(lài)關(guān)系是什么;二是對(duì)自然語(yǔ)言做預(yù)測(cè),比如只給出一句話的前幾個(gè)字,來(lái)預(yù)測(cè)后面的字是什么。
傳統(tǒng)意義的語(yǔ)言模型主要用在語(yǔ)音識(shí)別、機(jī)器翻譯、OCR(光學(xué)字符識(shí)別,即針對(duì)印刷體字符,采用光學(xué)的方式將其轉(zhuǎn)換為電子文本格式)等序列到序列任務(wù)里,對(duì)目標(biāo)序列做預(yù)測(cè)和判斷。
最常見(jiàn)的兩種用途之一是,機(jī)器會(huì)將一句中文翻譯成不同的英文,語(yǔ)言模型會(huì)對(duì)每句英文翻譯進(jìn)行打分,從而選擇最優(yōu)的翻譯。另一種是,在語(yǔ)音識(shí)別中,僅說(shuō)到“我們正在聊……”,語(yǔ)言模型就會(huì)預(yù)測(cè)出,你大概率要說(shuō)的是“我們正在聊天”,即使沒(méi)聽(tīng)到“天”的聲音就能判斷出你將要說(shuō)什么話,而聽(tīng)到的聲音則是這個(gè)信號(hào)的加強(qiáng)。
如果把訓(xùn)練一個(gè)模型類(lèi)比成培養(yǎng)一個(gè)學(xué)生,我們一般遵從一種叫作“先預(yù)訓(xùn)練、后微調(diào)”的教學(xué)方法。具體來(lái)說(shuō),我們先給機(jī)器很多書(shū)本讓他自己讀,這就是所謂的無(wú)監(jiān)督預(yù)訓(xùn)練(pre-training);然后給它很多有答案的題目讓它做練習(xí),這就是所謂的有監(jiān)督的微調(diào)(fine-tuning)。經(jīng)歷這個(gè)學(xué)習(xí)過(guò)程,模型就訓(xùn)練出來(lái)了,接下來(lái)就可以對(duì)它進(jìn)行各種考試了,比如說(shuō)給它一句話,讓它接著寫(xiě)下一句。
此次與人類(lèi)配合創(chuàng)作的AI模型來(lái)自創(chuàng)新工場(chǎng)DeeCamp 2020人工智能訓(xùn)練營(yíng)中的大學(xué)生創(chuàng)新項(xiàng)目“AI 科幻世界”,它是一個(gè)在一千多塊顯卡上訓(xùn)練出來(lái)的超大規(guī)模預(yù)訓(xùn)練模型,用了300GB的中文語(yǔ)料,其參數(shù)規(guī)模與GPT-2 Large相當(dāng),訓(xùn)練完畢后又用了少量故事數(shù)據(jù)做微調(diào)。今年大火的GPT-3上體現(xiàn)出來(lái)的一些模型特色,在“AI 科幻世界”上也能有所體現(xiàn),“并且是中文的”。
從操作層面看,人類(lèi)作家與模型的交互十分簡(jiǎn)單,只需要給定場(chǎng)景與人物關(guān)鍵詞,AI就能自動(dòng)生成幾個(gè)段落供作家們選擇。人類(lèi)作家可以在其基礎(chǔ)上進(jìn)行修改,而后AI將在經(jīng)過(guò)修改的前文的基礎(chǔ)上繼續(xù)進(jìn)行創(chuàng)作,如此往復(fù),完成人類(lèi)作家和AI的“共同作品”。
今天對(duì)于AI來(lái)說(shuō),一些簡(jiǎn)單的財(cái)經(jīng)新聞報(bào)告已經(jīng)不是難事,因?yàn)檫@些都是可以結(jié)構(gòu)化處理的語(yǔ)句結(jié)構(gòu)。不過(guò),要涉及文學(xué)創(chuàng)作就是另一回事,如果從創(chuàng)作者的角度理解人工智能創(chuàng)作文本的不同階段,最初的階段是用統(tǒng)計(jì)學(xué)對(duì)語(yǔ)言要素進(jìn)行排列組合,可以創(chuàng)作出簡(jiǎn)單的詩(shī)歌;后來(lái)進(jìn)階到人工智能在網(wǎng)絡(luò)文本數(shù)據(jù)集里無(wú)監(jiān)督地學(xué)習(xí)各種符合人類(lèi)語(yǔ)法的規(guī)則和客觀知識(shí)、去模擬人類(lèi)的寫(xiě)作風(fēng)格;可能更進(jìn)一步的是AI可以從一個(gè)意象、一段話,去生發(fā)出來(lái)一個(gè)邏輯自洽、人物關(guān)系清晰、具有典型敘事結(jié)構(gòu)的完整故事。
所以,至少目前機(jī)器(AI)寫(xiě)作所提供的只是一種技術(shù)路徑和文字組合的片段實(shí)驗(yàn),并沒(méi)有實(shí)現(xiàn)真正意義上的機(jī)器制造的文學(xué)。同樣的,王元也持這種觀點(diǎn),關(guān)于《他殺》,7月13日,我和王元在微信上有一個(gè)交流。
何平
王元
何平:?jiǎn)栆粋€(gè)問(wèn)題,森北和玄理、“我”和婧、光子和“我”,這三個(gè)“小夢(mèng)”完成的場(chǎng)景是如何選擇的?還是先有其他部分,然后讓“小夢(mèng)”完成這一段未完成的部分呢?再有,如果選擇中間某一個(gè)點(diǎn),讓“小夢(mèng)”自由地寫(xiě)下去,最后邏輯能自洽嗎?(我給王元發(fā)了豆瓣小組討論一篇“彩云小夢(mèng)”完成的小故事,還有一篇關(guān)于“彩云小夢(mèng)”寫(xiě)作的討論)豆瓣小組的這些故事也是“彩云小夢(mèng)”完成的嗎?
王元:首先是要在那個(gè)“彩云小夢(mèng)”的在線頁(yè)面內(nèi)進(jìn)行寫(xiě)作。我先寫(xiě)一段,然后隨機(jī)點(diǎn)擊生成,就會(huì)續(xù)寫(xiě)出幾個(gè)自然段,可以挑選一個(gè)滿(mǎn)意的,都不滿(mǎn)意,可以重新生成。沒(méi)有特別讓“彩云小夢(mèng)”去生成哪些內(nèi)容。因?yàn)檫@個(gè)在線續(xù)寫(xiě)軟件不夠智能,我在文章中也對(duì)生成的文本做了吐槽。
《他殺》里楷體字部分都是生成的,但是經(jīng)過(guò)了修改,不然語(yǔ)義有點(diǎn)太不通順,我已經(jīng)盡量保留了行文的原貌,以做區(qū)別。
豆瓣上那些我不太清楚,也沒(méi)有做參考,我只是使用了在線生成功能來(lái)完成一次人機(jī)交互寫(xiě)作,對(duì)這個(gè)軟件沒(méi)有做太多了解。這個(gè)遠(yuǎn)不如“創(chuàng)新工場(chǎng)”編寫(xiě)的程序好用,使用感并不好,更適合用來(lái)寫(xiě)網(wǎng)文水字?jǐn)?shù),很難產(chǎn)生真正的互動(dòng)。
我覺(jué)得很重要的兩點(diǎn)吧:一是,“彩云小夢(mèng)”不能像“創(chuàng)新工場(chǎng)”的寫(xiě)作軟件可以錄入作者的文本,讓生成的風(fēng)格貼近作者的敘事語(yǔ)言。二是,生成的本文很多時(shí)候與已有故事情節(jié)特別割裂,所以體驗(yàn)感不是很好。
我覺(jué)得人機(jī)交互寫(xiě)作是一個(gè)非常有趣的嘗試,但要說(shuō)人工智能取代作者還任重道遠(yuǎn)。人工智能更適合生成新聞通稿和報(bào)告,這些文本的措辭比較雷同,而且,可以完全避免敏感詞。
何平:《他殺》用的是“創(chuàng)新工場(chǎng)”嗎?
王元:《大成若缺》是“創(chuàng)新工場(chǎng)”寫(xiě)的,《他殺》是“彩云小夢(mèng)”寫(xiě)的。當(dāng)時(shí)“創(chuàng)新工場(chǎng)”的軟件服務(wù)費(fèi)到期不能用了,我就從網(wǎng)上找免費(fèi)的續(xù)寫(xiě)軟件。
何平:所以我覺(jué)得《他殺》里的“彩云小夢(mèng)”所寫(xiě)的恰恰證明了“彩云小夢(mèng)”的程式化。
王元:對(duì),玩一玩還行,正經(jīng)要靠這個(gè)寫(xiě)作不太夠用?;蛘哒f(shuō)沒(méi)有太多驚喜的發(fā)散。楸帆的《大有》的機(jī)器部分,我覺(jué)得比《他殺》要復(fù)雜一些。
何平:所以,這種寫(xiě)作基本上還是嘗試?!端麣ⅰ非∏∽C明目前寫(xiě)作軟件不可能完成文學(xué)性?xún)?nèi)容。
王元:相比文學(xué)性,我覺(jué)得創(chuàng)造性更適合一點(diǎn)。文學(xué)性的界定相對(duì)模糊。創(chuàng)造性就好說(shuō)了,就是說(shuō)給我們一個(gè)主題,或者已有的內(nèi)容,機(jī)器能制造出什么?
何平:網(wǎng)文的類(lèi)型化也許可以適應(yīng)這種寫(xiě)作軟件。機(jī)器能制造“文學(xué)”嗎?這正是我們要討論的話題。
王元:交互寫(xiě)作是一個(gè)人機(jī)合作和博弈的過(guò)程,得有碰撞才行。兩次寫(xiě)作感受下來(lái),碰撞都不夠,“彩云小夢(mèng)”比“創(chuàng)新工場(chǎng)”更差一些。對(duì),一個(gè)是網(wǎng)文,一個(gè)是通稿。就是類(lèi)型化比較明顯和簡(jiǎn)單的文體。這些相對(duì)來(lái)說(shuō),不用那么多創(chuàng)造性。
至此,我們可以看到當(dāng)下機(jī)器(AI)寫(xiě)作的大致邊界。介入其中的實(shí)踐者是清醒的,聒噪的往往是旁觀者。對(duì)我個(gè)人而言,也是一次技術(shù)啟蒙。想象這個(gè)專(zhuān)題之初,受前沿學(xué)者和大眾傳媒的蠱惑,我對(duì)機(jī)器寫(xiě)作(AI)抱有厚望,希望最終的文本不是“小冰”的詩(shī),而是完整的敘事單元,但最終實(shí)踐者陳楸帆和王元所展示的實(shí)踐成果,恰恰證明,到目前為止,基于算法和語(yǔ)料的機(jī)器寫(xiě)作(AI)并不能獨(dú)立完成“文學(xué)”文本,哪怕是小說(shuō)中的局部片段也不能完美地嵌入陳楸帆和王元的敘事中。而這種不完美,甚至是失敗,對(duì)比夸大“小冰”詩(shī)歌的完美和成功,正是這個(gè)專(zhuān)題的意義所在?!靶”痹?shī)歌的文學(xué)性則是詩(shī)歌文體本身曖昧模糊為闡釋者帶來(lái)了想象的空間。換句話說(shuō),“小冰”詩(shī)歌的文學(xué)性并不是“小冰”“寫(xiě)”出來(lái)的,而是闡釋者“說(shuō)”出來(lái)的。如果真要算文學(xué)成就,這個(gè)成就只能記在闡釋者的名下。但這不意味著世界范圍內(nèi)與機(jī)器寫(xiě)作相關(guān)的“賽博格”的廣泛討論和憂慮沒(méi)有意義,相反,初級(jí)的機(jī)器寫(xiě)作已經(jīng)引發(fā)了我們?nèi)绱硕嗟慕箲]和恐懼,如果科幻文學(xué)所描繪的賽博空間有一天真正兌現(xiàn),人類(lèi)準(zhǔn)備好了嗎?