人工智能的文學創(chuàng)作:實踐與問題
在阿蘭·圖靈(Alan Mathison Turing,1912—1954)、馬文·明斯基(Marvin Lee Minsky,1927—2016)和唐納德·米奇(Donald Michie,1923—2007)等先驅(qū)者的推動下,人工智能產(chǎn)業(yè)已經(jīng)開花結(jié)果,成為今天席卷全球的人工智能革命。人工智能正在對人類的核心領域形成挑戰(zhàn),因為它揭示了人類從事的許多工作同樣可以由機器出色地完成,甚至完成得更好。在文學領域,人工智能也引發(fā)了一場大地震,最新一代的ChatGPT展示出了不弱于人類的想象力和創(chuàng)造力,甚至能應人類要求,以極快的速度創(chuàng)作出高水準的文學作品。這不禁讓人想起德彪西的名言:藝術作品創(chuàng)造規(guī)則;規(guī)則不創(chuàng)造藝術作品。那么,人工智能是如何影響文學創(chuàng)作的?它思考和創(chuàng)作的密碼是什么?它能與莎士比亞競爭嗎?
人工智能寫作的代碼
通過與藝術互動,了解平凡和偉大的文學作品的區(qū)別,機器能不能學會文學創(chuàng)作,像我們?yōu)楹⒆訉懝适履菢泳哂袆?chuàng)造性,是作家和科學家一直在探索的課題。
1953年,羅爾德·達爾(Roald Dahl,1916—1990)在短篇故事集《出人意料的故事》(Tales of the Unexpected)中,講述了一個“偉大的自動語法師”的故事。主人公阿道夫·克尼普是一個計算機天才,但一直渴望成為一名作家。然而,他的努力毫無成效。后來他有了一個靈感:語言遵循語法規(guī)則,在原則上基本上是數(shù)學的。有了這樣的認識,他開始著手創(chuàng)造一個巨大的機器——偉大的自動語法分析器,這個機器能夠在15分鐘內(nèi)根據(jù)在世作家的作品寫出有獲獎潛質(zhì)的小說。有了這臺機器,克尼普大獲成功,并成立了一家出版公司,作為這種新的大規(guī)模生產(chǎn)文學作品的合法機構。他統(tǒng)治出版業(yè)的最后一步是收購真正的作者,并付錢讓他們不再寫作。故事的結(jié)尾處,敘述者透露,“在用英語出版的所有小說和故事中,有一半以上是由阿道夫·克尼普在大型自動語法儀上創(chuàng)作的”。
用算法生成文學作品并不新鮮。最早為計算機編寫的程序之一就是為了寫情書而開發(fā)的。在布萊切利公園破解了英格瑪密碼后,阿蘭·圖靈前往曼徹斯特大學,將他的想法付諸實踐,制造出多用途計算機的物理版本。在他的指導下,英國皇家學會計算實驗室很快就生產(chǎn)出了世界上第一臺商業(yè)化的通用電子計算機費蘭蒂·馬克1號,這臺計算機具有浪漫的一面,只要隨機輸入單詞,它就能生成情書。20世紀60年代,法國一些作家和數(shù)學家一起使用算法來生成新的寫作文本,這個團體自稱為烏利波(Oulipo),意思是潛在文學工作室(Ouvroir de littérature potentielle),創(chuàng)始人之一雷蒙德·奎諾(Raymond Queneau)認為,約束是創(chuàng)作的重要組成部分,盲目服從每一個沖動的靈感,實際上是一種奴役,而通過對寫作施加準數(shù)學約束,可以實現(xiàn)一種新的自由。該團體的早期項目集中在詩歌上。任何寫過詩的人都知道,對詩歌的約束往往會將其推向新的表達方式。
正如烏利波運動所表明的那樣,詩歌創(chuàng)作特別適合算法的方式。詩歌形式的約束性提供了一個模板,算法可以嘗試以一種有意義的方式來填充。例如,選中俳句或十四行詩的模式后,算法的任務就是選擇與模式相匹配的詞,同時想出某種形式的總體一致性。如果用押韻的模式來寫詩,押韻的詞語數(shù)據(jù)庫就非常有用。這就是20世紀80年代由未來學家雷·庫茲韋爾(Ray Kurzweil)創(chuàng)建的控制論詩人(cybernetic poet)背后的代碼原理。庫茲韋爾以雪萊和T. S.艾略特等有成就的詩人的作品來訓練控制論詩人。這首控制論詩人的俳句,就是根據(jù)濟慈的詩歌寫成的:“你打碎了我的靈魂。/永恒的汁液。/我嘴唇的精神。”還有一首融合了雪萊《西風頌》和艾略特《普魯弗洛克的情歌》風格的詩:“秋天女士的存在。/你,從那天起,不得不關心/現(xiàn)在教我們徹底的渺小和創(chuàng)造。/然后推測?/還有這個,還有我。/還有那未曾說出的話語,那未曾讀過的景象在海灣里的位置。/還有米開朗琪羅的后代?!痹趲炱濏f爾進行的圖靈測試中,控制論詩人創(chuàng)作的詩大多數(shù)時候都能騙過人類裁判,冒充人類寫的詩。
算法不僅在創(chuàng)作詩歌方面表現(xiàn)良好,在創(chuàng)作小說方面也有所嘗試。烏利波團隊成員約翰·萊斯庫爾(Jean Lescure)首先產(chǎn)生了將算法應用于現(xiàn)有文學作品的想法。這一想法為全國小說創(chuàng)作月(National Novel Writing Month)的編碼員所實現(xiàn)。他們邀請新銳作家在一個月內(nèi)敲出5萬字來。軟件開發(fā)人員和藝術家達柳斯·卡茲米(Darius Kazmi)當即決定,與其費盡心思每天寫出1667個字,不如在這個月里編寫出可以生成5萬字小說的代碼??ㄆ澝子?013年發(fā)布在社交平臺上的這一想法,開啟了一年一度的文學黑客馬拉松。許多參加全國小說創(chuàng)作月的編碼者都通過打亂現(xiàn)有文本來創(chuàng)作新的文本,如通過推特過濾《傲慢與偏見》(Pride and Prejudice);通過科幻算法解釋《白鯨》(Moby Dick);通過代碼對古斯塔夫斯·欣曼·米勒(Gustavus Hindman Miller)的《一萬個夢》(Ten Thousand Dreams)進行解釋和重新排序。但引起人們注意的是一部名為《探索者》(The Seeker)的作品。這部小說記錄了一個算法通過閱讀wikiHow上的不同文章,來了解人類如何運作的過程。該算法有一個元代碼:工作、掃描、想象、重復。在工作模式下,它搜索有關人類活動的概念;在掃描模式下,它從工作期間遇到的種子概念中搜索純文本“記憶”;然后,它使用在掃描模式中沒有識別的概念來想象種子概念周圍的“非視覺”?!短剿髡摺酚涗浟嗽撍惴ㄔ谔剿鱳ikiHow數(shù)據(jù)庫時從無知到理解的發(fā)現(xiàn)之旅。它查閱的第一個頁面是“如何讓一個女孩約你出去”。從這次掃描中發(fā)現(xiàn)了“傷害”這個詞,在“想象”模式下,它產(chǎn)生了一個關于“傷害”的超現(xiàn)實翻版。這就是算法生成文學作品的最終目標:讓我們了解一種新興的意識(如果它真的出現(xiàn)的話),以及它與我們?nèi)祟惖囊庾R有什么不同。因此,目前至少可以保守地估計,人工智能離創(chuàng)作偉大的文學作品還有一定距離,但在創(chuàng)作詩歌、暢銷商業(yè)書籍方面已經(jīng)相當成熟了。
人工智能寫作的升級:風格和自由
上述多數(shù)例子都依賴于自上而下的編程模式:按照一套明確的規(guī)則隨機填寫的詩歌模板;將經(jīng)典文本轉(zhuǎn)化為新作品的代碼;通過編程將數(shù)據(jù)轉(zhuǎn)化為故事的算法。這些程序其實并不允許有太多的自由。機器學習正在改變這一點?,F(xiàn)在,算法有可能把一個作者的整個作品拿出來,學習他們的寫作方式。通過建立一個關于作者如何用詞的概率圖,算法可以生成某個文本的延續(xù)。這就是預測性文本的工作方式。
這種利用機器學習來創(chuàng)作文學作品的想法得到了一個自稱為Botnik的團體的實踐。這個團體由作家杰米·布魯(Jamie Brew)和《紐約客》的前漫畫編輯鮑勃·曼考夫(Bob Mankoff)于2016年創(chuàng)立,現(xiàn)在是一個開放的作家社區(qū)。該團體根據(jù)對過去對話的數(shù)學分析,將《宋飛正傳》(Seinfeld)的劇本制作出了新的劇集,甚至還將七卷本的《哈利·波特》進行了改寫實驗。這種算法的做法是:在已存在的文本基礎上,提供18個詞供你選擇。這給了創(chuàng)作者極大的自由,可以任意發(fā)揮自己的想象力。因為這種算法在創(chuàng)建文本時仍需人類的參與,而且它也只能在捕捉作家風格的基礎上做出局部的改變,因此,它暫時還無法取代小說的人類創(chuàng)作者。
講故事的算法Scheherazade-IF成立于2012年,由馬克·里德爾和他在佐治亞理工學院的同事共同開發(fā)。它的目標是在可能的故事迷宮中引導出一條更連貫的路徑。該算法的名字來自《一千零一夜》中的蘇丹新娘謝赫拉莎德(Scheherazade),她通過夜以繼日地想出新的故事來吸引和分散殺人的丈夫的注意力,從而挽救了自己的生命;IF則代表“互動小說”(interactive fiction)。另一個在生成童話方面取得成功的算法是PropperWryte。它的童話算法是根據(jù)結(jié)構主義者弗拉基米爾·普羅普(Vladimir Propp)在1928年確定的俄羅斯民間故事31種敘事原型來進行訓練的。
ChatGPT創(chuàng)作功能和人工智能的缺陷
2022年,美國人工智能研究公司OpenAI開發(fā)了聊天機器人ChatGPT,代表著生成性人工智能的最新發(fā)展。它通過聊天(對話)的方式進行工作,即用戶只需在ChatGPT界面上輸入指令,可以是一個問題,一個任務,或者是隨意的聊天。ChatGPT系統(tǒng)分析輸入的指令,使用機器學習算法來生成回應,然后以文本的形式返回給用戶,用戶可再次輸入文本,ChatGPT系統(tǒng)再次進行分析和回應,這個過程可一直持續(xù)到對話結(jié)束。正是基于以上這些特性,ChatGPT的出現(xiàn)讓很多人擔憂文字生產(chǎn)者即將被淘汰。ChatGPT能寫詩,也能創(chuàng)作小說、劇本、隨筆、評論等,雖然創(chuàng)作出來的作品稍顯程序化,但大體上還是能滿足創(chuàng)作規(guī)范和要求的。
近日,筆者專門請在英國高校任教的朋友幫忙測試了ChatGPT的創(chuàng)作功能。例一:對ChatGPT輸入指令:以春、江、花、月、夜這五種事物,創(chuàng)作一首七言律詩。結(jié)果如下:“春風婉轉(zhuǎn)吹江岸,花開盛放映月寒。夜色漸深思悠遠,水流漣漪夢逍遙。”此詩雖然難以和唐代詩人張若虛的名篇《春江花月夜》相媲美,但至少在形式和韻味上體現(xiàn)出了唐詩的特色。例二:對ChatGPT輸入指令:請寫一段莎士比亞風格的獨白。結(jié)果如下:“生命是如此短暫,我不知道自己還能留在這個世界上多久。也許,我應該像一只孤鳥一樣,飛往遠方,去尋找自己的歸宿。但是,我害怕孤獨,我害怕被遺棄,我害怕面對那個孤獨的夜晚。啊,人生如夢,一切都是虛幻,卻又那么真實。我不知道該如何面對這個世界,但我知道,我必須繼續(xù)前行,即使一切都已經(jīng)毀滅。”這是不是有點莎士比亞的味道?
不過,ChatGPT的創(chuàng)作也有缺陷,如對數(shù)據(jù)資源的依賴、創(chuàng)造虛假信息、有立場偏見等。而且ChatGPT人機交互的模式也決定了人是主動提問的一方,而機器只是生成答案;機器也許可以模仿人類的自然語言,卻無法生成人類的自我和意識。自我和意識的概念與人類的創(chuàng)造力密不可分。沒有自我和意識,就沒有創(chuàng)造力。就是說,在機器變得有意識之前,它只是一種擴展人類創(chuàng)造力的工具。人工智能是否最終變得有意識,真正具有創(chuàng)造性?它的意識會和我們的意識一樣嗎?這些都是需要我們思考的問題。
或許,人類的命運將取決于它與有意識的機器的相互理解。但是,正如維特根斯坦所說,如果一只獅子能說話,我們可能不會理解它,這同樣適用于機器。如果它們變得有意識,人類也不太可能理解。最終,將是它們的繪畫、音樂、小說等創(chuàng)造性的產(chǎn)出,甚至是它們的數(shù)學,讓我們有機會破解機器的密碼、感受到機器的感覺。
目前,機器的所有創(chuàng)造力都是由人類代碼發(fā)起和驅(qū)動的。除了我們讓它們做的事情,沒有看到機器主動地表達自己。人類用來想象和創(chuàng)新的創(chuàng)造力是人工智能永遠無法觸及的能力。而且,我們還需要看到,目前人類創(chuàng)造算法的動力,在大多數(shù)情況下不是由擴展藝術創(chuàng)作的愿望,而是由產(chǎn)業(yè)和公司的利潤所推動。關于人工智能有大量的炒作,對其功能也有夸張夸大的成分。
(作者系《世界文學》編輯)