GPT時代的創(chuàng)意寫作
AI幫我擊敗莫言?
最開始的時候,排名第一的是莫言發(fā)表在《十月》雜志上的小說《等待摩西》。可到了最后一天,《小說界》選送了我與AI共同創(chuàng)作的《出神狀態(tài)》。結(jié)果在AI評委的眼中,這篇小說以0.0001分的優(yōu)勢反超登頂。就這樣,我成了“打敗”莫言的男人。
2017年,我與前Google同事工程師王詠剛一起開始一場寫作實(shí)驗(yàn),用CNN(Convolutional Neural Networks,卷積神經(jīng)網(wǎng)絡(luò))與LSTM(Long Short-Term Memory Network,即長短期記憶網(wǎng)絡(luò))訓(xùn)練能夠模仿人類創(chuàng)意寫作的算法模型。機(jī)器寫作并不是新鮮事,早在上世紀(jì)90年代,自動化程序便能以拼貼組合的統(tǒng)計學(xué)方式寫詩,抓取實(shí)時資訊生成結(jié)構(gòu)性新聞等等,但是作為高度復(fù)雜的敘事文本——小說所要求的邏輯性、自然語言理解能力,以及對于人物、情節(jié)、結(jié)構(gòu)、文法的不同層面的要求,之前的AI尚未達(dá)到這樣的能力。
我們用CNN對小說文本進(jìn)行特征提取,然后將輸出的特征圖譜(feature map)映射為序列矢量輸入到LSTM網(wǎng)絡(luò),便可訓(xùn)練出能夠模仿人類寫作的算法模型,然后通過調(diào)整參數(shù),也就是所謂的fine tuning,讓它寫出來的東西盡量接近我們現(xiàn)有對于文學(xué)的理解和審美。學(xué)習(xí)了上百萬字我的作品之后,AI程序“陳楸帆2.0”可以通過輸入關(guān)鍵詞和主語,來自動生成每次大約幾十到一百字以內(nèi)的段落,我與它共同創(chuàng)作的作品《出神狀態(tài)》,甚至還贏得了一座由AI評委評出的獎杯。
最開始的時候,排名第一的是莫言發(fā)表在《十月》雜志上的小說《等待摩西》。大家覺得算法挺靠譜,諾獎得主得獎,那還能有錯?可到了最后一天,《小說界》選送了我與AI共同創(chuàng)作的《出神狀態(tài)》?!冻錾駹顟B(tài)》的靈感來源是智利作家羅貝托·波拉尼奧的短篇小說集《地球上最后的夜晚》,故事記錄了主人公去上海圖書館還書途中的見聞思想,深入探究通訊中斷與緊急狀態(tài)下的人與社會。結(jié)果在AI評委的眼中,這篇小說以0.0001分的優(yōu)勢反超登頂。就這樣,我成了“打敗”莫言的男人。這次比科幻還要更科幻的驚喜也讓我醒覺到,未來的機(jī)器將更深入地卷入人類創(chuàng)作中,未來的內(nèi)容版圖也會變得更加復(fù)雜、曖昧而有趣。
巧合的是,2017年也正是Google發(fā)布重注意力機(jī)制與Transformer算法,并開啟了機(jī)器學(xué)習(xí)在自然語言處理(NLP, Natural Language Process)領(lǐng)域狂飆突進(jìn)的歷史性時刻。之后,我們見證了OpenAI推出的GPT(Generative Pre-Trained Transformer)模型不斷進(jìn)化,挑戰(zhàn)人類對于智能、意識以及創(chuàng)造力的理解邊界。
如何實(shí)現(xiàn)人機(jī)共舞
未來的作品,讀者或許根本分辨不出到底哪部分是人寫的、哪部分是AI寫的,因?yàn)檫@里包括非常多不同層次的修改和潤色。AI提供給我們非常強(qiáng)大的工具,創(chuàng)意的工具、寫作的工具、設(shè)計的工具,同時也讓我們思考到底原創(chuàng)性的邊界在哪里,人類的主觀能動性在哪里,包括知識產(chǎn)權(quán),包括怎么尊重被采集數(shù)據(jù)的作者,他們是否也擁有一定的權(quán)利。
2022年11月30日,在我的生日這天,OpenAI推出基于GPT-3.5的ChatGPT——一個能夠回答問題、寫作小說、論文甚至代碼生成的對話式AI,在全球掀起現(xiàn)象級熱潮。它從0到獲得100萬用戶只用了不到5天,而Twitter用了兩年,F(xiàn)acebook用了300天,Instagram用了75天。相比于之前的GPT-3模型,ChatGPT增加了“依據(jù)人類反饋進(jìn)行強(qiáng)化學(xué)習(xí)”(RLHF, Reinforcement Learning with Human Feedback)的概念,能夠更好地理解文本更深層次的復(fù)雜含義,無論是連續(xù)流暢的對話,還是對于錯誤想法的糾正,甚至能夠質(zhì)疑不合理前提或者干脆拒絕惡意提問,足以讓對話者產(chǎn)生“以假亂真”的幻覺。
如果說2017年的“陳楸帆2.0”語言模型還是混沌不堪的“隨機(jī)鸚鵡”,簡單的人稱都搞不清楚,人物關(guān)系里面誰是誰、彼此的聯(lián)系是什么,寫著寫著它就搞混或者顛倒了。但到了GPT-3.5和ChatGPT,它的寫作能力已經(jīng)超乎想象。在一個序列里,你給它一個環(huán)境或背景去做續(xù)寫,你能看到它前后的連貫性保持得非常好,甚至還能給出一些你意想不到的轉(zhuǎn)折,有一些甚至令我覺得帶有更深層的文學(xué)意味。
現(xiàn)在我花非常多的時間探索怎么跟ChatGPT合作,這肯定不是我們原來想象的簡單粗暴的“復(fù)制粘貼”的過程,它是一個非常復(fù)雜的人跟機(jī)器共生的、共同寫作的過程。在這個過程中我會對自己的寫作有非常多的反思,它讓你理解到你作為人類的邊界、慣性在哪里。
我會用它來進(jìn)行頭腦風(fēng)暴,或者生成一些對某個陌生場景非常細(xì)致的描寫,甚至把一段話輸入進(jìn)去,讓它調(diào)節(jié)整體風(fēng)格,變得詼諧一點(diǎn),或者嚴(yán)肅一點(diǎn),也可以模仿某個作家的寫作風(fēng)格。幾秒鐘之內(nèi),AI就可以給你生成一段接近你要求的內(nèi)容。但這是一個反復(fù)迭代的寫作過程,它跟我們傳統(tǒng)的、人文主義的寫作是完全不一樣的,我覺得這非常有意思,它會在可見的未來改變很多領(lǐng)域,寫作也會是其中之一。
最近我正在寫一個兒童科幻小說,寫一個非常懂AI的城市女孩去一個原始村落,遇到另一個少數(shù)民族女孩的故事。我會讓ChatGPT幫我描繪一下未來的AI城市是什么樣的,這個女孩一天的生活場景是怎么樣的,它寫出來的非常像《小靈通漫游未來》,我把文本再回輸進(jìn)去,要求它再增加一點(diǎn)文學(xué)性,再增加一點(diǎn)哲學(xué)的思考、一些生動的比喻,它就會再修改。我甚至曾經(jīng)要求它用科馬克·麥卡錫的筆觸來寫一個海嘯的場景,出來的文字不一定全都能用,但能給你一些感覺。
它也會生成一些我原來在大綱里沒有涉及的情節(jié),比如兩個女孩第一次見面,會有一些防備心理。那我可以順著這個防備心理的線索再去發(fā)展。和ChatGPT一起寫作就像一個開放的寫作實(shí)驗(yàn),你不需要做任何預(yù)設(shè),由意象展開成場景,再加上人物,借由ChatGPT,人物和場景之間發(fā)生的故事就不在你預(yù)先的設(shè)計范圍內(nèi)了。你就跟著它走,看它怎么把每個機(jī)器生成的模塊結(jié)合在一起,最后用你人類的審美、文學(xué)性的判斷標(biāo)準(zhǔn)再做統(tǒng)一修改。未來的作品,讀者或許根本分辨不出到底哪部分是人寫的、哪部分是AI寫的,因?yàn)檫@里包括非常多不同層次的修改和潤色。
機(jī)器所理解的文學(xué)性、哲學(xué)性,也是基于語言模型,抽象出很多文學(xué)作品里所謂的文學(xué)性,有時候會過度修飾,比如你讓它加點(diǎn)比喻,它恨不得每句話都來個比喻,你就知道了,機(jī)器把握不好這個平衡,而文學(xué)性的微妙恰恰在于取舍,在于留白,在說與不說之間,這部分機(jī)器還沒有那么智能。它對情節(jié)靈活性的掌握,來源于已經(jīng)學(xué)習(xí)了非常多歷史上的文學(xué)套路,讓它能跳脫出人類作家的慣性。人類寫作很多時候還是會受限于以前的創(chuàng)作路徑,但AI可以從整個人類的數(shù)據(jù)庫里抽象出非常多的原型,無限多地在原型里做排列組合,去生成無限多的分支結(jié)構(gòu)。
我也嘗試過用ChatGPT去翻譯,真的比我以前用過所有的翻譯軟件都好。它的流暢程度達(dá)到了一個新的高度。但我覺得有一些更微妙的東西,包括文化上的符號、引用的歷史典故等等,包括有時候有一些多義性的處理,AI還做不到人類譯者的水平。
甚至包括封面和插畫也可以讓AI參與創(chuàng)作。我馬上要出的一本小說集《贏家圣地》,封面就是我用另一個AI工具M(jìn)idjourney生成的。當(dāng)時我看了出版社請?jiān)O(shè)計師做的方案,覺得跟我想象的還是有點(diǎn)距離,就想自己來,在很短時間內(nèi)生成了數(shù)十個版本,篩選之后,讓設(shè)計師加上字體——以后可能連這一步都可以由AI代勞。
五年的時間,AI就已經(jīng)進(jìn)化成了現(xiàn)在這樣。技術(shù)的進(jìn)步確實(shí)遠(yuǎn)遠(yuǎn)超過我們的預(yù)期,這一點(diǎn)是最可怕的。它的進(jìn)步不是我們習(xí)慣的線性增長,而是一個指數(shù)性的增長,而且這個增長才剛剛開始。AI提供給我們非常強(qiáng)大的工具,創(chuàng)意的工具、寫作的工具、設(shè)計的工具,同時也讓我們思考到底原創(chuàng)性的邊界在哪里,人類的主觀能動性在哪里,包括知識產(chǎn)權(quán),包括怎么尊重被采集數(shù)據(jù)的作者,他們是否也擁有一定的權(quán)利。所有這些問題都在一團(tuán)迷霧當(dāng)中尚待被理清和討論。
我們是否將迎來
真正意義上的“文學(xué)已死”
如果科技真的到了我們無法分辨人類與機(jī)器的地步,哪怕只是語言層面上,都足以顛覆絕大部分行業(yè)及社會生活的面貌,因?yàn)槿祟悷o法離開語言進(jìn)行思考、表達(dá)與交流。許多人類的職業(yè)會被替代,企業(yè)會高度自動化。機(jī)器能夠無窮盡地生產(chǎn)出供人類娛樂的個性化內(nèi)容,不輸歷史上任何經(jīng)典的文學(xué)、影像或游戲。我們是否將迎來真正意義上的“文學(xué)已死”?
用AI寫作之后,我有一個非常明顯的感覺,就是人也好,機(jī)器也好,創(chuàng)作的過程其實(shí)沒有太大區(qū)別。
我們寫作、思考、交流,表達(dá)全都是用語言,那創(chuàng)作的本質(zhì)到底是什么?可能就是把你讀過的東西、你的體驗(yàn)、你的思考,重新排列組合成一種新的文字組合形式并表達(dá)出來,而機(jī)器是用一種數(shù)學(xué)模型來做它的排列組合。人可能要更加復(fù)雜,用大腦神經(jīng)結(jié)合情感體驗(yàn)等等。但我覺得從根本上來講,這兩者的生成過程是非常相似的。就像人的寫作很多時候也是從模仿開始,只不過人的大腦的“算法”是一個更內(nèi)隱的過程,更像一個黑盒子,會被賦予一種神秘感,一種類似于靈魂的光暈,就是本雅明所說的Aura。而當(dāng)我們真的試圖去理解GPT到底怎么建出來的,你會發(fā)現(xiàn)非常多工程學(xué)上的具體實(shí)施細(xì)節(jié),我們都不知道它的原理是什么,只是通過非常多的試錯來達(dá)成。所以,AI跟人的大腦一樣,我們都不知道它的底層邏輯是什么,都是黑匣子,只不過一個是碳基、一個是硅基。
當(dāng)你看到一個機(jī)器,它用這么簡單粗暴的訓(xùn)練方式,也能寫出讓你覺得“有一些東西”的文字時,就會開始回過頭想,那么多作家、畫家、詩人,這些藝術(shù)創(chuàng)作過程里到底有什么人類的獨(dú)特性?我現(xiàn)在的答案是,可能并沒有那么的獨(dú)特,也沒有那么的不可替代。
隨著AI不斷以這種指數(shù)級的速度自我進(jìn)化、自我迭代,接下來,非常多人類本體的定義、人本主義的基礎(chǔ)會被動搖,這是一個更深刻的東西,可能現(xiàn)在還沒有被討論得特別充分。我觀察到人文學(xué)者,包括一些傳統(tǒng)作家,他們面對新的事物還是比較保守,甚至很多會有一種拒斥心理。他會覺得這東西無非就是排列、組合、拼貼,從那么多東西里這兒抄一點(diǎn)、那兒抄一點(diǎn),但我覺得這個東西可能沒有他們想象的那么簡單。原來大家會質(zhì)疑AI無法創(chuàng)造新的東西,但現(xiàn)在意識到,人類創(chuàng)造的東西,很多也是通過原有的知識經(jīng)驗(yàn)打碎重組,放到新的場景里去運(yùn)用。
對于我來說,現(xiàn)在寫作中最花力氣的地方反而是在最不花力氣的地方。這么說可能有點(diǎn)玄,它不在收集信息、理解科技、編排人物與拿捏故事原型,而是在于不經(jīng)過理性思考判斷,從潛意識層面涌現(xiàn)的直覺,也就是“非計算性”的部分。你無法控制它的到來,很多時候只能等待,只能祈禱。這或許是AI尚未通過語言模型學(xué)會的部分。
最新的ChatGPT及各種變體已經(jīng)能夠以超乎想象的流暢程度與人類進(jìn)行對話以及進(jìn)行特定領(lǐng)域的寫作,比如財經(jīng)新聞、體育報道、法律文書、論文摘要……甚至模仿歷史上不同的作家風(fēng)格進(jìn)行創(chuàng)作。盡管生成內(nèi)容的質(zhì)量還不夠穩(wěn)定,且時常會犯一些常識性的錯誤,但目前也有科學(xué)家嘗試教會機(jī)器理解我們所身處的“世界模型”??梢哉f,我們已經(jīng)生活在這樣的科幻現(xiàn)實(shí)中。如果科技真的到了我們無法分辨人類與機(jī)器的地步,哪怕只是語言層面上,都足以顛覆絕大部分行業(yè)及社會生活的面貌,因?yàn)槿祟悷o法離開語言進(jìn)行思考、表達(dá)與交流。許多人類的職業(yè)會被替代,企業(yè)會高度自動化。新一代兒童會更習(xí)慣與機(jī)器進(jìn)行交流,相比之下,人類的交流笨拙而低效,充滿了誤解。機(jī)器能夠無窮盡地生產(chǎn)出供人類娛樂的個性化內(nèi)容,不輸歷史上任何經(jīng)典的文學(xué)、影像或游戲。我們是否將迎來真正意義上的“文學(xué)已死”?
發(fā)展人工智能,也是在認(rèn)識人類自己,最后你也會去思考智能的本質(zhì)是什么,意識的本質(zhì)是什么,存在的本質(zhì)是什么,它是否也是由語言、符號來定義的,它是否也是從一個混沌海量的數(shù)據(jù)里面,涌現(xiàn)出來的一種秩序感?而最后的最后,我們不得不質(zhì)疑意識與智能的本質(zhì),因?yàn)閺谋碚魃弦褵o法區(qū)分人與機(jī)器,那么,二者的界限在哪里?
如果從人類中心論的角度,未來無疑不站在我們這一邊。但如果將機(jī)器也視為我們文明延續(xù)的產(chǎn)物,那么我希望,新的智能生命能夠建立起更可持續(xù)發(fā)展的文明形態(tài),并平等地尊重所有物種,包括非生命的環(huán)境本身。按照卡達(dá)肖夫指數(shù)(Kardashev Scale)對文明的分類,人類連全面利用行星級能源的一級文明都沒有達(dá)到,我們沒有任何理由自大甚至自戀,而應(yīng)該以開放心態(tài)接受人類作為通往更高級文明形態(tài)(在詹姆斯·拉夫洛克看來是純硅基生命的“新星世”)過渡期的命運(yùn)。
彼得·沃茨的《盲視》以及最新一季《愛死機(jī)》里面的“蟲群”,其實(shí)說的就是這樣的無意識集群智能文明,自我意識對于它們來說是一種低效無用的冗余功能,就像盲腸一樣。但我同樣認(rèn)為,在那樣一種文明形態(tài)中會有不同水平的意識涌現(xiàn),也許是宇宙級別的分布式意識,它成為塑造時空與不同維度現(xiàn)實(shí)的基礎(chǔ),而我們現(xiàn)在人類所謂的意識與文明,只不過是其中渺如煙塵的分型與投射。但仍然,人類有自己的命運(yùn),有自己的旅程,就像古希臘神話《奧德賽》一樣,奧德修斯歷經(jīng)磨難,戰(zhàn)勝了巨人與怪物,最后衣錦回鄉(xiāng),但他已經(jīng)不再是原來的自己,他回到的也并不是原來的故鄉(xiāng)。他領(lǐng)悟到更大的使命與歸屬,那種崇高感或許是跨越了一切物種與文明界限的終極意義。
而文學(xué),毫無疑問正是承載這種文明崇高感與人類鄉(xiāng)愁的意識織體。它將伴隨著我們一直航向歷史的盡頭,無論掌舵者究竟是人類,還是機(jī)器。