AI創(chuàng)作出百萬字小說,“人人皆能寫長篇”不再是夢 ——華東師范大學(xué)教授王峰談《天命使徒》
編者按:
2024年6月22日,本版刊發(fā)一組文章,在理論層面從不同維度探討了人工智能(AI)寫作帶給網(wǎng)絡(luò)文學(xué)的影響。事實上,國內(nèi)已有成功使用人工智能創(chuàng)作網(wǎng)絡(luò)小說的實踐:《天命使徒》長達(dá)100萬字,使人工智能創(chuàng)作長篇文學(xué)成為現(xiàn)實;《機(jī)憶之地》匿名參加科幻文學(xué)大賽,在評委不知情的情況下獲二等獎。本期繼續(xù)圍繞人工智能寫作與網(wǎng)絡(luò)文學(xué)的話題進(jìn)行討論,兩篇人工智能小說的創(chuàng)作談表達(dá)了未來人工智能網(wǎng)絡(luò)文學(xué)創(chuàng)作的豐富前景,而青年評論家康春華則從兩篇小說的文本出發(fā),指出了人工智能小說創(chuàng)作所面臨的難以逾越的難關(guān)和障礙。
人工智能在短篇文學(xué)尤其是詩歌創(chuàng)作上有所建樹,但超長文本創(chuàng)作一直未能實現(xiàn)。這幾年人工智能技術(shù)突飛猛進(jìn)地迭代,人工智能文學(xué)創(chuàng)作也在不斷打開新的可能。
近日,華東師范大學(xué)教授王峰團(tuán)隊取得一項重大突破——他們成功創(chuàng)作出一部百萬字的人工智能小說《天命使徒》,標(biāo)志著人工智能在長篇文學(xué)創(chuàng)作方面邁出重要一步。
《天命使徒》采用“國內(nèi)人工智能大語言模型(以下簡稱“大模型”)+提示詞工程+人工后期潤色”的方式完成,整部小說超過110萬字。一個勤奮的網(wǎng)絡(luò)作家寫作如此篇幅的小說大約需要一年,而人工智能機(jī)寫僅用了一個半月。王峰團(tuán)隊的下一個目標(biāo)是將這一時間縮短為兩至三周。
“文學(xué)正經(jīng)歷著飛速的變化。我們在暢想未來的時候,很可能也正在見證某些奇跡的發(fā)生。”王峰如是表達(dá)著人工智能網(wǎng)絡(luò)文學(xué)創(chuàng)作的前景。
記者:《天命使徒》講了什么樣的故事?它是怎樣被創(chuàng)作出來的?
王峰:《天命使徒》描寫了修仙者周青不斷發(fā)現(xiàn)自我,在黑暗和光明兩極間搖擺,最后犧牲自我,不再做孤獨的守護(hù)者,而要做一個與所愛之人共享平凡日常的普通人的故事。人工智能小說,不是全部脫離人,而是人機(jī)協(xié)作,整體結(jié)構(gòu)由人決定,細(xì)節(jié)描寫由人工智能完成,這是一種新的創(chuàng)意寫作方式。在創(chuàng)作時,我們首先對網(wǎng)絡(luò)小說的結(jié)構(gòu)進(jìn)行了深入研究,分析情節(jié)脈絡(luò),撰寫大量提示詞,然后在人工智能大模型中批量生成內(nèi)容,形成整體線索連貫的長篇小說。后期通過人工介入,對大模型生成的小說進(jìn)行修改,刪除重復(fù)、累贅的部分,為情節(jié)跳躍的部分撰寫連接語句,最終打磨成型。
記者:小說呈現(xiàn)了什么樣的風(fēng)格,是否實現(xiàn)了預(yù)期效果?
王峰:小說整體線索能夠保持一致,語言具備了一定的文學(xué)性,比如開頭這樣寫道:“他緊張地握緊了手中的武器,指尖在冰冷的金屬中尋找一絲安慰。他的心跳如同在狂風(fēng)中的鼓點,敲擊著他的胸膛。儀式即將開始,他需要做的,就是走向山谷中心的火光處?!钡牵诩?xì)節(jié)方面還存在大量跳躍和重復(fù)之處,需要人工修改。比如,大模型對每個提示詞的生成內(nèi)容都是有始有終的,會為每次生成內(nèi)容添加一個結(jié)尾,我們稱之為“光明的尾巴”,這個就需要后期調(diào)整。在語言上,人工智能小說表現(xiàn)出一種愣呼呼的風(fēng)格,不少大模型生成的作品都是論文腔,我們只能不斷微調(diào)本地大模型來提升表達(dá)水平。下一步我們會訓(xùn)練出一個專注于文學(xué)(小說)創(chuàng)作的大模型,讓“人人皆可寫作長篇”成為可能。
記者:人工智能會根據(jù)提示詞順利生成適合的內(nèi)容嗎?創(chuàng)作過程中做了哪些調(diào)整?
王峰:提示詞被業(yè)界親切地稱為“耳語者”,要提供情節(jié)、環(huán)境、人物情緒及事件等信息。一開始,我們希望大模型能夠生成符合我們期望的文本結(jié)果,但現(xiàn)實是大模型的生成結(jié)果往往顯得有些“失控”。我們努力進(jìn)行控制,但很快發(fā)現(xiàn),幾乎所有的控制都無法完成任務(wù)。提示詞長了不行,短了也不行。將提示詞輸入大模型時,每次生成的內(nèi)容都不一樣,如果重復(fù)輸入六七次,所生成的內(nèi)容就開始重復(fù)出現(xiàn)了,這讓我們感到有些手足無措。后來我們領(lǐng)悟到:既然無法完全控制大模型的輸出,何苦一味追求符合自己完美構(gòu)想的結(jié)果呢?這或許正是大模型本身的特點?!笆Э亍辈皇撬娜秉c,而是它的變量,試圖讓它按照我們的期望產(chǎn)生完美的文本結(jié)果幾乎是不可能的。所以,我們不斷調(diào)整提示詞內(nèi)容,只為小說提供一個大致走向,使情節(jié)保持連續(xù)性,而具體故事細(xì)節(jié)就交給了大模型。
記者:為什么說超長文本輸出仍是人工智能的局限?未來的人工智能小說創(chuàng)作將是什么樣的圖景?
王峰:目前,人工智能創(chuàng)作仍是一問一答的形式,無法實現(xiàn)持續(xù)輸出,我們要源源不斷提供提示詞。對每個提示詞,國內(nèi)大模型平均會生成500字的內(nèi)容,所以創(chuàng)作100萬字的小說,就要提供2000個提示詞。其實,大模型的長文本處理能力主要體現(xiàn)在其閱讀理解能力上,它首先要理解我們的創(chuàng)作意圖,然后生成連貫性的語句。
技術(shù)是快速迭代的,隨著更多大模型的研發(fā)應(yīng)用,超長文本輸出和人工智能閱讀理解能力將不是問題。舉個例子說,我大約在三年前開始組建團(tuán)隊,探索智能寫作的方法。當(dāng)時,邀請了計算機(jī)、文學(xué)、語言、哲學(xué)、古籍、數(shù)學(xué)、地理等多個領(lǐng)域的研究者共同探討,基于當(dāng)時的大模型技術(shù)制定了創(chuàng)作方案。但是,2022年底,國外某個大模型的換代升級給我們先前的設(shè)計帶來巨大沖擊,曾經(jīng)的很多問題不再是問題。眼下人工智能技術(shù)如龍卷風(fēng)般迭代,我相信現(xiàn)在的很多困惑和難題將來都會迎刃而解。
目前,人工智能在文藝創(chuàng)作上主要影響網(wǎng)絡(luò)文學(xué),因為網(wǎng)絡(luò)文學(xué)寫作模式化、類型化比較強(qiáng),寫作者可以借助大模型的幫助進(jìn)行各個部分的細(xì)節(jié)寫作,比如人物生成、物品生成、人物關(guān)系圖譜生成、段落寫作等。這些功能都已經(jīng)實現(xiàn),只是質(zhì)量還不高,留有相當(dāng)大的探索空間。
記者:很多人擔(dān)心人工智能創(chuàng)作的版權(quán)問題。您怎么看待這個問題?
王峰:關(guān)于人工智能創(chuàng)作的版權(quán)問題,業(yè)界正在探討。我個人理解大致可分為兩個方面:一是訓(xùn)練語料的問題,二是生成產(chǎn)品的歸屬問題。前者目前是最主要的瓶頸,首先我們需要獲得公開語料,并對其進(jìn)行進(jìn)一步加工,這在研究范圍內(nèi)是允許的。如果進(jìn)行商業(yè)化運作,就存在備案等問題,我認(rèn)為一定要尋找大模型發(fā)展與語料權(quán)利保護(hù)的平衡點。至于后一個問題,生成的產(chǎn)品著作權(quán)到底是部分歸智能平臺部分歸個人,還是全部歸個人,要看具體的約定。這些都是未來智能寫作無法避開的問題,需要研究者和實踐者共同探討。