文學大數(shù)據(jù)與當代文學研究范式轉(zhuǎn)型
中國當代文學研究范式轉(zhuǎn)型是一個常談常新的話題。從當代文學發(fā)生之日起,學術界就面臨如何闡釋當代文學的問題,其中就涉及文學研究的方法和范式等內(nèi)容。而且,隨著文學社會語境、研究對象和訴求的變化,文學研究范式轉(zhuǎn)型問題也越發(fā)突出和明顯,通常顯現(xiàn)在文學研究方法論爭中,通過論爭確立某一歷史階段通約有效的研究方法,并在長期實踐中形成主流文學研究范式。從這一角度看,當代文學研究范式轉(zhuǎn)型與當代文學演進和當代文學研究史變遷緊密關聯(lián)。
當代文學與古代文學、近現(xiàn)代文學的本質(zhì)差異之一是它的“當代”屬性。“當代”的繁復多變和時刻在場,使當代文學研究需要直面最新的文學現(xiàn)場,成為“當前文學思潮、作品和現(xiàn)象最‘理想’的‘批評者’”,并運用“認同式”“討論式”批評(1)契合當代文學的“當代性”。這預設了當代文學研究范式的不穩(wěn)定,沒有任何一種長久不變的研究范式能夠有效應對不斷新變的文學現(xiàn)場。這也使當代文學研究顯現(xiàn)出強烈的危機感。當無法“對嶄新的文學實踐做出辨認、預判,疾言厲色或為之鼓與呼”時,(2)勢必對已有研究范式做出修正和調(diào)整,甚至進行顛覆和重構(gòu),尋找新的研究范式替代。只有如此,才能保證文學研究的有效闡釋力和公信力。因此,當代文學研究本身就包含對自身轉(zhuǎn)型問題的持續(xù)探索。
從中國當代文學研究史來看,大體形成了文學政治研究、文學審美研究、文學文化研究和文學社會研究幾種主流研究范式。它們與特定歷史語境和時代訴求密切相關。大致對應20世紀50—70年代、80年代、90年代和2000年以來幾個歷史階段。每種研究范式在相應的歷史階段都具有優(yōu)先于其他研究范式的闡釋權(quán)且處于流轉(zhuǎn)狀態(tài)。這說明任何一種文學研究范式都有其邊界和限度,當新的社會語境、新的文學現(xiàn)象出現(xiàn)時,必然產(chǎn)生新的研究范式?;蛘哒f,文學研究范式轉(zhuǎn)型問題是當代文學研究史自身生發(fā)的問題,一種新的文學研究范式的形成過程也是其他文學研究范式的式微過程??梢哉f,“學術范式的轉(zhuǎn)換和形成是一個相當復雜的過程,一方面出自社會文化轉(zhuǎn)型的需要,另方面有學術本身的發(fā)展特點”。(3)
因此,想辨識清楚當代文學研究范式轉(zhuǎn)型問題,就需要闡明與此相關的文學新語境和新現(xiàn)象,以及原有文學研究范式的限度和新的文學研究范式的適用性問題。在此意義上,我們需要解釋清楚文學研究在當下發(fā)生了怎樣的新變化,文學研究方法和思維發(fā)生了怎樣的新轉(zhuǎn)變,出現(xiàn)了哪些新的文學研究實踐路徑,生產(chǎn)了哪些新知識等問題。
一、大數(shù)據(jù)時代與文學大數(shù)據(jù)
1980年,美國社會學家阿爾文·托夫勒在著作《第三次浪潮》中闡述了科技發(fā)展在農(nóng)業(yè)社會到工業(yè)社會轉(zhuǎn)型過程中起到的關鍵作用,并且預測電子科技進步將引發(fā)“第三次浪潮文明”:人類將由工業(yè)社會進入信息社會,“整個文明和制度、技術、文化都在變化的浪潮下日趨分裂”。(4)尤其是大數(shù)據(jù)技術在日常生活諸多方面的廣泛應用,將推動大數(shù)據(jù)社會的形成。當下,隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和社交網(wǎng)絡的快速發(fā)展,阿爾文·托夫勒的預測開始變?yōu)楝F(xiàn)實,“根據(jù)國際權(quán)威機構(gòu)Statista的統(tǒng)計和預測,2020年全球數(shù)據(jù)產(chǎn)生量預計達到47ZB,而到2035年,這一數(shù)字將達到2142ZB,全球數(shù)據(jù)量即將迎來更大規(guī)模的爆發(fā)”。(5)
事實上,系統(tǒng)認識和理解大數(shù)據(jù)最先從學術界開始?!蹲匀弧贰犊茖W》《ERCIM News》等業(yè)界頂尖期刊都曾開設“大數(shù)據(jù)專輯”,對數(shù)據(jù)的維護、再利用,數(shù)據(jù)的可解釋性和數(shù)據(jù)處理主體等問題進行探討。雖然,學術界的討論主要集中在學理層面,但都表明一個事實:大數(shù)據(jù)可能成為引領未來社會發(fā)展的支配性力量。而且,隨著大數(shù)據(jù)理論的不斷成熟,大數(shù)據(jù)討論開始溢出學理層面,轉(zhuǎn)而在社會實踐應用維度發(fā)力,進而上升為國家發(fā)展戰(zhàn)略。中國、美國和歐盟等國家/地區(qū)紛紛制定了大數(shù)據(jù)發(fā)展政策。中國早在2014年就將“大數(shù)據(jù)”寫入政府工作報告,明確實施國家大數(shù)據(jù)戰(zhàn)略。更為重要的是,“一場由大數(shù)據(jù)帶來的技術革命”和“智能革命”(6)開始重塑現(xiàn)實世界,滲入日常生活的各個角落,“從商業(yè)科技到醫(yī)療、政府、教育、經(jīng)濟、人文以及社會的其他各個領域”(7)都有大數(shù)據(jù)的魅影。人們可以直接感受到自己生活在一個被數(shù)字編織的數(shù)據(jù)網(wǎng)中。那么,在大數(shù)據(jù)時代,數(shù)據(jù)技術是如何改變文學的?產(chǎn)生的文學大數(shù)據(jù)呈現(xiàn)出哪些新的特征?文學研究方法出現(xiàn)哪些變化?
回答上述問題的前提是首先明確“文學大數(shù)據(jù)”的概念。目前為止,學術界對“大數(shù)據(jù)”的概念仍存在較大分歧,麥肯錫、維克托·邁爾·舍恩伯格和肯尼思·庫克耶等學者都曾界定過大數(shù)據(jù),但都沒有形成共識。(8)所以,筆者只能從現(xiàn)有概念中提取大數(shù)據(jù)的一些基本特征:數(shù)據(jù)規(guī)模大,數(shù)據(jù)來源、種類多,數(shù)據(jù)增長、處理速度快,數(shù)據(jù)價值密度低等。(9)這些特征決定了大數(shù)據(jù)的“大”不僅是數(shù)據(jù)數(shù)量的大,更是指數(shù)據(jù)的復雜多變,以及通過數(shù)據(jù)獲取新知識的能力。以此為標準,可以為“文學大數(shù)據(jù)”暫時確立一個相對穩(wěn)固的概念:文學大數(shù)據(jù)與傳統(tǒng)意義上的文學數(shù)據(jù)不同,不是指文學作品和文學文獻電子化后產(chǎn)生的電子文本數(shù)據(jù),而是指文學作品在互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和社交網(wǎng)傳播過程中產(chǎn)生的與文學相關的數(shù)據(jù),包括日志、音頻、視頻、圖片、彈幕、點贊等結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化多種類型數(shù)據(jù)。這些數(shù)據(jù)數(shù)量巨大,來源、種類多樣,成碎片化分布,且處于實時更新狀態(tài),有價值和可利用的數(shù)據(jù)密度較低,需要利用計算技術分析這些數(shù)據(jù)。例如,余華的小說《文城》出版后,在微信、微博等社交媒體和豆瓣讀書、京東圖書等網(wǎng)絡購書平臺,以及抖音、快手等短視頻媒體中迅速傳播,產(chǎn)生了數(shù)量龐大的文學數(shù)據(jù),包括讀者截取的小說原文段落、長篇專業(yè)評論、簡短的即時感受文字、表達閱讀情緒的圖片、講述閱讀體會的視頻、購書推薦評語、銷售數(shù)字表格、小說影響力排行表和小說的知識圖譜等。從這些數(shù)據(jù)中可以分析出讀者對小說的總體評價、專業(yè)批評家與普通讀者的接受差異、讀者的地理信息、小說在不同地域的文化影響力、當下社會情緒的走勢、讀者的審美變化和小說的未來發(fā)展趨勢等內(nèi)容。而且,不同類型數(shù)據(jù)之間的重組又可以產(chǎn)生新數(shù)據(jù)。可以說,當《文城》進入互聯(lián)網(wǎng)和社交網(wǎng)被數(shù)據(jù)化之后,就不再是一部單純的文學作品,轉(zhuǎn)而成為生產(chǎn)文學數(shù)據(jù)及其相關新知識的載體。
文學大數(shù)據(jù)既是紙媒文學在互聯(lián)網(wǎng)和社交網(wǎng)傳播的結(jié)果,又是依托網(wǎng)絡、利用數(shù)字技術生產(chǎn)數(shù)字化文學的產(chǎn)物。這些“數(shù)字文學”(10)在利用文學大數(shù)據(jù)的同時,又再次產(chǎn)生了文學大數(shù)據(jù)。人工智能文學、超文本文學、視覺文學和界面文學等“數(shù)字文學”的誕生不僅是新舊文學形態(tài)的更迭,而且是文學寫作生態(tài)的全方位變革。它的“非線性敘事、非穩(wěn)定結(jié)構(gòu)、讀者參與性以及多媒體特征被視為對傳統(tǒng)文學理論以及文學審美的挑戰(zhàn)”,同時,其特有的“編程功能、數(shù)字代碼、計算機算法等數(shù)字文學內(nèi)部運行機制被視為新美學基礎和美學特征”。(11)可以說,這些新的文學特性都與文學大數(shù)據(jù)緊密關聯(lián)。例如,超文本文學就超越了傳統(tǒng)語義文本的限制,把詞語、地理位置和個體信息等眾多主題元素按照多種組合方式重組,甚至“任何可以看見、可以聽見的都可以構(gòu)成文本的紋理”。(12)而且,寫作主體既可以是人,也可以是智能機器。進一步而言,超文本形成的基礎是文學大數(shù)據(jù),通過分析和管理文學大數(shù)據(jù),把文學大數(shù)據(jù)存儲在各個文字節(jié)點上。然后,在這些文字節(jié)點之間確立相關關系,再以鏈接的方式把各個文字節(jié)點串聯(lián)起來,形成一種網(wǎng)狀結(jié)構(gòu)。同時,超文本在互聯(lián)網(wǎng)和社交網(wǎng)傳播過程又生產(chǎn)了新的文學數(shù)據(jù),并無限循環(huán)往復。林焱的小說《白毛女在1971》就是一部典型的超文本小說,作家在文本中設置了多個鏈接符號,這些鏈接符號與故事情節(jié)敘述密切相關,讀者只有閱讀完這些鏈接網(wǎng)頁的內(nèi)容后,才能繼續(xù)閱讀小說剩余的內(nèi)容。(13)
對當代文學研究而言,面對文學大數(shù)據(jù)及新的文學樣態(tài),需要認真思考如何調(diào)整和重塑文學研究方法,與此新變相契合,進而建構(gòu)新的研究范式。因此,“如何在設計算法、挖掘工具、可視化工具及存檔技術時凸顯價值、解釋和意義變得更加重要”。(14)
二、文學數(shù)據(jù)研究中“小數(shù)據(jù)”與“大數(shù)據(jù)”
為了應對文學的數(shù)字化和數(shù)據(jù)化,文學研究引入了“計算”方法,把信息技術和計算機技術應用到文學研究。文學計算的兩大核心是:文學數(shù)據(jù)和計算技術。尤其是計算技術至關重要,它決定了文學數(shù)據(jù)研究的上限。因為,文學數(shù)據(jù)研究“具有高度技術化的內(nèi)涵與本質(zhì),它必須依托數(shù)字系統(tǒng)建設、程序代碼編寫或者其他手段來實現(xiàn)研究過程或呈現(xiàn)研究結(jié)果”。(15)現(xiàn)階段,這些計算技術包括可視化與數(shù)據(jù)設計技術,文本分析、聚合與數(shù)據(jù)挖掘技術,地理信息系統(tǒng)技術和仿真技術等,這些技術的大規(guī)模開發(fā)和普遍應用推進了文學數(shù)據(jù)研究的深入發(fā)展。這也可以解釋為何在文學數(shù)據(jù)研究初期,大部分研究只能停留在單體文本詞語抽取、詞頻統(tǒng)計和語法分析上。因為文學數(shù)據(jù)量不夠,計算技術不先進,文學數(shù)據(jù)研究指涉的對象只能是小數(shù)據(jù)樣本和簡單計算分析。20世紀80年代,錢鋒、(16)陳大康、(17)丁寧、(18)、林興宅(19)等人曾提出文學與計算機科學、系統(tǒng)科學相結(jié)合的理論設想,利用數(shù)學建模和計算機自動計算的方法,對文學作品的文體特征、審美風格和作者身份辨識進行研究。但在具體實踐中,受制于文學數(shù)據(jù)庫和計算技術,大部分研究仍然集中在作品修辭風格的計量分析上,“通過建立語料庫,對文本語言的字符、段落、詞長、詞類、詞性以及高頻詞分布等特征項進行統(tǒng)計,運用計算公式來計算平均段落長度、詞長變化、文本聚類等”。(20)例如,武漢大學語言自動處理研究組通過統(tǒng)計老舍的《駱駝祥子》的詞頻,來分析小說的審美特征;(21)劉賓運用數(shù)學建模技術分析《福樂智慧》,經(jīng)過電腦檢索、排序,編制成索引詞典的框架;(22)錢鋒、陳光磊通過比較巴金的《我們會見了彭德懷司令員》和倪海曙的《三輪摩托車》中的辭格、音律和章法,確認巴金和倪海曙的小說語言風格;(23)與此類似,王景丹通過統(tǒng)計曹禺等8位劇作家文本的句頻,確認各自文體風格;(24)吳禮權(quán)通過分析詞語、句式和修辭運用,總結(jié)“簡約”與“繁豐”審美風格的基本特征。(25)從中不難看出,初始階段的文學數(shù)據(jù)研究以簡單統(tǒng)計文本修辭為主,很少使用復雜的計算模型和計算技術。
21世紀以來,隨著數(shù)字人文理論在國內(nèi)的傳播,以及眾多“關系型數(shù)據(jù)庫的建設、語言信息處理技術的發(fā)展和社會計量方法向人文領域的持續(xù)滲透”,(26)文學數(shù)據(jù)研究取得長足進步。例如,羅男運用基于改進的向量空間模型特征權(quán)重計算方法(TF-IDF)和潛在語義分析技術(LSI),分析15部金庸小說中的字、詞匯、句子和段落4個語法單位,以此探究金庸小說的語言風格,并辨識《臥龍記》的真實作者;(27)張小宇在建立魯迅雜文語料庫、魯迅小說語料庫和魯迅同時期作家雜文語料庫基礎上,使用語料庫檢索工具AntConc,計算魯迅雜文的詞長、句長、單音節(jié)詞和雙音節(jié)詞等17個語言特征出現(xiàn)比例,并與同時代作家的雜文語言特征進行比較,以此總結(jié)魯迅雜文的語言風格;(28)余韻為了證明巴金前后期小說語言風格的一致性,把巴金小說劃分為6個階段,并建立相應的語料庫,在此基礎上,計算不同階段巴金小說的詞長分布,詞匯豐富度,共現(xiàn)詞、獨有詞、實詞和虛詞使用頻率;(29)與此類似,金迪對格非和余華小說語言風格的研究,(30)時季對閻連科和劉震云小說語言風格的研究,(31)以及王少康、(32)年洪東、(33)李慧(34)對現(xiàn)代作家身份識別和作品辨?zhèn)蔚难芯慷紝儆诖朔N研究類型。但上述文學數(shù)據(jù)研究仍沒有突破文體學、修辭學和語言學研究框架。
但我們也不能據(jù)此掩蓋一些學者在文學數(shù)據(jù)研究方面做出的開創(chuàng)性探索,尤其是在小說人物功能和社會網(wǎng)絡分析方面取得的突破。例如,吳蕙羽利用優(yōu)化后的Python技術、Pyecharts數(shù)據(jù)庫和Echarts數(shù)據(jù)可視化JS庫,分析陳忠實的《白鹿原》中的人物關系和社會網(wǎng)絡,并涉及人物情感分析。(35)但吳蕙羽的研究重心在計算技術,而非小說敘事,因而沒有得出與小說敘事相關的結(jié)論。相對于此,趙薇對李劼人的“《大波》三部曲”的社會網(wǎng)絡和人物功能分析更為深入和透徹。趙薇運用社會網(wǎng)絡分析(SNA)方法,利用數(shù)據(jù)挖掘、中心性計算和可視化技術,分析《死水微瀾》《暴風雨前》《大波》前后兩個版本5部小說中的人物關系和社會網(wǎng)絡,“對加權(quán)網(wǎng)絡中最高中介中心性節(jié)點所提示的關鍵人物的敘事功能進行了深入探討”,(36)認為“小人物”具有重要敘事功能,承擔了講述重大歷史事件的責任。除此以外,通過分析文學研究數(shù)據(jù)庫,發(fā)現(xiàn)某一階段文學研究主題、(37)熱點、(38)發(fā)展趨勢和歷史軌跡,(39)以及學者影響力、(40)學科關聯(lián)(41)和學術刊物影響力(42)等內(nèi)容,成為文學數(shù)據(jù)研究的重要趨向。例如,丁帆、趙普光以當代文學研究中的論題詞詞頻為考察中心,通過分析論題詞的頻率、集中程度和論題詞的顯隱等數(shù)據(jù),客觀呈現(xiàn)當代文學研究70年發(fā)展軌跡。但文章沒有引入知識圖譜分析技術,仍屬于傳統(tǒng)意義上的計量統(tǒng)計范疇。而謝靖、章鑫鑫在對CSSCI數(shù)據(jù)庫數(shù)據(jù)進行清洗和格式轉(zhuǎn)化,以及設定頻次、中介中心度和聚類指標等參數(shù)基礎上,利用CtiespaceⅢ軟件計算2000—2011年期間CSSCI收錄的中國文學研究期刊發(fā)文情況,形成文學研究期刊關鍵詞共現(xiàn)圖譜,立體呈現(xiàn)這一期間中國文學研究熱點、發(fā)展趨勢和學科知識圖譜。(43)而且,通過統(tǒng)計中國文學期刊引文數(shù)據(jù),分析中國文學圖書學術影響力。(44)王賀則通過比較《解放日報》數(shù)據(jù)庫的電子目錄、索引與紙質(zhì)版的差異,探討“數(shù)字人文”與傳統(tǒng)學術的關系。(45)
雖然文學數(shù)據(jù)研究在廣度和深度上都取得了一定程度的進步,但還不是真正意義上的文學大數(shù)據(jù)研究:一方面,當代文學人物關系和社會網(wǎng)絡研究、當代文學關聯(lián)數(shù)據(jù)庫研究、當代作家檔案數(shù)據(jù)研究、當代文學學術地圖和知識譜系研究、基于共現(xiàn)分析的文本知識挖掘研究、當代文學研究者的隱性合作關系研究等諸多方面仍然存在進一步深挖的空間;另一方面,互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和社交網(wǎng)絡生產(chǎn)的文學大數(shù)據(jù)還沒得到充分利用,基本處于擱置狀態(tài)。例如,豆瓣讀書、微信、微博生產(chǎn)的文學數(shù)據(jù)及其關涉的人物情感和社會心態(tài)、文學的網(wǎng)絡主題模型、游戲文學的虛擬現(xiàn)實、界面文學的知識挖掘、新媒體文學的知識圖譜等眾多研究話題還沒有充分展開。之所以出現(xiàn)這種態(tài)勢,是因為現(xiàn)階段文學大數(shù)據(jù)研究存在一些困境和癥結(jié),為文學大數(shù)據(jù)研究從理論構(gòu)想進入現(xiàn)實實踐從而產(chǎn)生真正價值設置了壁壘。這也是當代文學研究范式轉(zhuǎn)型亟須解決的問題。
三、文學大數(shù)據(jù)研究的困境和癥結(jié)
當代文學大數(shù)據(jù)研究仍處于起步階段,難以避免出現(xiàn)諸多困境,我們需要直面這些癥結(jié),尋找解決問題的方法和路徑,在此基礎上推進當代文學研究的發(fā)展?,F(xiàn)階段,當代文學大數(shù)據(jù)研究面臨專題數(shù)據(jù)庫少、跨學科合作度低、研究方法認同度低、研究范圍窄、研究學者少、專業(yè)學術期刊少、學術評價體系缺失、學科專業(yè)建設緩慢、課堂教學滯后和網(wǎng)絡基礎設施建設薄弱等問題。
文學大數(shù)據(jù)研究的基礎是數(shù)據(jù),包括數(shù)字文學文本和文獻史料及其數(shù)據(jù)化后形成的各種文學專題數(shù)據(jù)庫,也包括文學文本在互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和社交網(wǎng)絡傳播產(chǎn)生的文學大數(shù)據(jù)。但大數(shù)據(jù)的海量、動態(tài)和價值密度低等特性使數(shù)據(jù)庫建設存在較大難度。比較便捷和高效的方式是利用數(shù)據(jù)挖掘、分析和顯示技術針對特定大數(shù)據(jù)進行研究。因此,文學專題數(shù)據(jù)庫和文學研究專題數(shù)據(jù)庫建設尤為重要。但現(xiàn)實情況是,已建成的中國現(xiàn)當代文學及其研究專題數(shù)據(jù)庫仍然很少,主要集中在“民國圖書數(shù)據(jù)庫”(46)“晚清和民國全文期刊數(shù)據(jù)庫”(47)“《申報》全文數(shù)據(jù)庫”(48)“《大公報》(1902—1949)數(shù)據(jù)庫”(49)“近代上海方志資料數(shù)據(jù)庫”(50)“民國文獻大全數(shù)據(jù)庫”(51)“解放前報刊題錄數(shù)據(jù)庫”(52)“民國圖片資源庫”(53)“民國時期文獻數(shù)據(jù)庫”(54)“大成故紙堆”(55)“典海民國圖書資源平臺”(56)“民國圖書數(shù)字化資源庫”(57)等民國文學數(shù)據(jù)庫上。而當代作家作品及其研究文獻數(shù)據(jù)庫、當代文學期刊數(shù)據(jù)庫和當代文學史數(shù)據(jù)庫等與當代文學研究直接相關的專題數(shù)據(jù)庫非常稀少。這一問題已得到學術界的重視,陸續(xù)啟動了“網(wǎng)絡文學文獻數(shù)據(jù)庫建設”“漢譯文學編年考錄及數(shù)據(jù)庫建設”“中國現(xiàn)代文學報刊作品系年及數(shù)據(jù)庫建設”“中國新詩傳播接受文獻集成、研究及數(shù)據(jù)庫建設”“抗戰(zhàn)大后方文學史料數(shù)據(jù)庫建設”“‘學衡派’年譜長編及文獻數(shù)據(jù)庫建設”“延安時期未刊文獻資料收集、整理與數(shù)據(jù)庫建設”(58)等項目。只有完成基礎性的專題數(shù)據(jù)建設,才能為文學大數(shù)據(jù)研究提供支持。
文學大數(shù)據(jù)研究作為新興的研究范式,從大規(guī)模的理論引入研究實踐不過十幾年的時間,學術界對這種研究范式始終保持足夠的距離和警惕,這種研究范式還沒有形成共識。這種認同情境來源于三個方面:第一,文學大數(shù)據(jù)研究運用的數(shù)據(jù)計量分析、實證性方法與文學的審美性、精神性特征相沖突,削減了文學的人文價值。人們擔心對“計算”方法的推崇,會使文學研究滑向技術中心主義,形成算法霸權(quán),成為技術的注腳,喪失自身的獨立性。因而,這種研究范式“對于文學研究而言,卻只能是一種手段和工具,研究者的才情、趣味、智性決定了研究的深度和走向”。(59)第二,文學大數(shù)據(jù)研究的根基是數(shù)據(jù)庫和計算技術,只有不斷優(yōu)化和更新相關計算技術,才能推進文學大數(shù)據(jù)研究的深入發(fā)展。一旦計算技術更新緩慢或停滯不前,這種研究范式也將處于懸停狀態(tài)。因而人們對這種研究范式的長效性持懷疑態(tài)度,“是否能夠從歷史的長線來對文學史現(xiàn)象和作家作品做出相對超越性的評價,是存有疑問和不無難度的”。(60)第三,文學大數(shù)據(jù)研究需要研究者熟練掌握和運用計算技術,而計算技術體系和理論結(jié)構(gòu)較為復雜,涉及數(shù)字化技術、數(shù)據(jù)管理技術和數(shù)據(jù)分析技術等多個層面,僅文本挖掘技術就涉及信息抽取、文本分類、文本聚類、關聯(lián)規(guī)則和模式發(fā)現(xiàn)等眾多方面,相關的計算軟件更是種類繁多。對人文學者而言,想要短期內(nèi)掌握計算技術,且能夠熟練使用計算軟件,存在較大難度。而能夠獨立“運用計算方法解答、探討或是思索人文問題的研究者”(61)更是寥寥無幾。這就不難理解為何大部分文學大數(shù)據(jù)研究都集中在理論反思和論爭層面,很少拓展到計算技術分析層面。
文學大數(shù)據(jù)研究是一種跨學科研究方法,它與統(tǒng)計學、信息管理學和計算機科學等其他學科有直接關聯(lián)。同時,文學也以其獨特的人文特性反思文學大數(shù)據(jù)本身的價值和意義,實現(xiàn)文學與數(shù)據(jù)和計算之間的多重互動。在此意義上,文學大數(shù)據(jù)研究具有明顯的交叉學科研究特征,它“促使各人文學科突破學科邊界,加強不同學科理論與方法的交流與合作”。(62)這就決定了研究者需要進行跨學科、跨專業(yè)的協(xié)同創(chuàng)新研究。但當前文學大數(shù)據(jù)研究還沒有真正實現(xiàn)跨學科研究,文學研究者的關注點集中在文學大數(shù)據(jù)研究的人文反思上,其他學科的研究者聚焦在計算技術上,二者處于不同的研究向度,無法真正交融在一起。類似陳大康、錢鋒、劉石、趙薇等學者能夠?qū)崿F(xiàn)二者之間的融合,是因為他們本身具有跨學科背景和扎實的數(shù)學功底,能夠熟知計算原理,獨立構(gòu)建數(shù)學模型和使用計算工具。但大部分研究者仍在技術外圍摸索和徘徊。這種局面的形成與國內(nèi)數(shù)字人文專業(yè)設置和相關教學環(huán)節(jié)薄弱密切相關。目前,只有中國人民大學信息資源管理學院在圖書情報與檔案管理一級學科下,設立了數(shù)字人文二級學科。而根據(jù)國家數(shù)字人文組織聯(lián)盟統(tǒng)計,在2007—2014年期間,國外設置數(shù)字人文專業(yè)的高校多達180余所,(63)并形成了從本科到研究生完備的培養(yǎng)體系。(64)而且,國內(nèi)外高校在相關課程設置方面也有較大差距。截止到2020年,開設數(shù)字人文相關課程的美國高校就有41所,(65)包括斯坦福大學、耶魯大學和伊利諾伊大學香檳分校等世界知名高校。而國內(nèi)只有清華大學、北京大學、武漢大學、西安交通大學、汕頭大學、南京大學、上海師范大學等少數(shù)高校開設了數(shù)字人文課程。同時,在課程的數(shù)量、教學體系建設和實踐應用方面,國內(nèi)外也存在較大差距。國內(nèi)數(shù)字人文研究中心和人文計算實驗室建設推進緩慢,只有武漢大學、清華大學和上海師范大學等為數(shù)不多的高校成立了數(shù)字人文研究中心。而國外的數(shù)字人文研究中心和實驗室多達百余家,并且不斷輸出學術成果。(66)尤其是斯坦福文學實驗室、倫敦國王學院數(shù)字人文實驗室、耶魯大學數(shù)字人文實驗室和普林斯頓數(shù)字人文中心在世界范圍內(nèi)都產(chǎn)生了重要影響力。
雖然文學大數(shù)據(jù)研究還存在諸多困境,但不能就此否認它的價值。除了為當代文學研究提供新的研究技術和方法,也為文學研究共同體的形成提供了可能性和實踐路徑。謝剛、江震龍在《現(xiàn)代中國民族文學觀與共同體詩學建構(gòu)》一文中深入闡釋了民族文學共同體意識和共同體詩學,認為其實質(zhì)“是一與多、己與群、局部與整體、差異性與共同性的辯證統(tǒng)一”,(67)并體現(xiàn)為民族審美共同體意識、辯證的詩學特征、包容共生的文學倫理觀和以人民為中心的民族文藝本質(zhì)。謝剛、江震龍對共同體意識和共同體詩學的理論建構(gòu)深刻而透徹,既沒有完全模仿西方的共同體理論,也沒有拘泥于中國傳統(tǒng)的共同體觀念,而是在中西理論之間尋找到恰切的平衡點?;蛘哒f,是站在中國文學的立場上構(gòu)建世界文學的共同體意識和詩學,因此具有很強的理論價值和實踐參考意義。按照謝剛、江震龍的邏輯推論,文學研究共同體的實質(zhì)也是“多”與“一”的辯證關系。而當代文學研究沒能處理好這種辯證關系,走向了共同體的反面。當下反全球化和逆全球化思潮在不同領域設置了構(gòu)建共同體的壁壘?;蛘哒f,共同體和反共同體在發(fā)生機制、運作模式和實踐路徑等方面遵循相同的原則和規(guī)律,二者之間的界限既涇渭分明又曖昧模糊。這種共同體危機意識和反共同體情態(tài)也在當代文學研究中存在,以文學研究范式的斷裂、顛覆和重建為表征,具體體現(xiàn)為文學政治研究、文學社會研究、文學歷史研究、文學審美研究和文學技術研究幾種研究范式之間的矛盾及研究范式的內(nèi)部沖突?;诖耍敶膶W研究史可以看作文學研究共同體與反共同體的關系史。但關鍵問題不是幾種研究范式是如何斷裂的,而是如何繼承和轉(zhuǎn)換的。一種研究范式的興起如何從另一種消隱的研究范式中汲取有價值的資源。也就是說,文學大數(shù)據(jù)研究的興起并不全然意味著原有研究范式的失效,而是研究范式之間的整合和重組。文學大數(shù)據(jù)研究的實質(zhì)是從數(shù)據(jù)角度挖掘和呈現(xiàn)文學新變,但新變不是顛覆文學的審美性和精神性特質(zhì),而是以數(shù)據(jù)進一步證實和豐富文學的審美性和精神性,并發(fā)現(xiàn)其中的新內(nèi)容、新樣態(tài)和新趨勢。文學研究應在數(shù)據(jù)技術加持下變得更客觀、理性,更符合當下對文學研究提出的要求。文學大數(shù)據(jù)研究建構(gòu)的技術化研究秩序不是劃出文學研究的固定邊界,而是提倡文學研究的敞開性,為人文與科技共同體搭建一條順暢通道。我們提倡的文學研究共同體意識,針對的不僅是反共同體觀念,而是以共同體意識為根基,接續(xù)和重建不同研究范式之間的內(nèi)在關聯(lián),“借以窺探某一歷史時刻的集體性是什么,它的需求是什么,它的矛盾性何在,它的問題何在等問題”,(68)尋找解決原有文學研究范式癥結(jié)的路徑,從而建立不同文學研究范式之間的結(jié)構(gòu)關系,因為“它們既有聯(lián)系又有差異,共同推進文學創(chuàng)作和文學研究的發(fā)展”。(69)而且,一種新的文學研究范式的價值不僅體現(xiàn)在方法論層面,更體現(xiàn)在價值論層面。在不同研究范式之間尋求價值觀的最大公約數(shù),在此基礎上構(gòu)建當今社會具有引領作用的價值觀,這是推進當代文學研究發(fā)展的重要前提條件之一。在此意義上,當代文學研究范式轉(zhuǎn)型絕不是線性時間鏈條上的替代問題,而是不同研究范式在對話中的相互補充和再造。它既是當下的又是歷史的也是未來的,但絕不是唯一的、霸權(quán)的和僵化的。