網絡文學研究中的數字人文視野 ——以晉江文學城積分榜單及“清穿文”為例
摘要:論文以“清穿文”這一網絡文學類型及其主要發(fā)表平臺晉 江文學城為例,討論了從數字人文的理論視野出發(fā)開展網絡文學研究 的可行性與必要性。分析了包括文學網站積分榜單計算公式在內的網 絡文學生產機制與數字人文思維之間纏繞共生的關系,由此指出相關 研究工具的匱乏和數據資料庫的缺失。為了加強理論自覺,推進學科 建設,當前最迫切的工作,就是盡快開發(fā)具有針對性的研究工具,以及建設完善一個學術向的網絡文學資料數據庫,抓緊搜集、保存現有 的各種研究資料。
關鍵詞:數字人文 網絡文學 “清穿文”
當我們借助數字人文(Digital Humanities)的研究方法與問題意識,去審視中國網絡文學的創(chuàng)作實踐,自不難發(fā)現二者之間客觀存在的適配性:網絡文學天然是數字人文的,它的整套生產機制,都是在互聯網這個數字媒介的環(huán)境之中,伴隨著數字技術的發(fā)展逐步確立并不斷更新的。
這事實上意味著,從數字人文的角度介入網絡文學研究,并不僅僅只是“可 能的選項”,而理應成為某種不可或缺的、內在化的思維范式。由此反觀當前網 絡文學的前沿研究,如圍繞生產機制、粉絲社群文化的研究,又或是對類型文的 研究(目前的方法主要是脈絡梳理+經典文本細讀)等,如能被納入數字人文的理論框架,必將打開一重全新的視野。同時,過往研究之中客觀存在的諸多困境,以及若干難以落實的推論,也有望運用數字人文的工具、方法得到解決。當然,更重要的是,在數字人文的思維模式下,還可能提出以當下的研究視域很難 預見的新問題。
為避免討論過于抽象,本論將以圍繞“清穿文”及其主要發(fā)表平臺晉江文學 城 1 (以下簡稱“晉江”)的研究為例,具體地闡釋數字人文的理論與方法介入 網絡文學研究的可能性、面臨的困局以及解決的途徑。
一 作為網絡文學生產機制內核的算法設計
“清穿文”是流行于網絡文學發(fā)展初期(2004—2007)的一個非常重要的創(chuàng)作潮流和子類型,通常描寫現代女性穿越 2 到清朝,與阿哥、親王們(或別的王公大臣、貴族子弟)戀愛的言情小說。其肇始之作,是2004年7月開始連載于晉江 原創(chuàng)網 3 的《夢回大清》(金子),與它齊名的作品,還包括《步步驚心》(桐 華,晉江原創(chuàng)網,2006)和《瑤華》(晚晴風情,晉江原創(chuàng)網,2006),即所謂 的“清穿三座大山”。
中文學界對穿越/清穿小說的廣泛關注,大約始于2011年,即《步步驚心》 電視劇熱播之后。這顯然是一種回溯性的肯定,遠遠晚于清穿文在網絡文學界內部的流行,甚至也晚于影視資本對它的挖掘。考慮到文學網站通常為UGC(User Generated Content,用戶生產內容)架構,刊載的作品均由用戶自主上傳,近乎于零門檻,印刷文明時代那種以編輯、學者為中心的、精英化的遴選機制,自然也 就無從談起。海量文本泥沙俱下,清穿文卻在浩如煙海的網絡言情小說之中自成 脈絡,《步步驚心》也迅速脫穎而出,成為最受矚目的代表作。這便足以證明,在網絡文學的生產機制和閱讀反饋機制內部,是存在著某種評判作品優(yōu)劣的標準 以及相應的推介渠道的。
這些標準和渠道的具象化,就是文學網站上常見的各類積分榜單。盡管不同了網站內部的榜單設置也不盡相同,但核心思路都是依據某種算法規(guī)則 4 ,將網站上刊載的所有作品按照點擊量、付費訂閱量或好評率等標準進行量化排序。
參見晉江文學城頒布于2005年3月2日(正是清穿文最為流行的時期)的一版積分計算公式 5 :全文點擊數/章節(jié)數×Ln(全文字數)×平均打分+(Ln(書評字 數)×書評打分)之和+精華書評特別加分
不難看出,在上述公式中,能影響到作品積分的系數主要包括三類:第一 類是作品本身的客觀數據,如全文字數;第二類則是對讀者瀏覽、評價作品的行為進行的量化與賦值,如全文點擊數、書評字數和平均打分等;第三類是網站編 輯對作品的獎勵和推薦,如精華評論特別加分。6 套用這個公式計算出的最終 數值,即一部小說的“作品積分”,是晉江在排列各種推薦榜單時的重要參考依據,對于總分排行榜、半年榜、月榜和新晉作者榜等榜單而言 7 ,甚至是唯一的依據。這些通過積分排序篩選出的作品,通常都是同時期最優(yōu)秀、最受歡迎的,而有幸登上榜單頁面,顯然也會為它們帶來更多實體出版和影視改編的機會?!扒宕┤笊健痹缒觊g都曾是榜單上的常客。
相比起印刷文明時代的編輯審稿制和學院體系內的精英批評話語,文學網站 訴諸積分算法,雖然的確是將選擇、評價一部小說的權力讓渡給了讀者 8 ,卻也絕非僅止于此。最為關鍵的秘密,其實就隱藏在公式之中:盡管每位用戶(包括 讀者和作者)的行為(點擊、寫書評)與喜惡(打正分或負分),都經由相對客觀、固定的渠道轉化成了數據,但總積分數值的輸出,卻是糅合了網站自身利益與傾向的加權計算。也就是說,雖然對小說的點擊和評分是由讀者決定的,每一章寫多少字是由作者決定的,但這些字數、點擊和評分的數值最終能在多大程度上影響總積分的大小,卻是由文學網站決定的。通過調整算法,網站就能將當下的運營理念貫徹到這個龐然大物的每一根毛細血管里。譬如,在晉江頒布于2016 年的新版積分公式之中,就新增了作者簽約限和版權授權狀況等系數,這顯然是在當時IP(Intellectual Property)運營熱潮的推動下做出的修訂。9
晉江推出這套積分計算公式的根本目的,一方面是對讀者的閱讀時間、審美 能力和判斷力加以征用,把原本由個別編輯、學者承擔的遴選任務分攤給每個用 戶,對站內數量龐大的小說展開地毯式摸底與分揀,為網站后續(xù)的版權運營工作 (如洽談實體出版、售賣影視改編權等)提供依據;另一方面,也是在利用算法引導和控制用戶的行為。事實證明,這種控制和引導是行之有效的:作者要想迅速提升人氣、嶄露頭角,就不免對積分規(guī)則多加鉆研,保持穩(wěn)定更新10 ;讀者為、了支持自己喜歡的作者和作品,也會積極地、反復地進行評論、點擊或打賞。11這些行為的最終結果,均為網站帶來了更多的流量和銷售額。除此之外,網站編 輯往往也會通過參考積分數值的變化,掌握并管理作者的創(chuàng)作情況。
盡管在積分計算公式的字里行間,的確暗含著網站對用戶的隱性剝削,但這僅僅是硬幣的一面,因為用戶也完全可以通過理解規(guī)則、利用規(guī)則來影響某部作品的積分,甚至于網站的決策。透過這行短短的積分計算公式,折射出的,是 一個小型“文學場”內部的各方博弈。其中,居于核心位置的公式,固然是在建構階序(受歡迎的優(yōu)秀作品和平庸的、失敗的作品),卻也同時設定了規(guī)則與玩 法。例如“平均打分”這個系數,指的就是讀者對小說各個章節(jié)打出的所有評分的平均值,實際可選分值從正2分到負2分不等。這類口碑評價體系在互聯網行業(yè)并不罕見,豆瓣、大眾點評和滴滴打車等網站或應用中,都包含這項功能。然而大多數文學網站,例如閱文系尤其是起點中文網(以下簡稱“起點”),似乎還是更看重點擊、收藏12和訂閱這些實打實的客觀數據,允許讀者對作品進行評分并將其納入積分算法的主流文學網站,其實只有晉江。
乍看上去,打分畢竟是一種主觀好惡,似乎容易影響榜單的客觀性。但對于晉江這樣一個深耕粉絲文化的“女性向”13 文學網站而言,卻有著獨特的意義。作為一種細水長流的日常操作,針對每一章更新進行的打分,顯然更容易在讀者和作者之間建立起深厚的羈絆關系。不僅如此,該評分系統的特殊之處還在于, 它是可以打出負值的。這是一種暗含著攻擊性的設置,它意味著,晉江的用戶完 全可以通過打負分,甚至是大量“刷負分”的操作,來降低一部作品的積分和排名。而相比之下,起點的用戶卻不可能通過任何操作削減作品的積分,而最多只能“還原”,例如取消之前的訂閱或收藏等。不同的規(guī)則也導向了不同的行為模式,在晉江,由于負分的存在,批判性的審美判斷、個人情緒的發(fā)泄甚至有組織 的抵制行為,都成為可能。不同粉絲團體(包括作者粉、作品粉等)之間的相互攻訐、黨同伐異,也往往通過“刷負分”來達成。14 這正是當前“女性向”網絡文學社群的基本生態(tài),它參差多變、難以一言蔽之,卻始終與網站算法互為因 果,環(huán)環(huán)相扣。
文學網站本質上屬于互聯網公司,甚至普遍具有游戲公司的背景,將算法視為指導網站運營的依據和建構社群文化(企業(yè)文化)的基礎,是很值得理解的策略。因為它顯然遵循著互聯網產品運營的基本邏輯,所能舉出的例子也絕不僅僅 是前面列出的那些。15
上述一系列事實,集中體現了數字媒介和數字技術對傳統人文學科的重要研究領域之一 ——文學——的生產機制的深度重構。歸根結底,這種依靠積分算法評判作品優(yōu)劣、篩選人氣作品的機制,無論創(chuàng)造它的人是否有此自覺,但本質上都是數字人文思維的產物。同理,當這種數據化的、新媒體運營的理念開始與文學的創(chuàng)作、接受和傳播等各個環(huán)節(jié)緊密纏繞,直面這一新興文化現象的網絡文學研究者,只要曾經直接深入網絡文學生產機制的內部,那么無論自覺還是不自覺,他其實已經在進行著某種數字人文式的研究了。
眾所周知,數字人文研究起源于文獻典籍的數字化與數據庫化。然而經過本節(jié)的討論,我們幾乎可以肯定,與必然需要經歷數字化與數據庫化步驟的傳統人文學科不同,網絡文學的起點,就是數字人文。甚至可以說,越是貼近網絡文學 生產機制內核的研究,就越和數字人文研究殊途同歸。而研究網絡文學的生產機 制,也未嘗不能是研究數字人文本身。
二 網絡文學研究與數字人文分析工具
盡管網絡文學與數字人文之間的聯系是如此緊密,但現有的適用于中文文本的數字人文研究工具和項目,顯然都不是針對網絡文學作品的研究需求開發(fā)的。以數字人文研究平臺Docusky16 為例,該平臺所提供的半自動標記工具包含有多種 功能:有的可以為研究者上傳的文檔標注人名、地名、年代及官名,這無疑有助 于古典文獻的分析和整理;有的能標記小說中出現的對話的參與者、類別和次數 等,對解讀長篇小說的劇情走向及人物性格具有一定的參考價值;還有詞頻統計這個常見功能,可用于分析某個作者的用詞偏好、寫作習慣或者以關鍵詞為依據 分析人文思潮的變遷等。
然而這些常規(guī)的分析工具對于網絡文學作品的研究而言,卻起不到太大的助益。網絡小說不同于古典文獻,以幻想題材居多,標記人名、地名本無太大 意義;并且相對于劇情、人物性格等要素,類型和結構的流變才是更為核心的 問題;此外,網絡文學研究對具體某位作者的遣詞造句和寫作風格也并不是特 別關注。
如此看來,著眼于網絡文學作品的研究需求搜尋和開發(fā)更為恰當的分析工具,就成了當務之急。可供開拓的方向大致有以下幾種。
首先是能針對不同類型的網文,提煉出它們的敘事結構的分析工具。長篇類 型小說在網絡文學中占據著非常顯著的位置,其最大的特征就是類型化,同類型的小說在敘事結構和風格上高度近似,而各大主流類型本身,又都是在復雜的演 化、融合的過程中慢慢成型的。
“清穿文”就是一個非常典型的例子。作為穿越文中知名度最高的一個子類型,這批作品的故事背景和人物形象多取材于20世紀末21世紀初熱播的一批清宮劇,特別是《雍正王朝》。因受其影響,相當一部分“清穿文”都將時間跨度設定在了康熙四十年左右至雍正繼位初期。如果我們將這批“清穿文”匯 總到一處,再把每本書都提到過的關鍵性歷史節(jié)點標記出來,例如康熙四十七年廢太子、或者康熙駕崩雍正繼位等,據此拉出一條公共的時間軸。再以這條時間軸為參照系,把每一部“清穿文”的劇情一層一層地疊加在這個時間軸上,凡遇到發(fā)生沖突的情況,例如有些小說里女主選上了秀女,有些小說則沒選上,就畫出分叉的兩條線索,以此類推。那么不難想象,最終形成的劇情流 程總圖,就會像是一條從康熙四十年發(fā)源的長河,先是迅速分裂出無數條平行的支流,偶爾收束,再分流,然后不斷向著雍正初年的入海口奔涌而去。如果 這些繁復而又有序的變化能通過工具批量化地加以處理并可視化,必將對“清穿文”的結構類型分布做出更為全面的總結與展示。
其次可以考慮開發(fā)的,是提取小說主要角色的萌要素的分析工具。所謂“萌 要素”17 ,是日本學者東浩紀在其專著《動物化的后現代》中提出的概念。特指ACG18 作品中某些與角色形象相關的,風格化、類型化的元素,包括著裝(水 手服、女仆裝等)、發(fā)型(雙馬尾、黑色長直發(fā)等)或性格特征(傲嬌、天然呆 等)等。19 東浩紀認為,1990年代中期以后的日本御宅族20 群體,由于身處后現代語境之中,早已不再執(zhí)著于作品背后的宏大敘事,轉而開始關注具體角色身上所攜帶的,能夠喚起讀者強烈愛意的“萌要素”。與這一趨勢相呼應,ACG作品 中的角色,也逐漸轉變?yōu)楦鞣N萌要素拼貼、集合與再循環(huán)的產物。這批萌要素匯總一處,就是所謂的“萌要素數據庫”,而御宅族群體對ACG作品及作品中人物的消費,本質上其實是針對這個數據庫的消費。21
這一消費萌要素的趨勢,也早已在中國的網絡文學界蔓延開來?!扒宕┪摹?中那些取材于清宮劇的人物形象,如康熙朝諸皇子,他們在進入“清穿文”的世界,成為女主人公情感、欲望的投射對象的過程中,顯然也遭遇過一次微妙的 “人設化”22 處理:先從電視劇的文本里拆解出若干較有辨識度的人物性格特 征,例如四阿哥胤禛的堅毅隱忍殺伐果決、八阿哥胤禩的謙謙君子溫潤如玉等, 將其“萌要素化”,再利用這些“萌要素”,拼貼出一個外表上看似與原形象相差無幾的“人設”來:四阿哥因此化身為“霸道總裁”,八阿哥則是公認的“暖男”。而這些“人設”在“清穿文”的創(chuàng)作過程中,也經由粉絲社群的交流討論,逐漸成為整個類型內部通用的“公共知識”和“基本共識”。這暗示著一個耐人尋味的事實,即網絡時代的作者和讀者,他們的欲望模式也同樣是數據庫化的。數字技術和數字媒介環(huán)境對網絡文學的影響與重構,又豈止停留在生產機制層面呢。
在理想的狀態(tài)下,如果可以利用分析工具解析海量文本中隱藏的萌要素,再加以匯總整理,必能得出有趣的結論,甚至最終形成一個由萌要素組成的字面意義上的“數據庫”。在數字人文分析工具“一葉·故事薈”23 中,就包含了一個 “人物側寫”的功能,即通過給出小說中主要人物的名稱,分析提取與之聯系最為密切的關鍵詞。但這個功能畢竟沒有針對萌要素的識別進行過優(yōu)化,經過筆者 的幾輪試用,結果也確實不能盡如人意。不過既然有珠玉在前,此類分析工具的開發(fā),就已經具備了相當的基礎。
除此之外,網絡文學的粉絲社群也是非常值得注意的研究對象,或可利用社會網絡分析的相關研究方法和工具進行介入。最典型的例子仍然是“清穿文” 的粉絲社群。由于整個“清穿文”的作者、讀者群體都是直接或間接的清宮劇粉絲,又往往容易將強烈的愛意投射到某個特定的人物身上,成為所謂的“角色粉”,例如四阿哥胤禛的粉絲團,就被稱為“四爺黨”,同理八阿哥胤禩的粉絲團則被稱為“八爺黨”。姑且不論這些粉絲社群的組織形態(tài)本身就非常具有研究價值,它們對“清穿文”創(chuàng)作的反哺作用也是顯而易見的,比方說,這些“角色 粉”的社群內部就常常圍繞著相應的人物形象展開交流討論以及史料挖掘等。盡管“清穿文”的創(chuàng)作熱潮早已過去,而當年這些粉絲團的討論現場也已消失殆 盡,但與之類似的現象卻仍在不斷上演,例如起點中文網開啟本章說功能之后,某些作者就會從讀者評論里吸取有價值的想法融入自己的創(chuàng)作。這些讀者與讀 者、讀者與作者之間的交往關系,無疑是網絡文學的生產、接受環(huán)節(jié)之中不可或 缺的重要組成部分。
倘若不必將視野局限于網絡文學的文本,那便不難意識到,近十年來,網絡文學作品改編的影視劇已越來越常見。《步步驚心》電視劇的熱播,正是這股潮 流的開端。既然如此,利用包括多模態(tài)語篇分析24 (multimodal discourse analysis) 在內的各種理論,開發(fā)用于分析對比網絡文學文本及其改編影視劇的工具,似乎 也是一個可行的方向。
三 建立網絡文學研究數據資料庫的必要性
在沒有數字人文技術介入的情況下,如果想要研究網絡文學之中的某個特定類型,例如“清穿文”,常見的做法是從中挑選出代表性的文本進行細讀,再借此挖掘與闡釋整個類型的特征與發(fā)展脈絡。這一研究思路本身并無問題,卻終究只能從結果向前追溯,無法系統、完整地呈現一個類型在演變過程中所有枝節(jié), 若引入數字人文的相關工具,或可處理此類問題。但對于“清穿文”而言,到遴 選研究對象這一步,還是不免遇到一些困難:文學網站的庫存書目往往數以百萬 計,如何才能盡可能全面準確地挖掘出符合條件的文本?目前為止,最具可行性 的解決方案,就是利用內嵌在文學網站主頁上的搜索欄,依據關鍵詞和標簽進行 檢索。這就不免令人聯想起數字人文研究的核心成果與重要工具——學術文獻數 據庫的使用,事實上,單以保存/檢索數字文本這項功能而論,二者之間其實并 不存在任何本質差異。正如前文所言,數字人文研究起源于文獻典籍的數字化與數據庫化,網絡文學顯然直接越過了“數字化”這個步驟,那么,文學網站是否 能夠直接承擔數據庫的功能呢?
仍以晉江文學城為例,該網站現有藏書331萬部,簽約版權作品也已超過25 萬部。25 為方便讀者查找書目,晉江在首頁上提供了兩種檢索方式,第一種是 關鍵詞檢索,即依據作品、作者或主人公的姓名搜尋具體的某部作品;第二種則 是通過限定時代(包括近代現代、古色古香等4種)、類型(包括愛情、武俠、 仙俠、科幻等16種)和風格(包括悲劇、正劇和輕松等5種)等標簽,篩選出符 合條件的作品列表。其中,“內容標簽”這個分類之下,就包含著一個叫作“清穿”的標簽。26乍看上去,這套標簽檢索系統與學術文獻數據庫中的某些功能倒也頗為相似,但作為以UGC為核心運營理念的文學網站,晉江站內的標簽編輯模塊,一直由作者自行打理。該模塊內嵌在發(fā)布/修改小說的后臺頁面上,可以根據個人的 理解與偏好自由選擇添加27 ,并沒有統一的操作規(guī)范,也就無從苛求它的準確性。除此之外,UGC這個屬性,還意味著內容的積累與增殖,以及新的創(chuàng)作潮流和類型的不斷涌現。然而網站標簽庫的更新卻要滯后許多,至少“清 穿文”的命名和“清穿”標簽的引入就絕不可能早于第一批“清穿文”的發(fā)表。事實上,連載于2004—2006年的“清穿文”,其常用標簽就多為“穿越時空”和“靈魂轉換”,但在這兩個標簽之中,卻又包含著大量并非“清穿 文”的作品。
僅憑搜索標簽,顯然是不夠的。那么能否利用爬蟲軟件,通過限定故事年代背景,再結合相應標簽等信息進行抓取呢?確實未嘗不可,但晉江歸根結底是一 個營利性的商業(yè)網站,一旦站內作品出現版權變動或被某項新政策波及,那么相 關頁面便會立即鎖定,無法瀏覽?!扒宕┪摹鼻『檬巧鲜鰞煞N狀況的重災區(qū),前文提到過的“清穿三座大山”,即《步步驚心》《夢回大清》和《瑤華》,目前均處于鎖定或部分鎖定的狀態(tài)。雖然上述幾部小說的紙質書和電子文檔早已廣為 流傳,但更多不那么知名的作品,或許便就此湮滅了。況且,原發(fā)布頁面的丟失也意味著一部小說連載至今的所有讀者評論、積分和點擊量等重要信息的損毀,這種缺憾是無可挽回的。
總而言之,盡管以晉江為代表的絕大多數文學網站在架構和功能等方面與學 術文獻數據庫存在一定程度上的相似性,但作為一個UGC屬性的商業(yè)網站,它終究只需要對投資者和用戶(作者、讀者)負責,既無義務也無意向為學術研究提供服務。并且,由于站內發(fā)布文本的總量極其巨大,也就談不上對小說的錯字病句進行勘誤或者核實作品標簽的準確性,距離正規(guī)學術文獻數據庫的標準,還差得很遠。
盡管如此,從數字人文的研究視野出發(fā),利用檢索、爬蟲軟件抓取等手法 遴選““清穿文””研究對象的基本思路,仍然是合理有效的。只不過一旦進入 實操環(huán)節(jié),就不免暴露出當前中國網絡文學研究面臨的一層隱憂,即學術導向的數據資料庫的缺位。相比一些傳統人文學科(如歷史學、古代文學等)在文獻典 籍數字化和數據庫化過程中投入的大量人力物力,網絡文學研究作為一門新興學 科,亟需加快腳步。目前可以著手的工作有兩個:一、與文學網站合作,開辟學 術搜索端口;二、著手搭建專用的學術資料數據庫,廣泛收集、整理和挽救網絡 文學研究所需的各種數據信息和材料。
隨著信息時代的來臨,許多傳統人文學科早已通過文獻典籍數據庫的建設以及相關分析工具的開發(fā),翻開了數字人文的新篇章。而原本就生長在互聯網算法規(guī)則與技術邏輯之中的文學網站及其內部的創(chuàng)作實踐,卻在誕生的一刻,就注定了要與數字人文的思維緊密糾纏。基于天然的媒介優(yōu)勢,如何一邊繼承過往研究成果,一邊借助數字人文的視野來推進學科建設與理論自覺,必將成為未來的網絡文學研究者們面臨的最大挑戰(zhàn)。
注釋:
1 晉江文學城創(chuàng)立于2003年8月,是網絡文學界規(guī)模最大,影響力也最為深遠的,主要面向女性用戶的文學網站。其前身為1999年由福建晉江電信局建立的文學站點“晉江 文學城”。最初主要靠掃描、校對港臺言情小說維持更新,2003年之后轉型為原創(chuàng)文 學網站。近年來諸多大熱電視劇的原著,最初都連載于晉江文學城,如《步步驚心》 《甄嬛傳》《微微一笑很傾城》以及《陳情令》等。
2 “穿越”指的是主角由于某種原因(通常是意外事件)來到了過去、未來或平行時 空。該詞由英文travel through或traverse翻譯而來,語源為“穿越蟲洞”(travel through a wormhole),是物理學界普遍認可的一種實現時空穿越的理論可能。參見邵燕君主 編《破壁書:網絡文化關鍵詞》,第263~267頁,“穿越”詞條,該詞條編撰者為李 強、肖映萱。
3 晉江原創(chuàng)網,是晉江文學城于2003年至2010年使用的站名,突出“原創(chuàng)”二字的目 的,是為了與此前掃描、校對港臺言情小說的主營業(yè)務切割,轉型為刊載原創(chuàng)作品的 文學網站,招攬培養(yǎng)本網站的簽約作者。2010年2月之后,又再度更名為晉江文學城, 并沿用至今。
4 算法是計算機領域的術語,指用系統方法描述解決的題的策略機制,由一系列解決的 問題的清晰指令構成。一個完整的算法對應一個要解決的問題,其內部包含數據傳輸 (如輸入、輸出、賦值)、算法計算(如加減乘除)、邏輯計算(如或、非、且)和 關系計算(如大于、小于)中的一個或多個環(huán)節(jié)。
5 該積分計算公式,由晉江文學城站長iceheart于2005年3月2日發(fā)布于晉江文學城論壇網 友交流區(qū)碧水江汀版塊,原帖標題為《原創(chuàng)網新版積分公式及評論規(guī)則,請讀者作者都進來看一下》。在清穿文最為流行的時期,晉江文學城的作品積分計算就是以這個公式為準的。該積分公式已于2016年作廢。
6 早期的晉江文學城,只有網站編輯才有權限為長篇評論添加“精華”獎勵,后來由于評論量激增而改為由作者手動添加,此后這項積分系數也就名存實亡了。
7 總分排行榜是對晉江全站小說的作品積分進行排名的榜單,沒有下榜期限。半年榜是 對發(fā)文時間在第131天到310天內的作品按積分排行的榜單。月榜是對發(fā)文時間在第 11~40天內的作品按積分排行的榜單。新晉作者榜是對30天內申請成為作者的賬號發(fā)表的作品的總積分進行排行的榜單。
8 這種讓渡也不同于暢銷書生產機制,雖然都是將選擇權交給讀者,但出版業(yè)畢竟只能通過消費這一個渠道,而文學網站的積分排序等機制,卻能多維度、精細化地對用戶行為進行引導和把控。二者是不可同日而語的。
9 自2013年起,以騰訊、阿里為首的互聯網資本全面進軍文娛行業(yè),大量收購網絡小說進行影視改編。晉江依靠售賣版權帶來的收入也因此一路飆升,占據了網站收益的絕 大部分比重。為了鼓勵旗下作者與網站簽訂長期合約,并盡可能地將版權運營授權給 網站代理,新修訂的積分計算公式才增加了簽約年限和版權授權狀況這兩個系數。
10 在晉江文學城論壇里,就不時能見到作者討論如何利用積分規(guī)則獲得更好排名的帖子。
11 讀者付費購買網站提供的虛擬道具贈送給作者,以表示支持的一種功能。
12 收藏是文學網站提供的一項功能,它允許讀者通過點擊具體作品頁面上的收藏按鈕,將這部作品添加進自己的收藏夾,以便查找管理。收藏榜一般按照作品當前現存的收藏人數由高到低排列。
13 “女性向”這個概念來源于日語詞匯“女性向け”(じょせいむけ jyosei muke),
字面含義為“面向女性、針對女性的”。它有廣義和狹義兩種含義,廣義上,包含 一切面向女性創(chuàng)作的文化消費品;狹義上,特指面向女性創(chuàng)作,同時“規(guī)避男性目 光”“逃離外界凝視”的一種文化生產與社群生態(tài)。參見邵燕君主編《破壁書:網絡 文化關鍵詞》,生活·讀書·新知三聯書店 2018年版,第166~172頁,“女性向”詞 條,該詞條編撰者為肖映萱。
14 例如發(fā)表于2020年4月1日的一篇名為《我的老攻××歲》的小說,由于存在拉票、刷 分等違規(guī)行為,作者“是個削”又卷入了復雜的粉圈斗爭,因而遭到抵制。具體的抵 制策略當然就是“刷負分”。截至2020年4月18日凌晨,該作品的總積分已降至負七億 零五百余萬,且仍在持續(xù)下降中。
15 事實上,論文舉例積分計算規(guī)則,不過是管中窺豹,目前在各大文學網站的閱讀App 上,利用大數據算法分析用戶喜好,進行定向推送的操作已越來越多見。在可預見的 未來,數字技術對網絡文學生產的干預必將越發(fā)顯著。
16 Docusky由臺灣大學數位人文研究中心、資訊工程學系數位典藏與自動推論實驗室規(guī)劃,是 一個滿足人文學者研究需要,提供面向個人的材料整理與分析服務的網絡平臺。
17 萌要素:萌,在日語中寫作萌え(moe),是燃え(燃燒)這個詞的同音詞。日本的御宅族常會用“燃”來形容喜愛一個角色到了胸口仿佛在燃燒的程度,后來漸漸被更 為生動有趣的同音詞“萌”所代替。而所謂“萌要素”,就是指能為人物增加可愛感 的特定元素。參見邵燕君主編《破壁書:網絡文化關鍵詞》,第23~33頁,“萌”詞 條,該詞條編撰者為林品。
18 ACG,是指Anime、Comic、Game,也即動畫、漫畫和游戲的首字母縮寫,在此處特指 與日本的二次元文化相關的一系列文化消費品。參見邵燕君主編《破壁書:網絡文化 關鍵詞》,第7~11頁,“ACGN”詞條,該詞條編撰者為高寒凝。
19 “傲嬌”,即性格別扭,口是心非,明明喜歡卻裝作不在意甚至很討厭的樣子;“天 然呆”,指性格迷迷糊糊、傻傻的樣子。
20 御宅族(御宅,おたく,otaku),這個詞起源于日本,指的是日系漫畫、動畫、電子 游戲和輕小說(light novel)的愛好者。參見邵燕君主編《破壁書:網絡文化關鍵詞》 第2~6頁,“宅”詞條,該詞條編撰者為林品。
21 [日]東浩紀:動物化するポストモダン:オタクから見た日本社會,講談社, 2001,第62、78頁。
22 “人設”指的是由“萌要素”拼貼而成的“人物設定”,也稱“角色設定”,通常 簡稱為“人設”。參見高寒凝《親密關系的實驗場:“女性向”網絡空間與文化生 產》,《文藝理論與批評》2020年第3期。
23 由谷臻故事工坊開發(fā),是一個基于人工智能技術開發(fā)的大數據文本分析系統。主要功 能包括關鍵詞提取、題材分析和情緒曲線分析等。
24 多模態(tài)語篇分析理論,是國際系統功能語言學者Kress van Leeuwen于1990年代中期提出 的一個較為系統化的、完善的分析視覺圖像中多種模態(tài)的語法框架。
25 參見晉江文學城“關于我們”頁面內的簡介。
26 “內容標簽”的選項多達160余個,“清穿”只是其中之一。
27 添加標簽的選項會出現在作者操作后臺的“發(fā)布新文”這個頁面上,分為兩類。第一類是必選標簽,例如時代、類型和風格等,小說發(fā)布之后,會依據作者選擇的標簽, 將文章按照這些標簽進行歸類。而“清穿”標簽所屬的“內容標簽”一欄,則并不是 必選項目,只要求作者從中選擇0~4個用于描述小說的內容。