林語堂、王云五與漢字檢索、打字機的故事
圖書館員是中國文字傳統(tǒng)的監(jiān)護人,他們認識到,必須找到辦法讓漢語得以進入現(xiàn)代技術環(huán)境。然而,如果想保留過去的傳統(tǒng)不予丟棄,就必須想辦法重新組織漢語以供系統(tǒng)性使用。要使?jié)h字和字母一樣好用,要為漢語創(chuàng)立成功的歸檔系統(tǒng)。一位年輕的英文教師無意間成了領頭人。
1917年,23歲的林語堂在《新青年》雜志上發(fā)表了自己的第一篇作品。這份雜志兩年前在上海法租界創(chuàng)刊,給中國躁動不寧和聰穎卓絕的青年人提供了一個平臺。雜志除中文刊名外還有同樣語義的法文刊名“La Jeunesse”,顯示了帶有馬克思主義鋒芒的世界性風格。在這本封面加紅套印的平裝雜志上,勤于思考的年輕人發(fā)文表達激進觀點,介紹西方思想,質(zhì)疑傳統(tǒng)知識。
與各種激烈批評傳統(tǒng)文化的文章相比,林語堂的文章沒有那么慷慨激昂。他選擇了一個看似無害無趣,更適于圖書館工作者思考的題目——《漢字索引制說明》。林語堂那篇7頁長的文章沒有提出什么振聾發(fā)聵、令反叛青年趨之若鶩的主張,但它后來做到了雜志中任何其他文章都做不到的事:它不可逆轉(zhuǎn)地改變了新舊知識的景觀。
林語堂的提議乍看似乎簡單,但其實可以算是一份組織漢字的完整指南。他把漢字分解成筆畫,確定了5類筆畫:橫、直、撇、點、勾。這里隱約可見傳統(tǒng)上教授書法時使用的永字八法的痕跡。可是林語堂給他的5類筆畫界定的范圍要寬得多,他注意的是筆畫的方向,不是筆畫的樣式。例如,一橫不僅包括明顯的一道橫線,如漢字的“一”,而且包括任何從左到右以類似的動作寫出的筆畫,不一定是平的。
數(shù)千年的書法練習使得筆畫和筆順根深蒂固,發(fā)展出了一套先寫哪筆,后寫哪筆,直至完成全字的固定規(guī)則。在英文書寫中,可以想象寫字母“A”時先寫中間的小橫,但常規(guī)寫法是先寫左邊的斜線,后寫右邊的斜線,最后寫連接這兩條斜線的小橫線。同樣,寫字母“X”的時候先寫哪一筆都可以,結(jié)果毫無差別。但是,手寫漢字時,筆畫和筆順嚴格得多。林語堂用一個字的首筆畫作為第一分類依據(jù),卻發(fā)現(xiàn)分得不夠細。于是他在那5個基本筆畫的基礎上加以擴大,確定了19個首筆畫,囊括了所有漢字書寫的第一筆。
接下來林語堂把第一筆和第二筆放在一起,找出了28個頭兩筆的格式,幾乎適用于所有漢字。這如同先分出所有以一條豎線,開始的字母:“B”“D”“F”“H”“K”“L”“M”“N”“P”“R”。然后加上第二條規(guī)定:第一筆豎線后必須是曲線,這樣前述那些字母就剩下了“B”“D”“P”“R”。用確定的一套頭兩筆組合來辨識漢字,如此產(chǎn)生的組織格式與字母的邏輯不相上下。
林語堂這個簡單明了的辦法向數(shù)千年來研究、學習和規(guī)范漢字的傳統(tǒng)提出了挑戰(zhàn)。他顯示了漢字如何可以按照其自身組織來分類,而不必依賴其他外在的原理,無論是西方字母還是代碼。在字典中分類查找漢字從來都是靠部首。在林語堂之前,沒有一個中國人提出過他這樣完整的替代部首制度的方法。
傳統(tǒng)上,分類所依靠的原理因多年的習慣和文化實踐積淀而成,而非來自抽象的語言理論。語文學和詞典學是中國經(jīng)典學問的核心,文字本身也是研究的對象。許多個世紀以來,學者們努力通過證實某個字的意思來保存古人的智慧,這是訓詁學這門備受尊敬的學問的關鍵。印刷術發(fā)明之前,此事的難度超乎想象。即使手抄本的字體依照規(guī)范,仍舊有許多筆畫差那么一點。一橫寫成一撇能引得以后好幾代學者對這到底是什么字爭吵不休。
管理漢字的全部詞匯枯燥無味,吃力不討好。把字詞整理記錄成詞匯表是對漢語知識基礎的重要支撐。這項工作是對漢語詞匯的必要維護保養(yǎng),需要懷著負責任的精神耐心地、不厭其煩地反復比較對照,細致入微地分門別類。所有這些一絲不茍的工作都遵循著一條基本規(guī)則。兩千年來,作為漢字一部分的部首一直是分類的唯一標準。最早的漢語書寫出現(xiàn)后大約1100年到1500年,部首得到了確定,當時用于管理內(nèi)務。那時漢字的數(shù)量已經(jīng)相當可觀。
部首是神圣的,上千年來一直得到尊重和遵守。不過,時常有人發(fā)問:為何要有如此多的部首?到底多少部首最為合適? 對此眾說紛紜。10世紀,一位僧人把部首數(shù)目從540減到了242,近500年后,一對父子選擇了444這個數(shù)字。最后的214個部首是明朝時確定的,由太學生梅膺祚整理編入了自己編纂的《字匯》之中。到18世紀,愛書如癡的康熙皇帝采納了214個部首的制度,命人編纂一部權威性字典,由此確立了214個部首的權威地位。
到20世紀早期,部首制度開始現(xiàn)出裂痕。幾個世紀以來,人們一直在修改、補充、調(diào)整部首制度,以維持它的可行性,但這個制度學習和使用起來仍然費時費力。沒有易于掌握、有章可循的規(guī)則來儲字檢字,也沒有合理的辦法來管理浩如煙海的字軸和書籍中用漢字記載的大量故事、歌謠和王朝歷史。
在1917年刊登在《新青年》上的文章中,林語堂把漢字和漢語信息管理視為同一個問題。若能輕易地在字典里找到一個字,同樣可以很快找到一本書書名中的第一個字。所以,解決前一個問題的辦法一定能夠解決后一個問題,而辦法從來就擺在那里,那就是漢字的結(jié)構。林語堂表示,漢字完全可以應付現(xiàn)代的挑戰(zhàn)。它的進步無需任何外援,不用羅馬字母,不用數(shù)字,也不用代碼。漢語不需要其他表現(xiàn)方法,它自己特有的筆畫和筆順就足夠了。
林語堂的主張立即引起了共鳴。在中國深陷疑惑與焦慮之時,他的主張給人們帶來了希望、慰藉,甚至信心。新文化運動的一位領袖錢玄同看到,林語堂的思想遠超同時代的人,對這位年輕的索引編制者贊不絕口。一時間稱譽四起。德高望重的教育改革家蔡元培指出,林語堂不僅重新構想了筆畫的功能,而且他的辦法詳細展示了筆畫如何引領并構成一個字的全部輪廓。林語堂發(fā)現(xiàn)的漢語表意文字的邏輯足以媲美西方字母的組織能力,卻一個拉丁字母都不用,這是何等的巧思啊。
從康奈爾大學留學歸來的庚款留學生胡適的看法最深刻。他看到,林語堂研究的是使中國的往昔得以延續(xù)到未來的基礎結(jié)構。林語堂的成就是認識到漢字有自我組織的能力,能夠用來在中國浩大而豐富的知識基礎內(nèi)存儲、搜尋、分類、選擇并查找想要的信息。這個能力可以擴展到各種排序系統(tǒng),甚至是其他語言的排序系統(tǒng)。也可以借此能力恢復中華知識寶庫的文化力量。胡適說,林語堂的索引制是打開其他門的那扇門,是被批評傳統(tǒng)的人忽略了的奠基工作。胡適認為林語堂對重建中國的貢獻是幫助拯救中國的傳統(tǒng)與遺產(chǎn),使之不致湮沒。
不過,林語堂不認為自己當?shù)闷鹑绱速澴u。
在林語堂的領跑之下,研究漢字索引法的競賽就此展開。這種系統(tǒng)性組織漢字資料的方法對管理信息有實際用處。林語堂的同儕用了幾年時間才看出他1917年的文章概述的那種制度方法的真正潛力。一旦認識到這一點,他們也開始聚焦字形問題,不僅注意筆畫,還研究漢字內(nèi)部結(jié)構的其他部分。林語堂出國期間,很多人熱切希望做出成果,超過別人。
競賽就這樣開始了。先是涓涓細流,然后大潮洶涌而至。20世紀20年代,關于最新最好的漢字索引的提議如雨后春筍不斷出現(xiàn),主要集中于三類:按偏旁區(qū)分字形、按數(shù)字區(qū)分字形、按其他空間單位區(qū)分字形。這些辦法的主旨都是用盡可能少的步驟快速識別、分類漢字。與此同時,著名知識分子、語言學家錢玄同在1925年發(fā)動了廣泛的漢字革命,呼吁對漢語文字發(fā)起全面攻擊。
改進漢字索引的競賽像是一場障礙賽跑。人們需要的不是作秀,而是攻略:索引制的指示必須簡單明了;漢字排序要合乎邏輯;不能多一道先查找部首或計算筆畫數(shù)目的手續(xù);索引制必須以客觀穩(wěn)定的標準為基礎。
人們爭先恐后地尋找漢字索引的最佳方法。有些人借用林語堂關于基本筆畫的想法,提出了自己的“魔數(shù)”。黃希聲找出了20個筆畫作為漢字核心組成要素。沈祖榮和胡慶生合作確定了12個筆畫。廣東的杜定友重新組織了字形分析法,提出了一套完整的漢字排檢法。在他之后,湖北的桂質(zhì)柏提出了26筆畫法。上海商務印書館的王云五大力主張回歸數(shù)字編碼。還有人想兼用字形和數(shù)字。加入競賽的人越來越多。他們把漢字翻來覆去、掰開揉碎地仔細分析,都想最先找到能夠幫助規(guī)范漢字組織方法的隱蔽客觀法則。
中國國內(nèi)研究漢字索引制的人各種各樣,目的也五花八門。國民政府高官陳立夫主要想簡化政府檔案的復雜存檔程序。他提出了一種五筆制,希望取代部首制。對教育家趙榮光來說,漢字索引僅是次等關注對象,他首要關心的是編制基本的識字課本。他和其他幾個人一起主張應制定包含1000到1300個字的漢語基本詞匯。這就如同基本英語(BASIC,British American Scientific International and Commercial)的850個單詞,那是非英語母語者學習英語時必須掌握的基本詞匯。
有人看到了這個迅速發(fā)展的現(xiàn)象,注意到僅1928年就有大約40個關于漢字索引的提議。1933年整理出來的另一份清單包含了37個提議,但那只是20世紀40年代的一半之數(shù)。隨著競爭的擴大,后來的人要絞盡腦汁另辟蹊徑。在各種提議和宣傳的喧囂之中,很難分清五花八門的提議孰優(yōu)孰劣。
最終勝出的是王云五發(fā)明的四角號碼法。王云五位高權重,是商務印書館的總經(jīng)理。他很有生意頭腦,對利潤的嗅覺非常靈敏。他按照弗雷德里克·溫斯洛·泰勒(Fred?erick Winslow Taylor)的科學管理原則管理印刷車間,知道如何充分利用機會,也知道如何在工作時間內(nèi)榨取最多的勞動價值。
王云五利用字形辨認方法制定了一套編號制度,以此作為唯一的賣點。他借鑒了19世紀的電報編碼方法,但有一點關鍵的不同。他不是隨機給不同的字分配數(shù)字,而是利用漢字是寫在想象出的正方形空間內(nèi)這一事實,畢竟?jié)h語中經(jīng)常把漢字叫作“方塊字”。他用這個想象出的空間來確定一個字的四角,然后給每個角分配從0到9的一個數(shù)字,每個數(shù)字都與某個特定的筆畫類型相關聯(lián)。這令人想起林語堂的主意。
王云五使出渾身解數(shù)推銷自己的辦法,因此躋身民國時期中國第一批現(xiàn)代資本家之列。他拍板出版了百科全書和作家選集等多種參考書,商務印書館因此不僅財源滾滾,而且名聲大振。全國各地數(shù)十萬年輕學生蜂擁購買這些學習現(xiàn)代知識的工具書。1928年,教育部門將王云五的四角號碼查字法頒布為標準參考工具書的官方索引制。做出這一決定部分是出于對王云五的地位和影響力的尊重。
王云五利用自己的地位把四角號碼檢索法納入了以商務印書館的名義出版的每一部重要參考書。這個方法的影響力從參考書向外擴散到市級電話簿、省立圖書館和大學圖書館、世界語學會、政府機構、百科全書、各類詞典、外國大學,甚至是與商務印書館競爭的其他出版社。四角號碼檢索法無處不在。有些書籍甚至標明了王云五的名字,如《王云五英漢大辭典》和《王云五小辭典》。可以說,無論學什么,都要會用四角號碼檢索法。
由于王云五傳奇般的成功,人們開始對他精心編造的關于自己如何獲得靈感的故事信以為真。他最喜歡別人問他是如何想到這個辦法的,每每提及,他總是回答說,那與自己天生熱愛生活分不開。王云五說,他每天都期待著凌晨3:30起床快步走10英里的日常鍛煉,有時還外加爬一千三百級臺階。他還說,自己十幾歲的時候花了3年時間把《大英百科全書》從頭到尾讀了一遍。早年的自學在他頭腦里種下了為他人發(fā)展學習工具的念頭,導致他后來運作出重大出版項目。原來批評王云五的人變成了他的擁躉。別人爭相從他對自己生平的述說中剽竊細節(jié),甚至一字不漏地照抄。
王云五想要的是絕對統(tǒng)治地位。他打算讓他的四角號碼檢索法獲得實證科學的權威。商務印書館在上海開辦了暑期課程和訓練班,對來自全國各地的中學生和大學生傳授王云五的四角號碼檢索法。學生們遠遠不止聽老師在課堂上授課,課程安排還包括班級競賽和名人演講,演講的內(nèi)容是四角號碼檢索法的優(yōu)點和中國文化遺產(chǎn)的未來。在一場查字競賽中,一個十幾歲的上海孩子以每字不到8秒鐘的成績擊敗了前冠軍。
當然,獨立評判者對四角號碼制度做出的評價更謹慎一些。王云五的辦法真的比原來的部首制度強很多嗎? 一所小學對比了這兩種方法后,認為并非如此。事實上,王云五的辦法更難學,因為必須記住哪個數(shù)字對應哪個偏旁。數(shù)字與它所代表的字的組成部分之間沒有無須思索的自然聯(lián)系,這就違背了易懂好用、立即可辨、無需更多步驟等原則。但是,王云五對這些懷疑的聲音毫不在意。他的名字現(xiàn)已成為品牌,商務印書館迅速壓下了一切反對聲音。他們干脆不再出版任何不用四角號碼檢索法、使用其他索引法的書籍,同時打折出售《四角號碼王云五小辭典》。
挑戰(zhàn)者在王云五面前一一敗下陣來,那情景簡直可以當熱鬧看。
當時無人知曉,王云五有個不光彩的小秘密。年輕的林語堂尚未公開自己的想法時,王云五就已經(jīng)先于別人得知,因而獲得了相對于其他競爭者的決定性優(yōu)勢。1917年,林語堂在清華大學教英文時,王云五通過兩人共同的一位相識聽說林語堂正在研究漢字索引法。王云五表示愿意幫忙,可以出資買斷林語堂在清華的教學合同,并給林語堂在商務印書館安排一年的研究合同,林語堂接受了。按照合同規(guī)定,林語堂每月要提交研究進度報告,那些報告都轉(zhuǎn)到了王云五手中。林語堂正全神貫注研究部首和筆畫分析,無疑把每個階段的研究成果都寫進了報告里。
后來,王云五堅稱自己在頭幾個月中因公事繁忙,根本沒有時間閱讀林語堂的報告。等他終于讀到了那些報告時,發(fā)現(xiàn)自己對這個問題“另有所見”。他認識到,林語堂的提議僅能解決一部分問題。王云五在自己的意志和想法的推動下,奇跡般地在幾周后看到了自己的道路:部首制必須完全被基于數(shù)字的制度取代。
王云五精明地逐漸淡化了他與林語堂的關系。王云五在1926年初次推出四角號碼的一本英文小冊子中承認了林語堂對筆畫的研究,但在兩年后出版的修正版中對林語堂只字未提。時隔幾十年,林語堂才說出其實數(shù)字分類法的主意也是他提供給王云五的。當時林語堂在研究索引法時探索了好幾條不同的路徑,數(shù)字分類法是其中一條。按此方法,每一類筆畫都標為從0到9的某一個數(shù)字。所以,王云五不僅把林語堂最先提出的想法拿來為己所用,而且就連他聲稱是自己想出來的那部分其實也來源于林語堂的研究成果。
與此同時,林語堂如愿走出了自己的路。他在1917年發(fā)表了那篇文章后,出國學習、旅行了幾年,但并未停下對此題目的研究。他找出了新辦法來發(fā)展索引法,在索引法競爭日趨激烈之時回到了中國。然而,林語堂的語言學興趣已經(jīng)開始向其他領域發(fā)展。這段時期內(nèi),他就漢語問題寫了不少文章,從宏觀到微觀,從方言學到漢字羅馬化。他用數(shù)字來標識字形,不僅用一個字的起筆,也將該字的最后一筆納入檢索范圍,并利用古音韻來建立圖書館卡片目錄。林語堂的研究面鋪得更寬,不再限于其他人全心投入的競爭。
林語堂想做成更大的事。文名鵲起的他找到了自己真正傾心的事業(yè)——他想造打字機。林語堂熟悉周厚坤、祁暄和其他人造出的打字機。但是他想象中的打字機設計與它們不同。他的設計將以深厚的語言學知識為基礎,兼顧東方與西方、古代與現(xiàn)代、文科與理科。過了20年,林語堂才造出了他愿意向世界展示的原型機。
(本文摘自《漢字王國:讓中國走向現(xiàn)代的語言革命》,[美]石靜遠著,林華譯,中信出版集團2023年8月第一版,68.00元)