速度千倍、自動(dòng)識(shí)別、風(fēng)格呈現(xiàn)…… AI翻譯助力網(wǎng)文出海
隨著中國(guó)網(wǎng)文出海迅速發(fā)展,作品的翻譯質(zhì)量和規(guī)模也逐漸成為各方關(guān)注的焦點(diǎn)。近年來(lái),國(guó)內(nèi)網(wǎng)文企業(yè)紛紛加強(qiáng)與人工智能科技企業(yè)的合作,共同探索網(wǎng)文作品的相關(guān)翻譯工作。
近日,30部由人工智能(AI)翻譯的中國(guó)網(wǎng)文作品上線起點(diǎn)國(guó)際平臺(tái),該平臺(tái)新推出的“用戶修訂翻譯”功能也同步上線。新功能令用戶在閱讀過(guò)程中能夠?qū)I翻譯進(jìn)行即時(shí)編輯修正,修訂信息還能夠使翻譯模型的效果得到不斷優(yōu)化。
近年來(lái),中國(guó)網(wǎng)文出海規(guī)模逐漸擴(kuò)大,海外讀者對(duì)作品的數(shù)量和翻譯質(zhì)量需求也逐漸增加,這對(duì)國(guó)內(nèi)網(wǎng)文企業(yè)提出了更高的要求。閱文集團(tuán)聯(lián)席CEO吳文輝介紹,作為國(guó)內(nèi)較成熟的網(wǎng)文出海平臺(tái),目前,閱文集團(tuán)旗下起點(diǎn)國(guó)際已與世界各地的200余名譯者和翻譯組保持著長(zhǎng)期的合作關(guān)系,并建立了譯者招募培訓(xùn)體系、翻譯質(zhì)量把關(guān)體系、核心標(biāo)準(zhǔn)詞庫(kù)等,持續(xù)對(duì)國(guó)內(nèi)經(jīng)典優(yōu)質(zhì)網(wǎng)文作品進(jìn)行翻譯輸出,在全球積累了大批忠實(shí)讀者。但目前,由于國(guó)內(nèi)網(wǎng)文作品數(shù)量規(guī)模巨大,人工翻譯出海的頭部作品只是海量網(wǎng)文作品中的一小部分,這還不包括不斷涌現(xiàn)的新人新作。
為了讓全球“催更”讀者更快、更全面地感受中國(guó)網(wǎng)絡(luò)文學(xué)的魅力,滿足全球讀者不斷增長(zhǎng)的閱讀需求,網(wǎng)文企業(yè)與人工智能科技企業(yè)在AI翻譯模型開發(fā)方面進(jìn)行了大量探索。據(jù)了解,此次在起點(diǎn)國(guó)際上線的30部AI翻譯的中國(guó)網(wǎng)文作品,就是由閱文集團(tuán)與國(guó)內(nèi)人工智能公司彩云科技共同開發(fā)的AI翻譯模型完成的。
“該模型能夠針對(duì)普通難度的網(wǎng)文文本進(jìn)行翻譯,翻譯速度是人工翻譯的千倍,大大釋放了海量網(wǎng)文作品的長(zhǎng)尾價(jià)值。同時(shí),為了更好地把控文本翻譯質(zhì)量,我們還對(duì)AI翻譯模型進(jìn)行了集中性的‘專項(xiàng)訓(xùn)練’,既往優(yōu)秀的譯本、經(jīng)典網(wǎng)文原作、標(biāo)準(zhǔn)核心詞庫(kù)都是AI學(xué)習(xí)、訓(xùn)練的語(yǔ)料?!辈试瓶萍加嘘P(guān)負(fù)責(zé)人說(shuō),在針對(duì)網(wǎng)文的AI翻譯模型開發(fā)過(guò)程中,開發(fā)團(tuán)隊(duì)基于自然語(yǔ)言理解技術(shù),還加強(qiáng)了對(duì)內(nèi)容的深入挖掘,“比如通過(guò)對(duì)大量網(wǎng)文內(nèi)容和優(yōu)質(zhì)社區(qū)內(nèi)容的清洗、訓(xùn)練和標(biāo)注,使得AI機(jī)器能夠更好地理解網(wǎng)文內(nèi)容,以此建立網(wǎng)文平臺(tái)的‘內(nèi)容大腦’?;凇畠?nèi)容大腦’,AI可以提取網(wǎng)文的一些專有名詞,同時(shí)可以自動(dòng)識(shí)別角色(人名)、場(chǎng)景(地名)、升級(jí)體系等結(jié)構(gòu)化信息,構(gòu)建整體網(wǎng)文的知識(shí)圖譜?!倍辛诉@些信息的補(bǔ)充,AI翻譯就能夠更好地翻譯網(wǎng)文特殊領(lǐng)域中的詞、句、段落,包括作品中的人名、地名以及類似“金丹”這種網(wǎng)文作品中的專有名詞,并識(shí)別出各種代詞指代的對(duì)象,盡可能避免傳統(tǒng)機(jī)器翻譯時(shí)常常出現(xiàn)的“一詞多譯”“張冠李戴”等現(xiàn)象。
此外,開發(fā)團(tuán)隊(duì)在訓(xùn)練AI模型時(shí)還加入了“翻譯風(fēng)格”的選項(xiàng),方便對(duì)不同品類網(wǎng)文作品的風(fēng)格進(jìn)行精準(zhǔn)呈現(xiàn)。比如,針對(duì)不同的風(fēng)格要求,AI能夠?qū)⑼痪湓捰枚喾N不同的譯法進(jìn)行差異化呈現(xiàn)。
據(jù)了解,目前,我國(guó)網(wǎng)文出海范圍已覆蓋英語(yǔ)、西班牙語(yǔ)、日語(yǔ)、韓語(yǔ)、泰語(yǔ)、越南語(yǔ)、印度尼西亞語(yǔ)等10余個(gè)語(yǔ)種(包括自有平臺(tái)運(yùn)營(yíng)和海外授權(quán)合作)。作為在海外率先實(shí)行付費(fèi)閱讀的中國(guó)正版網(wǎng)絡(luò)文學(xué)平臺(tái),起點(diǎn)國(guó)際在谷歌應(yīng)用程序商店的營(yíng)收榜單上,長(zhǎng)期位列圖書分類的頭部,累計(jì)訪問(wèn)用戶已超過(guò)5000萬(wàn)。平臺(tái)上有600余部中國(guó)網(wǎng)文英文翻譯作品,包括武俠、玄幻、奇幻、都市等多元題材。這些作品既蘊(yùn)含著傳統(tǒng)東方元素,又展現(xiàn)出當(dāng)代中國(guó)風(fēng)貌,同時(shí)含有人類共通的情感和故事元素,在海外讀者中均有很高的人氣。
“這些走出去的原創(chuàng)網(wǎng)文作品是中國(guó)網(wǎng)文作為‘文化旅者’漂洋過(guò)海、在全世界開出的‘中國(guó)花’。來(lái)自美國(guó)、英國(guó)、菲律賓、印度等地的數(shù)萬(wàn)海外讀者,在起點(diǎn)國(guó)際的平臺(tái)上從讀者甚至慢慢轉(zhuǎn)變?yōu)樽髡摺R粋€(gè)基于中國(guó)文化的國(guó)際化粉絲社區(qū)正在逐步建立,在這個(gè)社區(qū)體系下,海外用戶可以通過(guò)多元互動(dòng)模式,以及平臺(tái)上的特色詞匯百科等,深度了解中國(guó)以及中國(guó)的網(wǎng)文作品?!眳俏妮x說(shuō)。
此外,在海外授權(quán)方面,我國(guó)目前也已向全球多個(gè)國(guó)家的合作方進(jìn)行了數(shù)字出版、實(shí)體出版以及IP改編授權(quán)等,授權(quán)作品近800部。其中改編自《從前有座靈劍山》《全職高手》等網(wǎng)絡(luò)小說(shuō)的動(dòng)漫、圖書已登陸日本等國(guó)家;《慶余年》《皇權(quán)》等已授權(quán)出版泰文版;《鬼吹燈》系列的英文版圖書已由企鵝蘭登書屋出版;女頻類高人氣作品《許你萬(wàn)丈光芒好》已向越南授權(quán)影視改編。
除了文字,我國(guó)網(wǎng)絡(luò)文學(xué)還通過(guò)影視、動(dòng)漫、游戲等多種方式在海外“圈粉”。比如,在海外熱播的影視劇《全職高手》《扶搖》《你和我的傾城時(shí)光》《瑯琊榜》等,都是由知名網(wǎng)文IP改編而成。
業(yè)內(nèi)人士認(rèn)為,基于網(wǎng)絡(luò)文學(xué)和相關(guān)產(chǎn)業(yè)在海外的發(fā)展熱度,未來(lái),我國(guó)網(wǎng)文企業(yè)將持續(xù)加碼海外市場(chǎng)。而網(wǎng)文企業(yè)與人工智能科技企業(yè)在作品翻譯上的合作探索,也將進(jìn)一步助力我國(guó)網(wǎng)文出海進(jìn)程。