【摘 要】機器翻譯是相對人工翻譯而言的依賴于計算機程序的自動化翻譯技術,自誕生以來為翻譯工作創造了極大便利,也為語言學的發展做出不可忽略的貢獻。它對于提升源語言向目標語言轉換效率、加速拓展語言學研究范圍與方向、豐富世界多種語言文字表達方式產生積極效用。反觀機器翻譯目前發展困境得知:機器翻譯句子、段落等語言單位翻譯不精準;處理內涵豐富、充分情緒氛圍的跨文化交際文本束手無策;翻譯結果靈活性、多樣性匱乏,翻譯結果單一;語料庫建設延遲且數據規模有限。因此,機器翻譯技術仍有待規范升級,未來語言發展歷程中要堅信機器翻譯必然是為人類所用的工具,人機交互合作將成為翻譯工作的主流形式。
本文源自高恂:機器翻譯的語言學價值與發展困境 山西能源學院學報2020年12月第33卷 第6期《山西能源學院學報》雜志,于1988年經國家新聞出版總署批準正式創刊,CN:14-1390/TK,本刊在國內外有廣泛的覆蓋面,題材新穎,信息量大、時效性強的特點,其中主要欄目有:教育教學研究、社會科學研究、自然科學研究等。
機器翻譯是計算機科學、統計學、語言學等學科交叉融合發展的結果,是跨學科研究的成功技術案例。經過幾十年發展,機器翻譯雖可以交出一份合格的答卷,創造了一定程度的語言學價值;但迫于機器情感缺失及深度語言規則不可描述性,機器翻譯仍面臨諸多發展困境亟待解決。
一、機器翻譯的語言學價值機器翻譯已經成為語言轉譯的重要組成部分,其優秀之處不僅在于擴大信息傳播范圍與傳遞效率,也為語言學本身發展創造了一定價值。
(一)提升源語言向目標語言轉換效率
機器翻譯汲取了人工智能技術的學習能力,形成了高效的語言翻譯方法,面對復雜海量的語言文本,機器翻譯不會因為復雜的心理活動而影響翻譯效果和速度,大幅度提升了源語言向目標語言轉換的效率。并且,機器翻譯成本相對人工翻譯較低,盡管在翻譯質量上有所欠缺,但是權衡翻譯準確度、翻譯成本、翻譯效率各因素間的相關性及影響,一些涉外企業傾向使用人工智能輔助下的機器翻譯解決諸多場景翻譯問題。語言作為人類交往的關鍵介質,直接承載了個體思想與認知,所以,機器翻譯帶來的源語言向目標語言轉換效率提升,很大程度上使語言社會功能中最基本的信息傳遞功能得以增強。
(二)加速拓展語言學研究范圍與方向
人類社會單一學科應用已經難以解決紛繁復雜的社會現象與學術問題,使科學研究被迫停滯。學科融合與跨學科研究解決了此項難題,并成為主流研究方法大范圍推廣應用,甚至發展成為科技進步的主流方向。機器翻譯提升翻譯效率的同時無疑加速了跨學科研究進程。語言學研究的對象是人類語言,交叉學科、跨學科誕生使人類語言界限得到延展,延展的幅度是無拘束、無限定的,也意味著語言學研究對象的無限延伸。綜上所述,機器翻譯與語言學之間存在圖1所示的關系,機器翻譯一定程度上加速了語言學研究范圍與方向的拓展。
(三)豐富世界多種語言文字表達方式
當今世界語言種類可達幾千余種,但外語人才的學習方向大多集中在幾十種常用的語種領域,而小語種專門性人才稀缺,能夠同時掌握多項語言翻譯能力的人才更是少之又少,一般性的交流活動以及不具備聘請人工翻譯的語言交流場景受阻。當前社會信息化水平與互聯網水平已達到前所未有的高度,語言是全球化交流的關鍵工具,此階段語言交流障礙問題日益尖銳。大規模科技性資料、中外企業交流、政府文件都需要高效率地完成翻譯工作,人工智能性質的翻譯技術誕生需求極為迫切。機器翻譯通過設置語言學習算法輕松實現數十種語言之間的相互轉譯,解決世界范圍內多項語種之間的翻譯問題,例如,谷歌翻譯軟件相互轉換語種可達幾十種。機器翻譯自誕生和技術不斷更新優化以來,一般性質的跨語言社交實現了“從無到有”的可能性。如今機器翻譯可以通過手機軟件清除人類交流的“語言障礙”,不同語言應用個體可以自由地相互交流。并且機器翻譯已經由最初的文字翻譯拓展到圖像識別、語言識別形式的翻譯,通過讀取圖像上的文字即可翻譯相應內容,識別語音音頻即可呈現翻譯結果,此為人工智能在機器翻譯領域的橫向拓展。
二、機器翻譯面臨的發展困境
機器翻譯的諸多語言學價值成就了其在時代發展中的一席之地,哲學思想的兩面性指導我們機器翻譯發展過程中必然存在弊端與困境,只有切實解決這些問題才能促進機器翻譯的良性可持續發展,機器翻譯當代發展面臨的困境分析如下。
(一)各等級語言單位上面臨的困境
翻譯領域專家將語言發展階段總結為金字塔形狀,如圖2所示。
圖中由下至上代表了語言分析由淺至深的過程,既能保持語言深層次研究,又能保證精準度是機器翻譯的長遠性目標。各發展階段中機器翻譯語言單位上面臨的困境如下:
標題翻譯障礙。標題是文章翻譯的中心思想的
高度凝練,翻譯結果需要發揮吸引讀者、點明主題功能。但是目前機器翻譯呈現的題目翻譯效果僅能表達基本語句含義,很少考慮語言文化環境,翻譯效果不盡如人意。
詞語翻譯障礙。一些機器翻譯模型在設計之初以提高翻譯效率為目的,常常刪減一些使用頻率較低的詞匯,所以機器翻譯面對陌生詞匯無計可施。再如人名、地名、公司名稱等詞匯在詞典中沒有記載,所以缺乏專門性的翻譯規則。
句子翻譯障礙。句子翻譯是目前機器翻譯的主要單位和表現形式,但是長句子翻譯效果有待提升。即使是翻譯性能優異的神經網絡翻譯模型遇到較大量詞數的句子時翻譯精度一度下滑,機器翻譯常因為語序顛倒導致翻譯結果出現差錯。
段落與通篇翻譯障礙。段落翻譯、通篇翻譯在句子翻譯的基礎上增加了句子銜接、句子順序、句子關聯等多種難度因素,對機器翻譯的難度可想而知,基于統計的翻譯模型取得了良好的長句翻譯能力,但是處理段落性質翻譯問題時,也存在指代不當,銜接不暢等常見問題。
(二)跨文化交際面臨的困境
翻譯學科的形成一定程度是為了實現跨文化交際,然而機器翻譯在處理內涵豐富的文本、具有一定情緒語境的文本翻譯時面臨困境。
處理內涵豐富文本的困境。不同民族造就了差異性語言,民族文化獨特之處造就了豐富的語言文化內涵,機器翻譯跨文化交際是對這些民族文化內涵進行詮釋。一個具有豐富內涵的文本往往包含了這個民族的思維方式、價值認同、禮儀禮節等內容,但是機器翻譯缺乏人類認知差異文化的情感,在源語言向目標語言轉換過程中忽視了文化移植這一步驟,甚至自動過濾掉不能翻譯部分,所以機器翻譯跨文化交際容易遺失文化內涵,不能重構源語言真實含義。
情緒、語境氛圍下的翻譯困境。跨文化交際中,相同句子在不同情緒、語境下展現的含義有所不同。所以,人工翻譯處理跨文化交際翻譯問題時,準確把握字面意思的同時需要考慮語句處于何種語境,是否存在疑問、暗諷、比喻等情緒,而機器翻譯集成的算法模型尚且無法模擬人腦的這一系列思考過程。例如,“Heisacat”在機器翻譯下只能譯成“她是只貓”,而準確翻譯結果為“他陰險狡詐”,這個短句是典型的需要站在跨越文化視角考量,具有豐富的文化知識儲量的翻譯人才才能給出令人滿高恂:機器翻譯的語言學價值與發展困境意的翻譯結果。再如,“you are the boss”機器翻譯結果為“你是老板”,但本質意義是“你說了算”。
(三)翻譯結果靈活性、多樣性匱乏
機器翻譯模型往往對同一種文本給出一個最為優秀的翻譯結果,盡管多次輸入相同文本得到的結果亦是如此。而人工翻譯可以根據自身知識儲備以及文本情境靈活變換詞語、句式使用方法,能夠基于實際需求給出不同形式的翻譯結果,且合乎情理,翻譯性能更具靈活性與多樣性。相比之下,機器翻譯結果在以下方面不理想:機器翻譯難以察覺文本變換的微小差別;針對同一文本難以給出多種譯文結果;翻譯結果往往不盡如人意,給出大概意思,言辭組織不夠順暢嚴謹,缺乏創造性;機器翻譯不具備從微觀視角斟酌詞句、從宏觀視角奠定文本基調的能力;漢語中的成語、俚語、名言警句對于人工翻譯來說一直是一項難題,機器翻譯處理這些翻譯內容時能力更為薄弱。
由于機器翻譯結果優劣主要取決于語言專家賦予的語言機制、技術人員設計的計算機程序,因此機器翻譯創造性、靈活性、多樣性的提升有賴于智能算法的革新優化以及語言程序描述精準度。目前為止,機器翻譯尚未達到理想的翻譯狀態,但是足以勝任詞匯以及文本的初步翻譯工作,人工翻譯在半成品的基礎上細細斟酌,解放了大量人工翻譯的時間和精力,機器翻譯即使不單獨工作也可以成為輔助人工翻譯的智能化手段,優化翻譯工作的效率。
(四)語料庫建設延遲且規模有限
目前為止,機器翻譯領域的語料庫建設面臨數據更新延遲以及規模有限兩個主要問題。機器翻譯語料庫建設延遲主要表現在與社會發展速度的不相適應,科學技術以及交叉科學誕生衍生出大量新的專業術語,這些專業術語需要相應領域的專家集中研究商討后進行命名。這些術語更新到機器翻譯系統具有一定的時間差,造成了語料庫建設的延遲性,并且基于機器翻譯系統開發公司能力差異,語料庫更新的延遲性也有所不同。所以,機器翻譯處理新理念、新思想時無計可施,一般采取不譯或者直譯的方式,翻譯工作將產生較大誤差。機器翻譯規模有限主要體現在使用頻率較低的小語種應用上,機器翻譯結果優劣一定程度上取決于語料庫規模大小、權威部門統計,神經網絡機器翻譯需要超過1500萬詞條規模的語料庫作為數據支撐,以獲得理想的翻譯效果。但是對于應用對象規模較小的捷克語、塞爾維亞語、瑞典語等小語種而言,難以構成如此大規模的語料庫,自然降低了語料庫建設的豐富性,削弱了神經網絡這種先進機器翻譯方法的應用效果。種種證據表示,語料庫自身弊端使機器翻譯面臨質量優化困境,因此,對于要求嚴格的政府文件翻譯、科技文本翻譯等場合,需要優秀的譯后編輯人員對翻譯結果進行校對與把關,實現人與科技的相互融合。
三、結論
本文從機器翻譯在社會發展中為語言學創造的價值、面臨的發展困境兩個層面剖析了機器翻譯的成就與不足,顯而易見,機器翻譯的諸多弊端致使其無法取代人工翻譯。但機器翻譯已經成為語言轉譯的重要組成部分,亦是大勢所趨。機器翻譯作為人工智能的重要分支在社會信息傳播中不可替代,處理好人與機器間的依存關系極為關鍵。要轉變與機器翻譯對立的狹隘態度,使機器翻譯為人類所用,翻譯人員作為審核角色把關翻譯質量,這樣將實現文本翻譯質量與效率的雙重提升。
【參考文獻】
[1]劉宇鵬,馬春光,張亞楠.深度遞歸的層次化機器翻譯模型[J].計算機學報,2017,40(004):861-871.
[2]高夢璐.語言學知識在機器翻譯發展領域的應用[J].校園英語,2018(13):227-228.
[3]戴澤萍.語義理論在機器翻譯研究的應用述論[J].中外交流,2019,000(008):6-7.
[4]埃德溫·根茨勒,祝朝偉.翻譯研究:前學科,學科,跨學科與后學科[J].英語研究,2019(2):139-151.
[5]蔡子龍,楊明明,熊德意.基于數據增強技術的神經機器翻譯[J].中文信息學報,2018,32(7):30-36.
[6]李培蕓,翟煜錦,項青宇,等.基于子詞的句子級別神經機器翻譯的譯文質量估計方法[J].廈門大學學報(自然科學版),2020,59(2):159-166.
[7]周春芳.機器翻譯和跨文化交際:發展,問題及思考[J].湖北經濟學院學報(人文社會科學版),2019,16(11):114-116.
[8]胡開寶,李翼.機器翻譯特征及其與人工翻譯關系的研究[J].中國翻譯,2016,037(005):10-14.
論文指導 >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >