為改良nmt翻譯品質,研究人員提出很多手藝來解決,這當中包孕透過摹擬調校模子(externalalignment model) 處置罕見字詞、利用「留意」(attention)來對準輸入詞和輸出詞,和將詞拆解成更小的單位以應對罕有字詞等翻譯
其實不只簡體中文、繁體中文的語法溝通,他泄漏,日文、韓文在機器翻譯上也可算是語法溝通,用同一套系統翻譯
結合報系資料照片">google神經機械翻譯(gnmt)將中文句子翻譯成英詞句子的進程,透過編碼器 (encoder),起首,gnmt將中文句子的每一個單詞進行向量(vector)編碼,而每個向量將顯示出今朝為止單詞被讀取到的所成心義。
翻譯而今也有人提出讓alphago打alphago,進修能力可以更快的說法,就像是金庸小說「西嶽論劍」裡全真派的周伯通,用本身的左手和右手對打,使出的「閣下互搏」。
google翻譯的成長曆程快速,10年前,google推出翻譯辦事,並以片語式機械翻譯(phrase-basedmachine translation)作為首要運算體式格局翻譯從曩昔僅支援幾種語言,到目前可支援103種說話,且天天翻譯超過1400億個單詞,google翻譯的品質有了很大的進展。
注意 (attention)功能是為了每一步都產出准確的詞,解碼器將針對編碼中文向量裡最相幹的英文單詞權重分布(weighted distribution)進行解碼。
在讀取完全句子後,解碼器(decoder)就會開始運作,一次產生一個英語句子中的一個詞。
他認為,固然簡體中文、繁體中文有些不異的字詞有著不同的意義,或不異的字已衍生出新的意義,但因簡體、繁體中文語法不異,在機械翻譯上仍採用一套系統,可視為專著名詞,透過進修確立資料庫來校訂翻譯
數年前,google採用遞歸神經網絡(recurrentneural networks)將句子視為一個單元進行翻譯,以後的片語式機械翻譯方式(pbmt),則是將句子切割成單獨的字和詞組做獨立翻譯翻譯
簡立峰诠釋,google翻譯有學習及資料庫的功能,不斷積累經驗,錯誤也是一種經驗,除非幾近所的人都在「修改建議」欄寫下如出一轍的錯誤,才會積非成是,但事實上這類情況其實不可能發生翻譯
本文來自: https://udn.com/news/story/6811/2440774有關翻譯的問題歡迎諮詢天成翻譯社
請先 登入 以發表留言。