Google神經機器翻譯系統
Google 神經機器翻譯系統(英語:Google Neural Machine Translation,簡寫:GNMT), 是 Google 開發的神經機器翻譯(NMT)系統,佇二空一六年十一月推出,伊使用人工神經網路來提懸 Google 翻譯的滑度佮準確性。Google 神經機器翻譯系統通過應用是較實例的(EBMT)機器翻譯方法來改進翻譯品質,系統會對數百萬个範例中學習。系統提出的系統學習架構代先通過 Google 翻譯支援的百幾種語言進行矣測試。隨大型捀到捀架仔的發展,系統會綴時間的推徙學習,做出閣較好,閣較自然的翻譯。GNMT 會當一擺翻譯規句,毋是逐字翻譯。
歷史
Google 大腦項目佇二空一一年由 Google 研究員傑夫 ・ 迪恩,格雷戈 ・ 科拉多佮斯坦福大學計算機科學教授吳恩達佇 Google X 秘密實驗室成立。吳恩達的工作令 Google 佮史丹佛大學有取得突破。
二空一六年九月,Google 研究團隊宣佈開發 Google 神經機器翻譯系統,仝年的十一月,Google 翻譯停止使用其自二空空七年十月以來一直使用的專有統計機器翻譯(SMT)技術,開始做神經機器翻譯(NMT)。
Google 就翻譯的 NMT 系統使用矣會當用深度學習的大型人造神經網路。GNMT 使用通過使用數百萬較廣泛的來源來推斷出上相關的翻譯,提高翻譯的品質。然後會結果重新排列並組成是人類語言的語法翻譯。GNMT 提出的系統學習架構通過 Google 翻譯支援的語言來進行矣測試。GNMT 無建立家己的普遍語言,是針對濟濟語言之間發現的共同點,心理學家佮語言學家比計算機科學家對這閣較有興趣。二空一六年,Google 翻譯的其中八種語言開始使用此系統,包括英語乎,法國的,德語,西班牙話,葡萄牙語,中文,日本語,韓語佮土耳其語。二空一七年三月,增加俄語、印地話佮越南語。仝月,因為 Google 翻譯社群的幫助之下,添加了著希伯來語佮阿拉伯語的支援。二空一七年四月底,增加九種印度語言的支援,包括印度語,孟加拉語,馬拉地語,古吉拉特語,邊仔普語,泰米爾語,泰盧固語,馬拉雅拉姆語佮康納達語。
零點(Zero-shot)就共翻譯
GNMT 系統改進了以前的 Google 共你翻譯系統,GNMT 系統會當處理「零點翻譯」,即直接共這款的語言翻做另外一種語言(比如講中文到日文)。 較早 Google 先翻譯會先共源語言翻做英文,才閣共英文翻做目標語言,毋是直接對一个語言翻做另外一个語言。
參考文獻
外部連結
- The Advantages and Disadvantages of Machine Translation
- Statistical Machine Translation
- International Association for Machine Translation ( IAMT )
- Machine Translation Archive by John Hutchins . An electronic repository ( and bibliography ) of articles , books and papers in the field of machine translation and computer-based translation technology
- Machine translation ( computer-based translation )–Publications by John Hutchins ( includes PDFs of several books on machine translation )