欧美成人在线视频|成人影院一区二区三区|国产尤物白浆在线观看|久久久综合亚洲色一区二区|91久久美利坚合众国保护|欧美极品欧美精品欧美图片|国产亚洲午夜精品a一区二区|国产AV秘 无码一区二区三区

以人為本,本在心;以厚為道,道在行
厚溥官網(wǎng) 景寧人力

厚溥·2018年(第一批)產(chǎn)學(xué)合作協(xié)同育人: 點擊查看申報指南

企業(yè)郵箱 中文 English

新聞中心

您的位置:HOME > 新聞中心 > 內(nèi)部周刊
  • 武漢厚溥企業(yè)
  • Wuhan HOPU

人工智能,能否助人類重建“巴比倫塔”

發(fā)布時間:2016-12-20 來源:


假如上帝真的存在,他最近可能有些心事。
 
在猶太人的古老傳說中,人類曾試圖修建一座通向天堂的“巴比倫塔”。為阻止這個瘋狂的計劃,上帝想出一個絕招——賦予不同族群不同語言,讓人們難以溝通。
 
最終,語言的隔閡讓“巴比倫塔”計劃擱淺。直到今天,即便信息和交通技術(shù)把世界變成了“地球村”,語系之間的交流,依然只能依靠對彼此語言的專業(yè)學(xué)習(xí)。
 
但是現(xiàn)在,人工智能在語言翻譯領(lǐng)域的突飛猛進(jìn),又讓人們重新看到了“巴比倫塔”竣工的希望。
 
九成六級考生不如“它”
 
這段時間,機(jī)器翻譯技術(shù)可謂高調(diào)。
 
微軟剛剛在12月13日放出“大招”——推出實時語音翻譯應(yīng)用MicrosoftTranslator,支持多人、多語言、跨設(shè)備交流。國內(nèi)企業(yè)并未示弱。上個月底科大訊飛在其年度發(fā)布會上也展示了類似的技術(shù),可以將中文會議演講實時翻譯成英、日、韓、維吾爾等多種語言顯示在大屏幕上。發(fā)布會上推出的語音翻譯機(jī)“曉譯”還瞄準(zhǔn)了更廣闊的應(yīng)用場景——出國游玩。
 
平時不顯山不露水的在線翻譯應(yīng)用也已華麗升級。今年9月,谷歌翻譯啟用了谷歌神經(jīng)機(jī)器翻譯(GNMT)系統(tǒng),在人工智能界引起騷動。而追溯至去年5月,則是百度翻譯發(fā)布基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯(NMT)系統(tǒng)的時間。
 
機(jī)器翻譯的高調(diào),依賴于人工智能技術(shù)在這一領(lǐng)域的顯著進(jìn)展。
 
百度主任架構(gòu)師何中軍介紹,自上世紀(jì)40年代起,基于規(guī)則、實例以及統(tǒng)計的機(jī)器翻譯方法漸次登場。2014年起,人工神經(jīng)網(wǎng)絡(luò)開始在機(jī)器翻譯領(lǐng)域引領(lǐng)風(fēng)騷。
 
“最終的翻譯效果就是更加流暢了。”科大訊飛機(jī)器翻譯研究主管劉俊華告訴科技日報記者,科大訊飛所展示的會議實時翻譯系統(tǒng)和“曉譯”翻譯機(jī)便應(yīng)用了基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯方法。
 
若問人工智能的到來把機(jī)器翻譯“提”到了什么水平,何中軍舉出一道大學(xué)英語六級翻譯真題。這道題需要把一句中文翻譯成英文,而百度翻譯應(yīng)用給出的答案,從詞匯和語法來看都挑不出什么毛病。
 
無獨有偶,科大訊飛在推介其“曉譯”翻譯機(jī)時也曾表示它可以達(dá)到大學(xué)英語六級水平。“大學(xué)英語六級的翻譯題目滿分為15分,目前機(jī)器翻譯答題可以達(dá)到11分。”劉俊華解釋說,這意味著機(jī)器翻譯技術(shù)大概可以超過90%的英語六級考生。
 
“煉丹爐”取代了“流水線”
 
就在兩三年前,“流暢”和“自然”還是讓機(jī)器翻譯研究人員感到頭痛的字眼。那時,基于統(tǒng)計的機(jī)器翻譯方法是大熱門。
 
短短兩年多時間內(nèi),基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯系統(tǒng),就在多個公開測試集上超越了基于統(tǒng)計的機(jī)器翻譯系統(tǒng)。
 
單從翻譯步驟來看,劉俊華的體會是,基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯比其前任“簡潔了非常多”。比如,要把一句中文翻譯成英文,基于統(tǒng)計的機(jī)器翻譯方法首先要對句子的詞匯、短語進(jìn)行切分,然后分別對每個單元進(jìn)行翻譯,再把翻譯結(jié)果組合起來,最后還要進(jìn)行調(diào)序等等。每個步驟都對應(yīng)著十分復(fù)雜的模型。
 
形象地說,如果基于統(tǒng)計的方法是一條長長的流水線,基于神經(jīng)網(wǎng)絡(luò)之后只需一個“煉丹爐”。
 
新方法被稱為“從端到端”的翻譯。“基本的神經(jīng)機(jī)器翻譯模型包含兩個部分,編碼器和解碼器。”何中軍解釋說,編碼器將源語言句子表示為一個向量,解碼器根據(jù)此向量逐詞產(chǎn)生目標(biāo)譯文。也就是說,一個句子經(jīng)過一次“加工”就能夠直接輸出目標(biāo)語言。
 
不僅翻譯效率得到了極大提高,結(jié)果也更加流暢自然。這是因為,神經(jīng)機(jī)器翻譯方法是對整個句子進(jìn)行編碼處理,可以照顧到詞匯的上下文信息,因此翻譯出的答案不像統(tǒng)計機(jī)器翻譯方法那樣生硬。
 
正是“流暢”和“自然”將機(jī)器翻譯技術(shù)推向更加實際的應(yīng)用。而且在與其他人工智能技術(shù)相結(jié)合后,機(jī)器翻譯可以真正觸到人們語言不通的“痛點”,從而深度切入商務(wù)、旅行、學(xué)習(xí)等多個場景。
 
例如,無論是微軟的MicrosoftTranslator,還是科大訊飛的會議實時翻譯系統(tǒng)以及“曉譯”翻譯機(jī),都結(jié)合了語音識別技術(shù)來為語言交談架起橋梁。而融入了光學(xué)字符識別(OCR)技術(shù)的百度翻譯APP,則可以在國外購物或旅游的場景下,幫助人們翻譯看不懂的英文路牌、菜單和說明書等。
 
等待打破“嘆息”之墻
 
可以看到,人工智能正在一點一點“捅破”人與人之間的語言隔閡。有網(wǎng)友戲言,或許不久后的一天,揣著裝了高效語言翻譯APP的手機(jī),鄰居大媽也能來一場說走就走的世界旅行。所有國家的學(xué)生將徹底掙脫外語課的“黑暗統(tǒng)治”。
 
不過,要把重建“巴比倫塔”的美夢寄托給當(dāng)前、乃至未來一段時間內(nèi)的機(jī)器翻譯技術(shù),還是有點不太現(xiàn)實。
 
“基于神經(jīng)網(wǎng)絡(luò)的翻譯技術(shù)雖然帶來了機(jī)器翻譯質(zhì)量的較大提高,但是本身還存在諸多技術(shù)挑戰(zhàn)。”何中軍說。他把神經(jīng)網(wǎng)絡(luò)比作一個“黑盒子”,中文句子進(jìn)去,英文句子出來,但是這個“黑盒子”為何要這么翻譯,技術(shù)人員還難以對其進(jìn)行合理的解釋。
 
更重要的是,復(fù)雜、多變,我們自己都掌握不住的“人性”,仍然是所有人工智能發(fā)展的嘆息之墻。
 
雖然對單個句子的翻譯可以實現(xiàn)流暢和自然,但是在整個篇章的上下文理解方面,機(jī)器翻譯并不給力。一旦涉及歇后語、詩句、雙關(guān)語甚至口語化的表達(dá),機(jī)器翻譯更會毫不掩飾地掉鏈子。而對于如何將知識融合到機(jī)器翻譯系統(tǒng)中,讓機(jī)器真正“理解”人類的語言,目前還沒有較好的解決方案。
 
從另一個角度來看,無論是基于統(tǒng)計的機(jī)器翻譯,還是基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯,都以龐大的語料庫為基礎(chǔ)。然而劉俊華告訴科技日報記者,雖然中、英等主要語種的語料相對充足,一些小語種的翻譯,比如科大訊飛目前關(guān)注的國內(nèi)少數(shù)民族語言的翻譯,依然會面臨語料短缺的問題。
 
“目前的成果可以證明,神經(jīng)網(wǎng)絡(luò)在語言翻譯領(lǐng)域的應(yīng)用效果不錯,但它的潛力還沒有完全發(fā)揮出來。”劉俊華給出的方案是,可以考慮將其他技術(shù)路線與基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯方法融合起來,使其各施所長,實現(xiàn)更好的翻譯效果。
 
人工智能會不會取代專業(yè)的同聲傳譯?這個簡單的問題竟讓機(jī)器翻譯領(lǐng)域的專家們感到為難。何中軍用“任重道遠(yuǎn)”作為回答,而在劉俊華看來,對照傳統(tǒng)的翻譯規(guī)則——“信、達(dá)、雅”,人工智能目前僅能實現(xiàn)“信”,離后二者尚有距離。
 
這么說來,上帝或可放寬心:就算人工智能要幫助人類重建“巴比倫塔”,也不過剛剛撿起幾塊磚瓦而已。
 
只是,未來呢?
营山县| 岳阳县| 容城县| 秭归县| 紫金县| 平泉县| 永靖县| 甘洛县| 临澧县| 永胜县| 鄂州市| 清流县| 辽中县| 吕梁市| 靖边县| 张家口市| 福鼎市| 柘城县| 宁陵县| 卢龙县| 炎陵县| 永川市| 沈阳市| 义马市| 浦县| 华安县| 大竹县| 长春市| 绵阳市| 望江县| 万源市| 北辰区| 斗六市| 花垣县| 德令哈市| 余庆县| 宝清县| 修水县| 凤山县| 东辽县| 吐鲁番市|