首頁(yè) >快訊 >

Facebook新AI模型實(shí)現(xiàn)直接從非英語(yǔ)語(yǔ)言翻譯到另一種非英語(yǔ)語(yǔ)言

據(jù)外媒報(bào)道,機(jī)器翻譯技術(shù)自誕生以來(lái)走過(guò)了漫長(zhǎng)的道路。雖然像谷歌這樣的翻譯曾經(jīng)粗糙、不可靠,而且只對(duì)最基本的翻譯有用,但如今,由于AI的力量,它們可以實(shí)現(xiàn)驚人的準(zhǔn)確。然而一些古老的翻譯方法仍然存在。 比如在Facebook上,句子首先從一種基礎(chǔ)語(yǔ)言翻譯成英語(yǔ),然后再?gòu)挠⒄Z(yǔ)翻譯成目標(biāo)語(yǔ)言。

這由幾個(gè)原因造成,其中一個(gè)是缺乏有用的AI訓(xùn)練數(shù)據(jù)用于非英語(yǔ)語(yǔ)言到語(yǔ)言的翻譯。

許多人將單詞和短語(yǔ)從英語(yǔ)翻譯成法語(yǔ)或從法語(yǔ)翻譯成英語(yǔ),但將內(nèi)容從法語(yǔ)翻譯成西班牙語(yǔ)或西班牙語(yǔ)翻譯成德語(yǔ)的人卻要少得多。

這使得訓(xùn)練AI理解復(fù)雜的語(yǔ)言到語(yǔ)言的翻譯是一個(gè)相當(dāng)困難的過(guò)程。然而根據(jù)Facebook最近發(fā)布的一篇博文,這家社交媒體巨頭終于解決了這個(gè)問(wèn)題并想出了一個(gè)解決方案。

該解決方案以M2M-100的形式出現(xiàn),這是第一個(gè)“多語(yǔ)言機(jī)器翻譯模型”。該模型可以在100種語(yǔ)言的任意一對(duì)之間進(jìn)行翻譯,而無(wú)需依賴(lài)任何英語(yǔ)數(shù)據(jù)集。如果懷疑它的有效性則可以自己檢查,因?yàn)樵撃P褪峭耆_(kāi)源。

Facebook表示,跟它所謂的“以英語(yǔ)為中心”的翻譯系統(tǒng)相比,它的多語(yǔ)種翻譯模式更有意義。該公司聲稱(chēng),M2M -100在機(jī)器翻譯評(píng)估的BLEU scale上比這類(lèi)方法高出“10分”。

據(jù)Facebook介紹稱(chēng),這個(gè)項(xiàng)目已經(jīng)醞釀多年,盡管還有很大的改進(jìn)空間,但該公司對(duì)目前所取得的進(jìn)展感到滿(mǎn)意。

目前還不清楚M2M -100何時(shí)或是否會(huì)直接在Facebook上推出。

關(guān)鍵詞:

責(zé)任編輯:Rex_01

推薦閱讀