導讀:火山翻譯新增38種罕見語言翻譯,現在,火山翻譯包含94種+8742種語言。據火山翻譯團隊透露,火山翻譯雙語翻譯模式下僅需30天完成76個語言訓練。
12月31日消息:2021年12月,字節跳動旗下的火山翻譯官方網站增加了38種罕見語言的新翻譯,包括世界語、塔希提語和韃靼語。目前,火山翻譯具備94種語言和8742種語言,包括漢語英語、阿拉伯語、俄語、法語、西班牙語,整體bleu (機器翻譯質量自動評價指標) 達到33.45,處于行業領先水平。
據了解,通過自行開發的mRASP多語言模型,火山翻譯僅使用一個模型就完成了上述38種語言與英語之間的雙向翻譯,它突破了傳統的雙語翻譯模式,分別訓練每種語言,分別推出服務,大大降低了機器學習的培訓和服務成本。
“一般來說,訓練76個語言雙語模型需要150-200天。在相同的硬件條件下,訓練多語言模型只需30天。”火山翻譯團隊介紹,“對于小請求的語言,使用mRASP模型集中式服務可以大大節省計算資源,只有一半的用于深度學習培訓的Tesla T4顯卡能夠滿足38種語言的所有翻譯要求,與雙語翻譯所需的資源相同。“
目前,火山翻譯有三大產品:火山同傳、機器翻譯和視頻翻譯,支持飛書、今日頭條、西瓜視頻等業務的翻譯需求,并通過字節跳動旗下的企業級技術服務平臺火山引擎對外提供翻譯服務。
不知道大家有沒有用過這三種火山產品,而火山翻譯的使用是不是真的向火山翻譯團隊介紹的那樣呢,這個疑問還是等大家去體驗之后再來公布吧。