人工智能將替代許多基礎勞動已是不爭的事實,人工翻譯就被認為是一個會被AI影響的行業。實際上,人工智能在神經網絡機器翻譯領域早就有了諸多應用。例如,網易“有道翻譯官”app中的語音對講翻譯和拍照翻譯功能,就解決了語音和圖像識別領域的翻譯場景需求。
同為網易旗下產品,網易人工智能事業部近期推出的“網易見外”更進一步,把翻譯應用場景拓展到了視頻即時翻譯領域。而在目前,網易是國內率先實現該技術并進行商業化探索的公司。
視頻即時翻譯能做什么?比方說,你肯定有犯愁找不到外國電影或者視頻字幕的時候,特別是中文。但在“網易見外”網站,機器能對視頻進行語音識別并自動翻譯,生成雙語字幕,大大增強了用戶的觀看體驗。
所以,用“網易見外”能做什么?
結合了視頻聽翻技術的“網易見外”,可以說既是一個聚合海外短視頻的資訊平臺,也可以作為一款智能視頻字幕制作的輕量工具來使用。
在“網易見外”的視頻模塊,你能夠自由瀏覽和下載抓取自Youtube和Facebook熱門頻道的短視頻,機器聽寫英文,同步翻譯成中文,并自動切分好相應的時間軸,使視頻自動帶上雙語翻譯字幕,你再也不會因為英文不好而放棄去看國外有意思的短視頻。
除了“網易見外”平臺已有的視頻素材,你也可以自己上傳短視頻進行翻譯。一般等上三四分鐘,機器就能把一段20分鐘左右時長的視頻翻譯完成。
如果你還想把視頻下載到本地另作他用,也可以在見外平臺上將機器翻譯的版本上進行一些人工校對。無論如何,也比傳統人工視頻翻譯的效率高多了。
目前,網易見外的視頻翻譯主打的還是英譯中功能,后續也即將推出中譯英視頻翻譯。據悉,中譯英的語音識別與翻譯的準確性將會變得更高。
“網易見外”視頻翻譯背后的三大技術
為了實現這個“almost黑科技”的視頻聽翻功能,網易見外集成了三大國際前沿人工智能技術:1、NMT神經網絡機器翻譯;2、智能語音識別轉寫文字;3、自動解析語音并即時切分時間軸。
在這三大技術加持下,網易見外最終實現了視頻的高精度語音識別和即時翻譯功能,能夠一鍵生成雙語字幕,并自動壓制在視頻中。
“神經網絡機器翻譯”
相比于短句翻譯,NMT可以利用云語言與目標語言所有信息,使整個翻譯決策過程連續化全局化,使得譯文更流暢和可讀。
“語音識別轉文字”
見外可根據后臺的海量語料和場景模型,智能識別解析用戶語音,具備強大糾錯能力和智能推理能力。
“自動語音切軸”
通過判斷講話者語氣來短句,智能切分時間軸,為字幕組聽翻人員等需要制作輸出字幕的用戶群體極大地提高工作效率。
早在年初,網易見外的NMT技術就已在有道詞典、有道翻譯官等全線產品上線,成功地經過了超過6億用戶的每日驗證。
據悉,網易見外的視頻聽翻中譯英識別準確性已高于95%、翻譯準確率高于85%;英譯中識別準確率已高于80%、翻譯準確率高于70%。隨著人工智能的不斷學習,其翻譯準確率還將不斷提升。
并非取代人工,更為提高效率和體驗
采用這些人工智能技術的“網易見外”,并非為了取代人工翻譯而生。
以傳統字幕制作的流程而言,需要經過人工聽寫英文字幕、翻譯、切分時間軸、校對、特效制作以及壓制等一系列步驟?!熬W易見外”能完成其中語音聽寫、翻譯、切分時間軸等相對固定的工作流程,字幕制作者只需要專注于進行后期校對和特效制作便可,節省出更多時間來發揮創造。
(來源:鳳凰網科技)