“不管是運動員還是觀眾,只要有這個隨身‘翻譯官’,就可以隨時隨地跟其他國家的朋友無障礙溝通。”科大訊飛AI研究院副院長陳志剛拿著訊飛雙屏翻譯機邊演示邊介紹,“只要打開雙屏,選擇對方的語言,按住按鍵說話就可以了。”
話音剛落,翻譯機的屏幕上,幾行翻譯好的英語“跳”了出來。
科大訊飛長期致力于多語種翻譯和交互領域的研發,突破了基于多語種語音識別、合成、機器翻譯與智能問答等關鍵技術。圍繞冬奧會及冬殘奧會各種應用場景,科大訊飛很早就開始了研發布局。
2019年9月,成為北京冬奧會官方自動語音轉換與翻譯獨家供應商后,科大訊飛聯合中國科學技術大學、沈陽雅譯、哈爾濱工業大學等單位,共同承擔了“科技冬奧”重點專項“冬奧多語種語言服務關鍵支撐技術及設備”項目,通過相關技術、算法在團隊內部的共享,最終確保技術能滿足需要。
“在冬奧會、冬殘奧會上,我們將提供多語種智能語音和語言關鍵技術服務平臺,實現三類‘溝通無障礙’。”科大訊飛高級副總裁杜蘭說,“包括人與人之間的溝通無障礙,人與組織之間的溝通無障礙,人與賽事之間的溝通無障礙。”
為實現“人與人溝通”無障礙,科大訊飛推出雙屏翻譯機,可支持中文與60種外語互譯、15種外語口音的翻譯、中文和31種外語拍照互譯。并針對冬奧加入百萬級別專業詞匯以及行業術語,覆蓋各類體育運動和裁判用語,可有效滿足運動員、教練員、觀眾等的跨語言溝通需求。
在“人與組織溝通”上,訊飛多媒體會議辦公和信息發布系統支持語音實時識別、翻譯、記錄,并將識別和翻譯結果形成字幕投屏展示,減輕了對人工翻譯服務的依賴,大幅提高了多語種會議的溝通效率與視聽體驗。
在“人和賽事溝通”方面,他們采用新型多語種、多模態虛擬人技術開發了冬奧智能問答設備,支持冬奧知識問答和信息查詢服務,可通過智能語音進行交互,有效應對參賽人員咨詢內容龐雜、語言多樣的問題。
“我們通過語音識別、語音合成、機器翻譯等技術,參與開發了‘冬奧通’APP等應用,不僅能讓全世界觀眾和游客及時掌握賽事資訊,還可以幫助視障人士‘聽見’奧運文字,幫助聽障人士‘看見’奧運聲音。”陳志剛對《中國科學報》說,“屆時,比賽結果被翻譯成多語言并呈現在屏幕上,同時還將通過虛擬主播等形式同步發布者的語氣、語調,進行全天候播報。”
現場測試表明,科大訊飛為賽事提供的多項服務中,面向冬奧場景重點語種(中、英、日、韓、俄、法、西)的識別正確率超過95%,語音合成自然度超過4.0分(普通人說話水平),機器翻譯準確率大于95%,冬奧問答意圖理解準確率超過85%。
為讓冬奧虛擬志愿者“愛加”實現不同語言間的快速切換,科大訊飛創新性地提出“多語言免喚醒隨意切換自由說”技術方案,通過多語言共享基元并結合各國語言統一訓練方案,解決了跨語言知識共享和語種切換等關鍵問題,能讓各國人員體會到“科技冬奧”的魅力。
通過集成多語種識別、自然語言理解、機器翻譯、虛擬形象等核心技術,訊飛的AI虛擬主播形成了一站式視頻生產和編輯服務能力,可以合成各國運動員的形象,并支持31種語種和方言,做到嘴型、面部微表情全對應,替代真人進行播報。