近日,meta宣布推出口语翻译系统,meta CEO扎克伯格在facebook上发布demo影片,首次在线上通过该翻译系统和员工对话。
在demo影片中,扎克伯克说英文,来自台湾的meta工程师用闽南语,通过该口语翻译系统,两人无障碍交流,且翻译都非常地道。
meta称,将闽南语翻译成英语的这套系统,是第一个由AI驱动的“为非文字语言开发的语音翻译系统”。
在全球范围内,有许多语言和闽南语一样,有人使用,但没有标准化的书写方式,而AI翻译系统需依靠大量的可标签范例,像是口语标签或字符,才能把资料“喂”给机器学习。
meta的研究团队称:“我们利用普通话作为中间语言来建立伪标签,我们首先将英语(或闽南语)语音翻译成普通话文本,然后我们再翻译成闽南语(或英语),并将其加入训练数据。”
目前,该系统允许讲闽南语的人与讲英语的人交谈,尽管很生硬。该模型一次只能翻译一个完整的句子,但扎克伯格相信,这项技术最终可以应用于更多语言,并将改进到提供实时翻译的程度。
meta宣布,他们将开放大型语料库,让研究人员可以为更多“无法书写的语音”建立翻译系统。业内人士认为,良好的翻译工具对于元宇宙的开发不可少。
【开源AI模型,精准翻译超200种语言】
今年7月,meta公司宣布将免费开源旗下AI系统NLLB-200 ,该系统是全球第一个能翻译200种不同语言的单一AI模型,将为超过10亿人提供高品质翻译内容。
meta公司称,将会把NLLB-200对外开源,同时向非营利机构提供20万美元的资助,以开发该技术应用于更多应用程式上。
德国慕尼黑大学计算机语言学家Alexander Fraser认为,该模型的主要贡献在于数据,包含了100种全新语言。
目前,市面上很多翻译工具并不支持冷门的语言,也就是少于百万人口使用的语言,而NLLB-200解决了这个问题。
【"不遗漏任何语言"】
全球有数十亿人,但一直以来却没有可以翻译上百种语言的高品质翻译工具,他们无法通过自己惯用的语言或母语浏览网络上的内容,或在网络社群上参与讨论,尤其是对于非洲、亚洲等地区有高达数亿人使用不同种类的语言。
为了突破网络上的语言障碍,并促进元宇宙发展,meta的AI研究人员早年已成立NLLB专案,开发AI模型为全世界提供高品质的翻译功能。
据悉,NLLB是“No Language Left Behind(不遗漏任何语言)”的缩写,该AI系统可以高质量翻译世界上多达200种语言,除了主流语言外,其中还包含多达55种非洲系语言及其他少数语言。
在多项指标中,相较现有的其他翻译工具,NLLB-200的翻译品质平均高出44%。在部分非洲和印度语言中,提升幅度相较最新的翻译系统更提升了70%。
此外,meta也与维基基金会合作,希望NLLB-200之后可以提供维基百科翻译的服务,改善维基百科的翻译系统。通过双方的合作,NLLB-200持续学习其他翻译器中无法翻译的语言,AI模型可以自己学习语言中的文字系统,得到更准确的翻译结果。
可以想象的是,“通用语音翻译系统”一旦在元宇宙中实现,可以让全世界不同语种的用户,在元宇宙虚拟空间里沟通、开会、玩游戏,将会比在现实中更加方便,也将更进一步实现meta对发展元宇宙的野心。