Meta的AI翻译器可以解释无文字的语言 扎克伯格以闽南话举例

Android社区 收藏文章

634b8d4d410f430018147659.webp

作为Meta公司通用语音翻译器(UST)项目的一部分,该项目正致力于开发实时语音到语音的翻译,以便元宇宙居民能够更容易地进行互动(读作:互相进行性骚扰)。作为这个项目的一部分,Meta的研究人员研究了福建闽南话,这是一种散居在亚洲各地的无文字语言,也是台湾地区的主流语言之一。

机器学习翻译系统通常需要大量可标记的语言例子,包括书面和口语来进行训练--这正是像闽南话这样的无文字语言所不具备的。为了解决这个问题,"Meta使用语音到单元的翻译(S2UT),将输入的语音直接转换为Meta以前开创的声学单元序列,"首席执行官马克-扎克伯格在周三的一篇博文中解释说。"然后,我们从这些单元生成波形。此外,UnitY被采用为双通解码机制,第一通解码器生成相关语言(普通话)的文本,第二通解码器创建单元。"

"我们利用普通话作为中间语言来建立伪标签,我们首先将英语(或上面说的闽南话)语音翻译成普通话文本,然后我们再翻译成闽南话(或英语)并将其加入训练数据。"目前,该系统允许讲福建话的人与讲英语的人交谈,尽管很生硬,且该模型一次只能翻译一个完整的句子。但扎克伯格相信,这项技术最终可以应用于更多语言,并将改进到提供实时翻译的程度。

扎克伯格宣布,除了Meta已经从这个项目中开源的模型和训练数据外,该公司还将发布一个基于闽南话话语料库的首个语音翻译基准系统,以及"语音矩阵,一个用Meta的创新数据挖掘技术LASER挖掘的语音翻译大料库"。这个系统将使研究人员能够创建他们自己的语音到语音翻译(S2ST)系统。

相关标签
 相关文章
王慧文病休53天,旗下OneFlow团队重新创业 1年以前  |  1次阅读
智己CEO现场怒怼!不满LS6和小鹏G6当对手 1年以前  |  1次阅读
董明珠回应落榜世界500强:总比爆雷的世界500强好 1年以前  |  1次阅读
阿里云上线 AI 视频生成工具 Live Portait:可一键让照片开口说话 1年以前  |  78次阅读
妙鸭相机将并入神力视界,阿里大文娱CTO郑勇:不是“搬家”是“回家” 1年以前  |  85次阅读
特斯拉上海超级工厂约40秒下线一台车,零部件本土化率超95% 1年以前  |  69次阅读
宁德时代发布神行超充电池,可实现充电10分钟行驶800里 1年以前  |  71次阅读
中科院博士被骗到缅甸已一年!女友:他负债几万,家里条件一般,以为去当翻译 1年以前  |  85次阅读
小鹏汽车否认收购玛莎拉蒂传闻:系谣言 1年以前  |  63次阅读
联想二季度净利润猛降66%,股价应声跳水 1年以前  |  80次阅读
业内人士:视觉中国对不同侵权主体采用差异化策略,老客由销售沟通新客发律师函 1年以前  |  70次阅读
恒大集团在美国申请破产保护 1年以前  |  56次阅读
劳斯莱斯首款纯电轿跑将在北美亮相 1年以前  |  89次阅读
realme印度前CEO确认加盟荣耀,即将推出手机新品 1年以前  |  88次阅读
OpenAI正在测试内容审核系统,一天可以完成六个月的工作 1年以前  |  80次阅读
谷歌百人“复仇者联盟”出击,将发对标GPT-4的大模型,26位研发主管名单流出 1年以前  |  77次阅读
OpenAI收购数字产品公司Global Illumination,为创立以来首笔公开收购 1年以前  |  80次阅读
海口规定:电动汽车充电服务费不得超过0.65元每度 1年以前  |  80次阅读
波音任命柳青为波音中国总裁 1年以前  |  88次阅读
业内人士谈图片复杂代理链:图片代理商越多摄影师分成越少 1年以前  |  67次阅读

扫一扫

在手机上阅读