官方详解小爱同学连续对话功能:不只是减少唤醒次数这么简单

Android社区 收藏文章

IT之家12月3日消息 小爱同学官方刚刚发文详解小爱同学的连续对话功能,并表示该功能不只是减少唤醒次数这么简单。

小爱同学官方表示,自然连续对话功能底层基础是全双工技术。双工是通讯传输的一个术语,指同步双向的信息传输,在语音交互中,全双工的体现,是小爱同学具备“边说边听”的能力,即说话的时候,也可以处理用户的指令。从用户的角度来讲,就是可以随时打断小爱同学说话。

光有全双工技术还不够,想要在手机上实现连续对话,首先需要解决连续的说话声检测和语音识别,回声消除和无关人声拒识等一系列难题。

回声消除指的是,我们要把手机自己的声音消除掉,这需要的是硬件支持和系统底层的优化,手机部的同事给项目提供了很大的帮助,他们经过不断的调优,完成了技术突破,在新的主流机型取得了很好的效果。

无关人声拒识是要识别周围的人是不是在跟小爱同学说话,不是的话就不响应。这个问题给我们提出了很大的挑战,一是因为我们为了更好的满足用户跟小爱同学交互的诉求,直接针对开放领域来做全双工,而这在业界公认是比较困难的;另一方面,拒识不是一个有标准定义、界限清晰的任务,需要结合产品体验和技术现状定义问题边界。我们采用端到端数据驱动的方法,基于语音和语义特征联合建模,取得了不错的效果。在实测中,当用户在比较嘈杂的环境使用小爱同学时,可以把大部分无关人的说话声过滤掉,减少了对用户产生的干扰。

至于为什么要实现小爱同学的连续对话功能,小爱团队负责人王刚博士表示,连续对话不仅是一次唤醒、一个效率的提升这么简单,它更是一种能力的进化,通过连续对话,小爱同学能在人与人交互中发生更复杂的任务,比如说语音间餐、语音看病、语音教学,都是在连续对话中产生的更复杂的任务。

相关标签
 相关文章
王慧文病休53天,旗下OneFlow团队重新创业 1年以前  |  1次阅读
智己CEO现场怒怼!不满LS6和小鹏G6当对手 1年以前  |  1次阅读
董明珠回应落榜世界500强:总比爆雷的世界500强好 1年以前  |  1次阅读
阿里云上线 AI 视频生成工具 Live Portait:可一键让照片开口说话 1年以前  |  78次阅读
妙鸭相机将并入神力视界,阿里大文娱CTO郑勇:不是“搬家”是“回家” 1年以前  |  85次阅读
特斯拉上海超级工厂约40秒下线一台车,零部件本土化率超95% 1年以前  |  69次阅读
宁德时代发布神行超充电池,可实现充电10分钟行驶800里 1年以前  |  71次阅读
中科院博士被骗到缅甸已一年!女友:他负债几万,家里条件一般,以为去当翻译 1年以前  |  85次阅读
小鹏汽车否认收购玛莎拉蒂传闻:系谣言 1年以前  |  63次阅读
联想二季度净利润猛降66%,股价应声跳水 1年以前  |  80次阅读
业内人士:视觉中国对不同侵权主体采用差异化策略,老客由销售沟通新客发律师函 1年以前  |  70次阅读
恒大集团在美国申请破产保护 1年以前  |  56次阅读
劳斯莱斯首款纯电轿跑将在北美亮相 1年以前  |  89次阅读
realme印度前CEO确认加盟荣耀,即将推出手机新品 1年以前  |  88次阅读
OpenAI正在测试内容审核系统,一天可以完成六个月的工作 1年以前  |  80次阅读
谷歌百人“复仇者联盟”出击,将发对标GPT-4的大模型,26位研发主管名单流出 1年以前  |  77次阅读
OpenAI收购数字产品公司Global Illumination,为创立以来首笔公开收购 1年以前  |  80次阅读
海口规定:电动汽车充电服务费不得超过0.65元每度 1年以前  |  80次阅读
波音任命柳青为波音中国总裁 1年以前  |  88次阅读
业内人士谈图片复杂代理链:图片代理商越多摄影师分成越少 1年以前  |  67次阅读

扫一扫

在手机上阅读