阿里语音机器人现身李佳琦直播间,反应速度是Siri的20倍
10月30日消息,刚刚结束的李佳琦直播间里,剁手党通过阿里语音机器人首次实现与主播的实时互动。直播过程中,数十万用户同时用语音回答李佳琦的提问,最终机器人在50毫秒内就完成了语音识别和语音反馈全过程,反应速度是传统语音的20倍。
淘宝直播间观众用语音与李佳琦互动
今年双11期间,淘宝直播间推出 “语音猜价格”功能,观众在直播间也能实现语音交互,例如动动嘴就可以响应主播发出的猜产品价格任务。语音机器人成为决定这一互动过程能否顺畅的关键。
据介绍,一场淘宝直播的观众数量可达百万甚至千万,并且用户分布在全国各地,口音差异较大,目前主流的语音技术方案很难做到短时间内快速响应如此体量的用户语音,例如类似Siri识别用户语音的响应时长就在1秒以上,无法满足直播场景强互动的要求。
此次淘宝直播间采用了达摩院最新的移动端离线端到端语音识别技术。基于全新的网络结构和语音识别框架,即便在低配手机上,也能在50毫秒内完成语音交互过程,速度是传统语音识别的20倍;此外,该技术还解决了快语速、重口音等问题,高难度场景中的语音识别错误率降低近三成。
达摩院语音实验室技术专家万玉龙表示,“在实时性要求极高的场景,传统的云端语音方案无法满足需求,这套语音技术的创新在于同时实现了识别速度和准确度的提升,语音AI模型部署在每个用户的淘宝直播APP上,即便直播间有千万级别的用户,AI也不会漏听慢判。”
过去几年,阿里语音AI在基础研究和应用上取得了一系列突破。2019年,阿里语音AI入选《麻省理工评论》“全球十大突破性技术”,是唯一上榜的中国科技公司;今年7月IDC发布的《中国AI云服务市场半年度研究报告》显示,阿里语音AI以44%的市场份额,在云上语音AI市场中位居第一。

图片新闻
最新活动更多
-
4日10日立即报名>> OFweek 2025(第十四届)中国机器人产业大会
-
泰科电子立即查看>> 创新的工业机器人解决方案
-
4月23日立即报名>> 【在线会议】研华嵌入式核心优势,以Edge AI驱动机器视觉升级
-
4月25日立即报名>> 【线下论坛】新唐科技2025新品发布会
-
4月30日立即参与 >> 【白皮书】研华机器视觉项目召集令
-
限时免费下载立即下载 >>> 2024“机器人+”行业应用创新发展蓝皮书
推荐专题
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论