侵权投诉
焊接机器人 喷涂机器人 搬运机器人 装配机器人 切割机器人 其它机器人
订阅
纠错
加入自媒体

百度DuerOS登场,会做成"真开放生态"给开发者么?

2017-07-08 09:35
flinay
关注

离三伏天还有一周,但人工智能行业却已经提前“入伏”。

7月5日,百度、阿里两大巨头都发布了各自在AI领域的重要产品,百度在首届AI开发者大会上发布DuerOS开放平台,阿里AI Labs也发布了自己的首款产品——智能音箱天猫精灵X1。再往前看,6月22日,在腾讯云+未来大会上,腾讯云小微智能语音解决方案正式发布,而小米也在5月18日小米电视4发布会上,宣布了自己的人工智能“水滴计划”。

有趣的是,亚马逊也在7月5日宣布,Alexa平台上的功能(Skill)数量再创新高,已经超过了1.5万个,远远超过了Google Home拥有的378个技能和微软小娜的65个,而Homepod在年底才正式开售。

全自然语言交互仍是技术难点

一个智能语音系统有三大要素:语音、语义和技能,分别要解决听清、听懂和服务需求的问题。

目前,智能语音技术已经比较成熟,通用识别准确率已经能达到97%,其中比较难解决的远场识别问题,近些年来也有较大突破。在智能家居场景中,使用语音的环境通常都是3~5米的远场交互场景,远场交互中使用到的技术包括语音识别、麦克风阵列、TTS等都是感知的基础。在这一点上,国内外已经发展的相对成熟,目前使用多麦克风阵列的HomePod(环形6麦克)与Echo(环形6+1麦克)的远场识别能力都能达到15米以上,国内很多语音识别公司的方案也都能达到10米以上的水平。

也就是说,虽然还有很多复杂场景下的降噪等问题还亟待攻克,不过长远来看,远场交互的行业水平很快就能达到一个整体比较高的水准,会成为语音生态的一个基本能力,但不是差异化的瓶颈。

听清是基础,听懂是关键。如何实现全自然语言交互,仍然是近年语音行业的一大难点。语义技术主要包括自然语言理解、对话管理、自然语言生成等,目前多以聊天机器人的形态为主,比如微软小冰就是一个闲聊机器人。

语言博大精深,在不同时间、不同场景、不同知识背景、不同任务场景下,语义所面临的技术难点都不同。“从技术层面来说,从聊天机器人到强人工智能所面临的挑战还有很多,比如长对话、开域与闭域、上下文、个性化对答、意图和多样性,甚至是情商。”狗尾草科技CTO王昊奋表示。

生态和商业化核心:构建技能(skill)生态

从2016年底开始,整个国内人工智能产业都更加务实,AI+产业的落地是大家的共识。“特定用户、特定场景、特定需求,语言类AI才有意义。”语义创业公司海知智能创始人谢殿侠称。

在满足听清和听懂的需求之后,如何满足用户的需求是一个关键,这不但是差异化竞争的最大可能,也是生态化和商业化的核心。

所以,2015年8月亚马逊就将Alexa开放给了第三方开发者,并且采用比赛、风险投资的方式,扶持围绕Alexa整个的平台建设。直到本周,Alexa平台上的技能数量再创新高,已经超过了1.5万个,是全球最大的语音技能平台。

国内公司也逐渐意识到,建立技能skill生态成行业趋势。

今年3月,海知智能正式推出语义理解和知识图谱技术平台ruyi.ai,提供音频娱乐、信息查询、生活服务等在内的30多个内置技能插件,并通过bot工具可以帮助智能电视、智能冰箱、智能音箱、机器人等智能设备的开发者快速搭建订制化的内容和服务。6月,思必驰也发布了DUI开放平台,一站式打造专业技能商店,提供“云+端”混合方案。而其他的语义理解公司,比如三角兽也在加大在bot工具上的投入力度,构建skill生态。

1  2  下一页>  
声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号