ZLG深度解析——语音识别技术 - OFweek机器人网

当前位置： OFweek 机器人网 > 其它 > 正文

ZLG深度解析——语音识别技术

2019-02-20 15:51

ZLG致远电子

4语言模型

语言模型与文本处理相关，比如我们使用的智能输入法，当我们输入“nihao”，输入法候选词会出现“你好”而不是“尼毫”，候选词的排列参照语言模型得分的高低顺序。

语音识别中的语言模型也用于处理文字序列，它是结合声学模型的输出，给出概率最大的文字序列作为语音识别结果。由于语言模型是表示某一文字序列发生的概率，一般采用链式法则表示，如是由组成，则可由条件概率相关公式表示为：

由于条件太长，使得概率的估计变得困难，常见的做法是认为每个词的概率分布只依赖于前几个出现的词语，这样的语言模型成为n-gram模型。在n-gram模型中，每个词的概率分布只依赖于前面n-1个词。例如在trigram（n取值为3）模型，可将上式化简：

5语音识别效果展示

基于PC的语音识别展示demo如下视频所示：

视频包括使用“小致同学”唤醒设备，设备唤醒之后有12秒时间进行语音识别控制，空闲时间超过了12秒将再次休眠。

我们的语音识别算法已经部分移植到了基于AWorks的cortex-m7系列M1052-M16F12 8AWI -T平台。语音识别的声学模型和语言模型是我司训练的用于测试智能家居控制的相关模型demo，在支持65个常用命令词的离线识别测试中（数量越大识别所需时间越长），使用读取本地音频文件的方式进行语音识别“打开空调”所需时间0.46s左右。下面是在M1052-M16F128AWI-T的实测效果：

6关于算法库获取

目前语音识别系统处于研发阶段，广大客户可将自身需求反馈给周立功单片机有限公司与致远电子有限公司相关市场人员，我们会以最快速度研发客户需要的产品。

M1052-M16F128AWI-T产品图片

<上一页 1 2 3

本地收藏打印推荐给朋友

声明： 本文由入驻维科号的作者撰写，观点仅代表作者本人，不代表OFweek立场。如有侵权或其他问题，请联系举报。

发表评论

共0条评论，0人参与

登录登录即可访问所有OFweek服务

用户名/邮箱/手机：
密码：
忘记密码？
用其他账号登录： QQ | 微信 | 新浪微博

请输入评论内容...

请输入评论/评论长度6~500个字

暂无评论

暂无评论

图片新闻

行业报告

最新活动更多

一周热点月点击榜

企业服务广告服务猎头服务薪酬报告

机器人猎头职位更多

文章纠错

x

_*文字标题：

_*纠错内容：

联系邮箱：

_*验证码：

看不清，点击换一张

粤公网安备 44030502002758号