• 通向白垩纪的时空隧道(科技大观) 2019-09-16
  • 忻州 端午节假期旅游收入达59962万元--黄河新闻网 2019-09-15
  • 售8.98万-15.18万元 2018款广汽传祺GS4上市 2019-09-11
  • 【专题】气象防灾减灾 我们在行动 2019-09-03
  • 贵的有道理!OPPO华为专利量领先友商一条街 2019-09-03
  • 《春天读诗5》:蒋方舟致敬周梦蝶《我选择》 2019-08-29
  • 回复@老老保老张工:连马克思都要重构个人所有制也!你不会自以为比马克思还高明吧? 2019-08-26
  • 美国三大航空公司为何拒改涉台表述 英媒:是白宫要求死扛 2019-08-25
  • 马旭明:坚持“工业强市”战略不动摇 开创黄石经济新局面 2019-08-23
  • 微信群,让人又爱又恨 2019-08-23
  • 奇!鼻腔里竟然长出“土块”来 2019-08-23
  • 出卖社会主义,发不了大财。 2019-08-22
  • 日照市住建局争引到位省级政府和社会资本合作奖补资金94万元 2019-08-22
  • 人民网评:今天,“雄安故事”翻开了新时代的新篇章 2019-08-21
  • 回复@老老保老张工:你是想自己生产的产品没人要还继续给你配置资源? 2019-08-21
  • 首页 > 应用 > 智能硬件
    [导读]语音识别已成为人与机器通过自然语言交互重要方式之一,本文将从语音识别的原理以及语音识别算法的角度出发为大家介绍语音识别的方案及详细设计过程。

    内蒙古十一选五玩法 www.ologb.com 语音识别已成为人与机器通过自然语言交互重要方式之一,本文将从语音识别的原理以及语音识别算法的角度出发为大家介绍语音识别的方案及详细设计过程。

    语言作为人类的一种基本交流方式,在数千年历史中得到持续传承。近年来,语音识别技术的不断成熟,已广泛应用于我们的生活当中。语音识别技术是如何让机器“听懂”人类语言?本文将为大家从语音前端处理、基于统计学语音识别和基于深度学习语音识别等方面阐述语音识别的原理。

    随着计算机技术的飞速发展,人们对机器的依赖已经达到一个极高的程度。语音识别技术使得人与机器通过自然语言交互成为可能。最常见的情形是通过语音控制房间灯光、空调温度和电视的相关操作等。并且,移动互联网、智能家居、汽车、医疗和教育等领域的应用带动智能语音产业规模持续快速增长, 2018年全球智能语音市场规模将达到141.1亿美元。

     

    1.png

     

    目前,在全球智能语音市场占比情况中,各巨头市场占有率由大到小依次为:Nuance、谷歌、苹果、微软和科大讯飞等。

     

    2.png

     

    语音识别的本质就是将语音序列转换为文本序列,其常用的系统框架如下:

     

    3.png

     

    接下来对语音识别相关技术进行介绍,为了便于整体理解,首先,介绍语音前端信号处理的相关技术,然后,解释语音识别基本原理,并展开到声学模型和语言模型的叙述,最后,展示我司当前研发的离线语音识别demo。

    1.前端信号处理

    前端的信号处理是对原始语音信号进行的相关处理,使得处理后的信号更能代表语音的本质特征,相关技术点如下表所述:

    1)语音活动检测

    语音活动检测(Voice Activity Detection, VAD)用于检测出语音信号的起始位置,分离出语音段和非语音(静音或噪声)段。VAD算法大致分为三类:基于阈值的VAD、基于分类器的VAD和基于模型的VAD。

    基于阈值的VAD是通过提取时域(短时能量、短时过零率等)或频域(MFCC、谱熵等)特征,通过合理的设置门限,达到区分语音和非语音的目的。

    基于分类的VAD是将语音活动检测作为(语音和非语音)二分类,可以通过机器学习的方法训练分类器,达到语音活动检测的目的。

    基于模型的VAD是构建一套完整的语音识别模型用于区分语音段和非语音段,考虑到实时性的要求,并未得到实际的应用。

    2)降噪

    在生活环境中通?;岽嬖诶缈盏?、风扇等各种噪声,降噪算法目的在于降低环境中存在的噪声,提高信噪比,进一步提升识别效果。

    常用降噪算法包括自适应LMS和维纳滤波等。

    3)回声消除

    回声存在于双工模式时,麦克风收集到扬声器的信号,比如在设备播放音乐时,需要用语音控制该设备的场景。

    回声消除通常使用自适应滤波器实现的,即设计一个参数可调的滤波器,通过自适应算法(LMS、NLMS等)调整滤波器参数,模拟回声产生的信道环境,进而估计回声信号进行消除。

    4)混响消除

    语音信号在室内经过多次反射之后,被麦克风采集,得到的混响信号容易产生掩蔽效应,会导致识别率急剧恶化,需要在前端处理。

    混响消除方法主要包括:基于逆滤波方法、基于波束形成方法和基于深度学习方法等。

    5)声源定位

    麦克风阵列已经广泛应用于语音识别领域,声源定位是阵列信号处理的主要任务之一,使用麦克风阵列确定说话人位置,为识别阶段的波束形成处理做准备。

    声源定位常用算法包括:基于高分辨率谱估计算法(如MUSIC算法),基于声达时间差(TDOA)算法,基于波束形成的最小方差无失真响应(MVDR)算法等。

    6)波束形成

    波束形成是指将一定几何结构排列的麦克风阵列的各个麦克风输出信号,经过处理(如加权、时延、求和等)形成空间指向性的方法,可用于声源定位和混响消除等。

    波束形成主要分为:固定波束形成、自适应波束形成和后置滤波波束形成等。

    2.语音识别的基本原理

    4.jpg

     

     

    3.声学模型

     

     

    5.jpg

    传统的语音识别系统普遍采用基于GMM-HMM的声学模型,示意图如下:

     

    6.png

    7.jpg

     

     

     

    基于GMM-HMM的语音识别只能学习到语音的浅层特征,不能获取到数据特征间的高阶相关性,DNN-HMM利用DNN较强的学习能力,能够提升识别性能,其声学模型示意图如下:

     

    8.png

     

    GMM-HMM和DNN-HMM的区别在于用DNN替换GMM来求解发射概率9.jpg,GMM- HMM模型优势在于计算量较小且效果不俗。DNN-HMM模型提升了识别率,但对于硬件的计算能力要求较高。因此,模型的选择可以结合实际的应用调整。

     

    10.jpg

     

    5.语音识别效果展示

    基于PC的语音识别展示demo如下视频所示:

    此处插入视频zal_asr_demo_video.mp4

    视频包括使用“小致同学”唤醒设备,设备唤醒之后有12秒时间进行语音识别控制,空闲时间超过了12秒将再次休眠。

    我们的语音识别算法已经部分移植到了基于AWorks的cortex-m7系列M1052-M16F12 8AWI -T平台。语音识别的声学模型和语言模型是我司训练的用于测试智能家居控制的相关模型demo,在支持65个常用命令词的离线识别测试中(数量越大识别所需时间越长),使用读取本地音频文件的方式进行语音识别“打开空调”所需时间0.46s左右。下面是在M1052-M16F128AWI- T的实测效果:

     

    11.png

     

    最后附上M1052-M16F128AWI-T产品图片:

     

    12_副本.png

     

    6.关于算法库获取

    目前语音识别系统处于研发阶段,广大客户可将自身需求反馈给广州立功科技股份有限公司与立功科技·致远电子相关市场人员,我们会以最快速度研发客户需要的产品。

    换一批

    延伸阅读

    [技术专访] 种种瓶颈,看单片机大师“周立功”旗下ZWS云平台如何大展身手

    种种瓶颈,看单片机大师“周立功”旗下ZWS云平台如何大展身手

    6月28日,ZLG(立功科技·致远电子)于中国国际软件博览会上正式发布ZWS云平台,并以ZLG从“芯”到“云”作为此次发布的战略方向。21ic中国电子网受邀参加此次发布并采访。......

    关键字:周立功 云平台 ZWS 致远电子 立功科技 ZLG

    [智能硬件] ZLG震撼发布开源GUI引擎AWTK

    ZLG震撼发布开源GUI引擎AWTK

    随着手机、智能手表等便携式设备的普及,用户对于GUI的要求日渐提高。如何设计出高性能、高可靠性、低功耗、美观炫酷的GUI?这成为一个困扰开发者的难题!为此,ZLG打造了功能强大、可靠、简单易用的开源GUI引擎——AWTK。 ......

    关键字:ZLG GUI引擎 AWTK

    [智能硬件] 美国将扩大对关键技术出口管制,日韩企业或也将遭殃!

    美国将扩大对关键技术出口管制,日韩企业或也将遭殃!

    美国政府打算以国土安全为由,扩大限制外国企业取得高度敏感的科技,这虽是为了防范中国,但华盛顿并未阐明设限范围,却也让日本、韩国、台湾等地区的亚洲企业忧心忡忡。......

    关键字:人工智能 深度学习 机器人

    [智能硬件] 厦门公布新一代人工智能产业发展行动计划,2021年产业规模超过100亿元

    厦门公布新一代人工智能产业发展行动计划,2021年产业规模超过100亿元

    到2021年,厦门市新一代人工智能产业在智能芯片、云计算能力、机器视觉等核心技术上取得进展,在制造业、公共信息安全、交通、金融、健康医疗等领域积极推广应用,全面开展智慧城市建设,人工智能产业链基本完善,产业规模超过100亿元,协同带动相关产......

    关键字:人工智能 深度学习 机器视觉

    [智能硬件] 深度学习革命爆发,英伟达将在加州开设新的Core AI/ ML研究实验室

    深度学习革命爆发,英伟达将在加州开设新的Core AI/ ML研究实验室

    这个实验室将突破机器学习技术的界限。对我来说,AI是数据、算法和计算的三位一体。由于大量数据的可用性以及英伟达 GPU的大量计算,我们已经看到了深度学习革命的爆发。但是现在我们将带你们到下一个层次,也就是新的算法研究......

    关键字:深度学习 AI 人工智能

    [智能硬件] 燧原科技获Pre-A轮融资3.4亿,打造云端深度学习训练平台

    燧原科技获Pre-A轮融资3.4亿,打造云端深度学习训练平台

    燧原科技今日宣布获得Pre-A轮融资3.4亿元人民币,由腾讯领投,种子轮投资方亦合资本(武岳峰资本旗下基金)、真格基金、达泰资本、云和资本继续跟投。本轮融资将用于云端AI加速芯片及相关软件生态的研发投入。 ......

    关键字:燧原科技 深度学习 AI芯片

    [智能硬件] 中国人工智能行业发展趋势

    中国人工智能行业发展趋势

    中国人工智能行业发展趋势 1、新一轮的开源化将成为人才争夺主战场 2、语音识别领域将快速实现商业化部署 3、人工智能产业将与智慧城市建设协同发展 4、中国人工智能应用将在服务机器人领域迎来突破 ......

    关键字:人工智能 深度学习

    我 要 评 论

    网友评论

    技术子站

    更多

    项目外包

    更多

    推荐博客

  • 通向白垩纪的时空隧道(科技大观) 2019-09-16
  • 忻州 端午节假期旅游收入达59962万元--黄河新闻网 2019-09-15
  • 售8.98万-15.18万元 2018款广汽传祺GS4上市 2019-09-11
  • 【专题】气象防灾减灾 我们在行动 2019-09-03
  • 贵的有道理!OPPO华为专利量领先友商一条街 2019-09-03
  • 《春天读诗5》:蒋方舟致敬周梦蝶《我选择》 2019-08-29
  • 回复@老老保老张工:连马克思都要重构个人所有制也!你不会自以为比马克思还高明吧? 2019-08-26
  • 美国三大航空公司为何拒改涉台表述 英媒:是白宫要求死扛 2019-08-25
  • 马旭明:坚持“工业强市”战略不动摇 开创黄石经济新局面 2019-08-23
  • 微信群,让人又爱又恨 2019-08-23
  • 奇!鼻腔里竟然长出“土块”来 2019-08-23
  • 出卖社会主义,发不了大财。 2019-08-22
  • 日照市住建局争引到位省级政府和社会资本合作奖补资金94万元 2019-08-22
  • 人民网评:今天,“雄安故事”翻开了新时代的新篇章 2019-08-21
  • 回复@老老保老张工:你是想自己生产的产品没人要还继续给你配置资源? 2019-08-21
  • 炸金花必胜攻略 体彩6+1三等奖 手机赚钱软件 下载十三水 安徽十一选五技巧 香港六合彩开奖记录 重庆百变王牌开奖直播官网 安徽快3基本走势图分析 湖北30选5开奖信息 佬牛胜负彩 博雅德州扑克专业版 2019年正版生肖排期表 内蒙古三d开奖查询 赌缆十五式改良版 万博亚洲官网