语音交互系统是比较人性化的人机操作界面,它需要语音识别系统的支持。而语音识别技术在这其中起到中流砥柱的作用,它也被称为自动语音识别,其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。
特定人语音识别技术是基于“关键词语列表”的识别技术,它是对大量的语音数据(相当于对数千人采集的数万小时的有效声音数据)经语言学家语音模型分析,建立数学模型,并经过反复训练提取基元语音的细节特征,以及提取各基元间的特征差异,得到在统计概率化意义上的各个基元语音特征,才由资深工程师将算法以及语音模型转换成硬件芯片并应用在嵌入式系统中。
本文将介绍一款语音识别芯片——LD3320芯片。LD3320采用的是ASR技术,提供了一种脱离按键、键盘、鼠标、触摸屏等GUI操作方式且基于语音的用户界面VUI(Voice User Interface),使得用户对该系统的操作更简单、快速和自然。随着MCU的不断出现,以MCU为的嵌入式语音交互系统会有非常好的应用前景。
工作原理
图1 LD3320和单片机(或嵌入式系统)组成的语音识别系统原理框图。
在使用过程中,用户只需要把识别的关键词语以字符串的形式传送进芯片,即可以在下次识别中立即生效。比如,用户在51等主控MCU的编程中,简单地通过设置芯片的寄存器,把诸如“你好”这样的识别关键词语的内容动态地传入芯片中,芯片就可以识别所设定的关键词语了。每个关键词语可以是单字、词组、短句或者任何的中文发音的组合。基于LD3320的语音识别系统可以随着使用流程,在运行时动态地更改关键词语列表的内容,这样可以用一个系统支持多种不同的场景,同时也不需要用户作任何的录音训练。
图2 STC10L08XE构成的主控芯片
图3 LD3320A构成的语音识别主系统
由图可知,由LD3320组成的语音识别系统硬件有单片机(或嵌入式系统)及LD33202.图2和图3分别是由单片机STC10L08XE 构成的主控芯片和由LD3320A 构成的语音识别主系统。
LD3320评估板(其中,控制MCU选用的是STC的51单片机)
编者结语
编者认为这种语音识别系统主要应用于语音控制的点歌系统、语音控制的手机、音控智能导航仪、音控智能家电产品等。当然,这种语音识别系统不是完美的,它容易引起误识别,如当用户说的内容不在识别列表内时,必然会引起误识别。
为了克服这些缺点,降低误识别率,可在设定好要识别的关键词语后,再添加一些与识别列表内的单词有联系的任意其他词汇,用来吸收错误识别,从而达到降低误识别率的目的。
免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。