首先我先说一下语音识别的原理和本质。不想看的同学可以直接跳到文末。
语音识别技术就是让机器通过识别和理解过程,把语音信号转换为相应的文本或者是命令。
语音的识别符号主要以模式匹配法为主。
在训练阶段。用户把词汇表中的每一个词依次说一遍,并将其特征矢量作为模板存入模板库中,在识别阶段,将输入语音的特征矢量依次与模板库中的每个模板都进行相似度比较将相似度最高者作为识别结果的输出。
语音识别由下面几大模块组成,前端处理是指在特征提取之前,先对原始的语音进行处理,部分消除噪音和不同说话人带来的不同影响,使处理后的信号能够更加准确的反映语音的本质。前端处理一般是以断点检测和语音增强为主。
声学特征是提取率选择是语音识别的一个重要环节,声学特征的指提取一个信息,大幅压缩的过程也是信号解决的过程,目的是为了使模式划分其更好的划分
,声学模型通常是由声学模型和语言模型两部分构成,分别对应语音到音节概率的计算和音节到字概率的计算。
语言模型主要分为规则模型和统计模型两种统计语言模型,适用统计概率的方法,揭示语言单位内在的统计规律,其中N-gram简单有效被广泛所应用。
语音识别的性能指标主要有词汇表范围,说话人限制,训练要求以及正确识别率所组成。不要看语音识别,只是手机上最普通的一个小功能,但是它的技术含量还是要求很高的。不过随着科技的发展,借助机器学习领域的各位专家老师的学习研究。才让语音识别有了突飞猛进的发展。
好了,关于语音识别的就介绍完毕了。
下面回到题主的问题上,为什么评论不能用语音我认为有以下几点原因构成。虽然语音识别技术与以前相比有了突飞猛进的发展,但是现现有的语音识别技术还是要求用户要处于一个相对安静的环境之中。这样的话识别的准确率才能高,而且大部分识别软件还是偏向于让用户说普通话,如果用户说家乡话或者方言的话,机器也有可能识别不了。其次是如果一条语音消息,你可能要花5~6秒的时间去了解这一条消息的内容,而相比来说文字消息只需要2~3秒的时间就可以了解这条信息带给你的内容。就目前的情况来说,无论是在信息获取,还是在方便程度上,文字评论的优越性都远远高于语音。