2 。语音识别技术
2.1 。申请简
自动语音识别正在使用中
众多领域,并有25 %的大企业
在美国有发达的简申请
提高他们的生产力。锶主要用于方便
听写,但它也可以用于®免提¯
控制(如语音引导回升,在沃尔玛的仓库
住房改善了库存处理的准确性和
速度) 。
此外,通过沟通锶通常是
更快,更可靠的通信
一个人的电话营办商或触摸¨ ctone
*系统〔 37 〕 。例如,富达投资
实行简呼叫中心可以fi产量的一个
平均250,000电话,每天与能力
处理三¨ c4的时候,这个数字高峰日子〔 35 〕 。简
系统可支付自己的6 ¨采用c18个月
在呼叫中心,与50多个代理商,并逼近-
mately 30 %的新的自动化生产线呼叫中心
可使用简到2003年。目前,有79500或
其中三分之一更少电话营办商比有在
1990年,这主要是由于自动化,触摸¨ ctone系统-
电信设备制造商,并增加简电话就可以减少这
人数仍在进一步。
2.2 。简类别
简技术,可归纳而言
议长抚养和语音模式(所示
图。 1 ) [ 29 ] 。
2.2.1 。议长依赖或独立
议长dependentsr技术需要一个用户
培养计划,以确认他或她的声音(
过程被称为®招生¯ ) 。这种类型的
简,是更好地为有需要的人士非标准发言
图案,方言,或外国口音[ 28 ] 。议长
independentprograms旨在解释任何
用户¯ s声音,没有招生,但这种类型的
软件通常是不太准确。如果该软件
议长独立的,缺省设置离散声音
或音素的规定,否则用户报名
创造了一个个性化的一套音位改进
准确性。
2.2.2 。连续或离散讲话
连续speechsr允许用户对谈,也没有-
mally在完整句子whilediscrete - speechsr
需要用户停下来后,每一个字[ 17 ] 。行骗
tinuous讲话,是通常被认为是较
自然,那么令人沮丧,速度更快。此外,正在
更复杂的情况,连续语音简,能够认清
个人说了算(离散讲话) ,以及整
短语。虽然有些研究显示,
离散讲话简是较为准确的,而其他国家
显示出相反的是千真万确的[ 16,25 ] 。
2. 语音识别技术
2.1. SR 的应用
自动化的语音识别被使用
众多的区域, 和25% 最大的公司
在美国开发了SR 应用
改进生产力。SR 主要被使用促进
口述, 但它可能并且被使用为 ‘‘没有雇工’’
控制(即声音被指挥的采摘在沃尔码商品
房子改进存货处理准确性和
速度) 。
另外, 通信通过SR 典型地是
快速地和可靠比通信
以一个人的电话接线员或接触–口气
* 系统[ 37 ] 。例如, 保真度投资有
实施了能的一个SR 呼叫中心 field
平均250,000 个电话每天以容量
处理3–编号在峰顶days[35 ] 的4 次。SR
系统也许支付他们自己在6 之内–18 个月
在呼叫中心与超过50 个代理, 和approxi-
mately 30% 新自动化的线在呼叫中心
可以使用SR 在2003 年以前。当前, 有79,500 或
三分之一少量电话接线员比那里是
1990 年, 应得物主要对自动化, 接触–口气sys-
tems, 和增加的SR 电话能减少这
数字更远。
2.2. SR 类别
SR 技术可能被分类根据
报告人附庸和讲话方式(依照被显示
图1)[29 ] 。
2.2.1. 报告人依赖或独立
报告人dependentSR 技术要求一名用户
训练节目认可他们的声音(
过程被称为 ‘‘注册’’) 。这型
SR 是好为那些以非标准讲话
样式、方言, 或外国accents[28].Speaker-
independentprograms 被设计解释任何
用户’s 声音没有注册, 但这型
软件通常是较不准确的。如果软件是
报告人独立, 缺省套分离声音
或音素被提供, 否则用户注册
创造个人化的套音素为改善
准确性。
2.2.2. 连续或分离讲话
连续speechSR 允许用户谈话亦不
mally 在完全句子whilediscrete-speechSR
要求用户停留在各word[17 以后] 。精读
tinuous 讲话通常认为是更多
自然, 挫败, 和快速地。另外, 是
更加复杂, 连续讲话SR 可能认出
各自的词(分离讲话) 以及整个
词组。虽然一些研究建议了那
分离讲话SR 是更加准确的, 其他人有
被显示的相对于是true[16,25 ] 。