咨询热线
.技术文章列表

玩电脑 动手不如动口 电脑可受语音控制

    在整个自然界人类的发音能力绝对要排在第一位,因此人类一直就很迷信自己的声音,许多神话传说描述了人们对声音的各种向往(大家还记得“芝麻开门”这一“名言”吧?),期待着能够借助声音来完成越来越多的事情,通过语音来控制电脑就是梦想之一,例如:对着麦克风说“上成都日报网站”,将自动登陆成都日报网站,或者让电脑将你说的话转变为文字、将保存的文字朗读出来。这些都是人们长期以来梦寐以求的事情,随着计算机性能飞速提升,电脑在语音方面的应用,早已不仅仅局限于带动音箱发声了,语音识别和语音合成技术让电脑“听说”能力越来越强。

  语音识别技术概述

  语音识别的研究工作大约开始于50年代,Bell实验室David等人研制成功了第一个可识别十个英文数字的语音识别系统:Audry。60年代,语音识别得到了进一步发展。这时期的重要成果是提出了动态规划(DP)和线性预测分析技术(LP),对整个语音识别、语音合成、语音分析、语音编码的研究发展产生了深远影响。随后LP技术得到进一步发展,动态时间归正技术(DTW)基本成熟,并提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论,实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。而HMM模型和人工神经元网络(ANN)在语音识别中的成功应用,让美国人率先研制出了非特定人、大词汇量、连续语音识别系统:SPHINX,被认为是语音识别历史一个里程碑。进入90年代后,随着个人电脑普及和多媒体时代的来临,语音识别系统从实验室走向了实用和普及。

  语音识别技术的应用领域非常广泛,对于企业用户而言,语音识别软件可助企业降低客户服务基础建设及人员支出,而对于个人用户而言,语音识别让我们甩掉键盘鼠标,通过语音命令进行操作,不仅可以带给我们全新的控制电脑的体验,也具有很多实用价值,比如减轻单纯用手眼操作电脑带来的健康损伤。而对某些残疾人士来说,用语音控制电脑,也许是他们使用电脑的唯一途径,作用就更加重要了。

  语音识别基本原理

  语音识别是模式识别的一个分支,又从属于信号处理科学领域,同时与语音学、语言学、数理统计及神经生物学等学科有非常密切的关系。语音识别的目的就是让机器“听懂”人类口述的语言,包括了两方面的含义:其一是逐字逐句听懂非转化成书面语言文字;其二是对口述语言中所包含的要求或询问加以理解,做出正确响应,而不拘泥于所有词的正确转换。

  自动语音识别技术有三个基本原理:首先语音信号中的语言信息是按照短时幅度谱的时间变化模式来编码;其次语音是可以阅读的,即它的声学信号可以在不考虑说话人试图传达的信息内容的情况下用数十个具有区别性的、离散的符号来表示;第三语音交互是一个认知过程,因而不能与语言的语法、语义和语用结构割裂开来。

  预处理,包括语音信号采样、反混叠带通滤波、去除个体发音差异和设备、环境引起的噪声影响等,并涉及到语音识别基元的选取和端点检测问题。特征提取,用于提取语音中反映本质特征的声学参数,如平均能量、平均跨零率、共振峰等。训练,是在识别之前通过让讲话者多次重复语音,从原始语音样本中去除冗余信息,保留关键数据,再按照一定规则对数据加以聚类,形成模式库。最后模式匹配,是整个语音识别系统的核心,它是根据一定规则(如某种距离测度)以及专家知识(如构词规则、语法规则、语义规则等),计算输入特征与库存模式之间的相似度(如匹配距离、似然概率),判断出输入语音的语意信息。

  常见语音识别软件简介

  看了上面的内容我们也许会感觉语音识别技术是一门比较高深的技术,其实在具体应用上还是非常简单的,比如在个人电脑上就有不少语音识别软件,下面给大家简单介绍两款,感兴趣的朋友可以自行安装试用。这样我们就可以尝试不使用鼠标、键盘而通过声音来操作电脑和输入汉字了。

  IBM 的“ViaVoice”语音识别系统是诞生较早,发展比较成熟的一款软件,该系统可用于声控打字和语音导航。只要对着电脑MIC讲话,不用敲键盘即可输入汉字,每分钟可输入100个以上的汉字,经过训练后系统识别率可达95%以上。使用便利,特别适合于起草文稿、撰写文章和准备教案,是文职人员、作家和教育工作者的良好助手。同时ViaVoice也是很多语音应用系统的基础平台。ViaVoice包含了英语、汉语等各种语言的版本,而且提供了若干特殊的“主题”来帮助你进一步提高对专有名词的识别准确度。

  “语音专家”是一款国产的语音识别软件,体积小巧,你可以通过麦克风输入一些语音命令,来对计算机进行操作。它把电脑使用过程中经常使用的操作,比如打开注册表编辑器,打开记事本程序等,制作成语音命令,你只要通过麦克风输入指定的语音,就可以执行这些操作。比如,你通过麦克风说“注册表”,就立即打开注册表编辑器,这样,就减少了操作步骤,减轻了劳动。还可以通过语音来输入汉字。

  手持设备的语音识别技术

  除了电脑,在手机和掌上电脑等手持设备中我们也可以用到语音识别和合成技术。其实早在黑白手机时代,很多手机中就加入了语音控制功能,可以使用语音进行拨号及其他操作。 而现在语音技术更是在手持设备中得到了广泛应用,比如很多PPC GPS软件采用了TTS技术来进行语音导航。对于掌上设备来说,语音控制的功能有助于解决在颠簸的路途上,PDA触控笔容易出现的误点情况。

  中科信利的Thinkit VoiceTone Phone Edition 语音手机通是基于嵌入式语音识别和合成引擎,专门针对高端手机开发的语音应用软件,它为用户提供了通过人机语音交互模式控制移动设备的途径。使用该产品,只需直接说出要查询的人的名字,其资料将会自动显示出来,然后可根据语音提示的指令进行拨号操作。信利语音拨号是将先进计算机自动语音识别技术应用于手机,极大的改善了手机的人机界面;使用信利语音拨号,手机有了“耳朵”和“嘴”,能听能说,人们可以以最自然的方式——说出要联络的人的名字,其资料将马上被调出,可以查看或直接拨号;同时,也可以不打开手机,就能知道谁打来的电话或发来的短信及其内容 。

来源: 四川新闻网-成都日报


 

    新易天是华诚东讯旗下网站,一家专业的IT服务提供商,提供各种网络维护网络布线解决方案。为企业提供电脑维护计算机维护无线网络维护北京网站建设北京网站制作布线二手电脑回收、租赁等服务,同时提供电脑维修国贸电脑维修三元桥电脑维修朝阳电脑维修及北京其他地区的电脑维修服务。经过长期的努力公司积累了大量的企业网络维护客户和IT外包客户。签约维护,先服务后收费!
    欢迎来电咨询:010-89197000 65853091  15911068550