来源:物联中国
时间:2014-07-29
近微软公布了一个关于正在研究的语音翻译软件的视频,此语音系统可以翻译多种语言,甚至达到同声翻译的效果,在发布会上,展示者甚至说了一段中文让语音系统进行翻译,众所周知,中文的行文逻辑与英文完全相反,此语音居然能够正常理解中文并将之翻译,同时声音中保留了展示者的口音、音色和语调,听上去就像本人亲口所说。
微软语音翻译软件采用的是人工神经网络识别技术,人工神经网络技术包括学习和识别两个过程。其中的学习过程,就是使用者按要求念出指定的文本,经过话筒转化为已知的语音信号作为学习样本,经过语音分段,从中求取语音的特征参数(这个过程反复多次,所以也称之为训练)。识别的过程则是,将待测的语音(同样经过话筒)进行语音分段,提取出特征参数,按一定的规则与学习所得的结果进行比对计算,后得出识别的结果。可以看出,学习和识别的过程中,关键是的语音特征参数的求取。
微软本次演示的软件,在人工神经网络技术上更进一步,采用了“深度神经网络(DeepNeuralNetworks,DNNs)”技术。
以上是对微软语音翻译软件的语音识别部分的分析,如果智能语音系统可以采用这种高识别度的技术,完全可以利用于车载、家电、农业管理等领域,扩大智能语音的使用范围。
众所周知,智能语音系统发展的阻碍就是系统对于语言的识别程度,微软的语音翻译软件既然可以正确分析语义,那么相信未来也可以成为准确“理解”接收指令的一种模式,这就为智能语音的发展打开了新的局面。高效的理解力与执行力必然可以成为智能语音致胜的关键。
ICkey(云汉芯城)是一家一站式电子元器件采购网, 提供Digikey、Mouser(贸泽)、Element14(e络盟)、Wpi(大联大)、Future(富昌)、Avnet(安富利)、Arrow(艾睿)、Chip1stop、Onlinecomponents、Master等主流供货商的芯片采购服务,在IC采购, 元器件交易和IC交易业务领域中排名的在线采购平台。