分享好友 厨具导购网站首页 频道列表
无论走到哪里,机器人都能听懂你的乡音
2024-06-19 12:46    5924    中华厨具网

语音识别是人工智能的一项十分有趣的问题,想想看,人们的语音是多么复杂,不同国家、民族的人,说不同的国家和民族的语言,不同的人,口音不一样,例如中国还有许多方言,语音也不一样。一个本事大的人,可能懂七、八种语言,也能听懂男、女、小孩等等不同人、甚至不同方言的语言。但是要设计一个机器人能听懂七八种语言,甚至乡土的方言(例如在民航的接待处服务的机器人),这任务是十分困难的。但是我们可以期待,也许不久的将来就会实现。

再说,要在一篇科普文章中说清语音识别的技术,也有很大的难度。因为它用到了高等数学中的傅里叶变换的技术。也就是要用到“时域”和“频域”的两个概念,才容易讲清楚。那么什么是频域、什么是时域?也需要花点笔墨来介绍。

简单地讲,例如50周波的正弦波,在时域的图像上表示是一个连续上下波动的曲线,如果转换到“频域”,就是在频率轴(横轴)上的50处一个有幅度的点这不是很简单吗!

在上一篇“语音合成”一文中,已经介绍了人类语音的一些特征(例如说声母是相当于高频的噪声、韵母相当于周期重复的非规则波,声调是韵母的声高(频率)有变化的波等等),这是语音的时域形态。我们也说过,如果用示波器观看一般人说话的语音波形,是十分复杂,要研究它简直无从下手。但是经傅里叶转换到频域,就发现图形要简单得多了,语音波的频率表现在若干个频率点上有数值。比如男声低些,女声要高一些。小孩子的声频更高些。除此之外,在更高的频率域处有数值,那是噪声域,相当于声母的部分,而在较低的频率点上也有一组数值,是韵母域,这些都表示的是不同说话人的口腔参数,不同人的口型、舌头形状不一样,这组参数也不一样。所以,在频域分析语音:是声母、韵母、是几声调、是什么人说的等等,就容易多了。也由此可以想到,人的天赋智能具备了多么复杂的本领,我们的脑子里事先已经存储好了各种模板数据(属于频域数据,)包括各个汉字的读音、某些已认识人的声音特征数据,甚至风声、雨声、鸟的鸣叫声等等,因此,人就能判别任何时间听到的声音是什么声音、代表什么文字,这种人所具备的智能也是几千万年人类进化而得来的。

设计机器的语音识别,先要在计算机里先存放好标准的语音参数,称为“模板”(如果要将识别的语音转换成文字,计算机里也先存放好了所有汉字的语音参数(可能还分男声和女声的数据库,存储的数据是对应某种语音的频域参数,不可能是时域的波形),这个数据库的建立也可称为机器的训练过程。实际操作语音识别时,由麦克风读入待识别的语音,将输入数据先转换成频域数据,再和标准数据作比较,取参数最接近的作为识别结果,再输出,输出的是汉字(或某一国家的文字。)语音转换成文字还有一个同音字区分的问题,大多数汉语的一个读音对应多个汉字,有的发音对应许多个汉字,甚至上百个汉字(如音节“ji”对应的汉字有100多个)要去分辨某个发音是什么汉字,必须采用上下文的办法,就是看这个读音的前或后跟随的是什么汉字(或读音),是否能组成词。这些词组都事先在计算机中存好,经由匹配对比成功的词来决定该选定的汉字,有时候不是任何读音都可能找到能匹配的上下文,就可能要从语义来判断。这就更复杂了。

如果要设计的系统是要寻找说话人是谁,而不是关于具体说的什么,那就只要对比频域参数就可以了。同样一句话,不同人说的,波形不同,频域中的特征数据也不同。

平时我们的耳朵听取外界的声音有很强的滤波功能,在噪声很大的情况下能滤除噪音,辩认出需要声音(如语音)。聋人用的助听器,如果仅仅是把声波放大,就会连同噪声一起放大,听起来十分费劲。高级助听器就有滤除噪音的功能,因而售价就很贵了,因为其中也用了信号处理技术。

顺便说一个故事,是说明傅里叶变换、信号处理的本领的。这是上世纪80年代初,美国麻省理工学院的奥本海姆教授来清华讲学(我曾担任他的讲课翻译)演示过的一段语音处理的片段:

一段帕瓦罗蒂的演唱,有场面庞大的乐队伴奏,当然很好听。奥本海姆教授演示用了信号处理技术,竟然可以把乐队伴奏的声音全部过滤掉,只剩下了帕瓦罗蒂的唱声,这就可以单独欣赏他的纯真的歌声,这里面用到了复杂的滤波技术完全是傅里叶变换的功劳。(他的歌唱频谱范围和乐队演奏声音的频谱范围是不同的。将频域里的乐队声的频谱信号删除,再还原到时域就只剩下了人的歌唱声了。)可见,信号处理的本领之大了。

语音识别技术经过最近几十年的研究发展,已经十分成熟,能听人语音发出命令而做事的机器人本领也愈来愈大了。我们清华人在其中作了贡献,也值得自豪!

转载:中国机器人网(原始来源:评论:0)

以上是网络信息转载,信息真实性自行斟酌。

版权/免责声明:
一、本文图片及内容来自网络,不代表本站的观点和立场,如涉及各类版权问题请联系及时删除。
二、凡注明稿件来源的内容均为转载稿或由企业用户注册发布,本网转载出于传递更多信息的目的;如转载稿涉及版权问题,请作者联系我们,同时对于用户评论等信息,本网并不意味着赞同其观点或证实其内容的真实性。
三、转载本站原创文章请注明来源:中华厨具网

免责声明:

本站所有页面所展现的企业/商品/服务内容、商标、费用、流程、详情等信息内容均由免费注册用户自行发布或由企业经营者自行提供,可能存在所发布的信息并未获得企业所有人授权、或信息不准确、不完整的情况;本网站仅为免费注册用户提供信息发布渠道,虽严格审核把关,但无法完全排除差错或疏漏,因此,本网站不对其发布信息的真实性、准确性和合法性负责。 本网站郑重声明:对网站展现内容(信息的真实性、准确性、合法性)不承担任何法律责任。

温馨提醒:中华厨具网提醒您部分企业可能不开放加盟/投资开店,请您在加盟/投资前直接与该企业核实、确认,并以企业最终确认的为准。对于您从本网站或本网站的任何有关服务所获得的资讯、内容或广告,以及您接受或信赖任何信息所产生之风险,本网站不承担任何责任,您应自行审核风险并谨防受骗。

中华厨具网对任何使用或提供本网站信息的商业活动及其风险不承担任何责任。

中华厨具网存在海量企业及店铺入驻,本网站虽严格审核把关,但无法完全排除差错或疏漏。如您发现页面有任何违法/侵权、错误信息或任何其他问题,请立即向中华厨具网举报并提供有效线索,我们将根据提供举报证据的材料及时处理或移除侵权或违法信息。