分享好友 厨具导购网站首页 频道列表
研究人员通过对人类听觉处理进行建模来改进机器人
2025-08-26 09:11    4980    中华厨具网

我们很少想到噪音,因为我们正在倾听它们,但是在拥挤的城市广场和繁忙的百货商店等地方隔离音频存在着巨大的复杂性。在我们的听觉途径的较低层次中,我们将个体来源与背景隔离,将它们在空间中定位,并检测它们的运动模式 - 所有这些都在我们计算出它们的背景之前。

受到这种神经生理学的启发,一组研究人员在arxiv.org的预印纸上分享了这一文章(“ 使用仿生双耳声源定位的增强型机器人语音识别 ”),该设计旨在测试地貌(即面部特征)对人脸的影响。声音识别的组成部分,如声源定位(ssl)和自动语音识别(asr)。

正如研究人员指出的那样,躯干,头部和耳廓(耳朵的外部部分)吸收并反射声波,因为它们接近身体,根据声源的位置修改频率。它们前往耳蜗(内耳的螺旋腔)和内部的corti器官,产生神经冲动以响应声音振动。这些冲动通过听觉神经系统传递到耳蜗核,这是一种将信息转发到两个结构的中继站:内侧上橄榄(mso)和侧上橄榄(lso)。(mso被认为有助于定位左侧或右侧的角度以精确定位声音源,而lso使用强度来定位声源。)最后,它们被整合到大脑的下丘(ic)中。

为了在算法上复制结构,研究人员设计了一个机器学习框架,处理嵌入人形机器人头部的麦克风记录的声音--icub和soundman。该框架包括四个部分:一个ssl组件,将音频分解为多组频率,并使用频率波产生模仿corti神经冲动的尖峰; 对某些角度产生的声音敏感的mso模型; 对其他角度敏感的lso模型; 以及一个ic组合的层,它结合了mso和lso的信号。额外的神经网络可以最大限度地减少混响和自我噪声(机器人关节和电机产生的噪音)。

为了测试系统的性能,研究人员使用soundman建立ssl和asr基线以及icub头(配备允许其旋转的马达),以确定头部和内部组件的共振效应。一组13个均匀分布的扬声器采用半圆柱配置,朝向磁头喷射噪声,探测并处理它。

该团队发现,来自ssl的数据可以“显着改善” - 在某些情况下,在句子级别上提高了两倍 - 语音识别的准确性通过指示如何定位机器人头并选择适当的通道作为asr的输入系统。当从头部移除耳廓时,性能甚至更好。

“这种方法与相关的方法形成对比,在这些方法中来自两个通道的信号在用于asr之前是平均的,”该论文的作者写道。“动态ssl实验的结果表明该架构能够处理不同类型的混响。这些结果是我们之前在静态ssl中工作的重要扩展,并支持系统对真实环境中声音动态的稳健性。此外,我们的系统可以轻松地与最近的方法集成,以增强混响环境中的asr [55] - [57],而不会增加计算成本。“

转载:中国机器人网(原始来源:评论:0)

以上是网络信息转载,信息真实性自行斟酌。

版权/免责声明:
一、本文图片及内容来自网络,不代表本站的观点和立场,如涉及各类版权问题请联系及时删除。
二、凡注明稿件来源的内容均为转载稿或由企业用户注册发布,本网转载出于传递更多信息的目的;如转载稿涉及版权问题,请作者联系我们,同时对于用户评论等信息,本网并不意味着赞同其观点或证实其内容的真实性。
三、转载本站原创文章请注明来源:中华厨具网

免责声明:

本站所有页面所展现的企业/商品/服务内容、商标、费用、流程、详情等信息内容均由免费注册用户自行发布或由企业经营者自行提供,可能存在所发布的信息并未获得企业所有人授权、或信息不准确、不完整的情况;本网站仅为免费注册用户提供信息发布渠道,虽严格审核把关,但无法完全排除差错或疏漏,因此,本网站不对其发布信息的真实性、准确性和合法性负责。 本网站郑重声明:对网站展现内容(信息的真实性、准确性、合法性)不承担任何法律责任。

温馨提醒:中华厨具网提醒您部分企业可能不开放加盟/投资开店,请您在加盟/投资前直接与该企业核实、确认,并以企业最终确认的为准。对于您从本网站或本网站的任何有关服务所获得的资讯、内容或广告,以及您接受或信赖任何信息所产生之风险,本网站不承担任何责任,您应自行审核风险并谨防受骗。

中华厨具网对任何使用或提供本网站信息的商业活动及其风险不承担任何责任。

中华厨具网存在海量企业及店铺入驻,本网站虽严格审核把关,但无法完全排除差错或疏漏。如您发现页面有任何违法/侵权、错误信息或任何其他问题,请立即向中华厨具网举报并提供有效线索,我们将根据提供举报证据的材料及时处理或移除侵权或违法信息。