虽然现在许多汽车公司都在投资开发自动驾驶汽车,但迄今为止,自动驾驶车辆还尚未达到大规模部署所需的安全水平。若要达到该水平,车辆需要能够安全有效地应对道路上的各种挑战。
据外媒报道,卡内基梅隆大学(carnegie mellon university)的研究人员开发出基于强化学习(rl)的框架,可以帮助提高自动驾驶汽车在匝道合并场景中的性能,即匝道上的车辆偏离主干道的情况,或将提高自动驾驶汽车的安全性,降低事故风险。
图片来源:arxiv
开发该模型的研究人员之一soumith udatha表示:“此次研究关注的是高速公路并道,因为涉及高速车辆、不同风格的驾驶员以及各种不确定性。”
udatha及其同事致力于提高自动驾驶汽车的安全性。在最近的论文中,这些研究人员尝试设计出一个框架,可以有效地捕捉匝道合并场景,并根据对任何不确定性和可能风险的分析来规划车辆的行动。
udatha解释说:“rl模型与环境交互并收集数据以优化它们的奖励,但这种数据探索在部署到现实环境中时会遇到一些问题,部分原因是并非代理遇到的所有状态都是安全的。我们用控制屏障功能(cbf)来约束我们的rl策略,以确保在指定距离内的安全。因此,在环境约束下,我们可以忽略不安全状态,并增强系统学习导航的能力。”
cbf是一类相当新的计算方法,旨在增强自动驾驶系统的安全控制。cbf可以直接应用于不同的优化问题,包括斜坡合并。但cbf执行的优化并没有考虑系统在探索环境时收集的数据,而rl方法可以帮助填补这一空白。
udatha表示:“我们发现,我们的算法可以扩展到离线和在线rl环境。由于我们现在拥有大量用于离线rl的数据,因此对离线数据集的训练最终可以产生更好的模型。根据我们的指标,我们还发现将概率cbf作为约束包含在内可以提供更好的安全性,因为cbf在一定程度上考虑了驾驶员的不确定性。”
udatha及其同事在一系列测试中测试了他们的框架,使用的是由英特尔实验室(intel labs)和巴塞罗那计算机视觉中心(computer vision center)的研究人员开发的在线版carla仿真器。在这些仿真中,基于rl的框架成果显著,凸显了其在匝道合并期间提高自动驾驶车辆安全性的可能价值。
来源:盖世汽车
以上是网络信息转载,信息真实性自行斟酌。










