分享好友 厨具导购网站首页 频道列表
微软:要把视觉识别推进到智能终端里
2024-06-13 06:49    7364    中华厨具网

在几乎所有的科幻电影里,人工智能机器人都能像人类那样,用计算机视觉动态的识别周围环境、人与物。《星球大战7》里的新型机器人bb-8,还能通过头部的配合,制造出各种萌萌的眼神和表情。

然而与人类数千年的文化相比,计算机科学本身也不过几十年的历史。人眼可以轻易的识别各种2d和3d图像,对于计算机来说只是无数像素点的集合。如何让计算机分析这些捕获的像素点,“识别”出来各种物体,一直是计算机视觉想要攻克的难关。

微软研究院作为全球最大的企业研究院之一,长期以来也与其它科技机构一样,试图打开机器之眼。2015年底,微软在全球顶级的计算机视觉挑战赛imagenet中拿下了全部三项主要项目的冠军。与此同时,在硬件端微软还开发出了针对智能终端的视觉识别模型压缩算法。

可以说,现在离计算机视觉的全面突破,只有一步之遥。

百层卷积神经网络

imagenet挑战赛的项目之一是对1000 类、120万张互联网图片进行分类,每张图片人工标注5个相关类别,计算机识别的结果只要有一个和人工标注类别相同就算对。对于该图片集,人眼辨识错误率大概为5.1%,目前只有谷歌和微软等个别参赛团队的算法能够达到低于5%的结果。

2015年12月10日,微软亚洲研究院视觉计算组在imagenet计算机识别挑战赛中再次打破纪录,获得图像分类、图像定位以及图像检测全部三个主要项目的冠军,将系统错误率降低至3.57%。

在计算机视觉识别领域,卷积神经网络是主要的识别算法。微软亚洲研究院视觉计算组首席研究员孙剑介绍,之所以能实现3.57%的重大突破,是因为他所带领的研究团队使用了前所未有的高达百层的深层卷积神经网络算法,比以往任何成功的算法层数多达5倍以上。

目前神经网络算法的层级普遍为20到30层,而在此次挑战赛中微软团队的卷积神经网络实现了152层。孙剑的团队还采用了全新的“残差学习”原则,很好地解决了神经网络的层级数与准确度之间的矛盾。孙剑说,“深层残差网络”极为通用,将极大地改善计算机视觉的研究。

12下页

来源:行业资讯

以上是网络信息转载,信息真实性自行斟酌。

版权/免责声明:
一、本文图片及内容来自网络,不代表本站的观点和立场,如涉及各类版权问题请联系及时删除。
二、凡注明稿件来源的内容均为转载稿或由企业用户注册发布,本网转载出于传递更多信息的目的;如转载稿涉及版权问题,请作者联系我们,同时对于用户评论等信息,本网并不意味着赞同其观点或证实其内容的真实性。
三、转载本站原创文章请注明来源:中华厨具网

免责声明:

本站所有页面所展现的企业/商品/服务内容、商标、费用、流程、详情等信息内容均由免费注册用户自行发布或由企业经营者自行提供,可能存在所发布的信息并未获得企业所有人授权、或信息不准确、不完整的情况;本网站仅为免费注册用户提供信息发布渠道,虽严格审核把关,但无法完全排除差错或疏漏,因此,本网站不对其发布信息的真实性、准确性和合法性负责。 本网站郑重声明:对网站展现内容(信息的真实性、准确性、合法性)不承担任何法律责任。

温馨提醒:中华厨具网提醒您部分企业可能不开放加盟/投资开店,请您在加盟/投资前直接与该企业核实、确认,并以企业最终确认的为准。对于您从本网站或本网站的任何有关服务所获得的资讯、内容或广告,以及您接受或信赖任何信息所产生之风险,本网站不承担任何责任,您应自行审核风险并谨防受骗。

中华厨具网对任何使用或提供本网站信息的商业活动及其风险不承担任何责任。

中华厨具网存在海量企业及店铺入驻,本网站虽严格审核把关,但无法完全排除差错或疏漏。如您发现页面有任何违法/侵权、错误信息或任何其他问题,请立即向中华厨具网举报并提供有效线索,我们将根据提供举报证据的材料及时处理或移除侵权或违法信息。