分享好友 厨具导购网站首页 频道列表
英特尔推深度学习处理器 加快人工智能创新步伐
2024-05-20 21:58    6420    中华厨具网

在法兰克福举办的国际超级计算大会上,涌现了很多令人兴奋的新技术,驱动着广泛应用于各行各业的人工智能和深度学习技术的发展。英特尔为人工智能技术的各个层面提供了一套广泛全面的产品组合,其中包括即将推出的英特尔至强可扩展处理器以及英特尔现场可编程门阵列(fpga),还有即将推出的代号为knights mill的英特尔至强融核处理器,将深度学习技术提升到了一个新高度。

这个英特尔至强融核系列的新成员是专门针对深度学习训练进行了优化,预计在2017年第四季度投产。该处理器旨在满足数据科学家、工程师以及所有致力于机器学习技术应用领域的用户独特需求。knights mill尤其能够通过充分利用低精度计算优势而大大缩短训练深度学习模型的时间。

为什么低精度如此重要?简单地说,数据科学家需要硬件能够在训练模型时加速融合。在过去,深度学习模型可能要花上几天甚至几周的时间才能完成一个迭代的融合,这使得他们很难在有限的时间内进行研究。如今的硬件能够通过低精度计算把训练时间缩短到几个小时——这相当于加快了计算速度。只要硬件能满足深度学习框架的精度要求,那么最重要的就是看硬件训练模型的速度有多快。因此低精度计算可用于解决深度学习负载问题,并且与高性能计算相比是首选的计算方式,后者通常需要单或双精度运算性能。

那么knights mill和之前代号为knights landing的英特尔至强融核处理器有何不同呢?人们经常听到专注于高性能计算、人工智能和机器学习的用户提出这个问题。

knights mill使用和knights landing相同的整体架构和分装,两个cpu都是第二代英特尔?至强融核处理器,并使用相同的平台。区别就是knights mill使用不同的指令集来改进低精度性能,但牺牲了对许多传统高性能计算负载非常重要的双精度性能。这意味着knights mill适用于处理深度学习负载,而knights landing则更适合高性能计算负载以及其它要求高精度的运算。

这些不同的指令集被称作“四倍融合乘加指令”(qfma:quad fused multiply add)和“四倍虚拟神经网络指令” (qvnni: quad virtual neural network instruction)。qfma能把knights mill的单精度性能提高一倍,而qvnni指令则可以进一步降低精度,同时满足深度学习框架的精度需求。把单精度性能提高一倍并进一步降低精度的结果将使knights mill相比knights landing能够为深度学习负载提供更高的运算性能。此外,频率、电源和效率方面的改善也推动了性能的提升,但是指令集变化才是性能显著提升的最大因素。

退一步说,knights mill处理器并不仅仅是为了加速深度学习负载,而且是在现有的基于英特尔技术的环境中获得新的处理功能。英特尔至强融核处理器平台二进制兼容英特尔至强处理器。几乎所有运行在英特尔至强处理器上的负载都能运行在英特尔至强融核处理器上,这就让用户可以轻松地在英特尔平台上共享软件投资。

另一方面,英特尔正在统一深度学习实践者在整个硬件平台上使用深度学习框架的前进道路。这些都是受益于英特尔nervanagraph把先进的功能带到深度学习框架。这个面向神经网络的计算和执行图让开发者能够在多个硬件对象上自动进行优化,从而让用户能够在不同的英特尔平台上共享其软件投资。

来源:智能电子集成

以上是网络信息转载,信息真实性自行斟酌。

版权/免责声明:
一、本文图片及内容来自网络,不代表本站的观点和立场,如涉及各类版权问题请联系及时删除。
二、凡注明稿件来源的内容均为转载稿或由企业用户注册发布,本网转载出于传递更多信息的目的;如转载稿涉及版权问题,请作者联系我们,同时对于用户评论等信息,本网并不意味着赞同其观点或证实其内容的真实性。
三、转载本站原创文章请注明来源:中华厨具网