寒武纪深度学习处理器重磅发布】ISCA 2016 顶级论文产业化

2016-03-16 新智元 新智元

 新智元原创1

作者:闻菲


AlphaGo与李世石的人机大战已经落下帷幕,但人工智能的卓越表现相信在很长一段时间内都将深驻人心。不过,在目前的硬件条件下,AlphaGo需要使用巨大的计算资源;最高配置的AlphaGo被称为AlphaGo Distributed,它使用了1920个CPU和280个GPU。

 

“要是用寒武纪的硬件,只需要一个PC箱就可以运行AlphaGo的机群。”陈天石研究员笑着说。“运算速度也应该会更快。”

 

2016年3月15日,新智元记者参加了中国科学院计算技术研究所举办的媒体沙龙,计算所体系结构国家重点实验室未来计算课题组的陈天石研究员介绍了“寒武纪神经网络处理器”:


国际上首个深度学习处理器架构


第一个“挖坑”的人


深度学习是一类借鉴生物的多层神经网络处理模式所发展起来的智能处理技术。微软、Google、Facebook、阿里、讯飞、百度等公司都广泛地将这类技术应用于计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域。要说深度学习的强大,最好的例子,就是开头提到的AlphaGo这款基于深度学习的围棋程序。

 

但是,深度学习的基本操作是神经元和突触的处理,而传统的处理器指令集(包括 x86 和ARM等)对深度学习的处理效率很低,往往需要数百甚至上千条指令才能完成一个神经元的处理。例证就是,谷歌使用了上万个 x86 CPU核,运行了7天的时间,才训练出一个识别猫脸的深度学习神经网络。

 

因此,神经网络处理器一直是计算机硬件领域少有人触及的课题——哪怕如今AlphaGo让“神经网络”这个名词大红大紫,深度学习也成了世界公认的重要智能处理技术。但是,早在深度学习这股热潮兴起之前的2008年,还是博士生的陈天石便注意到神经网络的存在价值,和同事一起走上了体系结构和人工智能交叉研究的道路,探索神经网络硬件。交叉领域的研究要得到认可并不容易,用陈天石的话说,就是“第一个挖坑”。


即使有这么多人跟进,我们还是第一


2012年,陈天石等人提出了国际上首个人工神经网络硬件的基准测试集benchNN。这项工作提升了人工神经网络处理速度,有效加速了通用计算,大大推动了国际体系结构学术圈对神经网络的接纳度。


此后,陈天石、陈云霁课题组接连推出了一系列不同结构的“寒武纪”神经网络专用处理器。2014年,他们在ASPLOS的文章中实现了多个当前流行的深度模型,两获CCF推荐A类国际学术会议的最佳论文奖,并被《美国计算机学会通讯》遴选为研究亮点,在深度学习的硬件领域迈出了坚实的一步。


2016年3月,陈云霁、陈天石课题组提出的寒武纪深度学习处理器指令集DianNaoYu被计算机体系结构领域的顶级国际会议ISCA 2016接收,在所有近300篇投稿中排名第一。论文的第一作者为刘少礼博士。

 

DianNaoYu指令直接面对大规模神经元和突触的处理,一条指令即可完成一组神经元的处理,并对神经元和突触数据在芯片上的传输提供了一系列专门的支持。模拟实验表明,采用DianNaoYu指令集的深度学习处理器相对于 x86指令集的CPU有两个数量级的性能提升。



寒武纪芯片。来源:中科院计算所

 


寒武纪芯片的板卡。来源:中科院计算所


ISCA(International Symposium on Computer Architecture)被公认为是计算机体系结构领域最重要的国际会议。四十多年来,计算机硬件的多项核心创新都出自于ISCA,包括RISC、缓存一致性、动态多发射等。我国迄今在该会议上发表论文仅十余篇。自2014年中科院计算所提出首个深度学习处理器“寒武纪”之后,深度学习处理器已经成为ISCA最为关注的研究方向之一。ISCA 2016上,有近1/6的论文(来自MIT、斯坦福和UCSD等国际知名机构)都引用“寒武纪”的工作进行深度学习处理器探索。

 

“我们团队都是土博士,洋人不带我们玩儿,完全是凭着我们的工作成果才跟随过来。”陈天石自豪地说:“但即使有这么多人跟进,我们还是第一。”


人工智能的寒武纪


指令集是计算机软硬件生态体系的核心。Intel 和ARM正是通过其指令集控制了PC和嵌入式生态体系。寒武纪在深度学习处理器指令集上的开创性进展,为中国占据智能产业生态的领导性地位提供了技术支撑。

 

陈天石研究员特别感谢了“中科院战略性先导科技专项”,正是有了专项的资金支持,才能让“寒武纪”这个国际首个深度学习处理器架构保有中外专利。

 

据陈天石透露,与寒武纪处理器相关的产业化工作已经启动,未来几个月之内就会运行寒武纪公司。接下来,他们将专注于深度学习处理器的产业化运营,主要分为高性能服务器芯片、高能效终端芯片和服务机器人芯片这三方面的转化工作,力求“服务于民用市场,满足国家重大需求”。

 

“很多人都问,我们的处理器为什么要叫‘寒武纪’,”陈天石说:“因为寒武纪是生物‘大爆炸’的时代,现在也像是人工智能大爆炸的时代。”

 

“但是,寒武纪之后地球上也遭遇了生物大灭绝,”他接着说,席间有笑声响起,“人工智能也会迎来衰退或灭绝期,这是自然规律”。不过,他希望“寒武纪”能在接下来的衰退乃至灭绝(如果发生的话)当中存活下来,并且发展得更好。


寒武纪能支持各种智能主机和终端,进一步将应用面扩展到更多算法上。”