找回密码
 1分钟注册发帖

QQ登录

只需一步,快速开始

[科技新闻] 会当凌绝顶,清华大学发布世界首款异构融合类脑芯片

[复制链接]
恋蝶 发表于 2019-8-1 12:04:39 | 显示全部楼层 |阅读模式
百事牛点评:多多益善,聚沙成塔集腋成裘

人民日报客户端消息,清华大学施路平团队近日发布研究成果——类脑计算芯片“天机芯”。该芯片是世界首款异构融合类脑芯片,也是世界上第一个既可支持脉冲神经网络又可支持人工神经网路的人工智能芯片。目前,该成果已在《自然》杂志作为封面文章发表,实现了中国在芯片和人工智能两大领域《自然》论文零的突破。

据介绍,当前,人工智能芯片代表性工作可概括为两个主流方向:深度学习加速器 (支持人工神经网络) 和类脑芯片(主要支持脉冲神经网络)。由于算法和模型的差别,当前人工智能芯片均只支持人工神经网络或者脉冲神经网络,难以发挥计算机和神经科学两个领域的交叉优势。天机芯片则通过资源复用,只需百分之三的额外面积开销即可同时运行计算机科学和神经科学导向的绝大多数神经网络模型,支持异构网络的混合建模,形成时空域协调调度系统,发挥它们各自的优势,既能降低能耗,提高速度,又能保持高准确度。

2015年,施路平团队设计出第一代“天机芯”,经不断改进设计,2017年第二代“天机芯”问世。相比于当前世界先进的IBM的TrueNorth芯片,2017年流片成功的第二代“天机芯”密度提升20%,速度提高至少10倍,带宽提高至少100倍,灵活性和扩展性更好。

施路平介绍,早在2012年,清华大学就瞄准未来人工智能发展的前沿,通过人才引进布局类脑计算。2014年清华大学依托精仪系成立了联合了七个院系的类脑计算研究中心,施路平为类脑计算研究中心主任。基于自主研发的天机芯片,类脑计算中心还研制出第一代类脑计算软件工具链,可支持从机器学习编程平台到“天机芯”的自动映射和编译,开发出第一代类脑计算系统,并利用类脑自动行驶自行车建立一个异构可扩展人工通用智能开发演示平台,利用一块天机芯片展示了自行车的自平衡、动态感知、目标探测、跟踪、自动避障、过障、语音理解、自主决策等功能。

重磅!清华类脑芯片登上Nature封面,已成立公司,颠覆冯诺伊曼!


智东西8月1日消息,又一支清华芯片团队取得重大突破!来自清华的“天机”类脑芯片架构登上了顶级学术杂志《自然(Nature)》封面。

28nm的天机芯片由156个FCores组成,面积为3.8×3.8毫米,包含大约40000个神经元和1000万个突触,可以同时支持机器学习算法和类脑电路。

据智东西了解,“天机”类脑芯片项目脱胎于清华精密仪器系,是清华精密仪器系教授、脑计算中心主任施路平教授带队主导的类脑芯片项目之一。2018年1月,“天机”团队注册成立了北京灵汐科技,董事长兼CEO为祝夭龙。灵汐科技于2018年8月披露了其天使轮融资,投资方来自华控基石基金、优选资本、清华控股。而本篇Nature论文的第一作者裴京也是灵汐科技的监事,施路平教授则为灵汐科技公司董事。

脱身清华,落地灵汐科技


这篇论文名为《面向通用人工智能的异构融合芯片架构“天机”(Towards artificial general intelligence with hybrid Tianjic chip architecture)》

论文地址:https://www.nature.com/articles/s41586-019-1424-8

这篇论文中介绍了清华团队的“天机”类脑芯片架构,它不仅算力高、功耗低、支持多种不同AI算法、而且采用了存算一体技术,不需要外挂DDR,能够节省成本功耗和空间。在论文中,研究团队描述了这种芯片如何帮助机器响应语音命令,识别周围世界,避开障碍并保持平衡。



而在附上的视频中,“天机”团队还展示了搭载该芯片的自动驾驶自行车是如何自动控制平衡、并在操场上对目标人物进行识别、跟随、自动避障。



施路平教授表示,此次发表在《自然》的论文是一个非常初步的研究,人工通用智能是一项非常具有挑战性的工作,目前还处于起步阶段。他和团队的研究愿景是——“发展类脑计算,支撑人工通用智能,赋能各行各业”。据他透露,目前,团队已经启动了下一代芯片的研究,预期明年年初可以完成研发工作。未来,天机芯片有望部署在自动驾驶汽车和智能机器人中。







“天机”芯片技术拆解

“天机”是一种推进人工通用智能(AGI)发展的异构融合芯片架构,结合了神经科学导向和计算机科学导向方法的优点。在论文中,作者用一个无人自行车系统验证了这一异构融合芯片的处理能力。试验中,仅用一个芯片,无人驾驶自行车系统即可同时处理多种算法和模型,不仅可以识别语音指令、实现自平衡控制,还能完成对前方行人的实时检测和跟踪,并完成自动过障、避障和平衡控制等任务。据论文介绍,发展人工通用智能的方法主要有两种,一种基于计算机科学导向,另一种基于神经科学导向。据负责芯片设计和算法细节的论文作者邓磊介绍,此前,市面上的深度学习加速器通常只支持计算机科学模型,神经形态芯片只支持神经科学模型。两类方法依赖不同且不兼容的平台,在一定程度上延缓了人工通用智能的发展,因此需要一个可以支持通用的基于计算机科学的人工神经网络以及神经科学启发的模型和算法的通用平台。



研究团队由此提出天机芯片(Tianjic chip),同时支持计算机科学模型和神经网络模型。邓磊表示,天机芯片能做到两者都支持,同时支持神经科学发现的众多神经回路网络和异构网络的混合建模。因为两类模型所使用的语言、计算原理、编码方式和应用场景都不相同,实现这两种模型深度高效的融合,是天机芯片设计中最大的挑战。



天机芯片采用多核架构、可重构的构建模块和采用混合编码方案的流线型数据流,不仅可以适应基于计算机科学的机器学习算法,还可以轻松实现脑启动电路和多种编码方案。研究团队的一项重要创新是高度可重构的的统一功能核(FCore),它结合了人工神经网络和生物网络的基本构建模块——轴突、突触、树突和体细胞块。28nm的天机芯片由156个FCores组成,面积为3.8×3.8毫米,包含大约40000个神经元和1000万个突触,可以同时支持机器学习算法和类脑电路。




天机芯片提供超过每秒610千兆字节(GB)的内部存储器带宽,以及运行人工神经网络的1.28 TOPS的峰值性能。在生物启发的尖峰神经网络模式中,天机芯片实现了每瓦约650千兆每秒突触操作(GSOPS)的峰值性能。该研究团队还展示了与GPU相比的卓越性能,其中新芯片的吞吐量提高了1.6-100倍,电源效率提高了12-10000倍。





研究团队设计了一个无人驾驶自行车实验,来评估芯片整合多模态信息和做出迅速决策的能力。该自行车配备天机芯片和IMU传感器、摄像头、转向电机、驱动电机、调速电机、电池。自行车可以执行实时物体检测、跟踪、语音命令识别、骑行减速带、避障,平衡控制和决策等任务。




研究小组开发了各种神经网络(CNN、CANN、SNN和MLP网络)来完成每项任务。这些模型经过预训练并编程到天机芯片上,可以并行处理模型,实现不同模型之间的无缝片上通信。在实验中,采用天机芯片的无人驾驶自行车顺利完成了所有分配的任务,这标志着加速AGI发展的巨大飞跃。




研究小组还指出:“通过随机将新变量实时引入环境中可以产生高时空复杂性,例如不同的道路条件、噪声、天气因素、多种语言、更多人等等。通过探索允许适应这些环境变化的解决方案,可以检查对AGI至关重要的问题,比如概括、稳健性和自主学习。”





低功耗、低成本、高算力

在去年10月的安博会上,灵汐科技也向智东西展示了其110nm工艺的第一代、28nm的第二代“天机”架构的类脑芯片,主打云端智能市场。



▲第一、第二代“天机”架构类脑芯片灵汐科技告诉智东西,由于绕过了HBM内存技术对AI芯片性能和成本的限制,灵汐科技的芯片与市场同类产品比起来,具备低功耗、低成本、高计算力的优势。“天机”架构采用优化过的众核架构,由一系列核构成阵列完成神经网络的计算。在摩尔定律即将失效的今天,在现有的工艺基础上,从优化架构入手可能是提高芯片性能最重要的手段。




回复

使用道具 举报

 楼主| 恋蝶 发表于 2019-8-1 12:04:46 | 显示全部楼层
据灵汐科技介绍,“天机”架构已经超越了传统的冯诺伊曼结构,不像传统架构的芯片一样在计算的时候必须与DDR进行大量的数据交互而受存储带宽的限制,使整个芯片的性能受到影响。这也是“天机”架构芯片算力高的一个极其重要的原因。因为不用从外部导入数据,因此它的功耗比较低,也节省了成本和空间。





类脑芯片其实并不是一个新话题了。早在2014年,IBM就推出了业内首款类脑芯片TrueNorth。目前国内外有许多公司和机构正在类脑芯片研发上投入大量精力。据灵汐科技介绍,与当前市面上其他AI芯片架构相比,“天机”类脑芯片的主要优势有:1、算力高;2、功耗低;3、存算一体,不需要外挂DDR,节省成本功耗和空间;4、算法的支持度灵活,既能高效支持人工神经网络算法,又能高效支持SNN算法;5、扩展性好,能得到极大算力的芯片阵列,而且算力效率不会下降;6、支持多核重组特性,可以实现多任务并行处理。就在今年7月16日,英特尔也发布了“Pohoiki Beach”芯片系统,该系统主要由Loihi神经拟态芯片构成,可处理深度学习任务,速度比CPU快1000倍,效率高10000倍,耗电量小100倍。







Pohoiki Beach系统由64块Loihi芯片的800万个所谓的神经元构成。Loihi芯片是英特尔公司2017年首次推出的AI芯片,是一款模仿人类大脑的神经拟态芯片。相比于传统芯片,类脑芯片的确在功耗上具有绝对优势,完成同一个任务所消耗的能源有时甚至比传统芯片节省高达1000倍。同时类脑芯片的集成度也非常高,拿浙大推出的“达尔文”芯片来说,其面积为25平方毫米,也就是说边长只有0.5厘米,但内部却能包含500万个晶体管。随着行业对计算力要求越来越高,冯氏瓶颈将越来越明显,颠覆传统架构的类脑芯片已为芯片行业开启了一扇新的大门
回复

使用道具 举报

贫下中农 发表于 2021-6-5 05:22:16 | 显示全部楼层
百尺竿头更进一步...
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 1分钟注册发帖

本版积分规则

重要声明:“百事牛www.BestKnew.com”的信息均由个人用户发布,并以即时上载留言的方式运作,“百事牛www.BestKnew.com”及其运营公司对所有留言的合法性、真实性、完整性及立场等,不负任何法律责任。而一切留言之言论只代表留言者个人意见,并非本网站之立场。由于本网受到“即时上载留言”运作方式所规限,故不能完全监察所有留言,若读者发现有留言出现问题,请联络我们。

Archiver|小黑屋|百事牛

GMT+8, 2024-4-19 09:48 , Processed in 0.022039 second(s), 15 queries .

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表