金银海贵金属有限公司:阿里发布首款 AI 芯片“含光”
金银海贵金属有限公司:阿里发布首款 AI 芯片“含光”
金银海贵金属有限公司报道,2019年杭州云栖大会上,阿里巴巴集团首席技能官兼阿里云智能总裁张建锋发布了阿里的首款AI芯片含光800,该芯片是一款云端AI芯片,也是全球最高功能的AI推理芯片。含光800主要使用于视觉场景,现已在阿里巴巴集团内多个场景大规划使用,其它企业可以经过阿里云获得含光NPU的算力。
据悉,含光为上古三大神剑之一,该剑含而不露,光而不耀,正如含光800带来的无形却强劲的算力。
含光800为何能打破记录?
依据张建锋的说法,在业界规范的ResNet-50测试中,含光800推理功能达到78563 IPS,比目前业界最好的AI芯片功能高4倍;能效比500 IPS/W,是第二名的3.3倍。
含光800不只Resnet50的成果打破记录,从规划到商用的速度也很快。张建锋标明,平头哥用大约一年半的时刻完结了含光800从规划到商用。金银海了解到,平头哥用7个月完结了前端规划,之后用3个月就成功流片。仅建立一年的平头哥半导体为何这么快就能规划出云端AI芯片?
要知道,芯片作为典型的长周期产品,想加快芯片的商用,在硬件和软件方面都需求有很强的实力,特别是在AI年代,软硬一体化的重要性愈加突显。平头哥就得益于阿里在软硬件方面的堆集,算法方面,阿里巴巴达摩院机器智能实验室曩昔两年构建了完整的算法体系,包括语音智能、言语技能、机器视觉、决策智能等方向,而且取得多个国际领先水平的成果;硬件方面,阿里巴巴此前已在服务器、FPGA以及存储等范畴具有多年研制经验,此外,平头哥团队在体系结构、编译技能等范畴具有深厚的技能储备。
含光800功能的打破得益于软硬件的协同创新,芯片架构方面,含光800选用创新的架构,针对深度学习中运用的很多权重参数和张量数据,在支撑稀疏紧缩与量化处理的根底上,经过独特规划的数据访存与流水线处理技能,大大减低了I/O需求和数据的搬移。NPU一起深度优化了卷积,矩阵乘,向量核算和各种激活函数,经过高有用的硬件资源调度和全并行的数据流处理,把AI运算的功能和能效都面向极致。
其间,功能的进步有必要解决内存墙问题。所谓的内存墙,是指选用选用冯诺依曼结构的处理器,存储和运算处理别离,当进行深度神经网络处理时,算力得到了进步,但很多读写运转操作会受到带宽限制,芯片的全体功能进步也一起受到限制。
平头哥的做法是经过自研架构大幅削减对内存的访问,在确保功能的情况下,把芯片功耗降到最低水平。具体而言,含光800会依据神经网络推理运算特征,规划特定的硬件、高速衔接的存储结构以及专用指令集,对内存和核算单元完结高效组织办理,完结单条指令完结多个操作,进步核算功率和内存访问功率。
3个月发3款芯片新品,阿里“硬”了
阿里首款AI芯片发布之后,其从云端到终端的产品布局现已十分清晰。这些产品也都密布在最近几个月发布,今年7月的阿里云上海峰会上,阿里巴巴集团副总裁戚肖宁发布了高功能RISC-V架构处理器玄铁910。玄铁910集成16个核心,主频2.5GHz,选用12级乱序流水线,最大支撑8MB二级缓存,搭载AI增强的向量核算引擎,可用在人工智能加快器、网络通信和自动驾驶等范畴。现场发布的数据显示,玄铁910较业界主流芯片功能进步40%,较规范指令功能高出20%。
8月,平头哥又发布SoC芯片渠道“无剑”,无剑渠道由SoC架构、处理器、各类IP、操作体系、软件驱动和开发工具等模块构成,面向AIoT供给的集芯片架构、根底软件、算法与开发工具于一体的全体解决方案。依据官方的说法,无剑可以帮助芯片规划企业将规划本钱下降50%,规划周期紧缩50%。
需求指出,7月发布的玄铁910是根底单元处理器IP,无剑是芯片规划渠道,所以含光800是阿里的首款AI芯片。这也意味着,阿里的C-Sky系列、玄铁系列AIoT终端芯片IP,一站式芯片规划渠道无剑,以及最新发布的云端AI芯片构建了阿里端云一体的芯片生态,平头哥端云一体全栈芯片产品宗族雏形已现。
更值得关注的是,端侧的7款C-Sky系列嵌入式CPU IP核已得到大规划量产验证,授权客户超100家,累计出售超十亿颗,使用于机器视觉、工业操控、车载终端、移动通信和信息安全等范畴。
RISC-V架构的玄铁处理器以及无剑SoC渠道也已有客户,包括人工智能企业云天励飞、老牌芯片公司炬芯科技等。
含光800也现已完结了大规划使用,使用于阿里巴巴集团内多个场景,例如视频图像识别/分类/查找、城市大脑等,未来还可使用于医疗影像、自动驾驶等范畴。一起,阿里云作为全球前三的云服务供给商,含光的能力将经过云服务对外供给。张建锋现场宣告,根据含光800的AI云服务也正式上线。
别的,在生态建造方面,平头哥还将建立芯片敞开社区。
不只如此,平头哥还在研制用于阿里云神龙服务器的SoC专用芯片。未来,阿里还将进一步完善产品形状,推出包括云端AI训练芯片和终端AI推理芯片,满意更多场景的算力需。
自研AI芯片的终极意图是什么?
阿里从云端到终端AI芯片的布局现已清晰,而且也现已有不少客户,这是否意味未来阿里不只不需求购买芯片,还或许代替其它芯片公司?答案是否定的。在这一轮的AI浪潮中,我们看到无论是国外的谷歌、Amazon、Facebook还是国内的阿里,这些强于软件的科技巨子们都在活跃研制AI芯片。
至于其间的原因,Cadence首席执行官、华登国际创始人陈立武此前承受雷锋网采访时标明:“科技巨子活跃布局AI是由于他们不期望落后,由于他们都有很多的数据。当然,科技公司开端做芯片并不意味着传统的芯片厂商会被取代,科技公司期望在一些使用上用自主研制的芯片来进步功率。”
现实也的确如此,就拿阿里来说,其业务横跨电商、金融、物流、云核算、大数据、全球化等场景,用户规划巨大,对算力的需求更高,挑战也更大。传统CPU、GPU和FPGA难以满意所有需求,而且面对本钱和功耗挑战。定制化的ASIC芯片可以完结更高的功能一起兼具更低功耗,因而科技巨子们根据对自身业务和需求的了解,纷繁开端自主研制AI芯片,期望在坚持领先性的一起,下降全体核算本钱。
从全球范围看,谷歌TPU是全球科技企业从软变硬的代表。此次含光800的发布及商用,标明阿里的优势也不再只是在软件范畴,在AI芯片的加持下,未来阿里的优势也将是软硬一体的优势。
为了完结这一方针,阿里几年前就开端了布局。2017年云栖大会上,阿里建立达摩院,这是阿里在全球多点设立的科研机构,安身根底科学、颠覆性技能和使用技能的研讨。达摩院由全球建造的自主研讨中心、高校联合实验室,全球敞开研讨计划三大部分组成,包括量子核算、机器学习、根底算法、网络安全、视觉核算、自然言语处理、下一代人机交互、芯片技能、传感器技能、嵌入式体系等,包括机器智能、智联网、金融科技等多个工业范畴。
平头哥得到达摩院和阿里云的软实力加持,根据达摩院的算法能力,才能打破了算法和硬件之间的距离,根据阿里云飞天云渠道的优势,得以快速形成了端云一体芯片生态。
如今,阿里自主研制芯片的方针也现已部分达成。依据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需求40颗传统GPU,延时为300ms,运用含光800仅需4颗,延时降至150ms。拍立淘商品库每天新增10亿商品图片,运用传统GPU算力识别需求1小时,运用含光800后可缩减至5分钟。
明显,平头哥的意图并非是卖芯片,平头哥还会连续了母体阿里巴巴集团“让天下没有难做生意”的愿景,开辟了全新的商业模式,即平头哥模式(以无剑渠道为核心),为企业供给普惠算力。
另据介绍,针对AIoT商场有强使用驱动和场景碎片化等特色,芯片公司按照传统的方法规划芯片很难去习惯未来的需求,平头哥期望经过端云一体芯片生态为各行业供给普惠算力。
张建锋说:“在全球芯片范畴,阿里巴巴是一个新人,玄铁和含光800是平头哥的万里长征第一步,我们还有很长的路要走。”
作为科技巨子,阿里此前愈加擅长软件,而且具有很多的数据。在正在到来的以数据为中心的年代,可以凭借AI更快挖掘出数据的价值将成为科技巨子们继续坚持领先优势的要害之一。因而,无论是国外还是国内,科技巨子们纷繁开端投入巨大的资源进入技能、资金、人才都十分密布的芯片工业,阿里首款AI芯片的推出,意味着阿里现已不再只擅长软件,在其广泛的使用场景需求的支撑下,阿里将可以完结硬件的快速迭代的完善,在云端和终端进一步释放出软硬结合的优势。