新闻资讯

​云天励飞发布自主可控神经网络处理器芯片—云天初芯DeepEye1000

2019-11-19 admin

从2017年7月15日到2018年8月16日,经历397个日夜,云天励飞深度学习神经网络处理器DeepEye1000终于一次性流片成功,回片(试生产)一个星期,跑通人脸识别算法全链路;回片一个月,跑通人脸识别业务完整demo;回片两个月,跑通100万人像搜索,4K-200人抓拍识别全功能。

 

云天励飞的身上一直有很多标签:海归,孔雀计划,人工智能,算法……11月13日,云天励飞又添一枚新标签:芯片。其在“深圳第一展”高交会的第一天,正式发布了一款5AIoT芯片。

 

为什么从流片到发布要相隔13个月?作为一家以算法系统见长的AI公司,为何要花大成本、苦功夫造芯?这背后有什么故事?

 

造芯:迟来13个月的芯片

 

“我们今天就来挑战对传统芯片的理解。”

 

11月13日,身着黑色T恤和牛仔裤的云天励飞创始人兼CEO陈宁一开场就抛出一个听起来有些“惊世骇俗”的观点,语气间,他加重了对“挑战”二字的强调。

 

当天,云天励飞在深圳高交会期间,正式发布了自主可控的神经网络处理器芯片——云天初芯DeepEye1000。这颗芯片不是一个纯AI算力的芯片,而是满足边缘计算的SoC芯片。

 

芯片,云天励飞喻其为“城市大脑的AI触角”。

 

本次发布的面向AIoT领域的“云天初芯”DeepEye1000是一款面向边缘和端侧视觉应用的AI芯片。内置四核神经网络处理器,采用存算融合体系架构和可重构计算阵列,可以灵活、高效的执行各种深度学习算法模型的推理计算,峰值算力达2.0Tops。

 

在CPU方面,“云天初芯”DeepEye1000采用阿里平头哥玄铁810嵌入式处理器。此外该芯片还采用了双核视觉DSP处理器,内置硬件加速运算子ACC,支持超过20个高效算子,每秒可跟踪1200张人脸。DeepEye1000的视频处理能力,可支持4K 30fps视频、4路高清视频并行的实时分析。

 

单纯从神经网络处理器角度的出发,在相同条件下,经过测算,云天励飞的第二代深度学习神经网络处理器NNP和华为海思的NNIE相比,在性能上提供了十倍以上的IPS,单位模型处理性能的平均带宽需求降低40%,单位模型处理性能下的平均成本降低60%。

 

值得一提的是,这颗芯片背后的160多条指令,是基于人工智能神经网络和未来三年框架发展趋势,由算法团队和芯片团队跨界创新的成果。

 

 

​云天励飞发布自主可控神经网络处理器芯片—云天初芯DeepEye1000

 

 

自主可控的神经网络处理器芯片——云天初芯DeepEye1000

 

对于云端芯片来说,强大的算力是最重要的。而对于端和边缘侧芯片,面对海量的终端,云天励飞副总裁兼芯片产品线负责人李爱军认为,最重要的特点是高性能和低成本。

 

从高性能上看,云天励飞的异构架构有着分布式、可重构的特点,可以实现实时动态任务调度和智能高效的存储,这种架构保证了性能大幅度的提升。经过测算,和通用GPU相比,该芯片单位性能提升20倍,单位能效提高100倍,系统时延降低200倍。

 

其中,最为关键的秘诀是“数据复用”。主要体现为云天励飞的算法映射到处理器上时,输入数据的复用和内部执行数据的复用。这会在带宽、成本上明显体现出来。

 

从低成本上看,这颗芯片售价为10美金。团队深刻地记得,2012年,云天励飞还在草创阶段的时候,英伟达送了几片芯片给硅谷的团队做研发支持,那个时候一片GPU的价格为4000美金。眨眼7年后,芯片的价格已经有很强的市场竞争力了。

 

实际上,这款5AIoT芯片于2018年8月投片,10月流片回来并测试成功,为何此时才召开发布会?在从流片到正式发布的这13个月里,云天励飞干什么去了呢?

 

免费芯:算法公司创新商业模式

 

在这13个月里,云天励飞做了一件事:围绕这颗面向边缘的AI芯片,完善了从端到云的开发服务能力。让合作伙伴有能力在一个月时间内,基于云天的芯片和云端的服务“从无到有”开发出一款产品。他们把这称之为“1-1-1-1计划”,又叫“双十一计划”。

 

“1-1-1-1”四个“1”分别指代:一周完成硬件,一周适配算法,一周对接服务,一个月具备完整AI产品的能力。

 

也就是说,有了云天励飞提供的芯片和模组,一周时间用来组装硬件;一周的时间用来适配算法,在硬件上跑好业务逻辑;还有一周的时间用来对接云天的SIK,满足所有业务接口的需要;最后再用一个月的时间,把端和云端的能力打造好。

 

“不是出来一个芯片就要开发布会,我们在意的,是要让芯片有服务的功能。过去13个月,云天励飞就是在打造端云协同的AI生态。”李爱军说。