在国内做底层芯片方案设计,属于典型的吃力不讨好,芯片设计的大前提一定是生产出来的产品有人买,或者说,能被软件生态所拥抱,有人用。
没人买也没人用的东西,做的再好,做出来没有用。
但依然有公司不服输,叫杭州中天微。
中天微的历史,就是不服输的历史,因为他们做的是底层芯片方案,这个赛道早就有了垄断者。
Intel的X86体系和微软windows组成的Wintel联盟,只要是PC生态,就绕不过他们的技术。
Arm通过授权技术方案霸占了移动市场,Arm技术架构是当下移动设备绕不开的基础,苹果华为三星联发科,都是基于Arm的IP授权进行研发的,虽然都有自己的核心技术,但终究是运行在Arm的规则框架内。
中天微不服输,他们选择另起炉灶设计底层芯片方案,做与Arm同为最底层的方案,主攻iot和物联网领域,创造属于自己的世界,定立属于自己的规则。
实事求是的讲,他们选择的路用不太好来形容都算保守了,基本算找死,但杭州人自古被称之为【杭铁头】,撞了南墙也不回头,而是一直撞,撞到死为止。
这和平头哥的性格非常像,不管面对多么强大的对手,先干再说。
经过10余年的不服输,杭州中天微是大陆唯一长期从事指令架构研发、CPU微体系结构与系统芯片产品研发,且成功开发多款CPU IP核,量产芯片销售10亿+的公司和团队。
这个成绩不能说差,但和上述几个巨头的差距稍微有点大。
中天微的法人叫做戚肖宁,1984年在杭州电子科大(时名为杭州电子工业学院)就读,本硕连读。
戚肖宁就读杭电的那段时间,杭电有一个青年教师,教英语。
青年教师叫做马云,他在杭电度过了难忘的执教时光。
2017年10月,阿里巴巴成立达摩院,立足基础科学、颠覆性技术和应用技术的研究,计划3年投入1000亿。我们基础科学落后,但马云和阿里巴巴不服输。
不服输的戚肖宁和马云走到了一起。
2018年4月,阿里巴巴全资收购杭州中天微。
2018年10月,阿里整合中天微与达摩院,成立了独立的半导体公司
两家不服输的公司要改变基础科学和芯片落后的格局,公司就叫平头哥。
芯片领域,绝不后退,绝不妥协。
生死看淡,不服就干。
当你走进这家半导体公司的时候,如果不知道的话,你可能以为误入了传销窝点。
70%的员工钉钉头像都是蜜獾,各种狂热的标语挂满了办公室。
这种小而伟大的精神,完美契合当前国内芯片业的现状。
小,但伟大,而且不服输,不怕死。
要么打死各位,要么被各位打死。
平头哥半导体成立的时候,阿里就对外吹出过牛,要做属于自己的神经网络芯片,Ali-NPU,要做就要做到世界做好,尽管前路上的霸主不计其数。
但平头哥从来不问对手有多少,不问对手有多强,只问对手在哪里。
当然最重要的,是整个团队如平头哥一般的意志坚定。
平头哥在组建团队进行招聘的时候,HR最担心的是在国内做半导体招不到人才,毕竟待遇和基础差距摆在面前,这无可否认。
但来自海外的邮件几乎塞爆了招聘邮箱,大量的海外华人与愿意降薪回国,抛下海外的一切,只为能在中国为中国制造属于自己的芯片。
那些年少时发誓要当祖国科学家的孩子们,抛弃了已有的荣誉与金钱,回家了,几十年前,他们的前辈也是如此。
芯片研发不是光靠情怀,硬实力是绕不过的坎。
达摩院一众学术界的大神加上中天微十多年的芯片设计积累再加大量海归的芯片尖端人才,以及阿里无上限的预算投入,阿里生态体系沉淀的海量数据,世界三大云之一阿里云的算力全部开放,这一切,为芯片研发插上了翅膀。
这一切的威力,在于2019年5月,玄铁910发布时得以一窥。
这是平头哥的第一款产品,高速,高能,平台化。
玄铁910是与ARM高端Cortex-A7X系列性能一致的底层处理器方案,相较于只有大公司才能使用且场景有所局限的Arm方案,玄铁910对于中小开发者们更为友好,不需要很高的技术成本,中小开发者就可以基于玄铁910来设计契合自己业务场景实际需要的CPU。
玄铁910绕过了手机和PC两大血海,聚焦于下一个时代的万物互联与IOT,能耗比和计算效率才是他们的核心痛点。
并且最重要的是,玄铁910是开放的,代码是透明的,成本更是友好的。
阿里的平台思维展露无遗,先让大家用起来,大家都用的时候,生态就有了,有了生态,就有了一切。
小试牛刀,初战告捷。
玄铁910开了一个好头,但不够,远远不够。
下一代的技术核心在于AI,人工智能已经是不可绕过的落地场景,人工智能将赋能所有传统产业完成转型,在强大的机器学习支持下,世界会变。
谁掌握了这里面的芯片技术,谁才能真正卡住未来的咽喉。
PC时代,英特尔的授权费割了全世界。
移动时代,强大如华为苹果曾经也要向Arm购买授权才能开发芯片。
AIOT时代,我们不应再低头,这块阵地无论如何也要拿下。
AI芯片的核心是算力与能耗,从本质上讲,机器学习就是无限的算术试错,最终试出一个可能性最大的最优解。
深度学习和神经网络,都是算力黑洞,没有足够的芯片支撑,无法达成有效的产出。
各类AI应用落地场景的核心技术,万物互联,自动驾驶,矿产发掘,人工医疗,智能安防等等等等,每一个应用都需要海量的算力。
一开始大家都是用CPU来跑机器学习,后来发现GPU跑机器学习效率更高,能耗更低,再后来,有厂商发现了这个市场,推出了专门用于机器学习计算的芯片。
当前市场上占有率最高的专用芯片是Nvidia(英伟达)的tesla P4及P40两款,平头哥成立之初就立下过誓言,要作用效果强40倍的AI专用芯片。
PC和移动芯片已是血海,并且有夕阳的苗头,但AI的应用正在冉冉上升,各家巨头也意识到了这一点,在这个竞争下一代技术领先地位的节点,每一家都在全力以赴。
对于平头哥而言,这是时代赋予的弯道超车的最好时机,平头哥这代造芯人,心里背负了太多的委屈和不甘,面对这样机会,没有人会放弃。
时间不等人,因为落后太久,所以要用百米冲刺的速度开始跑马拉松,赌上性命。
没有动员,每一个员工自发陷入了疯魔的工作状态。
他们不是在工作,而是在和过去芯片不甘的岁月作战。
有的工程师头发半年白了二分之一,大部分时间都在公司,都是妻子在照顾孩子,丈母娘生气地从老家跑到杭州了,结果一看是在做芯片,老人默默地留在杭州帮助照顾。
有的工程师蹲在供应商的工厂里面现场修改设计,问题不解决谁都不让走,工厂的设计师气得直骂,但后来理解到这个芯片的重要性,习惯了朝九晚五的员工们默默开始工作生活不区分。
大家心里有一团火,火里是一些往事。
6
芯片设计是一个复杂的系统工程,单纯完成设计并不意味着就可以流片成功,这是行业的深水区,假如流片失败,就意味着硬件设计需要推倒重来,这比软件出BUG问题更加严重。
一般芯片公司需要做两次(engineering sample、production sample)或多次才能流片成功。
但是平头哥更快,更强,更猛。
头哥用最短的时间完成了核心AI芯片的设计、流片整个过程,7个月完成前端设计,之后仅了3个月就成功流片。
速度的背后,是无数最顶尖人才的血泪。
第一次流片回来的时候,一群工程师忐忑在电梯口等老大带着芯片出来。
门开了,老大比了个“v”,突然有人哇哭出声,10个大男人都没忍住,瞬间崩了。
但他们成了。
玄铁910之后,【含光800】出世。
含光属于当前世界最强的AI芯片,晶体管数170亿,打破业界记录,性能以及能效比均为全球第一。
在芯片测试标准平台Resnet 50上验证,具体跑分性能高达78563 IPS,是第二名(15012)5倍。
能效比500 IPS/W,是第二名(150)3.3倍。
如此极致的性能与能耗比,是因为该自研架构穷尽所能的采用了多种密集压缩的计算、存储、数据复用、流水线等技术,能够使全部网络一次性装在在芯片上运转,并极大地增加了动态载入数据的有效利用率。
吃光最后一个比特的骨头,平头哥从不浪费。
以数据横向对比,含光800展现性能,是英伟达最新T4五倍,是应用最广的英伟达P4的46倍——超过去年设计之初吹下的“牛”。
1块平头哥NPU,相当于10块GPU的算力,平头哥虽小,以一当十。
含光800,是以中天微为代表的10几年芯片研发经验,也是国内外引进的前两代芯片人的集大成呕心沥血之作。
更关键的是,阿里平头哥成立一年来,走过了软件架构(处理器IP、SoC平台)到硬件流片的完整流程,这为未来的芯片研发打下了坚实的基础。
这是真正领跑世界的技术实力,并且即将全面应用于世界三大云之一的阿里云,承载国内云基础设施的运算,承受阿里生态的实战检验。
金融,支付,电商,物流骨干,云计算,都是算力消耗大户,而且对于稳定性有极高的要求。
然后全面铺向市场,给世界一个更好的选择。
十年磨剑,而今一剑封喉。
声明:本文内容由脉脉用户自发贡献,部分内容可能整编自互联网,版权归原作者所有,脉脉不拥有其著作权,亦不承担相应法律责任。如果您发现有涉嫌抄袭的内容,请发邮件至maimai@taou.com,一经查实,将立刻删除涉嫌侵权内容。