在刚刚结束的Hotchips 2015会议上,一家成立不久的中国企业公布了一颗代号“火星”的ARM指令集64核心处理器。令人震惊的是,这颗由中国团队开发的CPU拥有媲美Intel公司最顶级服务器芯片的性能,毫无疑问是目前ARM阵营最强大的处理器。
Phytium,中文名飞腾,是一家成立于2012年的年轻CPU研发企业。然而光是从公司名称和所在地——广州,我们就可以知道这家企业的真实身份。飞腾公司是中国国防科技大学高性能处理器研究团队建立的企业,而国防科大在IT界最为人熟知的作品就是天河2A超级计算机——连续五届夺得世界超算排行榜性能冠军。天河2A 的部分芯片采用了国防科大自主开发的Sparc指令集CPU,飞腾1500。显然,飞腾公司的名称就是取自这款产品。公司选址在广州也是为了靠近广州超级计算中心,也就是天河2A的所在地。
与中科院计算所知名的龙芯处理器团队不同,国防科大的CPU研发机构在公众眼中没什么名气。事实上,早在十年前业内就有传闻指国防科大正在逆向山寨Intel的IA64体系处理器安腾。后来安腾CPU在市场上举步维艰,NUDT(国防科大英文缩写)也停止了对其模仿的工作,转而开发采用Sparc指令集的高性能芯片。经过数年的努力,NUDT先后研制出飞腾1000、飞腾1500两款服务器处理器,开始逐渐为业界所知。
天河系列超算开始在全球超算领域崭露头角后,国防科大将眼光放到了更远的未来。天河2A和之前的一系列国产超级计算机均采用Intel、NVIDIA、AMD等美国企业生产的处理器,其计算能力、软件编写严重依赖这些外国公司。若想自己掌控超级计算机的研发节奏,研制自主知识产权的高性能处理器是必经之路。此时,学校的 CPU团队经过几代产品的研发已经颇具实力,他们便担负起了设计有着世界一流水平的CPU的重任。
如今,NUDT的努力结出了硕果。Hotchips 2015大会上,飞腾公司介绍了他们的”火星”,一颗兼容ARMv8指令集,四发射乱序执行,拥有多达64个核心,主频达到2GHZ的服务器CPU。
在标准测试集Spec 2006中,”火星”的多核整数分数高达672,浮点分数585。相比之下,Intel目前最强的处理器Xeon E7-8890v3和Xeon E5-2699v3的整数、浮点成绩分别是680和460,"火星”的性能足以与它们媲美。
“火星”的核心代号为”小米”,这个名字足够令许多人浮想联翩了。不过取这个名字很可能只是巧合,因为飞腾公司与制造智能设备的小米公司并没有任何关联。”小米”核心是典型的现代高性能处理器微架构设计,四发射、两个浮点单元,不长的流水线和三级缓存方案。它显然并不是为密集浮点运算设计的产物,单周期双精度浮点输出只有4Flop。
但是"小米"核心的访存结构设计很激进,192个寄存器、单核心512K L2、2M L3的设计非常像Intel的Haswell微架构。”火星”采用二维mesh多核互联结构,每8颗”小米”核心组成一个阵列,每个阵列有一个双通道 DDR3-1600内存控制器;8个阵列组成”火星”芯片,总共64个核心、32M二级缓存、128M三级缓存和16通道内存,205G/s理论内存带宽。芯片上还有32个PCIe 3.0通道。
“火星”的理论浮点计算能力是512G DP Flops,采用28nm制造工艺,主频2GHZ,核心运行电压不足1v。虽然整个芯片面积达到了吓人的640平方毫米,但是满载功耗只有120w,甚至比使用22nm先进工艺,性能相当的Xeon E5-2699v3、E7-8890v3都低一截。ARM阵营性能功耗比较强的优势过去仅仅体现在移动设备使用的低功耗芯片上,而飞腾公司证明了即使在高性能服务器处理器领域,兼容ARM指令集的处理器也能取得对同时代Intel顶级产品的功耗优势。
“火星”的量产版本预计会在2016年推出,预计会首先用在国防科大下一代超级计算机(可能命名为天河3)上。不久前,国防科大展示了一款用来取代Intel Xeon Phi浮点运算芯片的计算卡Matrix 2000,预计下一代天河会使用”火星”和Matrix 2000的组合来搭建。
除了”火星”,飞腾公司还展望了他们针对主流市场开发的”地球”处理器。”地球”显然是”火星”的简化版,核心数量可能减至4-16个,面向桌面PC、低功耗服务器等市场。从”火星”单核心Spec测试集成绩来看,8核心的”地球”就可以提供与Intel Core i7 四核处理器接近的多线程性能,而功耗可能还有优势。而兼容ARMv8指令集意味着无论是”火星”还是”地球”都可以轻易运行安卓、Linux系统和市面上无数的应用,甚至可能兼容微软的Windows 10。性能差距不复存在后,ARM阵营进军桌面PC和服务器市场挑战x86的地位也就有了足够的底气。飞腾公司不仅仅做到了世界一流水平,更为重要的是他们为整个ARM阵营建立了信心:
从此之后,再也无人能质疑ARM指令集是否能开发出高性能产品了,x86体系在PC、服务器市场称雄二十年后,终于遇到了强大的对手。
而值得国人骄傲的是,这一历史性时刻是一家之前默默无闻的中国企业创造的。自从2006年Intel发布酷睿2处理器以来,十年时间里除了老牌巨头IBM,未曾有任何企业挑战Intel性能冠军的宝座。
如今,第一个向老大哥扔出巨斧的不是AMD,不是NVIDIA,也不是一众欧美企业,而是几年前还背着”山寨”恶名的中国团队。即使是业界最老资格的前辈,此刻也应向年轻的飞腾致以敬意。
毫无疑问,”火星”的发布会大大刺激ARM阵营的发展,直接影响未来数年的CPU产业格局。照此趋势发展下去,我们很快就会在桌面、高性能服务器领域看到ARM与x86的直接对抗。当Intel的神话不再闪耀,IT产业又会迎来一个高度竞争的全新时代。