铁流:美国禁售至强芯片后,中国超算经历了什么?
2015-11-19 13:21:55
2015年4月,美国商务部决定对中国四家国家超级计算机中心禁售至强PHI计算卡,一石激起千层浪。
有人信誓旦旦地表示天河超算将无芯可用,要完蛋了;有人表示这种禁售不具备可操作性,几个皮包公司就能解决中国超算对CPU的需求;也有人表示美国禁售是中国自主技术发展的大好机遇,西方封锁什么,几年后,中国在该领域取得技术突破的历史将再现;更有人表示,中国超算只是拿国外CPU做的组装货,不具备科技含量。
今年8月,德国莱比锡市发布的第43届世界超级计算机500强排行榜,而11月10日至11月12日,在无锡召开的HPC China 2015大会发布的TOP100上,天河2号在两个排行榜上依旧雄踞榜首。
时隔半年,天河、曙光等100P超算建设方案相继进入公众视野,用实践证明了美国禁运至强PHI并未对中国超算建设产生多大影响。其实,在过去半个世纪的时间里,历史已经证明了毛泽东同志的那句话——“封锁吧,封锁他十年八年,中国的问题就解决了”。
技术封锁无法阻碍中国技术进步
自60年代以来,美国和苏联同时对中国进行技术封锁,使中国只能走独立自主、自力更生的发展道路。正如赫鲁晓夫撤走了苏联援华专家后,逼着中国凭借自己的能力搞出了“两弹一星”,美国和苏联同时技术封锁下,逼着中国凭借自己的力量做出了独立自主的半导体产业。
在60年代,欧美和苏联都认为在对中国技术封锁后,中国做不成晶体管,无法制造出自己的晶体管计算机。而中国人民解放军军事工程学院四系四○四教研室康鹏于1962年成功研发出“隔离-阻塞振荡器”,成功解决了晶体管的稳定性问题,“隔离-阻塞振荡器”问世后,109厂遂开始量产晶体管,使中国比美国近晚八年进入晶体管时代,有力地回击了西方和苏联的质疑。
接下来更是捷报频传——
1965年,中国自主研制的第一块集成电路在上海诞生,只比美国晚了5年进入集成电路时代;
1972年,自主研制的大规模集成电路在四川永川半导体研究所诞生,比美国晚4年实现了从中小集成电路发展到大规模集成电路的跨越;
截至70年代末,中国从一穷二白,重工业基础几乎为零的农业国,依靠前辈们“献完青春献子孙”的奉献精神和“一万年太久,只争朝夕”的拼搏精神,奋起直追,并将和美国的技术差距缩短到5年。
中国科研人员和产业工人发扬自力更生、自强不息的精神,建成了中国自己的半导体工业,掌握了从单晶制备、设备制造、集成电路制造的全过程技术。在当时,只有美国、苏联掌握从单晶制备、设备制造、集成电路制造的全过程技术(当时日本技术很强,但个别领域被美国阉割)。
在改革开放后,因奉行“市场换技术”、“造不如买、买不如租”理论,毛泽东时代积累下的家底被败得精光,技术人才要么流失到国外,要么去大学教书,有的甚至被调去看守机房,毛泽东时代培养起来的技术人才流失殆尽。
至80年代末,以联想为代表的计算机企业奉行“贸工技”路线,只从事低附加值的微型计算机组装,中国凭自己的技术已经很难生产出一台计算机了。
在中国丧失独立自主研发制造计算机的能力后,1989年,美国政府严格限制对中国出口高性能计算机,除了采购价格高昂外,还要把计算机放在透明的玻璃房中,由美国人监控,钥匙在美国人手中,每次使用的用途都要向美国人请示,并由美国人核准使用。
痛定思痛后,中国重启高性能计算机研发项目,1992年银河2诞生。1993年,曙光1号诞生,曙光1号研制成功后3天,西方解除对中国高性能计算机出口限制。
因此,技术封锁其实是件好事,建国以来的这段历史就可说明:只要西方技术封锁,国内买办和国外势力就不可能用“市场换技术”、“造不如买、买不如租”的方式来扼杀自主技术。
那么,中国的人力物力财力将全部投入到自主技术的研发中,辅以中国全世界最齐全的工业部门和扎实的工业基础,加上中国庞大的市场和丰富的资源(资源总量,不是人均资源),就能做到“封锁什么,解决什么”,所以从长期来看,技术封锁是好事。
就在美国对华禁售用于超算的至强PHI后,国防科大先后对外发布了自主研发的“火星”和矩阵2000。
关于“火星”的详细介绍可以参看中科院计算机工程师文章:《想挑战英特尔的国产芯片Mars为什么饱受质疑?》。
“火星”将于今年年底前流片,“火星”兼容ARM V8指令,微结构被命名为“小米”,“小米”是一个优于ARM cortex A72的微结构;“火星”拥有64核心,主频达2G,理论双精浮点计算能力是512Gflops;为了应对访存密集型运算,“火星”拥有32M二级缓存、128M三级缓存和16通道内存,205G/s理论内存带宽,芯片上还有32个PCI-e 3.0通道,非常适合充当超算计算节点主核心;计划由中芯国际代工生产,制程工艺28nm,功耗120W——在制程工艺落后Intel两代的情况下,做到功耗比E5还小,实属不易;虽然“火星”单核性能较弱,但依靠核心数量优势,在Spec 2006跑分中,多核整数分数达672,浮点分数585,足以和Intel的Xeon E5 2699v3相媲美。很明显,“火星”就是为替代计算节点中的E5而设计的。
矩阵2000采用40nm制程工艺,拥有16核,主频1G,双精浮点2.4Tflops,功耗为200W——矩阵2000的性能功耗比不仅大幅超越第一代至强PHI(2.4T/200W 对比 1T/300W),还略优于第二代至强PHI(2.4T/200W 对比 3T/300W),而且这还是在矩阵2000采用40nm制程工艺,大幅落后于第二代至强PHI计算卡的14nm制程工艺下取得的成绩。因此,矩阵2000完全能替代至强PHI计算卡,而且还有非常大的潜力可以挖掘。
根据国防科大公布的资料,因保留了天河2号的主体I/O结构,天河2A的计算节点主处理器依旧使用E5-2692 V2(用“火星”要重新设计,改动太大,分步走更稳妥),计算节点增加到18000个,按照一个计算节点需要2个E5和3个加速器来计算,天河2A需要36000片E5和54000片矩阵2000,仅54000片矩阵2000的理论浮点峰值就可以达到129.6Pflops。
(GPDSP)
显而易见,只要国防科大适当保证GPSDP的效率,GPDSP就会非常具有竞争力,使用矩阵2000替换至强PHI计算卡后,天河2A号的整机效率较天河2号会有较大提升,理论浮点性能将会得到质的飞跃,并有望再度蝉联TOP500排行榜第一的宝座。
曙光公司设计的新一代超级计算机系统——曙光7000将从处理器、高速通信网络、大规模存储系统、系统软件到应用软件全面采用自主技术,安全可控,性能也将超越100P。
某超算全面采用自主技术,性能功耗比、整机效率、理论峰值等性能参数更是无与伦比——超算系统峰值几乎是天河号的2倍;超算系统整机效率比天河2号高16%;超算系统性能功耗比是天河2号的2.5倍,根据2015年6月发布的Green500排行榜,该超算能直接排进前五。超算建成后,将面向医疗服务、生物医药、海洋科学、现代农业、油气勘探、气候气象、金融分析、信息安全、工业设计、动漫渲染等领域提供计算和技术支持服务,为中国科技创新和经济发展提供平台支撑。
因此,美国禁售至强芯片后,最多只对天河2号的升级造成了延误,并未对中国其他超算发展产生太多影响,而且禁售后,反而坚定了中国做自主技术的信心,对做出自主技术更有利。
国防科大早在2013年就申请了不少GPDSP的专利,可能将用作至强PHI的替代品。因此,美国情报部门不可能不知晓国防科大正在研发GPDSP来替代至强PHI,那为何美国还要做此无用功呢?
因为禁售至强芯片根本不是针对中国的超算建设,而是更多的包含政治色彩和情报刺探。
禁售至强芯片既是是一种刺探,从中国对美国禁售至强芯片的反应来刺探中国自主芯片的发展进度和成熟度,试探中国是否具有替换美国芯片的技术实力;
禁售至强芯片又是美国政治敲打中国组合拳的一部分,随着中国综合国力不断提升,特别是自中国在东海划定防空识别圈,在南海填岛并部署越来越强大的海空力量后,成为美国的亚太再平衡战略的心腹大患,美国通过经济上、舆论上、技术上等各种方式的限制来警告中国不要玩得太过火,用无形大棒敲打中国,而禁售至强芯片,显然是其中的一部分。
但禁售至强芯片着实不是一步好棋——至强芯片在失去了中国这个大客户后,不仅销量倍减而成本更高,更对Intel公司造成了巨大的经济损失。
更重要的是,禁售使国内某些信奉“造不如买”的人如丧考妣,无法再像过去那样扯自主技术的后腿,坚定了中国用自主技术替代国外技术的决心,集中更多的资源和精力用于矩阵2000和国产众核芯片对至强PHI计算卡的替换,加速中国超算在芯片方面国产化的进程。