发新话题
打印【有0个人次参与评价】

[ZT] 中国芯点燃冬天里的一把火

[ZT] 中国芯点燃冬天里的一把火

2000年,22岁的我本科毕业来到深圳,成为华为一名硬件工程师。因为工作努力,很快成为交换机S8500产品的项目经理,研发出华为交换机的第一个10GE。2003年,我又调入了IP核心路由器团队,从此与路由器结下不解之缘,开启了我在IP路由器的十几年奋斗之旅。

      进入IP之后才了解到,IP技术是一项非常高端的技术。到目前为止,全球也只有为数不多的几家厂商掌握,而回到2003年的华为,我们还处于不断追赶国际先进水平的阶段。限于技术积累不足,当友商在路由器市场上开始推销40G新产品时,我们只有10G、20G老产品。客户对我们不屑一顾,市场一线的同事们对产品竞争力落后抱怨很大。一开始我们路由器没有自己的IP芯片,不得不从西方厂家外购,而外购的芯片往往在功能规格上比竞争对手落后一代,公司下决心要发展的自己的40G IP芯片,掌握核心技术。

      40G芯片凝聚着我们对整个IP网络的理解、定义和构想。为了在规格和性能上大幅提升,我们采用了全新的架构、算法、几亿门电路、业界最新的半导体工艺,也带来了前所未有的技术挑战。团队成员很多是新加入的,分布在北京、深圳、成都、美国硅谷等地,大家边干边学,在奋斗中成长。大容量表项的算法优化和物理设计的极限约束,一度使的团队深陷困境。我们集中了芯片和软件专家和骨干,联合攻关,第一次采用了套片建模仿真性能和虚拟布局布线的方法,对设计方案进行了充分的模拟和验证,最终攻克了技术难题,铺平了后续芯片开发和应用的道路。

      在2009年底,40G样片试产完成准备调试。大伙一商量,干脆都集中到深圳,第一时间让核心路由器装上中国芯,快速提升产品竞争力。春节前一周,40G IP芯片在海外加工完成投递到深圳。芯片一过海关,同事们争分夺秒送到深圳研发中心实验室里,开始上板调试。大家围坐在一起,遇到问题马上讨论,有问题立刻修改。实验室里一会儿讨论得热火朝天,一会儿安静得只能听到键盘的“哒哒”声。夜里11点钟,40G IP芯片实现首个数据报文转发成功,随后一个又一个测试用例顺利通过。凌晨1点多钟,大伙的兴奋劲儿还未消退,在实验室精神抖擞地测试。领导心疼大家,赶大家回去休息:“芯片关键用例已经测试通过,先回去好好睡一觉,明天再继续”。

      大年三十晚上,公司附近的一家酒店里,固定网络产品线总裁查钧和我们一起过大年,他把父母、爱人和女儿一起都带来了,四岁大的女儿满心欢喜和爸爸一起表演节目,唱起了国歌。渐渐的大家都跟着唱起来,随着歌声越来越大,很多人的眼睛湿润了……那个晚上大家又哭又笑,喝了很多酒,唱了很多歌。一个万家团圆的传统节日,一群热情的年轻人,一个“让核心路由器拥有更强中国芯”梦想,点燃了“冬天里的一把火”,也点亮了我们一颗颗年轻的心。

      大年初一,我们去了一趟深圳华侨城风景区,作了短暂休整。年初二,我们又投入到紧张的芯片调试战斗中。年初八,全国人民正式上班的第一天,我们按时交付了核心路由器第一代IP芯片。

      自此,华为核心路由器的中国芯,全面具备了赶超世界一流IP芯片的能力,使路由器硬件竞争力显著提升。在芯片众多关键技术点上突破,使我们掌握了核心技术,真正具备了赶超业界最佳水平的能力,为后继在400G的超越打下坚实的基础。

      即使许多年过去了,每每想起那个春节,那些一起唱过的歌一起吃过的年夜饭,想起和大伙一起奋斗的日子,还是让人心潮澎湃,久久挥之不去。


        挺进集群路由器三家俱乐部


      岁月匆匆而去,挑战滚滚而来。为了赶上中国电信国家干线网络核心节点的建设,我作为产品负责人接到任务,一年内做出集群路由器。

      国家干线网络的核心节点作为区域信息交换中心,负责周边多个省份城市的流量汇集和转发交换,数据洪流非常大且每年以50%速度持续增长,单机框无法满足这些超级核心节点容量快速增长要求。只能通过多个单机框级联方式,组成一个大的集群系统,支撑网络扩容演进。长期以来多框集群系统被两个美国公司(Cisco和Juniper)把持,广泛应用于中国、美国等国国家干线网络。作为全球最复杂的IP系统,集群路由器代表了一个设备厂商最高的IP技术水平,毫不夸张的说是IP领域的“珠穆拉玛峰之巅”。

      公司对集群项目很重视,给予很大支持,在架构设计阶段,快速集结了10多个跨领域专家:硬件大牛大军,交换网专家小杨,主控专家老周,软件SE老范和毛师傅,整机专家大田等,阵容相当豪华。在北京研究所的一间会议室里,七八台电脑,两三个白板,开始了集群路由器的架构设计。集群路由器技术难度大,由传统的1台独立设备变成了8+64集群系统,硬件和软件复杂度均是成百上千倍增加,这意味着现有知识和架构无法满足要求,必须从头开始。手头可参考的材料极少,只能靠专家们多年的积累去碰撞和讨论。会议室的白板成为最稀缺资源,大家突然迸出的一个点子要快速画下来,不行了擦掉,擦干净了再画,一次次思想的碰撞和一个多月内部反复讨论,最终经过IP领域fellow邓抄军评审和拍板,我们自己的路由器集群系统架构诞生了。

      产品正式研发过程中遇到了我们从未想象到的艰辛,太多新技术是首次应用,中央框、级联光纤、集群控制平面、分布式计算……都是新的,有大量技术难点需要攻克。集群中央交换框第一批硬件返回后,由于系统设计偏差,导致了大批单板倒针和坏板,工作一度无法开展下去;底层VxWorks操作系统不支持集群形态,软件进行大规模切换整改;集群系统板卡数量成倍增加后,软件性能严重下降,进行多次优化……。

      在最艰难的时刻,我们就给大家鼓劲儿:“把卫星送上天的只有四个国家。目前能做出全球最复杂的集群路由器只有美国的两家公司。如果我们能把集群路由器做出来,那我们就进入全球仅有的三家集群俱乐部。看我们有多牛!”当大家反复攻关进入困境时,试图放弃的时候,想起这些话,咬咬牙就坚持下来了。有人说这是 “画饼”,有人说是“吹牛”,有人说是“梦想”,但不管怎样,人总是要有梦的,总是要追梦的。吹过的牛皮都实现了,那叫真牛。但光靠吹牛可不行,一步一步拼才是实实在在的。

      进入系统联调阶段,一套路由器集群系统测试动辄需要几百上千个端口,对仪表资源需求巨大。但资源有限,项目组就两班倒地攻关解决问题,做到人休设备不休。一帮人晚上加班干得热火朝天,也饥肠辘辘,开始只能靠吃方便面充饥。负责集群系统硬件测试主管陶淳父母正好在深圳,老两口是东北人,每晚做一锅春饼,雷打不动地九点半送到公司门口,再由陶淳拿到实验室。兄弟们吃的那叫香啊。后来项目组流行一句话:“吃完一锅春饼,解决一锅问题”。攻关结束后,大家最想念的是陶淳父母做的那一锅春饼。

      也就在那个节骨眼,我的女儿出生了。在医院里,我一边为女儿的出生喜悦,一边为项目的进度着急。太太看着我不停的拨打电话接听电话,就说“你赶紧去看看你的‘儿子’,这儿有爸妈照顾,你就放心吧”。我看太太这么善解人意,赶紧回到了工作岗位。同事遇到我问,“怎么这么快就回来了”。我顺口说了一句,“这里也有我的孩子,离不开啊!”。的确,大家把这款产品当作是亲生骨肉,倾注了大量心血,背后更有来自每位家属默默无闻的理解和支持。

      集群系统的开发难度,远超出了我们预期。项目进展几次延迟,市场一线传来工作联络单要求加快进度,必须通过当年运营商集采入网测试。这让我倍感压力,运营商集采测试堪比当年高考,一次测试机会,考试时间也是固定死的,只有测试通过才能参与第二年网络建设机会。一旦测试不通过,回家准备一年后再来。失败意味着我们将错过电信骨干网络建设的契机,无疑对整个团队士气将会是个巨大的打击。狭路相逢勇者胜,最终我们的团队顶住巨大市场压力,集群路由器首次亮相广东电信研究院,经历了长达3个月的大压力,满规格测试,顺利通过,拿到了进军国家骨干网络市场的入场券,正式成为集群路由器三家俱乐部中的一员。

      直到今天,我太太还会开玩笑说一句 “你在公司的那个儿子现在怎么样了?”。我告诉太太,我那儿子可有出息了!西安电信的全球首个核心路由器2+4集群成功商用,吹响了我们进军国家干线核心节点的号角;2013年全球最大容量集群搬迁工程—中国联通169无锡节点的成功搬迁,证明了华为集群路由器上不仅有能力新建,还有能力搬迁;现在中国电信163、中国联调169和移动CMNET国家骨干网都有我司集群路由器的身影,占据了中国国家骨干网络的半壁江山,为国家信息网络建设保驾护航。其实我更想对家人说:“要感谢你和项目组所有家属们,没有你们的理解支持,我们不可能渡过产品最艰难的时段,不可能打造出全球最尖端的IP集群系统,军功章有我的一半,更有你们的一半!”


        千锤百炼的IP软件操作系统


      有些事使人难忘,有些人使人敬重。

      IP网络的另外一个核心竞争力是运行在路由器设备上的IP软件操作系统VRP。在硬件竞争力提升的同时,还要考虑软件竞争力的提升。

      刚一开始,在设计新一代IP软件操作系统VRP8时,整体方案商量了很多次,一部分专家认为在原有操作系统的基础上持续演进;另一种观点认为,老的系统已经不能支持新的客户对网络性能的要求,需要重新开发一套新的软件操作系统经。通过严格的论证和慎重决策,最终选择重新开发一套系统,要支撑公司IP操作系统长期未来发展,成为公司网络设备下一代软件平台。

      正式的架构设计是在北京研究所,一共21名架构师,就在这里开始封闭做架构设计。每个架构师立下了军令状,每位架构师都收到了一个精致的水晶相框,上面写着“我郑重承诺全身心投入,为VRP8架构质量终身负责!” 。

      大家来自五湖四海,来之前都是各领域的顶级专家,个顶个的牛。这些专家从骨子里都有着相互比比看谁更强的念头,把架构当成工艺品,反复雕琢,精益求精。评审过程非常严格,大家在精益求精的基础上,把“精”做到极致的地步。每一次方案的评审,架构团队总是能够提出更高的要求,一口气追问你十几个Why(为什么),直被问得哑口无言。有些专家面子薄,夺门而去,闭门练功以图下次前来“雪耻”。

      2010年夏天,VRP8软件操作系统迎来它人生中的第一次大考——济南电信商用实验局。对于VRP8的首次上网开局,产品线非常重视,担心客户对第一个“吃螃蟹”,使用VRP8版本开局有顾虑,黄河带着几位专家去济南考察商用环境,与客户交流,给客户讲VRP8先进性和可靠性、开局风险应对预案,最终济南客户同意了。2010年9月9日凌晨全球第一个VRP8商用局在济南电信割接上线,稳定运行。这次成功开局大大提升了VRP8的团队士气,证明了VRP8架构是经得起考验的。

      2010年底核心路由器承载VRP8的软件版本首次亮相国内运营商的高端数据集采测试,在路由协议收敛性能、协议倒换时间这些历史上落后的性能项目中,测试结果排名第一。VRP8软件操作系统从诞生之日起,就瞄准了IP网络操作系统性能第一的目标,高标准、严要求,一开始定下的各项最高目标都达成了。很多架构师在回忆这段激情岁月时,激动之情溢于言表。


        厚积薄发,核心路由器400G激情超越


      2011年底我开始担任路由器产品线总裁,摆在我面前的首要问题是如何超越。

      4K、2K视频和云业务的到来,运营商对带宽的诉求越来越高,要构建像太平洋一样宽的管道。面对这些大机会,我们在芯片、软件操作系统以及路由器集群的十多年压强投入,具备了做到业界领先的研发实力。能否抓住这个千载难逢的历史机遇,厚积薄发,实现几代IP人超越梦想。

      2012年夏天的北京异常得闷热,北京研究所西山脚下的大觉寺,一座有几百年历史的古剎,红墙绿树,禅意十足,可以静下心来,讨论超越大计。产品线市场、MKT、研发的管理团队成员齐聚一堂,进行了激烈的讨论。MKT通过竞争分析得出判断,如果我们将400G核心路由器上市时间比原计划提前半年,我们就有机会在400G时代实现超越领先。然而有人认为这是Impossible Mission(不可能完成的任务),要做的任务太多,不可能再提前半年交付。经过一天PK,产品线达成共识,十多年来我们在IP芯片、软件操作系统的持续投入,具备了做世界第一的实力。即使MKT提供的竞争分析只有50%把握,我们也要全力争胜。错过这个机会窗,我们将抱憾终身。我们决定砍掉与核心路由器400G非相关的需求,聚集研发资源饱和攻击,把核心路由器400G至少提前半年商用上市,实现400G的超越领先。会议结束后我们一起在大觉寺吃了一顿斋饭,感觉比吃肉还香,大家看到了全力一搏超越的希望。临行前我们一起在大觉寺门口合照留念,戏称400G超越了,要记得是从这一天开始的。

      核心路由器400G的研发,按照研发能力,产品要到2013年下半年才能达到商用标准,现在交付时间提前到5月,对研发团队无疑是个很大挑战。需要400G芯片导入一次成功、硬件投板一次成功、软件开发效率大幅提升。为了达成挑战时间,研发提出了 “零调试、零等待、零缺陷”目标。

      为了真正把芯片开发和产品导入融为一体,当时提出了“One Team One Dream”口号。加拿大的400G芯片架构师Paul Nadj总是说“遇到困难,我们就要回退一步想想问题的核心是什么,根因是什么,仔细分析找到关键,猛击痛点。”经过这样一丝不苟的细致工作,使得关键技术点快速收敛,质量得以保证,为芯片产品化落地打下坚实基础。2012年10月8日,400G芯片到达深圳实验室,在芯片回片9个小时后,我们就完成零调试既定的目标,大家都很兴奋。2012年10月25日,在相同的实验室,驱动软件、芯片、转发软件、上层软件等各领域团队骨干早已齐聚一堂,紧张的400G软硬件联调开始了。时间在一分一秒的过去,第一天CPU小系统启动运行,第二天NP调通,但是到TM却卡住了。所有专家们聚集在白板前,逐条列举各种可能,逐条分析和验证,终于所有业务全部打通。看着仪表上跳动的收发包计数,丢包数稳稳地定格在“0”,在场人员激动不已,击掌相庆。

      2013年5月路由器400G产品比原计划提前7个月商用,比友商领先了一年半。

      同年8月,400G核心路由器在沙特Mobily成功开局商用,震撼了整个全球运营商市场。据专业评测,华为NE5000E路由器400G单框与业界同等容量的2+4 100G集群路由器相比,功耗仅是后者的1/8,体积仅1/6,重量仅1/12。在技术可获得性上领先了业界一年半,以历史最好成绩,跑赢了这场高手的竞赛。

      华为400G核心路由器以其领先的线卡能力、更高的性能、更低的功耗以及安全可靠的质量成为国家最高端数据干线的主力设备,结束了国干核心路由器依赖欧美厂商的历史,并引爆了全球市场。截至目前,华为核心路由器400G已在全球5大洲, 60多个国家,服务于十几亿人口。华为400G核心路由器的成功是勇于抓住机会窗,厚积薄发坚忍不拔的胜利。十多年来,IP几代人在关键技术上聚集力量,压强投入,密集投资,最终抓住了机会窗,实现了超越领先。


        致青春·执著与梦想

      2016年巴展展台上,我司新一代P比特级核心路由器NE9000和业界迄今最快的2T比特路由线卡首次亮相。当看到全球TOP运营商CEO/CTO在新一代产品前驻足停留听取汇报,表示出赞许和肯定时,自豪感油然而生。凭借我们最新一代IP芯片和多个关键技术的突破,我司的IP产品进入“无人区”。

      蓦然回首,因机缘巧合使我进入了IP通信这个领域,没想到一干就是十几年。这十多年来,我们坚持在IP芯片、软件操作系统、路由器集群系统等核心关键技术上聚集力量、密集投资,我们努力追赶竞争对手,隐忍坚守、厚积薄发,最终抓住机会实现了400G超越领先。此时此刻,心中燃起几许豪情,几多喜悦,又有几分感慨交织在一起……。

      以前常听人说“通信行业太残酷了,你根本无法预测明天会发生什么,下个月会发生什么”。当时不觉得,身临其境中才明白这句话意味着什么,在这样高科技含量又竞争激烈变幻莫测的行业里,每个玩家当初都自信满满,实力雄厚,可走到如今的还有几家?我一直在想,是什么让我们最终实现超越摘取到胜利的果实?是什么让我们愿意为不确定的未来努力奋斗?又是什么让我们十几年如一日的执着坚守?

      我知道,华为公司给我们搭建了一个巨大的舞台,包容成长的代价,持续投资、压强投入,让我们尽情演绎华为IP的乐章;我知道,是爱我们的家人、可爱的同伴给我们一片温馨的港湾,彼此温暖、相互鼓励,让我们熬过孤独、迈过坎坷,拥抱晴朗的天空;我知道,是一群怀揣梦想的年轻人,为了 “做世界第一的产品”无怨无悔地挥洒着青春热血,即使再苦再累再艰辛也一往无前;我知道,我们是青春,是天边执着的飞鹰,选择了蓝天,也就选择了飞翔,飞向远方……



盖刚

TOP

对于通信人来说,BAT小米什么的跟华为比较,算老几啊?却一个个在台上拽的很。

TOP

发新话题