亲,欢迎光临天天书吧!
错缺断章、加书:站内短信
后台有人,会尽快回复!
  • 主题模式:

  • 字体大小:

    -

    18

    +
  • 恢复默认

正月初四一过,吕辰就扎进了昆仑1的机房,再没出来过。

先是各种故障测试,接着又是微程序全覆盖校验。

到了正月十六,2月21日,墙上的“软硬件接口对照表”已经打满了绿色的勾,只剩下最后几行空白,像待填的棋盘。

陈茂林站在表前,双手背在身后。

“进度怎么样?”

“还剩最后127条。”吕辰拿着一个本子,“预计三天之内能跑完。”

陈茂林点了点头,接过本子。

应急模拟演练、使用说明书编写、机组人员培训,三项并列,进度参差不齐。

“演练的事,你盯着。说明书和培训,我负责。”

吕辰点了点头。

微程序全覆盖校验,是交付前最后一道硬门槛。

汪涵教授把团队分成三组,每组负责1600多条,三班倒,人停机不停。

吕辰来到终端前,卫知南靠在椅子上,眼睛里全是血丝。

“怎么样了?”吕辰蹲下来,看着终端屏幕。

“最后一批了。I/o通信协议栈,最后37条,今天上午能跑完。”

屏幕上,绿色的字符一行一行地滚,每一行都是一个测试用例的结果。

全部都是pASS。

卫知南从椅子上站起来,活动了一下僵硬的脖子,拿起一个记录本,递给吕辰。

“全部跑完一轮了,这是第三轮回归测试,改过的微程序重新验证。”

吕辰接过本子,翻开。

每一页都密密麻麻写着测试记录,时间、操作人、微程序编号、测试结果、问题描述、解决方案。

字迹工整,每一条都有签字。

他翻到最后一页,上面写着几行字:

“第三轮回归测试完成。4863条微程序,全部通过,无新增问题。”

下面是汪涵教授的签名。

“汪教授人呢?”

“在4号机柜。”卫知南用手指了指,“盯最后几条I/o中断的时序,已经盯了四个小时了。”

吕辰来到4号机柜后面,汪涵教授手里拿着示波器的探头,夹在总线信号线上。

屏幕上的波形稳定,方波边缘干净,没有毛刺。

“汪教授。”

汪涵抬起头,眼睛下面一圈青黑,嘴唇干裂,但眼神很亮。

“最后一条。”他说,“I/o中断响应,连续触发次,没有一次超时。”

他把探头收起来,站起来的时候晃了一下,扶住机柜才稳住。

“汪教授,您去歇会儿。”

“不歇了。”汪涵把示波器的电源关了,探头绕好,放回工具箱,“我要看着它跑完最后一条。”

他走到终端前面,敲了一行命令。

屏幕上跳出一行绿色的字符:

ALL mIcRocodE VERIFIEd. 4863 INStRUctIoNS. 0 ERRoRS.

汪涵盯着那行字看了几秒,然后拿起桌上的记录本,在最后一页签了字。

他把笔帽拧上,放回兜里。

“微程序全覆盖校验,完成。”

应急模拟演练,分两大类:技术故障类和安全威胁类。

技术故障类分单板卡故障、单机柜故障、全系统级灾难三级。

每级若干子项,一共47个故障场景。

每一个场景都要有详细的脚本,故障怎么注入、怎么发现、怎么定位、怎么恢复、恢复后怎么验证。

安全威胁类涵盖防空、防暴、防火、反侦察、防爆五个维度,一共23个演练科目。

先是单板卡故障,郑长枫从工具箱里拿出那块自制的故障注入板,串在I/o总线上。

“第一个场景,I/o板输出驱动芯片失效。”

然后拧动了信号发生器的一个旋钮。

机柜前面板的黄色“故障”灯亮了,七段数码管显示了一组数字:06-03-02。

第六号机柜,第三块板卡,第二槽位。

吴国华走到机柜前面,根据数码管的提示,找到了那块板卡,按下锁紧机构,抽出抽屉,换上备用板卡,推回去,锁紧。

整个过程不到两分钟。

系统没有重启,任务没有中断。

终端屏幕上的数值还在跳动,仿佛什么都没发生过。

I/o板卡热更换,2分10秒,达标。

接着是存储板Ecc纠错上限。

郑长枫在数据总线上注入了连续的双比特错误,这是Ecc能纠正的极限。

诊断系统报出了警告:UNcoRREctAbLE ERRoR dEtEctEd. dAtA REStoREd FRom

bAcKUp.

系统从备份副本中恢复了数据,任务继续运行。

没有死机,没有数据丢失。

接着又是单机柜故障,这是更严酷的考验。

郑长枫直接拉下了一台存储机柜的总电源。

“嘭”的一声,六台存储机柜中的一台彻底黑了。

机柜前面板的红色故障灯亮了,诊断面板显示“St-03 oFFLINE”。

主控核心在0.5秒内检测到了故障,将原本分配给这台机柜的存储请求,全部重新路由到了其他五台机柜。

终端屏幕上的任务输出没有中断,甚至没有任何延迟。

吴国华走到故障机柜前面,打开柜门,检查了一遍,确认没有硬件损坏,然后重新推上电源。

机柜启动,自检,重新上线。

诊断系统自动将这台机柜加入存储池,恢复数据同步。

整个过程不到五分钟。

单机柜断电,系统无感知恢复,4分50秒。

……

全系统级灾难,这是技术故障演练的最后一个场景,也是最极端的一个。

模拟主控核心软件死锁。

郑长枫在终端上敲了一个命令,模拟主核心进入死循环。

辅核心在3个心跳周期后检测到了异常,自动接管了控制权。

黄色的“接管”指示灯亮了,绿色的“运行”灯没有灭。

终端屏幕上的任务输出没有中断。

然后是模拟全厂断电。

郑长枫拉下了机房的的总配电开关。

所有的灯光、所有的指示灯、所有的风扇,在一瞬间全部熄灭了。

机房陷入了短暂的黑暗,只有应急灯昏黄的光。

然后,柴油发电机组启动了。

轰鸣声从地下传来,像一头被惊醒的巨兽。

35台机柜的绿色指示灯依次亮起来,像多米诺骨牌。

从一号机柜到三十五号机柜,从左边传到右边,用了不到30秒。

系统从最后一次检查点恢复了任务。

终端屏幕上的数值继续跳动,仿佛那场断电只是一次短暂的眨眼。

如此每日循环往复,持续做了七八十轮。

整个集成组50多名成员,加上昆仑1机的机组人员,轮番上阵。

吕辰甚至把在红星轧钢厂防静电车间组装的测试机柜般了来,配置了一个最小系统,进行各种极端故障抢修模拟。

安全威胁类,是纯军事环节。

这是昆仑1机验收前新增的硬性要求,国防科委明确指示,昆仑1机是国防重点工程,必须具备应对各种安全威胁的能力。

钟汉成亲自带队,从军区抽调了一个警卫排,配合演练。

演练地点从机房扩展到整个计算机所厂区,从白天的正常工况到夜间的战备状态,全程模拟。

第一个科目,防空袭演练。

“呜——”

防空警报在清晨六点整拉响,尖锐的声音划破了中关村的天空。

这是不预告的突击演练。

机组值班人员听到警报,第一反应不是跑,而是冲到机柜前面。

他按照《战备操作手册》的流程,在45秒内完成了全部操作。

按下“状态保存”按钮,系统自动将内存数据写入磁带;关闭所有机柜的电源开关;拉下机房的总配电闸;将关键备份磁带装入防磁防火的保险柜。

然后值班小组撤离到昆仑1机房的地下管廊。

从警报响起到最后一个人进入地下管廊,用时2分18秒。

钟汉成站在地下管廊的作战室里,掐着秒表,面无表情。

“防空警报响应,2分18秒。合格。”

“今晚进行夜间空袭模拟,不预告时间。”

当天夜里零点,防空警报再次拉响。

这一次是在深夜,大部分人在睡梦中被惊醒。

值班机组接班不到一小时,听到警报后几乎是本能地冲向机柜。

他的手在抖,但动作没有变形。

状态保存、断电、拉闸、备份入柜,一气呵成。

2分35秒。

比白天慢了17秒,但仍然在3分钟的指标以内。

夜间反应速度需加强训练,目标提到2分15秒。

第二个科目是防火演练。

机房火灾是数据中心最大的噩梦。

钟汉成设计了一个极端场景,模拟机柜内部电路短路起火。

消防小组在机房外待命,值班人员先期处置。

演练在下午两点开始。

郑长枫在机柜背板的一个隐蔽位置,用做了一个短路点火模拟,点燃了一小片烟雾棉。

烟雾从机柜顶部冒出,天花板的烟雾探测器在8秒后报警。

值班人员看到烟雾,先按下了机柜的紧急断电按钮,然后拿起二氧化碳灭火器,对准烟雾源头喷射。

从烟雾报警到火源扑灭,用时47秒。

消防小组在1分20秒后赶到现场,接手了后续处置。

整个过程中,相邻机柜没有一台断电,系统没有中断运行。

钟汉成检查了现场后,问了一句:“为什么不启动自动灭火系统?”

秦无功道:“自动灭火系统启动条件是‘烟感+温度’双重确认。烟雾已经触发,但温度还没到阈值。手动优先,避免误喷。”

第三个科目,防暴演练,模拟破坏份子冲击机房。

钟汉成从军区调来一个班的战士扮演破坏份子,着便装,手持武器,试图强行闯入机房。

保卫科在两分钟内完成了人员集结和防线布设。

机房的防爆门在大门被突破前30秒落下,将核心区域与外界彻底隔离。

破坏份子冲进第一道大门后,被保卫科和值班人员组成的第二道防线拦住。

双方对交火了五分钟,增援力量赶到,破坏份子被击毙。

整个过程,核心机房没有受到任何冲击,系统运行正常。

钟汉成还不满足,又增加防爆门手动关闭的应急演练频次。

第四个科目是反侦察演练。

这是最敏感的科目,也是昆仑1机作为保密工程的最终底线。

演练模拟境外势力试图渗透窃取技术情报。

境外势力自由发挥,制定了潜入方案,先是假扮成维修工,混入计算机所厂区,试图接近机房。

保卫科在厂区入口设置了多道检查岗。

第一道岗核对证件,第二道岗抽查工具包,第三道岗由值班工程师随机询问技术问题。

可疑人员通过了第一道岗,在第二道岗被拦下,他的工具包里有一台没有登记的小型相机。

保卫科将其带离,在其身上发现了藏匿的微型胶卷。

从可疑人员进入厂区到被控制,用时11分钟。

钟汉成对这个时间不满意。

“11分钟,够他把核心数据传出去三遍了。”

他要求保卫科重新设计巡逻路线和检查流程,将响应时间压缩到5分钟以内。

随后,境外势力又策划了策反机组人员,收买后勤人员,绑架工程师等,连吕辰都被绑架到郊区地下室,应对了各种糖衣炮弹、金钱美女、高官厚禄,甚至家人威胁,呆了四个小时才获救。

第五个科目是防爆演练,这是所有军事环节演练中最极端的一个。

模拟自杀式爆炸袭击,一辆载有爆炸物的车辆冲向机房大楼。

保卫科在厂区外围500米处设置了第一道观察哨。

车辆出现在视线范围内时,观察哨立即报警。

值班人员启动应急预案,机房进入“战备锁定”状态,所有机柜自动保存状态并待机;防爆门落下;核心数据磁带通过应急通道转移至地下掩体。

从报警到完成全部防护措施,用时3分45秒。

“爆炸”发生后,抢险组在1分钟内抵达现场,评估损失,启动备用系统。

系统从备份状态恢复到正常运行,用时12分钟。

钟汉成看着记录本上的数据,沉默了片刻。

“防爆响应,3分45秒,达标。系统恢复,12分钟,还有优化空间。目标压缩到10分钟以内。”

第六个科目,反电磁侦测演练。

这是钟汉成特意增加的一个科目,针对的是昆仑1机在运行时会产生的电磁辐射。

“你们可能不知道,”钟汉成在演练前说,“一台大型计算机工作时产生的电磁辐射,在一定距离内可以被接收和解调。如果防护不到位,敌人在一公里外就能‘听见’你们在算什么。”

演练开始,一辆满载电子侦测设备的军用卡车停在计算机所厂区外500米处,模拟敌方侦察平台。

方教授带着工业监测实验室的人,用他们自己研制的频谱分析仪,在机房外围布设了监测点。

结果令人震惊,在多个频段上,确实检测到了可识别的辐射信号。

“这不是昆仑1的问题,”方教授解释说,“任何电子设备都有电磁泄漏。关键是,泄漏到什么程度,能不能被解调出有用信息。”

钟汉成当即决定,增配电磁屏蔽措施,在机房内壁加装铜网屏蔽层,对所有信号线缆进行电磁加固。

“这件事,列为最高优先级。验收之前,必须完成。”

所有科目都跑完之后,钟汉成提出最后一个要求,综合演练。

不预告时间,不预告科目类型,把技术故障和安全威胁混合在一起,随机触发。

这意味着值班人员不仅要应对系统故障,还要同时处理外部威胁。

演练在凌晨两点开始。

先是防空警报,值班人员按照流程开始关机。

关机过程中,突然出现总线仲裁冲突,系统模拟了一个罕见的死锁故障。

与此同时,保卫科报告,厂区外围发现“可疑车辆”徘徊。

三件事同时发生。

值班小组四个人,分工明确。

一个人继续处理关机流程,一个人调出总线波形分析故障,一个人与保卫科沟通核实“可疑车辆”情况,一个人准备应急备份。

6分钟后,系统安全关机,数据完整保存。

8分钟后,总线仲裁冲突被定位为“偶发性时序竞争”,通过微程序补丁临时解决。

12分钟后,“可疑车辆”被确认是误报,是一辆迷路的货车。

钟汉成掐着秒表,看着记录本上那行数字,说了两个字:“通过。”

但这只是及格。

真正的考验,在交付之后。