记者 徐林军 文/摄
大年初三早9点,中国电信杭州智算中心的机房里,一个身高约120厘米、长着两只“大眼睛”的机器人缓缓驶过门禁,身子轻轻一转,开始了一天的巡检。它叫天翼AI机器人,机房运维支撑工程师杨洋管它叫“铁皮打工人1号”。
“机器人在运动中,请注意避让。”提示音在空旷的机房里回荡。杨洋站在监控屏前,看着“1号”穿过坡道、进入机房,两只“眼睛”上下伸缩,左右环顾,仔细地检查着温湿度、消防标识、地面是否有积水。“它是台前,我是幕后。”杨洋笑着说。
今年春节,他俩是搭档。
中国电信杭州智算中心总规划10幢建筑,设计机架规模超过2万个,是浙江省“十四五”期间重点打造的十大标志性项目之一。算力作为数字经济时代的新质生产力,其发展水平直接关系到国家数字竞争力与产业升级效能。
战略高、规模大,运维压力就跟着往上走。
过去,像杨洋这样的运维工程师得靠两条腿跑遍每一间机房,光是日常巡检就得耗去大半天。如今,“1号”接过了这些繁琐、高频的任务,效率提升50%以上。“它干活不累,也不用过年。”杨洋乐呵呵地说。
然而,“1号”并不是一上来就这么能干的。
“一开始误把地面反光当成水,上坡转弯摔倒,是常有的事。”杨洋解释道,机房地形复杂,有坡道、有门禁,机器人转弯时重心不稳,容易侧翻。工程师们就一点点调,增大轮距,加支撑轮,还准备给那双“大眼睛”换上防抖云台和广角摄像机。
“目前还不完美,但谁不是从这一步走过来的呢?”杨洋说,“你看看宇树,前几年还老摔,今年春晚那功夫耍得多帅。”
AI机器人一期工程是做试点,杨洋的任务就是各种适配:机房改造、数据接口开发、机器人硬件升级。就连春节,他也不停给“1号”下指令、提需求,测试各类巡检数据。
“为什么不大规模部署?”记者问。
“得让它先学会走路,再学会跑。”杨洋说。
“1号”的大脑藏在“幕后”。它基于预训练大模型,结合专业小模型,能对巡检结果进行有效性筛选。下一步,中国电信杭州智算中心AI机器人二期项目还将升级推理方式和训练流程,让机器人学会深度推理、自优化模型,甚至自己“教”自己。
“传统运维是被动救火,现在是主动预防。”杨洋说。“1号”让数据中心拥有了一套“自主神经系统”,而像他这样的工程师,则从重复劳动中解放出来,转向故障诊断、策略优化等更有挑战性的工作。
采访快结束时,杨洋又给“1号”下达了一条新指令。“1号”缓缓转身,驶向下一个机房。记者问:“等它完全成熟了,你干什么?”
杨洋想了想,笑了:“那我可能就是它的‘教练’了吧,教它新东西,带它去新地方。”
机房里,超级计算机的低沉轰鸣声依旧。“1号”的身影消失在走廊尽头,杨洋盯着屏幕上的数据流,像是看着一个正在长大的孩子。