杭州高端数据标注基地落地上城

全链条数据产业生态加速成型

2026-04-03

“1000万元,就等最硬核的团队来揭榜!”

   3月30日下午,玉皇山南基金小镇路演中心,上城区行政审批服务管理办公室主任桑丽的话音刚落,台下不少人掏出手机拍屏幕二维码。

   这不是一场普通的招商会。当天,这里正在举行上城区数据产业高地推进大会暨火山引擎合作签约仪式。

   政府不仅签下了火山引擎这个“链主”企业,揭牌了杭州高端数据标注基地,还一口气发布了20个区内数据产业优质机会场景——其中一个构建智能电网场景的项目,清晰直观地表明寻找硬核技术团队,预算1000万元。

   “一家企业无法长期发展,需要算法、算力、数据、应用场景多方协作。”在首批入选上城区数据企业“伙伴圈”的北京海天瑞声科技股份有限公司浙江区总经理韩义武看来,这场大会释放的信号很清晰:上城不再只是给政策、给空间,而是要用“链主+伙伴圈”的方式,加速构建数据产业的全生态闭环。

   “链主”落子

   补齐“数据标注”这一环

   大会的重头戏,是上城区与火山引擎正式签约。紧接着,杭州高端数据标注基地揭牌亮相。该基地落地上城区九堡街道杭海金座,首期提供1.3万平方米产业空间,既能承载大项目落地,又能兼顾小微团队孵化。

   为何要建这样一个基地?上城区数据资源局副局长娄莹解释:“目前全区已集聚超4000家数据企业,形成了从数据资源、技术、服务到应用、安全的完整产业链。”但他同时点出了关键一环的缺失——数据标注。

   人工智能(AI)的发展离不开高质量数据的“投喂”,而数据标注工作是高质量数据诞生的基础。简单来说,AI要“看懂”世界、做出判断,离不开一种基础性的转译工作——数据标注。它把原始图片、语音、文本中的信息,翻译成算法能够识别的特征和标签。没有这道工序,再强大的模型也只能面对一堆杂乱无章的“天书”。

   火山引擎的加入,让这个基地有了技术底气。火山引擎数智平台解决方案总经理萧然在分享中透露,其智能标注工具可将效率提升60%以上,准确率高达98%,并已积累超8000个高质量数据集,覆盖45个数据方向。这些“AI燃料”将直接为入驻企业提供高价值弹药。

   更值得关注的是“伙伴圈”。会上发布的8家企业“伙伴圈”中,既有火山引擎这样的技术平台,也有海天瑞声等深耕数据服务20年的专业公司,还有国际数据管理协会(DAMA)这样的行业组织。

   韩义武说,以前做数据标注,大家可能各自埋头干活。现在进了“伙伴圈”,“我们可以相互协作,结合上城区政策、基地建设,结合场景需求做更多事情”。他提到一个关键点:火山引擎作为“链主”,将整合生态企业的标注需求形成“订单池”,海天瑞声这样的公司(下转2版)