姚瑶 陶俊
可信数据空间是相对传统网络“以数据分享”为中心向以“数据权益保护”为核心转向的新型网络基础设施,可以说是互联网的进化。互联网让人们实现了信息自由,随时分享、上传文本、语言、图片、视频等各种模态的数据,诞生了电商、社交、出行等各类互联网平台企业。这些互联网平台企业利用收集用户的大量数据,创新了产品和服务,发展了数字经济,极大促进了数据这一类似空气一样取之不尽用之不竭的资源价值释放,但是也带来用户数据权利失衡的问题。
普通用户由于无法收集、持有、控制自己在“别人土地”上生产的数据,眼睁睁看着自己的“数据”被复制、被利用,承担个人隐私被偷窥、私人数据被滥用的风险,可以说个人和小型企业组织在传统互联网空间中缺乏数据权益控制技术和制度,无法保护自己的“数据剩余价值”。在这种数据权益和数据风险不对等的模式下,个人和小型组织的数据权益意识日渐觉醒,数据维权案例日增,且私域高价值数据越来越“不愿意上网”“不敢上网”,互联网数据产权保护成为数字经济和社会发展亟需破解的难题。
2022年随着ChatGPT为代表的语言大模型异军突起,人工智能迎来发展史上空前高光时刻,人工智能三要素(数据、算法、算力)成为主要国家和地区竞相争夺的热点,互联网开放数据很快被大模型“大胃”消化,非网络上的高价值私域数据在算力平替、算法趋同情况下,成为人工智能竞争的焦点。
可信数据空间正是在这种情况下应运而生的新型互联网基础设施。在此之前,为了破解网络数据权益保护问题,人们已经实践出数字对象技术架构,实现了数字图书馆实例,很好地保护了数字出版物的权益问题,可信数据空间是这一技术的继承和发展,融合区块链技术解决数据流转可溯源、可追踪问题,融合数字合约技术解决数据非授权不可用问题,融合“token”技术实现数据调用可精准计量计价问题等,为还数权于民提供理想的技术支撑,配套相关制度政策,促进各类市场主体和个人加大高质量数据供给,真正做到数据“供得出、流得动、用得好”,为数据价值的释放再造一个“春天”,为数据成为新型生产要素,赋能千行百业,促进经济社会更良性循环发展,提供必要基础条件。
2024年11月,国家数据局印发《可信数据空间发展行动计划(2024-2028年)》,提出推进企业、行业、城市、个人、跨境可信数据空间建设和应用,这是首个举国之力把可信数据提高到全国一体化数据市场高度的国家意志行动。杭州作为全国数字经济第一城,勇挑重担,承担了可信数据空间建设国家试点的任务,并于2025年9月25日第四届全球数字贸易博览会上,发布杭州城市可信数据空间、文旅行业可信数据空间、视觉行业可信数据空间、低空经济行业可信数据空间等,为数据空间这一承担数据权益保护、数据价值释放、数据收益计量的新型数据基础积累先行先试的宝贵经验。同时企业可信数据空间和个人可信数据空间建设也在紧锣密鼓、有条不紊地推进中,届时人们可以发现“自己的数据有便捷、安全、可控换钱的渠道”,中小企业也能分享生产、经营数据安全共享的红利,一个数据促进经济社会发展的良性互动时代将会开启。
2026年,市委市政府提出杭州要打造人工智能创新发展第一城,城市可信数据空间勇担使命,承担起建设人工智能语料库,为杭州人工智能发展提供高价值语料的责任。当前杭州语料库首批已入驻数据企业近400家、发布数据产品近千个、链接全球开源数据集2万余个,为杭州建设人工智能创新发展第一城提供了坚实的持续增长的“数据石油仓”。
可信数据空间“外貌”看似与常见网站没有什么不同,内核却是多种前沿数据科技技术的融合支撑、应用。在数据空间里,数据被加工成“数件”,每个数件有自己的功能、操作许可、使用范围等,通过“数件”与“数件”的广泛关联、链接,拓展未知的知识边界,助力人工智能发现新知识、新规律,辅助人类科研和产业创新。推进可信数据空间技术发展既是科技创新的需要也是产业创新的必要,是科技创新和产业创新融合的实例,也是还数权于民的新型数据基础设施和促进人工智能高质量发展的利器。
【姚瑶,浙大城市学院城市大脑研究院院长助理;陶俊,杭州市大数据管理服务中心助理研究员。本文为浙江省哲学社会科学规划课题“公共数据授权运营范式研究”(24SSHZ021YB)阶段性研究成果】