2023年1月,信通院发布《数据要素报告》,以数据要素市场化发展的主线,以数据要素价值创造为理论起点,以解决我国数据要素市场培育的瓶颈问题为基本导向,通过理论、案例、比较等分析手段,给出了一套破解我国数据要素市场难题的技术、市场和制度思路与方案。
前 言
习近平总书记指出,数据作为新型生产要素,对传统生产方式变革具有重大影响,要构建以数据为关键要素的数字经济。
2019年10月,党的十九届四中全会首次将数据纳入生产要素范畴;
2022年12月,党中央、国务院印发《关于构建数据基础制度更好发挥数据要素作用的意见》,为最大化释放数据要素价值、推动数据要素市场化配置提出了最新指引。
在三年的实践探索中,我国数据要素市场建设取得显著成效,市场主体和市场环境不断完善,要素质量得到大幅提升,但是制约数据要素市场化配置的权属界定、估值定价、市场规则、流通技术等关键性难题仍有待破解。
本报告把握数据要素市场化发展的主线,以数据要素价值创造为理论起点,以解决我国数据要素市场培育的瓶颈问题为基本导向,通过理论、案例、比较等分析手段,初步给出了一套破解我国数据要素市场难题的技术、市场和制度思路与方案。
全文主要观点如下:
一是归纳出数据要素价值的实现途径,即业务贯通、数智决策、流通赋能三次价值的释放,为数据要素市场建设提供理论基础。
二是明确了数据要素市场的内涵和特征,即数据要素市场以数据产品及服务为流通对象,以数据供方、需方为主体,通过流通实现参与方各自诉求的场所,是一系列制度和技术支撑的复杂系统。
三是辨析了数据要素市场存在的三种流通形式,即开放、共享、交易三种既有区别也有联系的流通形式,探讨了其适用场景与发展现状。
四是概括出数据要素市场经营运行存在的三种新模式,即从自行管理运维到委托运营的机制创新模式;从供需直接对接到多元数商参与的主体创新模式;从分散对接到统一数据空间的设施创新模式。
五是识别出数据要素市场培育的四大障碍,即权利归属难以界定、估值定价缺乏依据、流通规则尚不完善、流通技术仍未成熟,并给出了解决思路建议。
最后,本白皮书对“十四五”期间我国数据要素的发展方向进行了展望,在不远的将来为实现数据要素价值的全面释放,必须加快数据要素基本问题研究,加快技术创新步伐,切实推动数据交易流通。
目 录
图目录
以下为报告正文:
一、数据要素理论问题概述
数据要素已快速融入生产、分配、流通、消费和社会服务管理等各个环节,深刻改变着生产方式、生活方式和社会治理方式。如何理解数据的内涵与特性,把握数据成为生产要素的背景和价值实现的途径,都是值得深入探讨的理论问题。
(一)数据的概念与独特属性
在广泛意义上,数据(data)就是对事实、活动等现象的记录《辞海》(第七版)将数据定义为“描述事物的数字、字符、图形、声音等的表示形式”。按照《中华人民共和国数据安全法》中给出的定义,数据是指任何以电子或者其他方式对信息的记录。由此可见,数据本身可以有丰富的表现形式。
数据一直伴随着人类的发展而变迁。在古代,数据呈现出规则化汇聚的特征。例如,我国古代的黄册(全国户口名册)、天文观测记录均以特定规则进行登记造册,它们对人类社会和物理世界的性质、状态与相互关系进行记录和计算,都是宝贵的古代数据遗产。计算机发明后,数据与计算机编码产生重要联系。凡可被编码为一系列0和1组成的二进制记录,都是计算机可处理的数据。早期计算机的采集、存储、计算技术尚不成熟,只能有效处理行列结构明确的数据表,此时数据更多指代这类结构化数据。近十几年来,数据存储、传输和计算的性能不断突破,数据管理、数据处理技术快速迭代,网页、声音、图像等半结构化、非结构化数据也逐渐得到有效处理和利用。
大数据时代,数据是基于二进制编码的、按预先设置的规则汇聚的现象记录。在此阶段,数据不仅是对客观现象的被动记录,越来越多的复杂现象由人们主动发掘并记录成为数据。例如,主动埋点收集的行为数据、基于关系网络挖掘的图数据、精细布放传感器捕获的物联网数据等。这种从被动到主动的转变昭示着一种新的观念,即物理空间中的一切事物都可以被预先设置的认知角度、记录规则和技术框架映射到数据空间,数据的创造融入了数据观察者或收集者的认知视角。例如,一篇文学作品,在自然语言处理的视角下只是遵循语料库规则的一条数据。
数据与信息之间虽然有复杂联系,但二者并不应混淆。从人类认知的角度看,数据是汇聚起来用于认知的原材料,信息是人类大脑可以理解和认知的事物状态和联系。在“数据-信息-知识-智慧”(Data-Information-Knowledge-Wisdom,DIKW,如图1)模型看来,数据本身是无意义的原始事实记录,只有经过主体使用、分析和提炼,才会产生对人类有用的、具有特定功能的信息。数据能够承载信息,信息则是已经被加工为特定形式的数据。当今技术和产业更强调数据作为原材料的独特价值,依靠数据驱动可以产生大量人类理性难以直接感知到的信息,这些信息是数据价值释放的一种结果。
数据与土地、劳动、资本、技术等传统生产要素相比有明显的独特性。产学研各界对数据的特性已有广泛讨论,总结各方观点可以发现,数据首先作为独特的技术产物,具有虚拟性、低成本复制性和主体多元性。这些技术特性影响着数据在经济活动中的性质,使数据具备了非竞争性、潜在的非排他性和异质性。
数据的以上特性使得与传统生产要素相配套的规则体系、生态系统等难以直接沿用。
作为技术产物,数据具有虚拟性。数据是一种存在于数字空间中的虚拟资源。土地、劳动力等传统生产要素都是看得见、摸得着的物理存在,与数据形成鲜明对比。
数据具有低成本复制性。数据作为数字空间中的存在,表现为数据库中的一条条记录,而数据库技术和互联网技术又能使数据在数字空间中发生实实在在的转移,以相对较低的成本无限复制自身。
数据具有主体多元性。数字空间中的每条数据可能记录了不同用户的信息,数据集的采集和汇聚规则又是由数据收集者设定,用户、收集者等主体间存在复杂的关系。同时,每个企业、每个项目都可能对所用的数据资源进行一定程度的加工,每一次增删改的操作都是对数据集的改变,因而这些加工者也是数据构建的参与主体。
作为经济对象,数据具有非竞争性。得益于数据能够被低成本复制,同一组数据可以同时被多个主体使用,一个额外的使用者不会减少其他现存数据使用者的使用,也不会产生数据量和质的损耗。例如,在各类数据分析、机器学习竞赛中,同一份数据可以被大量参赛者使用。非竞争性为数据带来更普遍的使用效益与更大的潜在经济价值。
数据具有潜在的非排他性。数据持有者为保护自己的数字劳动成果,会付出较高代价使用专门的人为或技术手段控制自己的数据,因而在实践中,数据具有部分的排他性。然而,一旦数据持有者主动放弃控制或控制数据的手段被攻破,数据就将完全具有非排他性。排他性是界定产品权利的重要基础,土地、劳动、资本都有明显的竞争性和排他性,可以在市场上充分实现权利流转。技术在当今专利保护制度下具有排他性,也可实现权利转让和许可。
数据具有异质性。相同数据对不同使用者和不同应用场景的价值不同,一个领域高价值的数据对另一领域的企业来说可能一文不值。与数据形成鲜明对比的是资本,资本是均质的,每份资金都有相同的购买力,对所有主体同质。
综上所述,相比其他生产要素,数据的部分特性使它难以参照传统方式进行管理和利用,但其可复制、可共享、无限增长和供给的禀赋,打破了传统要素有限供给对增长的制约,为持续增长和永续发展提供了基础与可能。
(二)数据成为生产要素有深厚的技术和产业背景
生产要素是对生产过程中为获得经济利益所投入资源的高度凝练。每当出现经济增长速度快于已知要素投入增长速度时,就可以概括出新的要素来说明其余要素未能说明的剩余产出。因此,生产要素是随着生产力的发展而不断扩充的。将数据增列为生产要素的原因在于它对推动生产力发展已显现出突出价值。数据显著推动生产需要相应的技术和产业基础,随着数据相关技术和产业的发展,数据逐渐具备规模大、价值高等特征,演变为推动生产效率提升的重要要素。
20世纪70年代,关系型数据库的发展使数据处理效率大幅提升,数据推动生产的价值初步显现。在数据库诞生之前,程序员处理数据时需要直接面对操作系统的底层文件进行针对性开发,无论是数据结构还是文件格式,执行起来都有较高复杂度。1970年,埃德加·科德(Edgar Codd)提出关系型数据库模型,指明了数据库发展的一大重要方向。随着关系型数据库的成熟,以关系代数为基础的SQL语言的普遍使用,以及Oracle、DB2等事务数据库产品的涌现,面向事务处理的OLTP(On-Line Transaction Processing,联机事务处理)系统得到应用,数据的增删改查有了标准工具和组件,数据使用者可以不再直面操作系统底层环境和数据处理底层逻辑,从而专注于上层应用系统开发,业务运转效率明显提高。
20世纪末,挖掘数据价值的需求不断增长,数据仓库与数据分析
技术迅速发展,数据在生产中的意义进一步显现。随着1991年万维网的提出,互联网浪潮席卷全球,数据量迅速膨胀,利用数据集进行信息分析和知识挖掘的需求不断增长。比尔·恩门(BillI nmon)确立了数据仓库的概念,提出数据仓库是面向主题的、集成的、相对稳定的、反映历史变化的、用于支持在线分析和管理决策的数据集合。科德则认为传统的OLTP在性能、适用性、性价比方面已不再适用,于1993年提出满足多维分析的OLAP(On-Line Analytic Processing,联机分析处理)系统。OLAP支持复杂的分析操作,提供直观易懂的查询结果,追求满足大规模聚合分析查询的性能表现。与此同时,机器学习算法不断创新,人工智能技术正走出第二次低谷期,数据驱动的分析决策逐渐获得关注。
进入21世纪,数据的大规模集中和高维度分析全面推动生产效率提升。为满足数据大规模存储、高性能计算、在线实时查询等需求,越来越多的组织开始搭建大数据平台,数据处理和分析方面的技术向分布式、基于Hadoop的体系靠拢,对数据的管理也逐渐规范化。随着近年来平台经济迅速崛起和移动互联网的普及,数据呈现指数级爆发的增长趋势,业务数据处理及时性和快速性的需求也不断提升,各组织从Hadoop转向Storm、Spark和Flink体系,在吸收开源技术的基础上,不断探索流式计算、秒级采集系统的建设,构建企业级的实时数据分析体系。随着数据湖、数据中台等概念和技术加速落地,结合机器学习、人工智能等新兴技术,众多组织对数据进行统一存储计算和高质量治理,为各类应用提供数据服务,对海量数据实时处理和智能分析的能力不断增强,极大推动了生产效率的提升。
数据技术的发展伴随着数据应用需求的演变,影响着数据投入生产的方式和规模,数据在相应技术和产业背景的演变中逐渐成为促进生产的关键要素。因此,“数据要素”一词是面向数字经济,在讨论生产力和生产关系的语境中对“数据”的指代,是对数据促进生产价值的强调,即数据要素指的是根据特定生产需求汇聚、整理、加工而成的计算机数据及其衍生形态,投入于生产的原始数据集、标准化数据集、各类数据产品及以数据为基础产生的系统、信息和知识均可纳入数据要素讨论的范畴(如图2)。对于数字化转型刚刚开始的企业,原始数据集是维持业务系统运转、提高业务运行效率的基础资源。对于数字化较为成熟的企业,其经过清洗、预处理后的数据集具有更高质量,能够提供更准确、更全面、更有预测力的信息用于分析决策,可以为企业带来更大的效益。企业还可将自身持有的数据加工成多样的数据衍生品,在符合法律制度的前提下向外流通,使其他企业利用数据蕴含的价值参与生产活动。
图2 数据要素主要表现形态
(三)数据要素主要通过三条途径实现价值
激活数据要素的根本目的是以多样、创新的方式投入生产,为经济社会生产创造更大的价值。数据要素究竟如何发挥其作为生产要素的价值,需要进一步分析厘清。随着信息技术的发展和产业应用的演化,数据要素投入生产的途径可概括为三次价值释放过程(如图3)。
1. 一次价值:数据支撑业务贯通
数据投入生产的一次价值体现在支撑企业、政府的业务系统运转,实现业务间的贯通。数据经由各个业务系统的设计而产生,用以支撑业务系统的正常运转。通过计算机对数据的读写,贯通线下与线上的界限,实现业务初步的标准化、自动化管理和运营。此过程中,数据集中产生、单一存储、形式简单,相应的治理工作也以增、删、改、查、对齐、合并等常规的数据库管理为主,多集中于局部业务领域的流程改善和相关业务数据的贯通。虽然此阶段数据并未得到深度整合与分析,数据开发利用并未得到很大关注,但数据对业务运转与贯通的支持是实现数字化转型、提高内部管理效率的第一步。
例如,20世纪末谷歌公司成立后革新了数据存储与计算系统,得以处理当时整个互联网的数据,构建起精准高效的搜索引擎。基于庞大数据量和排序算法的搜索业务产生巨大利润,奠定了谷歌公司行业翘楚的地位。
二十年前,我国以“两网、一站、四库、十二金”工程为代表的电子政务建设全面开展,经过多年推进,各级政府业务信息系统建设和应用成效显著,通过业务数字化的方式实现了数据在系统中的有效运转和贯通,公共服务水平得到全面提升,“最多跑一次”、“一网通办”、“一网统管”、“一网协同”、“接诉即办”等创新实践不断涌现,为当今的数字政府建设奠定了基础。(备注:“两网”指政务内网和政务外网;“一站”指政府门户网站;“四库”指人口、法人单位、空间地理和自然资源、宏观经济四个基础数据库;“十二金”是面向政府办公业务建立的十二个重点信息应用系统,包括金财、金农、金盾、金保、金税、金关、金水、金质、金审、金卡、金贸、金企等十二项工程。参考资料:中国电子政务网http://www.e-gov.org.cn/article-166340.html)
为推动数据的一次价值释放,企业、政府主要工作重心是业务数字化及各类业务信息系统建设。这一阶段,各主体所持有的数据种类相对单一、计算的要求简单,技术门槛较低,关键是深入挖掘业务需求,明确业务数字化方向。如制造业企业通过建设订单数据管理系统,实现物流、信息流、资金流的对齐、核验,可有效推动整个业务流程的有序流转。
随着业务信息系统的建设,企业、政府的数据实现独立存储、统一管理,大量宝贵的业务数据不断积累,为进一步挖掘数据的生产要素价值奠定了重要基础。
2. 二次价值:数据推动数智决策
数据要素投入生产的二次价值释放体现在通过数据的加工、分析、建模,可以揭示出更深层次的关系和规律,使生产、经营、服务、治理等环节的决策更智慧、更智能、更精准。在数据分析、人工智能等技术的辅助下,数据自动化、智能化的采集、传输、处理、操作构成了新的生产体系,可以实现经营分析与决策的全局优化,数据要素成为决定企业竞争力的重要因素。究其原因,数据要素二次价值释放的关键在于数据可以提供独特的观察视角,在此基础上可以构建出理解、预测乃至控制事物运行的新体系,从而摆脱经验的局限,更加即时有效地防范化解风险,创新行动方略。
例如,2012年海尔公司利用成熟的技术工具栈,建立了针对业务管理和经营决策的完整数据链,从而实现通过业务智能化来优化管理岗位用工结构;各大银行充分整合中小企业的经营数据,挖掘更准确的企业客户画像与信用评分,由此决定中小企业贷款风险评估结果,为中小企业低成本融资提供可能。可以看到,数据要素不仅可以投入于自有业务支撑分析决策,还能够优化传统生产要素的经营与配置,使传统要素价值倍增,提升全要素生产效率。数据驱动的智慧化、智能化决策可以实现更少的要素资源投入创造更多的物质财富和服务,有助于实现生产率跃升、产业链优化和竞争力重塑。
数据二次价值释放过程对企业数据挖掘和洞察能力提出更高要求。无论大势判断还是业务执行,数据都有利于消除人的认知误区和主观偏见。一方面,在对大量数据进行管理和分析的基础上,决策者
需要结合对业务目标的深刻理解,运用数据呈现出的关键指标与信息深入评估发展态势,做出更具智慧的决策。另一方面,二次价值可以直接回馈一次价值,企业需要充分利用数据分析结果,寻找关键的函数、标签、画像,实现自动化的预测、分析和决策,使业务运转更智能。
3. 三次价值:数据流通对外赋能
数据要素投入生产的三次价值释放让数据流通到更需要的地方,让不同来源的优质数据在新的业务需求和场景中汇聚融合,实现双赢、多赢的价值利用。随着政府和企业数字化转型的不断深入和智能化水平的不断攀升,各组织对于数据的渴求已经超越了自身产生的数据。政府希望各级各部门数据实现对接共享,提升政务管理和公共服务水平;企业希望通过其他企业或政府部门的数据来丰富自身对于数据的挖掘,因此产生了数据流通的需求。对数据提供方来说,数据流通后并不减损自身持有数据的价值,相反还有可能将这部分价值变现,带来新的业务增长点,实现双赢乃至多赢的局面。
例如,通过来自市场监督管理部门的企业注册数据、来自法院的企业判决数据、来自银行的信用数据等精准描绘企业画像,或通过来自电网的用电数据、来自电商平台的消费数据、来自物流公司的物流数据等提供宏观经济的观察指标,社会经济活动中的各类事项均可被多方来源的数据赋能,其中涉及的数据流通可能产生极大的市场规模,使数据要素价值在多元场景中持续释放,从而将数据要素的业务价值、经济价值和社会价值显性化,为数据要素市场的发展提供强劲动力。
在数据的三次价值释放过程中,数据要素市场及其技术路径成为行业关注的焦点。在保障数据安全的前提下,各组织打通数据壁垒、优化数据配置的需求日益凸显,通过数据要素市场引入外部数据的需求尤为迫切。保障提供方数据安全、防止数据价值稀释的数据流通技术蓬勃发展,以隐私计算为代表的数据流通技术提供了“数据可用不可见”“数据可控可计量”的流通新范式,为需求方企业安全地获取和分析外部获取的数据提供了技术可能。
数据安全有序流通的技术成为数据要素三次价值释放的关键,也为数据要素市场建设提供了重要的技术路径。
从数据应用的业务需求看,业界对数据的关注焦点经历了从“对内”到“对外”的变化。“十三五”时期提出“数据是钻石矿”,更多强调组织内部应用数据发挥价值;“十四五”时期提出“数据要素市场化配置”,增添了从组织对外提供和从外部获取数据的视角,进一步凸显出数据在流通中实现的价值增值。部分企业受限于资金、人才、技术水平不足,尚不具备业务数据电子化或分析决策智能化的能力,即使引入外部数据也无法有效利用,无法形成回馈业务发展的价值回路。因此,数据支撑业务贯通和促进数智决策的价值仍需要持续释放,数据流通对外赋能的价值也应在前两次价值的基础上逐步发挥。
二、我国数据要素市场培育现状
“数据是生产要素”这一判断突出了数据促进生产的重要价值。随着数据采集、治理、应用、安全等方面的技术和产业发展,数据支撑业务贯通的一次价值和促进数智决策的二次价值已得到初步释放,互联网、金融、电信等行业头部企业数据驱动的数字化转型加速发展,为广大中小企业释放数据要素价值提供了参考经验。但是,当前大量数据集中于少数主体,数据要素分布不均、结构失衡,需要加速市场化流通使数据价值惠及广大市场主体。同时,数据具有规模效应,越大规模、越多维度的数据融合汇聚创造的价值倍增,企业自有数据与外部数据的充分融合才能实现数据应用价值的最大化。
因此,在前两次价值释放的基础上,数据流通对外赋能的价值逐渐获得政策布局和产业实践的重点关注,下面的讨论也将聚焦数据要素市场。
数据要素市场是以数据产品及服务为流通对象,以数据供方、需方为主体,通过流通实现参与方各自诉求的场所,是一系列制度和技术支撑的复杂系统,是促进数据自主有序流动、提高配置效率、发挥数据价值的关键。
(一)数据要素市场政策布局不断细化深入
我国自2019年十九届四中全会首次将数据增列为生产要素以来,中央发布多项政策文件,围绕数据要素发展进行谋篇布局(如图4),并将关注点聚焦于数据要素市场建设。
2020年印发的《关于构建更加完善的要素市场化配置体制机制的意见》首次提出培育数据要素市场。
2021年《要素市场化配置综合改革试点总体方案》进一步以“探索建立数据要素流通规则”为主题进行数据要素市场化配置改革的布局,聚焦数据采集、开放、交易、使用、保护等全生命周期的制度建设,具体从完善公共数据开放共享机制、建立健全数据流通交易规则、拓展规范化数据开发利用场景和加强数据安全保护四个方面展开。
面向未来,我国《“十四五”数字经济发展规划》对于数据要素发展的布局集中体现在壮大数据要素市场规模、开展数据要素市场培育试点工程等方面。进一步扩大数据要素市场规模的工作重点在强化高质量数据要素供给,创新数据要素开发利用机制,培育壮大数据采集、标注、清洗等服务产业,鼓励市场力量挖掘数据价值,推动统一标准体系建设,努力实现互通互操作,形成完整贯通的数据链,促进数据、技术、场景深度融合。培育数据要素市场的工作方向集中在探索数据确权与定价规则,开展数据确权及定价服务试验,完善市场运营和治理体系,培育规范的数据市场主体和数据交易平台,营造安全有序的市场环境。
由于数据汇聚能带来价值倍增,具有规模效应,容易出现“赢者通吃”的自然垄断现象。政策布局既要反地方保护、反垄断,又要扶持具有产业链影响力的数据要素生态。2022年4月,中央布局全国统一大市场建设,数据要素市场作为其中一部分,也需打破地域间、市场间壁垒,加强数据要素的协同。
2022年12月,《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》提出构建数据基础制度体系,促进数据合规高效流通使用,建立保障权益、合规使用的数据产权制度,建立合规高效、场内外结合的数据要素流通和交易制度,建立体现效率、促进公平的数据要素收益分配制度,建立安全可控、弹性包容的数据要素治理制度。国家的顶层设计逐步对数据要素各环节提出更细致的目标和要求,为推动数据在更大范围内有序流动和合理集聚、进一步促进数据价值转化应用指明了方向。
(二)数据要素市场主要存在三种流通形式
培育数据要素市场的目标是数据在各市场主体间高效有序自由流通。按照数据与资金在主体间流向的不同,可分为开放、共享、交易三种流通形式(如图5)。
图5 数据要素流通的三种形式
1. 数据开放:以公共数据为主的开放持续推进
数据开放是指提供方无偿提供数据,需求方免费获取数据,没有货币媒介参与的数据单向流通形式。由于数据提供方无法通过开放直接获得收益,因此开放的对象往往是公共数据。公共数据是指国家机关和法律、行政法规授权的具有管理公共事务职能的组织履行公共管理职责或者提供公共服务过程中收集、产生的各类数据,以及其他组织在提供公共服务中收集、产生的涉及公共利益的各类数据。一般而言,公共数据被认为归国家或全民所有,管理、开放等职责由政府或其他公共机构代为行使。由于其公共性,除去个人敏感信息、企业商业秘密、国家秘密之外,公共数据向社会开放可以使其拥有的高价值回馈社会。
建立公共数据开放平台是各地政府推进数据开放的主要手段。近年来各地方政府在公共数据开放平台建设方面积极推进,取得了良好成效。目前,除港澳台外,我国已有21个省级行政区上线公共数据开放平台。全国333个地级行政区中建成公共数据开放平台的地区占比已达58%(来源:华中师范大学信息管理学院、湖北省数据治理与智能决策研究中心,《中国政府开放数据利用研究报告(2022)》)。
尽管各地数据开放平台建设效果存在差异,部分平台数据容量小、更新频率低,但一些省市平台已形成较大规模,开放的数据集、数据接口已覆盖公共安全、社会民生、经贸工商、交通出行等多个领域,为公共数据开放平台建设做出示范。
部分地市公共数据开放配套的制度与机制逐步完善。目前,我国已有十余个省市的地方法规涉及公共数据开放相关内容,各地正在加紧落实中央指导文件与地方数据条例的相关要求。例如,广东省在省级制度层面落实“一数一源”,即公共机构根据职责分工编制公共数据采集清单,按照一项数据有且只有一个法定数源部门的要求,依据统一标准提供公共数据,有效解决基础数据重复采集、汇聚路径不清晰、质量问题难追溯等难题。上海市2022年8月发布《2022年上海市公共数据开放重点工作安排》,持续对开放细则、工作机制、技术要求提出更细致目标,通过建设样本数据集、组织开放清单常态化梳理、建立需求工单转交机制等措施,确保开放服务便捷、质量持续提升、需求及时响应。
我国的公共数据开放现状距离国际先进水平还存在一定差距。发达国家的公共数据开放起步较早,美国、德国等国家均已建立起全国性的政府数据开放平台。例如早在2009年上线的美国data.gov网站,发布了农业、商业、气候、教育、能源等多领域的高质量公共数据,至今仍在不断更新。为保证公共数据开放质量,data.gov还开发了开放数据仪表盘,设计了数据质量自动评分与人工评分机制。政府、企业、公众均可查看开放政策数据进展、数据质量评分等内容,公共数据需求方可获得良好的服务体验。
2. 数据共享:政府参与的数据共享趋势加强
数据共享是指互为供需双方,相互提供数据,没有货币媒介参与的数据双向流通形式。根据共享主体的不同,可分为政府间共享、政企之间共享、企业之间共享等形式。
我国政府间数据共享工作持续推进,国家数据共享交换平台进一步完善。截至2021年5月,国家数据共享交换平台已上线目录超过65万条,发布共享接口1200余个,累计提供数据查询或核验服务超过37亿次(来源:中国网络空间研究院,《中国互联网发展报告(2021)》)。其中,公安部的自然人基础信息、教育部的高校学历学位信息、市场监管总局的企业基本信息、民政部的婚姻登记信息等,长期位于共享调用榜前列4,对各类政务服务提供了有力支撑。
政企间数据共享逐渐形成趋势。以美团与各地监管机构合作的“政企通”为例,自2019年以来,美团与辽宁、天津等地建立合作,通过数据共享优化餐饮安全监管。2021年6月,美团同上海联合打造“城市美好生活数字体征系统”,政府提供交管数据,帮助美团优化交通调配;美团提供不涉及用户隐私的规律性数据,协助政府探索覆盖吃、住、行、游、购、娱等场景的城市数字治理方案。(来源:中国电子信息行业联合会,清华大学公共管理学院,《中国政务数据治理发展报告(2021年)》)企业间数据共享以供需合作需求为牵引,同一生态内企业、产业链上下游企业之间通过点对点协商约定相互提供数据的方式。然而,企业内部协商的模式导致数据共享情况整体处于黑箱状态,具体共享方式、开发利用方式相对不透明,公开资料较少。
3. 数据交易:场外需求旺盛,场内重启热潮
数据交易是指提供方有偿提供数据,需求方支付获取费用,主要以货币作为交换媒介的数据单向流通形式。数据交易可对接市场多样化需求,灵活满足供需各方利益诉求,激发市场参与主体积极性,促进数据资源高效流动与数据价值释放,对于加快培育数据要素市场具有重要意义,正在成为数据流通的主要形式。
传统的数据交易模式以点对点的方式进行。数据需求方和数据供给方可通过两两协商或平台对接的方式实现数据的采购与流转,具体的点对点交易形式多样。例如从数据需求方角度看,银行信贷业务为应对风控需求,向征信机构、运营商、公共部门等机构采购用户身份信息核验、信用评价信息等外部数据资源。又如从数据供给方角度看,一些企业对金融信息、企业信用、法院判决、报告论文、AI标注等数据进行汇聚、处理,供需求方购买对接。现阶段,点对点的数据交易规模已相当可观,比如大型商业银行每年数据采购金额就超过百亿元。许多供方企业在其行业领域内已建立特色化数据产品与服务体系,形成了较稳定的供需关系。
点对点交易模式规范程度和交易效率较低,难以大规模推广。点对点交易缺乏有效监管,规范程度不够高。同时,市场中的供需双方信息分散,对接渠道不畅通,交易效率较低。数据充分流动是发挥数据要素三次价值的基础,尤其是在建设全国统一大市场的背景下,点对点交易不利于实现大规模数据要素市场化配置。目前,全国各地以设立数据交易机构为主要抓手,鼓励集中式、规范化的“场内数据交易”。
我国自2014年开始探索建立类似证券交易所形式的数据交易机构,截至2022年11月,各地先后成立48家,仍有8家正在筹备建设中(如图6)。总体来看,早期建设的数据交易机构大都没有找到成功的商业模式,多数机构已停止运营或转变经营方向,发展情况未达预期。近两年来,随着党中央国务院多项重要政策出台,各地新建一批数据交易机构,试图消除供需双方的信息差,推动形成合理的市场化价格机制和可复制的交易制度和规则。
新一批数据交易机构从强化技术支撑、完善配套规则入手,探索在数据要素市场中的立足点、突破点,帮助市场建立信任、保障权益。
一是搭建“数据可用不可见”的数据可信流通技术平台。例如,北京国际大数据交易所依托隐私计算、区块链、测试沙盒等领域技术,构建新型数据交易系统;深圳数据交易有限公司牵头发起国内首个国际化自主可控隐私计算开源社区,依托技术开源吸引政府、企业合作,打造数据要素生态圈。
二是发布数据交易规则和交易凭证。例如,贵阳大数据交易所于2022年5月发布系列数据交易规则,为交易主体权责划分提供依据,并依据规则为数据产品、数据商、第三方数据服务中介机构等提供登记凭证,以确认数据和主体具备进入市场交易的条件,探索解决市场主体互信难的问题。
(三)数据要素市场供需对接向多行业扩展
目前参与数据要素市场的主体较为集中。从数据提供方看,各级政府、电信运营商、大型国有企业、大型互联网公司聚集了海量经济社会、行业、用户数据,通过数据接口、数据产品、数据服务等形式可满足大量企业的数据需求。数据需求方则主要集中在金融机构、零售企业等机构,希望通过获取外部数据来优化业务。相较于中小企业尚未充分挖掘数据需求的情况,头部企业逐渐在多个行业产生较为典型的数据流通实践,开展跨领域数据深度融合应用,为各类业务提供新资源、新方案,有效实现数据的供需对接。
金融行业中,风险控制要求极为严格,各大金融机构以雄厚的资金实力做支撑,早已成为数据要素市场的主要参与者。以银行信贷业务为例,为降低审贷成本、优化客户画像和风控模型,银行产生大量同业和跨行业的用户数据需求。2021年11月25日,上海数据交易所挂牌成立,由国网上海电力公司自主研发的“企业电智绘”成为首单成交的数据产品,中国工商银行上海分行作为购买方,可通过“企业电智绘”产品提供的企业用电数据脱敏、深度分析结果,掌握企业用电行为、用电缴费、用电水平、用电趋势等特征内容,为银行在信贷反欺诈、辅助授信、贷后预警等方面提供决策参考。
互联网行业中,许多头部企业已对外提供众多数据接口或数据产品,以满足中小互联网企业或其他行业研发应用、精准营销、提供智能服务等用途。例如京东的万象平台、阿里云的API市场汇集了电子商务、金融科技、企业管理、公共服务等多领域数据接口,其自有数据和人工智能服务具有较大吸引力。
工业领域行业中,由于较多传统行业数字化转型刚刚起步,还需经历产线内数据联动、工厂内数据协同、企业内数据共享、企业间数据流通等多阶段探索。目前,国家工业互联网大数据交易平台已处于内部测试阶段,该平台着力解决工业企业数据流通的难点,促进工业数据要素市场发展。
此外,政务、气象、交通、医疗等行业和场景的数据需求也逐步显现,相应公共数据的开放或企业数据的供给获得更广泛的关注。未来随着提供方数据治理能力提升和需求方数据需求深度挖掘,以业务场景为牵引的数据要素市场将更加活跃。
(四)数据要素市场经营运行模式积极创新
1. 新机制:从自行管理运维到委托运营
公共数据授权运营成为提高公共数据配置效率的探索新热点。针对公共数据持有机构没能力开放、没动力开放的问题,我国各地开始探索按照法定程序,授权特定主体在一定期限和范围内以市场化方式运营公共数据。公共数据授权运营与公共数据开放之间具有一定的协同关系。公共数据开放的范围和质量影响着公共数据授权运营的资源基础,而授权运营获得的经济效益可以激励运营方改善公共数据质量和效用,有利于进一步带动市场活力,深化对公共数据的挖掘利用,加速公共数据价值释放。
例如,北京市经济和信息化局授权北京金融控股集团下属的北京金融大数据有限公司建设金融公共数据专区,对全市公共数据进行托管运营,搭建政府和社会之间的数据桥梁。目前,专区已汇聚金融机构开展信贷业务所“亟需、特需”的工商、司法、税务、社保、公积金、不动产等多维数据25亿余条,实现按日、按周、按月稳步更新。通过构建完善的数据安全管理体系,北京金控集团依托生态优势,打造京云企业征信平台,通过引入专区汇聚的公共数据,累计为银行、保险、担保等44家金融机构和2万多名平台用户提供服务800多万次。
数据信托为企业数据委托运营、实现数据资产变现提供新思路。数据信托是指数据供方将其数据作为信托财产设立信托,由信托机构按照委托人意愿,自行或委托第三方运营机构对信托财产进行专业管理,由此产生的增值收益按照信托目的进行利益分配的数据流通模式。应用信托财产的权利与制度设计,数据资产的使用、收益等权利可以得到有效安排,有利于减轻数据供需双方企业的合规和管理压力,为暂时没有技术能力或需要现金收入的供方企业提供数据价值变现的机会。
中航信托曾于2016年发行国内首个数据资产信托产品:数据堂作为委托人,以其持有的数据资产设立信托,通过信托受益权转让获得了现金对价。受托人中航信托委托数据服务商对特定数据资产进行运用增值并产生收益,向社会投资者进行信托利益分配。
但是,在我国现有制度和市场下推广数据信托还有很多问题值得探讨。由于数据的财产属性和权利内涵尚未明确,导致数据信托无法参照我国现有法律直接采用信托的法律关系。数据信托机制需要在普通信托的架构之外,针对数据的特性进行制度的创新。
2. 新主体:从供需直接对接到多元数商参与
传统点对点流通模式下的数据供需匹配效率不足且缺乏信任,各地数据交易所的成立旨在帮助市场解决这一问题,但仅靠数据交易所自身很难承担数据交易中的全部服务角色。因此为数据供需双方提供撮合、托管、经纪、结算、评估、担保等服务的多元数商在各地数据要素市场培育中的作用开始受到更多关注。
上海提出打造“数商”新生态。2021年11月上海数据交易所在其揭牌成立仪式上率先提出“数商”概念,即“以数据作为业务活动的主要对象的经济主体”,并签约100余家数商。在这些数商中,既包含数据产品的直接提供者,也包含为数据交易提供合规咨询、质量评估、资产评估、技术支持等服务的第三方服务商。
北京提出建立“数字经济中介”产业体系。为健全数据交易生态体系,2022年1月,北京国际大数据交易所宣布率先在全国建立数字经济中介产业体系,以数据交易所为基础,培育数据托管、数据经纪等一系列创新型中介产业。其中,数据托管体系包含数据资源拥有方、授权运营方、安全保障方、合规处理方、场景应用方等角色,共同实现数据的合规存储、授权管理和市场应用;数据经纪体系则侧重于场景化的数据利用,通过对接数据资源、开展经纪服务、撮合进场交易、参与价值分配等方式活跃数据要素市场。
广东开展“数据经纪人”试点。2021年7月,《广东省数据要素市场化配置改革行动方案》提出“鼓励设立社会性数据经纪机构,规范开展数据要素市场流通中介服务。”2022年5月,广州市海珠区公布了首批“数据经纪人”名单,并进一步将其定位为数据供需匹配的撮合者、数据流通交易的中介者、数据权益冲突的化解者,承担受托行权、风险控制、价值挖掘等作用。
虽然数商、数字经济中介、数据经纪人的概念和具体范围有所差异,但这些数据要素市场新主体的定位逐步清晰,除直接供需方以外的第三方数据服务商在连接匹配数据资源中的重要性日益凸显。
3. 新设施:从分散对接到统一数据空间
为解决数据供需方分散、对接不畅等问题,欧盟力图建设“单一数据市场”,率先提出打造国际数据空间(International Data Space,IDS)。国际数据空间是通过标准化的通信接口、统一的连接与交互网络等架构设计,实现国际间数据可信流通的整体技术设施。欧盟作为IDS的主要发起者和倡导者,在架构搭建、机制设计、行业生态等方面已形成领先优势。
我国借鉴数据空间理念,垂直领域内的工业数据空间开始探索。
《“十四五”大数据产业发展规划》提出“率先在工业等领域建设安全可信的数据共享空间”。工业数据空间的目标是着力提高技术互操作性,降低工业数据使用成本,实现工业数据在不同利益相关方之间安全、透明的共享和交易。从表现形式和实现目标上讲,工业数据空间与数据交易所有相似之处,都是实现供需双方安全对接的中间平台。但工业数据空间更侧重表现为实现数据、算力等资源共享流通的基础设施,支持供需方数据在工业数据空间内部共享开发。
当前我国工业数据空间具体解决方案仍为点状探索。目前我国工业数据空间建设主要由个别头部企业发起,建设方案不尽相同。例如,华为基于国际数据空间参考架构,研发为产业生态圈企业服务的一对一数据共享流通平台,可进行程序自实现的跨企业数据可信流通;阿里云建设了基于隐私计算的DataTrust平台,可安全接入各品牌自有数据,在原始数据不出本地的情况下实现数据计算结果的共享流通。
2022年1月19日,中国信通院联合业界共同发起成立“可信工业数据空间生态链”,分5个工作组合力打造可信生态,力图“连点成网”,共同推进共识建设,促进工业数据要素可信共享、交易的沟通合作。
三、数据要素市场培育障碍与探索思路
总体而言,我国数据要素探索处于起步阶段,数据要素市场培育的基础尚不坚实,权利关系、价格机制、流通规则、技术支撑等数据要素市场的构成要件存在诸多障碍,需要不断推进相应的理论研究和制度设计,通过试点应用积累实践经验,持续探索各方面难题的解决方案。
(一)权利归属难以界定,有待建立产权制度
1. 问题分析
数据权属界定的场景与问题复杂,难以达成理论共识。数据权属问题是数据要素市场培育的理论前提,主要关心各主体针对数据所产生的权利义务关系,即围绕数据产生的权利或者权益到底归谁享有。传统生产要素的流通和生产关系的建立都是以生产要素所有权为核心,在所有权基础上围绕使用权、收益权等其他权利进行。
数据权属问题复杂的原因在于,传统生产要素往往具有稀缺性、排他性,拥有清晰的、可分割的客体和明确的、独立的占有主体,传统产权制度设计可以通过评估、登记、监管等机制有效解决权利划分、争议仲裁等问题,而数据作为一种虚拟物品,低成本复制性、潜在的非排他性等特点与现有产权制度核心功能不相兼容,再加上数据主体多元、权利内容多样、场景丰富多变,数据与数据之间,数据涉及的多元主体之间关联交织难以分割,与传统要素主体的确定性、要素关联关系的稳定性和固定性之间也存在矛盾,使得数据权属界定尤为复杂。
制度设计目标与产业实际需求不完全一致,难以凝聚产业共识。目前各界对数据权属问题的探索还没有形成普遍认可的解决方案。对数据权属制度的设计与建设来说,其目标是明确数据的产权结构和归属规则,划定各参与方的权利和责任,通过制度设计保障数据可控。但对产业中实际的数据流通与使用而言,现阶段解决数据权属问题的核心需求,不是决定数据所有权到底赋予谁,而是如何理顺个人、企业、政府等不同主体间的不同权益,优化利益分配。例如,随着互联网平台经济日益发达,个人用户与平台企业之间的权利关系问题日益突出。个人用户在使用平台服务过程中产生的数据是平台企业提升业务效率、创新商业模式、获取垄断地位的核心资源,但用户行为产生的数据究竟归属于谁并不明确。从制度保护原则看,个人用户是企业数据的逻辑起点,理应是数据权利拥有者。从产业实际情形看,数据创造价值的前提是平台的规模化汇聚,独立的个人数据在个人手中不产生价值,将数据产权配置给平台企业才有利于更多经济价值的创造。
我国法律尚未对数据权属做出清晰规定,难以形成规则共识。现有法律多是从保护和监管的角度出发,通过《网络安全法》《数据安全法》《个人信息保护法》等规范数据的利用,但还没有一部法律对各种场景下数据应归谁所有做出明确界定,现行法律也较少涉及数据本身所承载的其他权益关系。司法过程中,目前主要是以《反不正当竞争法》等作为数据权益保护的权宜之计,承认数据具有竞争性利益,但具体的界权规则尚未达成共识,具有较大不确定性,各经营者仍容易频繁陷入因权属不清引发的纠纷之中。
2. 探索思路
面对数据权属相关障碍,应结合顶层设计与实践经验,逐步形成中国特色的数据产权制度体系。《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》指出,要探索建立数据产权制度,推进公共数据、企业数据、个人数据分类分级确权授权使用,探索数据产权结构性分置制度,建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制,健全数据要素权益保护制度。考虑到数据种类、内容和流转形态的复杂性,应结合具体实践经验,对“数据分类分级确权”和“产权分置运行机制”的制度设计进行优化。
一是进一步细化分类分级标准,探索数据分类分级确权授权使用机制。现有的制度框架和实践中,“分类分级”更多仍是概念性的提法,实操性不强。目前,只有《金融数据安全分级指南》等少数特定领域的指南给出若干子类、几百项细分类型和安全等级的数据划分指引,更多行业的分类分级实践还较为粗糙,难以兼顾数据产生过程中所涉主体的权利。同时,大部分个人数据授权过程只有同意和拒绝两种选项,缺乏按照拒绝授权、最小必要授权、部分条件授权、完全授权等级别进行授权管理的尝试。面对众多行业和多元场景,数据的分类分级规则尚不具备可落地性。未来需要依据数据来源、数据主体、敏感程度、应用场景、使用环节等研究数据分类分级的细化标准,探索多类型、多层次的数据确权授权使用机制。
二是结合具体场景,探索产权分置运行的有效机制。数据的持有权和使用权通常掌握在相同主体手中,产权的分置也需要考虑具体场景。非流通场景中,持有权和使用权通常难以分置,基本不存在只有其中一项权利的情形,但经营权需要进一步授权才可行使。流通场景中,持有权、使用权、经营权可分置运行,可分别通过授权进行权利转移,当前最常见的情形是转移数据使用权。然而就具体执行而言,分环节、分步骤、分主体的产权分置还缺乏有效机制,如何在具体业务和技术场景中保障产权分置后的顺利运行还缺乏深入研究。因此,需要区分不同场景,进一步探索产权分置运行中确权、授权、行权、维权等的具体规则。
三是通过权利登记与示范合同推进数据确权探索。数据权利确认的主要表现形式是权利主体拥有一份获得共识、不可篡改的权利声明,可依法采取制度或技术手段开展数据确权登记试点,依托数据交易所等可信第三方机构进行数据资源持有者、数据加工使用者、数据产品经营者等主体的权利登记备案,使数据产权分置运行和权益保护有据可依(如图7)。同时针对市场主体大多一事一议地通过商务合同约束权利与责任的现状,开展试点的过程中,相关机构可依法提供合同示范文本以供参考。2021至2022年,中国信通院云大所《数据交易合同示范文本》系列给出了传统数据集、API接口交付和新兴隐私计算融合结果交付的权责划分模板,为行业内组织间的数据交易提供了指引。
(二)估值定价缺乏依据,有待发挥市场作用
1. 问题分析
数据的估值和定价虽有一定内在联系,但不能完全混为一谈。数据估值是基于数据生产者或使用者的角度,根据数据本身的特点进行价值评估,为价格发现提供参照基准,是相对静态的行为;而数据定价讨论的是市场行为中数据最终按什么价格交割,是动态的行为,它以市场需求和市场竞争为导向,是基于购买者对该数据的价值评估和预期成本的考量,利用市场的价格发现功能进行竞价匹配的过程。
传统的资产评估方法不完全适用于数据要素。传统的资产评估方法包括成本法、收益法和市场法三类。成本法以成本估值,收益法以预期收益折现估值,市场法则是以市场上类似交易的成交价格作为估值参考。对数据的估值来说,应用成本法的问题在于数据生产涉及多元主体,成本不易区分,且贬值因素难以估算;应用收益法时,数据的时效性、使用期限评估又成为难点;应用市场法时,又受制于数据要素市场尚不活跃,缺乏足够案例支持。由于数据预期产生的经济价值与数据具体应用场景、数据要素市场结构高度相关,不同主体间潜在收益、供求关系均有较大的异质性,目前对数据的价值和价格进行统一、标准化规定几乎是不现实的,现有数据估值方法均有其限制,未必能客观准确反映数据的真实价值。
数据产品价格很难根据统一的标准衡量。当前各类数据交易场景或交易平台主要采取卖方定价、协议定价等方式。卖方定价即卖方通过评估自己的数据质量、成本、需方效用给出统一报价,这一过程由卖方主导,缺乏供需双方在市场机制下的博弈互动。协议定价虽然给予供需双方充分的沟通机会,但双方的反复报价议价过程中耗费了大量时间成本,无法形成标准化、大规模、高效率的价格发现机制。如果回归市场的本质要求,数据的价格仍应该遵循价值决定价格、市场供求影响价格的基本逻辑来确定。但由于数据价值的评估尚未形成统一规则,导致参与主体难以确定衡量价格的统一标准。
会计报表核算数据价值价格面临挑战。严格意义上讲,只要数据能进行合理的估值定价,就应当能作为数据资产计入会计报表,数据的估值定价应当与会计计量核算具有一致性。然而按照现行会计准则,数据资产入表存在现实困难。一方面数据价值已部分体现在提升利润、增加客户、降低成本等方面,有重复计量的可能;另一方面企业间数据资产差异较大,存在难以量化的内容,列报口径难以统一。因此,现有的会计核算方法仍无法为数据估值定价提供有效依据。
2. 探索思路
面对数据估值定价的难题,需要结合数据要素自身特点,不断探索科学的数据价值评估方法,结合具体场景有针对性地核算数据要素价值,坚持发挥市场的决定性作用,探索基于估值基础模型的价格发现和形成机制,更好发挥政府作用,对数据价格进行监督和调控。
一是深入研究数据价值评估的理论依据。数据价值在具体的数据应用场景中显现,可将衡量特定场景下数据经济价值的问题作为攻关着力点,建立货币法和非货币法相结合的数据估值框架。在具体场景中,数据集、数据产品作为流通对象,往往有较为清晰的应用目标,可以较为明确地区分出影响数据价值的因素。在此基础上,分类、分场景搭建数据价值评估指标体系和评估模型,运用货币法计算数据的直接经济价值、间接经济价值,运用非货币法从数据自身质量、风险等特性出发,计算数据效用,对货币法计算结果进行修正,提高估值的准确性。
二是开展数据估值定价试点。在数据价值评估指标体系和评估模型的基础上,需要培育专业化的数据资产价值评估机构,在金融、通信、互联网等领域率先开展数据资产价值评估和数据资产入表试点。同时支持试点企业开展数据流通实践,基于数据估值结果形成市场认可的数据价格。在试点过程中,不断完善数据资产价值评估指标体系,收录数据估值定价的典型场景,形成数据估值定价的推广示范案例。
三是建立健全数据要素价格监管制度,探索科学规范的数据定价监测模型。健全的数据价格监管体系是公平竞价的制度保障。针对可能出现的价格歧视、价格严重偏离价值等问题,要通过反不正当竞争、价格异动与风险预警等制度体系建设,对数据要素价格进行有效监管和合理调控。短期内,受制于数据交易市场活跃度和透明度的限制,不完全市场下,数据价格的确定将仍然侧重于供需方的意愿,难以形成有效的数据价格监督机制;未来,成熟市场中,可基于基础价格、增值价值、异质性价值、风险溢价等各类市场因素建立科学统一的定价监测模型,为数据价格监管和调控提供科学规范的支撑。
(三)流通规则尚不完善,有待鼓励积极探索
1. 问题分析
现有法律法规尚不完善,难以消除市场主体的合规顾虑。法律是合规的底线,《网络安全法》《数据安全法》《个人信息保护法》等现有法律主要对数据的规范利用和安全隐私保护作出原则性规定,但并未就数据流通市场的准入、监管等给出清晰的法律界定。例如,《数据安全法》有规定“从事数据交易中介服务的机构提供服务,应当要求数据提供方说明数据来源,审核交易双方的身份,并留存审核、交易记录”,但没有涉及数据交易双方在交易中的权利义务。在数据流通立法体系尚不完善、数据流通行为缺乏统一监管机制的情况下,面对强监管形势,各类市场主体在探索数据流通的具体问题时缺乏合规风险评估依据,对责任判断没有稳定预期,对数据流通方案的实施存在诸多顾虑。
配套规则体系仍不明确,数据要素流通缺乏有效的激励和权益保护机制。现阶段,我国数据资源化、资产化等过程尚未完成,数据作为资产或商品直接进行流通的理论基础不扎实,数据要素权属界定、分类分级、估值定价、收益分配等方面缺乏系统框架,数据要素流通难以制定明确的配套规则。在此情况下,激励各方参与流通的体制机制尚不具备,保障参与各方权益的共识还未建立,参与方之间信任的建立缺乏规则的指引,使参与各方望而却步。
具体而言,在数据供给环节,数据供方常缺乏提供数据的意愿。除对合规风险的顾虑外,激励机制的缺失也会导致数据供给不足。例如,公共数据开放过程中缺乏对数据进行整理、更新、持续运营的动力,将导致公共数据供给的数量不足、质量不高。事实上,有效的激励机制有助于打造高质量数据供给,如贵州省气象局将持有的气象数据投入市场化运营,打造“气象数据专区”作为省内气象数据的统一出口,利用市场规则实现了交易额回流,保障了数据资源的权威性,形成推动高质量气象数据流通的正反馈。
在供需对接环节,除权责利的界定与分配缺乏共识规约外,市场参与方之间还存在信任壁垒。供方担心需方对数据的使用超出约定,需方担心供方的数据来源不真实、不合规。无论是点对点模式下的供需双方对接还是交易所模式下的市场准入都缺乏标准化的规则参考,现有的企业内部评估审核流程或数据交易机构的资格审核机制相对分散,往往局限于对企业经营情况的审核,而对供方企业的数据来源、供应形式及需方企业的数据用途等方面没有具体的评估审核标准,参与方之间存在的信任壁垒难以打破。
在需方应用环节,现有的数据流通过程和数据流通结果的审计监督机制薄弱。无论是点对点的直接流通还是通过数据交易机构进行的间接流通,通过协议或合同建立的事前信任约束效用有限,一旦数据集交付或接口调用结束,数据提供方很难确认需求方是否按照协议约束对数据进行后续处理和应用。相关系统或平台的日志记录是现阶段最主要的审计依据,但大多只用于统一的计费和清算,很难用日志记录来核验需求方的数据应用方式,数据流通后的结果只能依靠形式核验,使得数据流通的事后审计监督不易实现,相关的信任与合规闭环仍然存在缺口。
2. 探索思路
面对市场主体的顾虑和规则体系的不完善,应以审慎包容的态度鼓励各主体积极探索,加快研究制定监督管理和权益保障规则。
一是建立容错免责机制,划定法律监管红线。在数据基础制度体系研究制定过程中,应先行划定法律法规红线,明确合规监管底线,建立容错免责机制,分类清理规范不适应数据要素流通发展需要的行政许可、资质资格等事项,为数据流通参与主体的探索提供稳定预期,进一步释放各主体创新活力和内生动力。
二是持续鼓励并推进地方及行业的数据要素市场规则探索。当前各地正在围绕数据要素市场建设开展先行先试。如,北京率先提出“财政补贴”方案,北京市朝阳区政府提出“对企业上年度数据交易总金额达到500万元以上且企业上年度营业收入实现正增长的,按照年度实际数据交易总额的10%给予补贴”。这是我国首个公开的由政府对于数据交易参与方进行直接补助的文件,探索通过经济手段激发企业数据交易热情。
三是借鉴传统要素市场经验,推动数据要素市场规则建设。数据要素的诸多特性使得难以照搬传统要素市场的模式,但是通过分析各个要素市场的基本情况可以发现以下共性,它们都是激励主体参与、维护市场秩序的重要因素:一是依托各类登记管理办法,通过登记实现交易基础和交易行为的认定;二是有《土地管理法》《证券法》《促进科技成果转发法》等明确的监管规则保障市场秩序;三是有交易磋商、资信评级、中介代理等配套的服务体系。上述经验为探索数据要素登记、建立数据流通规则与监管体系、培育多元数据交易服务商提供了宝贵参考。
四是逐步探索多层次的数据要素市场体系。除散点式探索外,推进数据要素市场建设还应结合传统要素市场的发展思路和我国数据流通的发展现状,坚持场内外相结合的发展思路,结合数据流通的不同形态探索多层次的数据要素市场体系建设,分别建立各层市场的监督管理机制,更好发挥市场主体在各层市场中的作用。
第一层是数据登记市场,实现数据资源归集、权属确认,要能做到一地登记,全国共享;第二层是数据产品市场,实现数据加工使用权的流通;第三层是数据衍生品市场,实现各类基于数据加工处理形成的数据商品、应用或服务的交易(如图8)。
来源:中国信息通信研究院
(四)流通技术仍未成熟,有待强化技术支撑
1. 问题分析
数据在多主体间的安全流转过程需要恰当成熟的技术工具支撑。数据安全和隐私保护是数据流通的前提,流通的数据可能侵犯个人隐私,也可能减损企业的商业秘密和知识产权。由于数据可以低成本复制,屡发的数据泄漏、越权滥用等事件加剧了人们的不信任感,各主体均有对数据出域后失控的顾虑。因此,如何在保护数据安全和隐私的同时保证数据的可用性成为数据流通中的迫切需求。
数据流通涉及诸多技术环节的协同,现阶段数据安全流通技术体系尚未完全成熟。面对数据流通的多元模式,现有技术还不能完全满足实际场景下的落地应用需求。如何实现在原始数据可见的形态下保证流通的数据不被复制、篡改,目前尚无可行的技术解。以数据脱敏、数据失真为代表的技术可以以较低成本隐藏敏感信息,使得经过处理的数据无法识别特定自然人或秘密,且不能复原,从而可以将数据转化为可以安全流通的形态。但这类技术会改变原始数据形态,导致大量数据信息损失,价值大幅降低。
近年来,隐私计算技术和产业逐渐火热,被视为解决数据要素流通难题的关键技术。这种技术是指在保证数据提供方不泄漏原始数据的前提下,对数据进行分析计算的一系列信息技术。通过对个人信息等敏感数据的加密保护和专门的通信和算法协议设计,隐私计算可以实现“原始数据不出域”,保障数据在流通与融合过程中的“可用不可见”,只实现数据价值的转移,有效解决数据流通后潜在的失控问题。
尽管隐私计算技术发展如火如荼,但它在性能、安全和数据的互联互通等方面仍然存在挑战,较高的技术成本也让众多企业望而却步,这些难题在一定程度上限制了隐私计算的推广和应用。
性能瓶颈阻碍隐私计算规模化应用。根据测试结果,国内隐私计算产品在特定场景下已基本具备可用性,但在面临更多数据方、更大数据量、更复杂场景时,隐私计算需要极大的通信开销和计算开销,大多数企业难以承担,因而性能等指标仍须继续优化加强。
安全合规挑战影响市场信任。任何信息技术产品都没有绝对的安全,算法协议安全和开发应用安全是隐私计算产品安全性的两大挑战。隐私计算中的联邦学习技术路线虽然性能开销相对较少,但将梯度等中间因子传输给其他参与方的过程中,存在从梯度信息反推出原始数据的可能,导致原始数据存在泄漏风险。可信执行环境技术路线依赖可信硬件,而高性能硬件主要依靠境外厂商提供,依赖境外进行远程认证,给数据的安全可信带来较大挑战。而法律法规不会为技术细节背书,使用隐私计算无法完全规避安全合规风险。
互联互通壁垒或使“数据孤岛”变“数据群岛”。由于隐私计算底层技术和上层开发设计多样复杂,不同技术产品间无法互认、互用,因而可能将“数据孤岛”催生转化为“数据群岛”。现阶段,各技术厂商都在探索异构隐私计算互联互通的实现,但尚未出现完全成熟的案例。
2. 探索思路
历史经验表明,技术往往可以为产业发展瓶颈带来新的解决方案,甚至引发经济社会的整体变革。以隐私计算为代表的数据安全流通技术是数据要素市场建设破局的关键之一。面对现有技术体系尚不完全、技术应用成本较高、大规模落地艰难等问题,需要从技术融合互补、核心技术攻关、强化市场认知、技术合规监管四个方面协同推进,为构建完善的数据要素市场关键基础设施提供有效支撑。
一是推动多元前沿技术的融合互补。任何单一技术都不能一蹴而就地解决制约数据要素市场建设的所有问题,每项技术都只能针对性地解决数据要素市场建设过程中的某个具体问题,因而各项技术需要相互融合才能构成数据要素市场建设的有力支撑。例如,隐私计算与区块链的结合已成为数据要素安全流通的一大探索方向。区块链和隐私计算都融合了密码学理论以增强安全。结合隐私计算,区块链可获得数据保密能力,增强数据在链上全节点流转过程中的安全性;借助区块链,隐私计算的过程数据和关键计算环节等信息通过上链实现存证回溯,将有力提升隐私计算任务的可验证性。因此,要鼓励产学研合作,推动区块链、隐私计算以及云计算、人工智能等技术的深度融合与协同。
二是持续攻关核心技术。当前隐私计算仍在加速成熟,硬件加速在隐私计算性能提升方面正在发挥越来越关键的作用,软硬件协同优化性能将提升技术可用性。分布式隐私计算逐渐应用,为解决隐私计算的瓶颈提供了优秀实践。这些技术进展都为核心技术攻关奠定了基础。从长期发展来看,跨技术路径、跨系统平台之间的隐私计算技术工具的互联互通将成为广泛需求,要继续推进互联互通的实践探索,不断降低应用门槛。对于数据要素市场最理想的技术支撑方案,即同时保障数据可见、可用又可控的创新技术方案,需要鼓励各界勇于探索和尝试,以新技术、新模式牵引数据流通的新需求。
三是强化技术应用的市场认知。支持企业开展数据流通技术应用实践,收录典型场景,形成技术应用指南和推广示范案例。鼓励企业搭建隐私计算等关键技术的开源框架,将更多的参与方吸引到数据要素关键技术的开发中,以开源带动生态,以开源促进安全。可依托数据交易机构,充分发挥区块链、隐私计算等技术的独特优势,搭建数据权利登记认定平台、数据流通合规监测平台等,加强对数据流通渠道的溯源和监控。
四是加快完善技术合规监管体系。虽然监管层面逐步认可并鼓励应用隐私计算,企业对于应用隐私计算是否能够应对监管要求仍有疑问。需要出台针对数据流通关键技术应用的具体指导意见和标准规范,为企业的技术实践提供明确依据。同时,技术发展会随着合规要求的不断变化而动态演变。随着攻击手段和破解技术的不断发展,合规要求将不断更新,技术的发展也应随之动态演变。
四、数据要素发展展望
“十三五”时期,我国深入实施数字经济发展战略,数据要素的价值获得广泛认识。但是,许多组织对数据应用的感知仍然模糊,覆盖生产活动全流程、全产业链的数据链仍不完善,无法有效利用数据支持业务运转、贯通和智慧化、智能化决策,数据的价值潜力还没有充分释放。发挥数据作用是为了解决生产中的问题,提高生产效率,数据要素应作为新动能而不是目的本身。组织内部对于数据的业务应用、技术手段和管理方式如果还不完善,数据在发挥生产要素价值方面将既无需求也无能力。未来应牢牢抓住业务发展的核心问题,深入分析数据应用的具体路径,持续推动数据要素在业务贯通、数智决策方面的价值释放。
“十四五”时期,我国数据要素市场体系将初步建立,数据作为生产要素的三次价值将全面发挥,推动研发、生产、流通、服务、消费全价值链协同。数据管理专业化程度将进一步加强,优质数据要素供给得到激活。数据确权、定价、交易将有序开展,数据要素可信流通的认可度与规模不断扩大。与数据要素价值和贡献相适应的收益分配机制有望建立,市场主体创新创造活力将进一步释放,最终形成全体人民共享数据要素发展红利的新格局。在这一过程中,面对数据要素供给、应用、流通的重重障碍,我们期待政产学研各界加快创新突破,因势利导促进数据要素全面健康发展。
一是充分开展数据要素基本问题研究。当前仍有许多数据要素基本问题为数据要素相关理论和实践框架带来挑战,例如,业界投入生产的数据有哪些具体形态,有哪些共性、规律和创新的方向;数据要素价值的产生机理究竟是怎样的,独特价值和潜在收益如何区分和衡量;数据要素相关的权责利究竟如何界定,培育安全有序高效的市场有何策略等。要鼓励各界的学术争鸣,尽快澄清相关概念与机理,为难以达成共识的问题提出解决方案。
二是推进数据要素应用与流通的创新探索。完善数据采集、数据质量、数据管理等标准体系,引导各组织机构逐步提高数据管理意识和能力,提升数据要素应用与流通的供给质量;以高价值公共数据为突破口,吸引和带动更多商业数据与公共数据进行融合应用,发挥各行业央企、国企和龙头企业的带头作用,形成一批具有行业特色的数据应用精品样板,积极探索提升数据应用的广度和深度,打造数据要素融合创新应用典范;建立健全数据要素法律制度体系,鼓励大型央国企和互联网平台企业参与数据要素市场建设,培育多元市场主体,明确数据要素市场准入、监督和权益保障规则,规范引导数据流通行为,营造审慎包容的探索氛围。
三是鼓励数据要素相关技术研发创新。着眼数据要素生产、采集、存储、加工、分析、安全保护各环节,持续推进自主可控技术工具研发,鼓励人工智能、区块链、隐私计算等前沿技术创新,尽快突破性能、安全、成本等瓶颈;提升各环节通用技术水平,鼓励技术开源,提高相关技术工具的自动化、智能化水平,降低技术使用门槛;制定技术应用合规指引,在实际业务中依法依规应用、迭代新兴技术,着重发挥技术在解决难题过程中的巨大作用。
“筚路蓝缕,以启山林”。各界对数据要素的探索刚刚起步,新事物、新经济的发展不可能一帆风顺。前路虽艰难,曙光也初现。党的二十大报告指出,要加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。我们相信,在我国海量数据和丰富应用场景优势的驱动下,更多的数据技术和应用创新将全面落地,数据采集、数据治理、数据流通、数据开发利用、数据安全保护等各方面将协同推进,数据要素规模化产业集群和规范化产业生态将逐步形成,数据要素的价值将得到充分挖掘和释放,从而进一步促进数字经济和实体经济深度融合,助力数字经济高质量可持续发展。
参考文献
[1] 国务院办公厅.要素市场化配置综合改革试点总体方案[EB/OL].2021.http://www.gov.cn/zhengce/content/2022-01/06/content_5666681.htm.
[2] 国务院.“十四五”数字经济发展规划[EB/OL].2021.http://www.gov.cn/zhengce/content/2022-01/12/content_5667817.htm.
[3] 中共中央,国务院.关于加快建设全国统一大市场的意见[EB/OL].2022.http://www.gov.cn/gongbao/content/2022/content_5687499.htm.
[4] 国务院.关于加强数字政府建设的指导意见[EB/OL].,2022.http://www.gov.cn/zhengce/content/2022-06/23/content_5697299.htm.
[5] 中国信息通信研究院.大数据白皮书[R].2021.
[6] 隐私计算联盟,中国信通院云大所.隐私计算白皮书(2021年)[R].2021.
[7] 华中师范大学信息管理学院,湖北省数据治理与智能决策研究中心.中国政府开放数据利用研究报告(2022)[R].2022.
[8] 复旦大学数字与移动治理实验室.中国地方政府数据开放报告
(2021年度)[R].2022.
[9] 中国网络空间研究院.中国互联网发展报告(2021)[R].2021.
[10] 中国电子信息行业联合会,清华大学公共管理学院.中国政务数据治理发展报告(2021年)[R].2020.
[11]Rosenberg,Daniel.DatabeforetheFact[C]//”RawData”IsanOxymoron[A].Cambridge:MITPress,2013.
[12] 胡翌霖.什么是技术[M].长沙:湖南科学技术出版社,2020.
[13] 郭明军,王建东,安小米等.政务数据与社会数据平台化对接的演进历程及政策启示[J].电子政务,2020(03):32-39.
[14] 童楠楠,窦悦,刘钊因.中国特色数据要素产权制度体系构建研究[J].电子政务,2022(02):12-20.
[15] 王超贤,张伟东,颜蒙.数据越多越好吗——对数据要素报酬性质的跨学科分析[J].中国工业经济,2022(07):46-66.
[16] 张莉,卞靖.数据要素定价问题探析[J].中国物价,2022(04):116-118.
[17] 魏凯,闫树,吕艾临.数据要素市场化进展综述[J].信息通信技术与政策,2022(08):59-64.
[18] 尹西明,林镇阳,陈劲等.数据要素价值化生态系统建构与市场化配置机制研究[J].科技进步与对策,2022,中国知网网络首发.
[19] 丁晓东.数据交易如何破局——数据要素市场中的阿罗信息悖论与法律应对[J].东方法学,2022(02):144-158.
[20] 许可.数据交易流通的三元治理:技术、标准与法律[J].吉首大学学报(社会科学版),2022(01):96-105.
[21] 贾轩,白玉真,马智华.隐私计算应用场景综述[J].信息通信技术与政策,2022(05):45-52.
白皮书PPT解读
2023年1月7日,“2023年中国信通院ICT+深度观察报告会”数据要素分论坛在京举办,中国信息通信研究院(以下简称“中国信通院”)发布了《数据要素白皮书(2022年)》,中国信通院副院长魏亮对白皮书进行了深度解读。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
来源:中国信息通信研究院
下载本白皮书: 数据要素白皮书(2022年).pdf
【END】