穿越迷雾,数据“二十条”如何搭建基础制度?

中国数据基础制度体系正在建成。图文无关。(视觉中国/图)

数据,已经成为继土地、技术、劳动力、资本之后的第五大生产要素,但数据要素流通却始终障碍重重。

2022年12月,《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》发布,被业内称为数据“二十条”,与数据安全法、个人信息保护法共同构成数据要素产业的“基石性”文件。

数据“二十条”明确提出了数据产权制度、数据要素流通与交易制度、数据要素收益分配制度和数据要素治理制度。

“这个圈子不大,每次政策发布,圈子里就会迎来新朋友。”张瑶说。他是数据交易网创始人,数据交易网创办于2021年,作为一家垂直领域的媒体,张瑶对数据产业近两年的发展有着直观感受,“数据供需方通常比较低调,数据交易所、律所、隐私计算、数据服务商比较活跃。”

对于参与各方而言,数据“二十条”使有的问题探索多年终于得以确认,也有问题依然待解。

公共数据授权运营

创办数据宝前,汤寒林在上海创办了一家企业,做搜索引擎和精准营销,由于长期与数据打交道,他深谙各类数据价值。贵州数据宝网络科技有限公司成立于2016年,从事公共数据代运营服务,也是华东江苏数据交易所的运营方。

“个人数据、企业数据和公共数据中,公共数据价值最高。”汤寒林坚信这一判断,因为个人数据开发成本高、投资回报率低,企业数据难以覆盖全域且自身缺少开放动力,而公共数据规模大、覆盖面广,更易满足市场需求。

公共数据,通常指国家机关、公共管理及服务机构依照法律相关规定,在履行职务过程中获取、采集、处理、生产、存储的数据资源。

2015年国务院发布《促进大数据发展行动纲要》,明确提出稳步推进公共数据资源开放,以政务数据的公开共享,引导企业、行业协会、科研机构和社会组织参与数据开放。

2012年上海在全国率先探索公共数据资源开放工作。2021年,上海市国资委首次试点国有企业数据资产化,将数据资产纳入国资保值增值考核。

汤寒林将政府公共数据代运营作为数据宝的核心业务。“代”字意味着,数据宝是作为第三方服务机构协助运营公共数据,公共数据的持有人依然是政府部门。

撬动政务数据最难的是取得政府部门的信任,“数据安全”是头等大事。“很多人理解的‘数据安全’只是保护个人隐私,但最核心的问题在于数据主权安全。”

意识到这一点,汤寒林做了一个不同的决定。同期,大部分有能力的数据运营企业的融资方或多或少有外资背景,但汤寒林只选择了有国资背景的融资方。

汤寒林给政府部门的解决方案是,通过模型类和核验类的数据产品实现公共数据开放,不直接接触数据,源数据仍留在相关部委的数据库。

以核验类产品为例,数据需求方无法获得源数据,只需获得用户授权,便可核验授权信息,通过校验结果来辨别真伪。

目前,已有多地通过构建地方法规的方式,明确公共数据授权运营的基本原则。在此基础上,数据“二十条”更明确地指出公共数据的分级分类授权制度。公共数据可以在保证个人隐私和公共安全的前提下,通过模型、核验等产品和服务向社会提供。尤其是用于产业发展、行业发展的公共数据可以有条件地有偿使用。

“这等于说,我们过去所做的探索得到了‘白纸黑字’的肯定。”汤寒林语气中难掩兴奋。

淡化所有权,强调产权

“过去我们是代运营,未来‘代’字都可以拿掉。”汤寒林的底气来自数据“二十条”中提及的“三权”分置数据产权制度。

“三权”指数据资源持有权、数据加工使用权和数据产品经营权。值得注意的是,数据“二十条”中并未提及数据的所有权。

清华大学社会科学学院经济所所长、教授汤珂向南方周末记者介绍,持有权属于数据的采集方和管理方,而信息(数据)所有权属于提供数据的主体,数据加工和流通环节更多涉及的是数据资源的加工使用权和数据产品的经营权。

在汤寒林看来,采集信息的政府部门、公共管理及服务机构拥有数据资源的持有权。像数据宝这类第三方服务机构则享有数据加工使用权和数据产品经营权。数据“二十条”中明确肯定数据要素收益向数据价值和使用价值的创造者倾斜。

汤珂表示,分享数据收益,前提是明确获益主体,在数据交易前还需要进行数据确权。目前,数据确权主要通过登记的方式,“但如何登记,具体的方法及流程都还需要进一步探讨”。

人民数据资产服务平台是中国首个数据确权平台。人民数据总经理郑光魁回应南方周末记者称,该平台初期仅针对企业数据资产,采取主体权属登记数据所有权的形式进行确权。

郑光魁表示,进入2.0阶段后,平台对数据持有权、加工使用权和经营权进行确权,涵盖企业数据和个人数据的确权、授权、行权,以数据确权为核心覆盖数据要素流转的全生命周期。

数据要素流转全生命周期,包括数据交易前的安全合规审查、数据确权授权、数据资产化、数据交易流通及数据流通监管等。这些内容与各地的大数据交易所提供的服务基本相同。

不少数据交易所也提供数据产品登记服务。例如华东江苏大数据交易中心出具的数据产品证书上印有证书编号、产品名、申请人、产品形态、更新周期、覆盖范围、应用领域,及产品上架、登记和到期时间。证书有效期通常为一年。

当前国家没有法律规定数据必须确权才能进入市场交易。

数据的权属、收益问题,涉及每一个人。图文无关。(视觉中国/图)

“数据可见不可用”

除了数据权属问题,安全性也是数据交易流通中的另一障碍。

翼方健数成立于2016年,是一家提供隐私安全计算服务的高科技企业。翼方健数首席战略官许晓峰向南方周末记者回忆,早期大量数据交易是原始数据以拷贝的形式进行的,他们团队开始思考,究竟使用数据的什么内容?

得出的结论是,数据价值不在于原始数据,而是经过计算统计后的数据结果。原始数据本身也不能以复制的方式流通,否则将给社会带来严重的信息安全风险。

解决这一问题的最好办法是“只分享计算结果,不分享原始数据”。数据“二十条”将其表述为“数据可用不可见”。

当团队成员带着这一理念与各行各业接触时,医疗、金融和营销三大领域的企业或机构给出最为积极的反馈。这三个领域的共性在于,既对数字化程度有较高要求,又要避免因处理不当引发重大隐私泄露风险等严重后果。

许晓峰从事医疗信息化工作近20年。在医院里,医生撰写一份病历往往耗时1-2小时。虽然耗时费力,但不管出于保障医疗质量、法律合规和医疗安全或是未来研究的考虑,医生必须完成医疗文书写作。

想提高工作效率,就要建立医疗病历模板。这要将病历转化为智能化模型,根据不同症状,提供不同诊断方案,自动生成病历模板,医生只要对个性化信息进行补录,就可以完成一份病历写作。工作时间缩短至20分钟,有的甚至结合智能语音技术一键生成。

以现在的人工智能技术来说,形成这类模式不难,但医院必须把若干年的患者病历文书数据复制给人工智能厂商。即使通过伦理审核、确保操作流程合规,谁也无法保证不会出现病例数据泄露风险或人工智能厂商截留数据的情况,产生病患个人信息泄露风险。

许晓峰说,正是出于对数据安全的顾虑,医院一直对智能化技术的引进持谨慎态度。

隐私安全计算则是在医院内部搭建平台,数据上传后,该平台只会信任医院数据管理者账号,该账号可以在平台内授权给某家人工智能厂商,被授权厂商借助平台相关建模工具完成开发。经过加工后的数据以模型化、结构化的形态转变为数据资产。

目前,隐私数据技术也在数据交易所发挥作用。许晓峰介绍,翼方健数曾参与上海数据交易所IT交易架构设计,提出交易、交付松耦合的系统架构。数据交易所不接触数据,自然也不会发生数据留存的情况。场景授权也会自动判断数据需求方的使用场景,避免超出允许范围的数据应用。

此类方案恰好符合数据“二十条”所提出的,结合数据流通范围、影响程度、潜在风险,区分使用场景和用途用量,建立数据分类分级授权使用规范。

进场交易成本高

数据交易在互联网产生之初就已经存在。过去的数据交易属于企业间的商业行为,法律监管约束不足,不乏买卖交易源数据的情况,这也形成数据黑产和个人信息安全隐患。

大数据交易所正是为了规范数据交易行为而产生的,但大数据交易所至今仍受困于数据交易量不足的问题。业内流传的一句话点出数据交易所的窘境,“数据交易不需要数据交易所,但数据交易所需要数据交易。”

大量交易活跃在场外,数据黑产甚嚣尘上。2021年1月,国务院、发改委等九部门接连发布政策文件,多次提到“打击数据黑市交易”。

“场外交易和黑市交易不同。”汤珂解释,中国当前大量数据交易在场外完成,只要双方出于自愿,交易合法合规的数据产品,签署规范的交易合同就会受到认可。而黑市数据往往是未授权流转和买卖的数据,黑市数据或侵犯个人隐私,或危害国家安全。

数据交易网创始人张瑶介绍,场外交易也需要完整的数据授权链,需求方往往会要求数据持有方提供数据源的授权文件,“合规要求不亚于场内交易”。

多位受访者总结场内交易冷淡的原因,一是合规成本较高,除去数据交易所的服务费,挂牌交易前需由第三方机构出具数据合规报告、质量评估报告等文书;二是场内数据产品少,难以准确匹配数据需求;三是供需双方不愿意公开数据交易情况;四是法律并未强制数据入场交易。

目前,各地数据交易所挂牌以公共数据为主,企业数据较少。而且数据交易所的供需双方必须是数据交易型企业,个人或非此类企业很难达成交易。

对于某个垂直领域的企业而言,通常会直接向数据持有方购买相关服务。一位美妆行业从业者透露,工作中常常使用的广告营销数据、商品销售数据,往往掌握在大型互联网企业手中。

汤珂介绍,由于“信息悖论”,数据交易主体间天然存在“不信任”。数据需求方购买前无法获知数据全貌,数据供给方无法掌控数据信息交易后的数据使用与再流转,这时候需要第三方监管交易与协助建立双方信任,数据交易所的作用就在于此。

由于场内交易经由数据交易所,所有环节都得到存证,一旦发生争议需要仲裁,方便双方提供证据,这也是对数据交易者的保护。

“我个人还是看好场内交易。”广和律师事务所信息网络委主任丁振赣分析,政务数据是支撑数据要素流通的重要拼图,也是核验真伪质量最高的数据源。政务数据、公共数据未来可能主要还是通过数据交易所完成交易流通。

对于场内外差异,数据“二十条”也只是提出“场内外结合”,“引导场内交易,壮大场外交易”。

做数据行业的“券商”

进场挂牌交易前,必不可少地要遵循确权、合规审查、质量评估等一系列操作流程,这些服务少不了第三方机构。

丁振赣拥有多年数据合规经验,2022年初,深圳数据交易所要求进场交易的企业提交数据合规同意书,他正式进入数据流通交易服务市场。

他发现不少企业对自己在数据要素市场中的角色认识不清,“甚至连自己是数据持有方还是数据服务方都弄不清楚”。

大部分数据持有方担心触碰法律红线不敢将持有的数据释放出来。同时,企业将数据释放出来流通交易,会面临很大一笔的合规支出,在收益不明确的情况,企业驱动力不足。

当前市场交易规则的矛盾在于,开放数据面对的是已知的风险成本和未知的收益回报,“很多企业干脆就不碰了。”丁振赣说,这就需要数据经纪人的角色,有判断市场、预估收益、识别风险、解决合规问题的综合能力,简单理解就是数据交易流通领域的“券商”,为流通主体提供服务,又能为监管机构提供完整的合规证明。

2021年7月《广东省数据要素市场化配置改革行动方案》发布,提及“数据经纪人制度”。次年,广州、深圳、顺德、江门多地开始试点。

2022年4月,丁振赣发起设立数据经纪(深圳)有限公司。这家公司是中国首家以数据经纪为主营业务和登记名称的企业。它在5月底为顺丰科技有限公司和圣辉征信有限公司的数据流通交易设计了中国首套数据经纪交易结构,这一合作在贵阳大数据交易所完成。

他解释这是一套“没有输家”的服务模式:数据经纪人识别数据供给方的数据利用价值,承担流通前相关服务成本,待数据供给方获益后,按约定比例向数据经纪人分配收益。在上述案例中,双方签订五年以上服务期,“毕竟没有企业会购买供应不稳定的数据源”。同时数据经纪人也与数据交易所、第三方服务提供方签订长期合作协议,并按约定分配收益。

数据“二十条”鼓励培育数据流通交易的服务生态,列举了包括数据经纪在内的11类第三方服务机构,还特别提到培育“数据商”,为数据交易双方提供数据产品开发、发布、承销和数据资产的合规化、标准化、增值化服务。

把定价交给市场

相比以往文件,数据“二十条”在定价问题上给出了相对明确的操作指引:公共数据按政府指导价有偿使用,企业与个人信息数据由市场自主定价。

汤珂表示,数据有非标准化的特点,无论是场内还是场外,数据产品的交易主要通过买卖双方“讨价还价”确定价格。由于买卖双方不同,数据使用权限、场景、期限不同,同一份数据的交易价格也可能不同。“不应该用标准化产品的交易来理解数据交易”。

但目前公共数据尚未出台指导价。汤珂认为,通常来说,谁享受数据收益,谁有权利制定价格,但定价需要接受监督。

比如各地政府将公共数据经营收益权授权给国有企业,以数据产品的形式进场交易。定价原则应是产品价格基本覆盖成本,保留薄利以维持数据加工方生产经营,不宜过度追求收益,尽可能扩大数据流通。

尤其是上海试点国有企业的数据资产入表后,也会逐渐涉及数据资产估值。汤珂介绍,较为常用的估值方法是成本法、收益法和市场法,但由于数据资产未来收益通常较难厘清,市场交易数量有限,而成本已确认发生,目前更多人倾向于使用成本法。

此外,数据“二十条”还提到,“依法依规维护数据资源资产权益,探索个人、企业、公共数据分享价值收益的方式”。

汤珂解释,信息(数据)所有权属于提供信息的主体,信息提供方的收益往往体现在企业或平台为其提供服务的对价。数据的持有和运营方应保证数据信息所有权人不被侵犯。

谈及数据确权及定价等政策,大多数业内受访者态度统一,“行业发展初期,法律法规不宜规定太细太死,还是尽量交给市场。”

南方周末记者 周小铃 南方周末实习生 周冀

展开阅读全文

页面更新:2024-04-22

标签:确权   数据   病历   场内   迷雾   交易所   要素   收益   资产   制度   基础   产品   企业

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top