当前位置:主页 > 评论 > 观点 >
    大数据共享与开放及保护所面临的挑战
      时间:2017-03-29 10:29 作 者:邬贺铨

现在大数据本身有物理空间的数据,有信息空间的书局,还有智慧空间的数据,这是三元数据。作为网络层面的数据有自媒体数据、富媒体数据、基层网络数据、日志数据,麦肯锡曾经讲过大数据的利用能给美国的保健、欧洲公共管理服务的提供者分别带来3000美元、2500亿欧元和6000亿美元的年度价值,会给经销商带来60%的利润增加,会给制造业带来50%的成本降低。麦肯锡曾经统计过,受教育、运输、消费产品、电力、游戏、保健,如果政府开创数据,大约在保证国家安全和公民隐私的情况下开放数据,可以带来年度的全球经济价值32000亿美元到54000亿美元,所以大数据本身带来的产业价值是很大的。

  首先说共享,国务院关于促进大数据发展的行动纲要里提到推动政府信息系统和公共数据的互联共享,消费信息孤岛,避免重复建设和数据打架,增强政府的公信力,促进社会信用体系建设。大数据共享是谈什么共享呢?政府部门之间的数据共享、跨行政区域政府间的信息共享、政府与企业间的数据的合作和共享、企事业单位之间的数据共享,这是很多方面的,当然我们可以先看政府层面的。需要设立大数据协同管理机构促进政府部门间的数据共享,必须有很多政府间合作才有很大得数据量,但是必须要健全地制造框架和制度体系,明确共享什么,明确参与共享的责任和义务,要有互利,否则共享是很难持久的。现在一些城市设立大数据局来做这个工作,比如广州大数据管理局,主要做协调政府内部的信息平台的共享,怎么打破部门之间的信息壁垒,共享各项民生数据。

  另外需要建立进一步的基础数据库,一方面是要集中存储被共享的数据,同时进行清晰、校验和整合,提供可以共享的目录,以便用户可以接入和收取这些数据。当然还要规定访问的权限,跟你没关的数据你不见得都需要去访问。还要灾备等等。

  这是政府基础数据共享与交换平台,首先包括人口数据、空间地理数据、宏观地理数据、医疗数据、经济数据,进行融合、重组、转换、关联、安全。提供服务可以提供部门之间综合的服务,部门企业政府的数据共享。

  按照行动纲要的要求,明年中央就要构建形成统一的互联网数据平台,习总书记讲要建立全国统一的数据集中的平台,当然这是逻辑上的统一,是不是物理上都是统一,这可以研究。有一些跨神经区域的大数据共享合作的例子,这里讲的是连云港有个区是跨山东和江苏的,跨两个省,它彻底打破了行政区划的限制,整合了山东和江苏相邻的几个地方的监控图像数据,要做统计分析、轨迹展示、布防布控,实现一键查询、统一风控报警、快速判定行窃轨迹等等,目前通过这个平台抓获了国内违反犯罪人员500多名,破案400余起,这仅仅是这一个区和周边五个县就已经取得这么好的成效。这是跨部门的大数据共享,发展行动纲要提出要加快建立公民法人和其他组织的统一社会信用代码制度,要有企业的信息公示系统。目前已经建成了网络执行查获系统,现在已经有13个国家部门、3000多家银行能够查询11类14项,使得全国法院可以了解所有被执行人的情况,实现自动化的精准查询。

  中央政府之间的共享,监察部对其他部门有监督作用,他可以共享其他部门的数据,不见得其他政府部门可以共享他的数据,中纪委的数据不太可能跟其他部门全部共享,部分的数据共享可能是不对称的。中央政府跟地方政府间的数据共享也是不对称的,中央政府可以看到所有地方政府的数据,但是不等于地方政府都能看到中央政府的数据。中央政府共享到什么层次,是省级、市级还有县级现在没有界定。政府数据共享到什么程度,是不是政府与政府部门之间所有工具都是透明的,至少公安部不会跟其他部门的数据透明。

  政府跟企业间的数据共享是不对称的,政府提供给企业的数据本身就是可以公开的数据,除此之外政府也不能只给某个企业提供信息,而不给另一个企业提供信息。从国家安全出发,政府是有权调用企业数据,但除此之外企业是不是有义务一定要向政府提供数据,这是有疑问的。在政府调用企业数据的情况下怎么保证企业的商业秘密不泄露,现在还没有完成规范,企事业单位间的数据共享,这实际上是交易行为。在国家大数据行动纲要提到,2018年要开展政府和社会合作开发大数据的试点,不是简单说政府调用企业的数据,而是政府怎么跟企业合作开发。在关于积极推进互联网+行动计划纲要,开展一批社会治理互联网的应用试点,打通政府部门、企事业单位之间的信息壁垒,利用大数据分析手段提升政府的数据治理能力。政府为了很多数据,很多BAT数据政府是不拥有的,如果政府能把BAT数据融合在一起,对于政府能够掌控社会智慧城市、中国的治理都会有很大的作用。

  2013年在北爱尔兰召开的会议提出了开放数据,发布数据是为了激励创新。开放14个重点领域,这里边非常详细。开放数据三项共同行动,激发国家的行动计划,每年都要评估政府开放数据的情况如何。要求发布的数据不是一般的数据,而是高价值的数据,包括预算、民主、环境,另外不仅仅是发布加工过的数据,还要有源数据,往往我们认为政府发布的数据是加工过的,实际上只要不影响国家安全和公民隐私,很多原始数据政府应该开放。开放的数据是要完整的、重要的、及时的,很重要读,不要对某些公民开放,对某些公民不开放,不能说一定要有授权才能接入,不能开一阵就关掉了。共享是政府部门之间、政府和单位之间,开放是对社会,所以在这点上对开放的要求是很严格的。

  美国政府有个开放网站,有些没有开放,公民提出来要求开放的时候要分析,有些就立即开放,有些经过一段时间开放,因为安全隐私原因没法开放要向政府交代。而且开放数据要屏蔽掉隐私,比如他开放人口数据,是安全编码分区域的人口数据,老龄化的有多少,上学儿童有多少,男的多少女的多少等等,可以看出这个地方的情况,还有用电量、犯罪记录、中小学评估等等,可以判断这个地方的学区房值不值得卖。还有小区的污染、噪声等等。还要注意到美国政府的开放数据同时开放了数据挖掘的工具,帮助老百姓利用这些数据,在政府开放数据的平台收集了老百姓通过挖掘这些数据得出的可视化的结果,所以非常有利于公民对社会的了解。美国开放数据可以开放到很多方面,有交通、空气污染、环境、支付各种。

  这是英国的开放数据,他在网上,比如你的收入是2万英镑,你就点网上,把鼠标拉到2万英镑,得出你一年的税收是8774英镑,你的税收用到哪里,用到政府运行,每天的税收,1.69用在国防,每个人都可以很清楚地看到你的纳税在政府里的应用状况,是阳光透明的。中间的大图是英国总共收到的税收,6948万亿英镑,其中用在各个方面多少钱,就知道政府开支具体的状况。中国政府开放得怎么样?根据不完全统计,中国政府数据开放平台超过40多,其中沿海经济发达地区占总数的70%,西部中部还是比较少的,我们开放了教育、医疗、文体、环境,开放的数据存在什么问题?开放的总量偏低、结构化程度低、数据质量不高、民众参与反馈不准。我们还有很多方面做得不够。

  以北京的政府开放数据为例,去年北京政府主动公开政府信息超过100万条,跟2015年差不多,其中主动公开的文件不到1万件,主动公开的重点政府领域信息73万条,细看一下北京公开的政府信息里主要是关于食品安全标准和食品生产的占了一半,关于企业信用系统占40%,两项加起来占了90%,剩下的只有10%,10%有政府的三公预算、农民征地、政府定价,实际上可以看到还是很不全面的,还有很多可以开放应该开放的数据没有开放。公民关心食品安全,所以这方面的数据比较多。

  联合国电子政务发展指数,有三项,信息基础设施、人力资源、在线服务的情况,其中在线服务跟开放数据有关。我们看到两年统计一次,2016年开放电子政务发展最好是英国,中国排第63位,还是比较靠后的。数据有个晴雨表,开放数据的准备程度、开放数据的执行力,开放了什么类型,质量怎么样,开放数据的影响力、效果、透明性、对环境的影响、对国家经济的影响。根据三方面来评价,2014年中国排在46位,第一位是英国100分,中国只有28分。2015年中国退后了,排在第55位,不是说中国2015年跟2014年比没有前进,而是别的国家前进更多,相比之下中国得分排名反而下降。可以看到我们的影响力,特别是看到2015年的影响力只有8,我们也开放,但是我们开放的效果比较差,只有8,北京开放100万条数据,从应用效果上来看反映还是不够的。政府开放数据需要技术框架来支持,包括开放数据管理、开放数据技术、开放数据的门户。今天我主要不是讲技术,所以不细致地解释这部分了。


来源:中国通信院





发表评论

最新评论
 
 
热点文章
浏览排行