姜春宇:政务大数据标准化现状和趋势

来源:中国IDC圈

点击:1760

A+ A-

所属频道:新闻中心

关键词:大数据 云计算 现状及趋势

    近年来,国家相继出台了多项政策指导和推进云计算发展的产业政策,云计算产业日益成熟。其中,政务云作为云计算向传统产业融合的重点领域,整体行业发展迅猛,备受关注。

    2018年3月21-22日,由中国信息通信研究院主办、中国通信标准化协会支持的"OSCAR云计算开源产业大会"在国家会议中心举行,会议特设“中国政务云发展论坛”,邀请了来自政府、企业和其他机构的代表共同探讨我国政务云发展的政策导向、技术标准情况和发展现状,探索政务云发展的新方向。

    中国信息通信研究院云大所政务大数据负责人姜春宇出席了会议并发表主题演讲。

    姜春宇:感谢续总,感谢各位嘉宾,坚持到现在,现在已经进入下半场。从上面的演讲嘉宾内容来看,好像混入了一个跟云没太多关系的主题。我是来给大家分享一下跟云计算,也是政务里面非常重要的一块,政务大数据标准化现状和趋势。

    我前面有三张片子更多是从政策方面,和现有标准发布情况,给大家一个呈现,第四张片子是一个总结。大家感知一下近期国家层面发布的电子政务和数据相关的一些文件与指引,刚才浪潮朱总也提到了,中间有一个政务信息系统整合共享实施方案,2017年提的。我个人认为,我把国家层面标了三个加重的,一个是信息资源共享管理暂行办法,2016年发的,紧锣密鼓的又发了一个政务信息系统整合共享实施方案,第三个是政务信息资源目录编制指南(试行),发改委和网信办发的,都是这一两年的事,密集发的。刚才我网上搜了一下,大部分省和市都紧锣密鼓跟着国家的步骤发了XX省或者XX市政务信息系统整合共享实施方案,或者政务数据资源共享管理办法。什么原因呢?密集在2016年、2017年时间档发布呢。

    标准化的东西,我们在2007年很早就已经有国家标准了,政务信息资源交换体系2007年,政务信息目录体系2007年,它是两个不同侧面。一个是从技术维度交换共享,你这个应该有哪些功能点,有哪些技术规范和要求,这是交换体系标准解决的问题,目录体系,解决静态目录编写,云数据规范,可以说在07年那个时间档,我们已经有了一系列相对比较规范的标准。为什么在2016年、2017年才会有了目录编制指南?意味着2007年发布这个标准的时候并没有配套相应标准使用方法,正确打开方式并没有配套。我们回过头来再看地方一系列的。

    其实最早发地方标准是北京市,跟国标是一个时间维度上,也说不清楚谁参考了谁,互相都有。北京市最早发布信息共享交换平台技术规范,紧接着山东和广东是在2017年指南出来之后,2018年初发布了一系列标准规范。在这之前,除了北京市有相应的跟随国家标准与地方标准出台,其他的好像并没有相应的跟随标准,而只是等那个指南出来以后,包括一系列东西出来以后,2016年、2017年紧锣密鼓,各个地方政府才开始投入到这场革命里面,或者这场运动里面。什么原因?从时间轴上给大家拉伸一下。

    2006年北京市最早发布信息资源共享交换平台技术规范,国标大概参考了这套体系,陆续发布了两个标准体系,一个是目录,一个是信息资源。过了八年,其实杭州市这个都不算,可能是2016年吧,到2016年,大概九年时间,这其中关于信息资源共享标准再没有新的修订、新的更新,也没有进一步的指导。直到2016年的时候,国务院才发了信息共享暂行管理办法,上海、贵州,大部分省市都紧跟着这个办法发布了自己本省的落地版。2017年国务院又发布了政务信息整合共享实施方案,还有目录编制指南,紧接着所有各省市才动起来。我们中间有八九年是空白的,没干什么,国家层面和地方层面好像都没跟进干过什么,这是很有意思的一个现象,可以值得大家推敲一下。现在在标准体系里面地方做的不错的,现在紧锣密鼓在做的是广东和山东,还有一些其他省市,因为他们出了相应的实施方案,方案里面肯定都写了相应标准规范要出,现在我看到的是广东和山东发了。

    所以,这是时间轴上的。我们拉伸总结一下,之前国家标准是解决什么问题呢?目录体系是解决资源元数据编码规范,交换体系是解决功能架构,但种种原因,这套标准体系并没有被推广起来,这十年来推广进展缓慢,各个地市和地方政府都是根据自己的理解和自己的想法建设系统,包括构建自己里面的数据规范与标准。我也去过很多地方政府交流过,说你们的信息化有没有参考国标或者什么什么的,好像答案都不是特别乐观,可能都没有去参照,也不知道有这么回事。我们观察到了一个很有意思的节点,06、07、08,甚至2010年、2013年以前,我们谈的是政务信息资源,2013年以后有什么概念呢?大数据概念来了,等于说当年我们要在的交换共享体系等大数据时代来了以后,发现又有了新的任务,除了把部门信息系统共享起来,大家数据能够互相打通以外,还面临大数据数据资源的汇集,包括为各个部门提供一套分析支撑的能力。另外一个是数据要形成资源和资产,要对外辐射到整个社会、企业,有一个资产化资产运营的需求。所以突然从2013年又多出两个任务,支撑业务分析,支撑社会对政务数据的需求。这七八年空档期造成它任务变多了。

    我把国务院最近发的三个主要文件给大家详细解读一下,我个人理解它们是三把斧。

    第一个,政务资源共享管理暂行办法,它到底说了什么事呢?确立了一个共享原则,四点:共享是常态,不共享是例外,这是第一个原则。需求导向,无偿使用,部门之间共享,只要是合理需求,你可以提,提完,你可以免费使用。统一标准,统筹建设,不能再自己随便建了。建立机制,保障安全,安全是很重要的。这是四个原则。

    政务信息资源也进行了分类,从共享层面进行了分类,数据分三类,无条件共享、有条件共享和不与共享。第三个,确定了政务信息共享平台定位,分为内网和外网两个部分,支撑各政务部门开展求知欲望信息资源共享交换的国家关键信息基础设施,未来会有进一步定位,这个共享平台到底设立成几级,比如国家级是不是有一个,省是不是有一个,市是不是有一个,到县是不是就没有了。这样的话,市和省之间是不是有一个打通,省和国家层面是不是要有接入,肯定要有这样一个规范出来。第四个,确立分工,发改委网信办出台一个评价办法,很有意思,国家突然意识到以前光推一套标准出来没人用,没人执行,为什么呢?不知道怎么用,用了能干什么,用了以后好坏谁来评估。所以这些原因促使国家连续发了三个文,他来解决的就是他现在要建立一套评价方法。网信办是负责网络安全管理制度,发改委和财政部、网信办还要建立一套项目建设投资和运维经费协商机制,说明评价好坏和后续经费申请是有关系的。这样的话,我觉得这个思路是对头的,我来给你打分,不合格的明年这部分运维费用,或者是建设方面的费用,我就给你砍了,这样的话大家有一个权利在那,你就不得不重视这些事情。

    我们再看一下政务信息系统整合共享实施方案解读,它到底说了什么事。首先它针对的是什么?上一个演讲嘉宾浪潮朱总讲到,僵尸系统太多了,没有备案,哪个部门都随便自己想建一套系统就建了,建的好不好,用不用,坏没坏,有没有监督,花了多少钱,都没有,现在要清理僵尸系统,统一在大平台里面,五个统一原则。工程规划统一,标准规范统一,统一备案管理,统一审计监督和统一的评价体系,这个思路非常清晰,以后要建的这些系统,中间有一个部门要去管理,要去问责,要去了解,知道你的进展。

    它里面还有22项重要细则,总体目标,分两步走,2017年完成国务院各部门系统整合清理工作,2018年6月实现各个部门整合后的政务信息系统统一接入国家数据共享交换平台,要有国家层面大数据共享交换平台。接下来它有10项重要任务来做,包括审清结合加快消除僵尸信息系统,看你都在哪,我要清理你。二是促进内部信息系统整合共享,能整合的都放在一起,别再自己单独建。设施共建,统一数据共享交换平台,开放网站,共享网站等等一系列举措,大概有22项细则。有七项保障措施,包括组织领导,推进落实,我个人觉得比较有意思的是评价考核审计制度,这种制度的建立我觉得才是真正能往下推行的良好机制,没有一套评价考核机制,没有一套审核机制,还有备案机制,很多东西其实是无据可查的,没有办法管理起来。我们再看一下政务信息资源目录编制指南试行版。不知道大家有没有看国标政务信息资源目录,国家标准这个,当时我看的时候也觉得有点抽象。但是这个指南比较好,比较有意思了,可能国家部门也意识到了它的标准没人用的原因是什么了,你给人家一个标准过去,人家不知道这玩艺是啥,它必须附带一个正确打开方式的指南,就像买一个家具,你要给人家家具组装说明书。所以,这就是目录编制的说明书,发出来了。

    首先,它解释了政务信息资源目录分哪几种,从资源维度分基础信息,主题信息,部门信息,基础信息包括人口、法人、自然资源、社会信用。主题信息,比如属于公共服务类的、健康保障、社会保障这些大的类别。从涉密维度来说,只有两个分类,涉密和非涉密,共享维度是三个点:无条件、有条件、不予共享,你的一个数据资源,你的一个表,这个表怎么样描述,目录元数据,有这么一长串的链来描述表是什么情况,名称分类、摘要、共享属性、开放属性、更新日期,每张表作为目录必须填写到目录元数据下面去,这样的话你就很清楚这个表共享类型是什么,信息项是什么,资源格式摘要这些东西全都清楚了,它告诉你目录元数据的格式。第三点,很清楚告诉你目录编写流程,以前光给你格式,不告诉你怎么编。包括前期准备,目录编制与报送,目录汇总与管理,目录更新,这四步每步里还有小的点,包括谁来做这个事情。我个人认为,前几年我们一直没有把这套标准体系推起来和用起来的原因就是缺乏手段,包括标准说明书和指引,以及后续审核评估机制,所以整个标准肯定推不起来。业务系统建设过程中我发现,大部分没有参考国标标准来建设,很落后,有的是人上门查数,在这个电子化时代,很多都是人工的行为,还有专业机构的缺失。我一直认为,政府部门需要一个数据类的,包括系统架构类专业机构的辅佐,包括数据类数据标准建设、运营管理这套东西,挺复杂的,这些东西不是政府单独面临的,大家都面临海量数据涌过来,怎么样做分析和支撑,在银行和运营商这都花了很大力气,有专门人员做这件事,我们的政府部门很缺少这样的专业化人员帮他们做这样的事情。

    还有数据共享权责,我们经常谈责任,很少谈激励,如果愿意去共享,我愿意把我的数拿出来,能不能给我一些好的激励方式,促成我做这件事情。我觉得应该从正面想这些措施。另外,数据的集中又会造就新的权力,数据即权力,很好理解。你管数据,我要用个数就要求你给我看,我跟你关系好,你给我先反馈点,我跟你关系不好,我是不是就不符合你。所以要明确管数据机构的权责是什么,他的定位是什么,不能造就新的武断和权力机构,一定要定位为它是为其他部门服务的机构。还有安全和保护,这个强调很多遍都不为过。

    我再讲讲政务数据治理和数据资产管理,在大数据时代,我认为它是一个新的挑战。以前政府部门想做的很简单,想把数据孤岛打破,比如公安想调一些其他部门的数据,民政部门想用一些公安户口身份证数据,因为它更准确,有些东西确实自己数据缺失了,所以想有共享交换平台,把各个委办局的数拉通,你有需求就可以调。几十年前一直想干的就是这么个事,但是结果大数据来了,这个事干一半没干完,大数据来了。中国所有的企业都在面临大数据转型,把以前业务系统数据要拿出来,拿到分析平台里去分析,去调查,去了解,发生了什么,未来会发生什么。政府部门也一样,他发现这些业务数据他也要拿出来,用于支撑政府领导的决策,公民的服务,城市的管理,公共安全等等等等,他也需要这些。所以在共享交换基础上它又变了,它又增加了新的东西,我要用数据提升我自己的政府能力,因为政府是一个公益性的存在,它的数据还有一部分是需要释放给社会的,让社会各界人和企业来用的,所以它也有数据整体运营、对外开放这一系列东西,也有数据运营和资产管理的问题,所以就有新的任务出现了。

    这是我提的架构图,它把数据采上来,存储,打通了,共享交换了,第一步做完,还要支撑上面各个政府部门委办局的应用,招商部门关心哪些楼宇没有招满,哪些部门要用,经济部门关心今年宏观情况怎么样,整个社会经济运行怎么样,公安、交通等等,每个部门都有关心运用大数据要做的事情,未来还有对公众开放的,有些企业可以用政务数据进行信息挖掘,促进更细领域的服务。所以它的责任转变了,有了数据资产管理这项服务。

    什么叫数据资产,我们做过《数据资产管理实践白皮书》,我们定义的数据资产,单指企业,我觉得任何企业和政府部门都可以包含在内的,能够为实体带来经济利益的,能够为企业产生价值的数据资源。贵州出台了《贵州省政府数据资产管理登记暂行办法》,它说政务数据资产是指由政府服务实施机构建设、管理、使用的各类业务应用系统,以及利用业务应用系统依法依规直接或间接采集、使用、生产、管理的,具有经济、社会等方面价值、权属明晰、可控、可交换的非涉密政府数据。福建也出台了,它认为数据资源是公共资源,是国家资源,把它纳入国有资产的概念,变成国有资产以后,有些部门再不开放,就有法律风险了。我们看一下数据资产管理模型,这也是我们自己在白皮书里面梳理的模型。

    底下有组织架构和制度体系做支撑与保障,组织架构是谁具体负责什么样的事情,制度体系是用来考核这些人员做的怎么样,有些规范性指引文件。上面九个活动是具体这些事情,涉及哪些事要做,包括数据标准、模型、元数据一系列事情,这和我们国际化打码做数据资产管理体系有一些温和的。我们认为,政务这套东西牵涉的是要明确原则,我管理政务数据资产管理事情,首先要确立一个原则,资产是归谁所有,是国家所有还是公民所有,怎么管理、怎么利用,怎么控制它。还要建立相应管理机构,现在各个省市都有大数据管理局什么的,可能以后会进一步细化出来一个数据标准,或者数据资产管理,或者运营的机构,可能里面又长出来一个处,长出来一个科,专门做这件事情,主要做数据运营和管理,包括监管。需要建立一整套流程和规范,包括评估它的实施效果这一套。

    我们自己也树立了一套实施路径,建议性的,不一定大家都是这个样子,这是我们自己的认识。前期第一步,确立需求,搭建组织架构,第二步,盘点政务一个市或者一个部门数据分散在哪里,规模多大,产生的频率有多高,一系列的盘点,开始进行汇聚,建立平台。把数据标准完善,把质量提升,了解数据和数据的关系,接下来做运营的事情,包括敏感数据的,划分数据安全等级,数据权限。最后是整个提供给其他部门要做数据应用,包括对应用的活性,数据本身使用的活性,成本,最后应用产生的价值,要进行一套全量评估。因为现在很多企业流行评估,大家都讲数据价值,我们先来讲数据成本,数据的价值有时候很难衡量,但数据成本很容易衡量,我用了多少台服务器,花了多少人、花了多少周期、花了多少钱把它建立起来,承载这个数据的平台多少成本,把这些成本算出来。最后估算这个平台上线以后给用户,或者给政府,带来多大效用,这些东西肯定要机器化评估,所有企业大数据团队都在做这些事情,因为搞了半天,领导问你到底给我带来哪些价值他说不清楚。

    最后,我们也正在牵头做一个事情,信通院准备在大数据发展促进委员会下面成立政务大数据工作组,着力于 梳理政务大数据解决方案的技术标准,政务数据资产管理、数据治理的,所涉及的规范、流程与标准,包括已有的哪些最佳案例,我们要在工作组里面做出来,共享给大家,包括提供给政府做参考。这里面有一些治理体系的梳理,交换共享体系梳理,可以用标准化方式,也可以用其他方式把它做起来,其实我们前期也做了很多这样的工作,可信云有可信云的一套评估体系,我们有大数据产品的一套评估体系,正在梳理大数据厂商的产品能力,我们希望给行业做数据资产管理过程中所需要的方法论和规范制度这些东西梳理出来,确实对任l何一个行业企业,或者一个政府,都是非常困难的一件事情,这件事情必须有群策群力的过程,达成共识,形成有用的经验。

    今天我就讲这么多,谢谢大家!

    (审核编辑: 智汇张瑜)