visualc操作数据库

2022-06-12 版权声明 我要投稿

第1篇:visualc操作数据库

大数据背景下科学数据互操作实践进展研究

摘 要:文章在梳理科学数据互操作的基本概念和最新研究进展的基础上,重点介绍了欧盟科学数据基础设施建设项目GRDI2020、美国安全数据研究组织IJIS以及医学数据研究所West Health三个不同性质的国际机构对科学数据互操作的实践研究状况,进而指出目前科学数据互操作实践研究中面临的政策落实困难、难以制定共同的标准协议、缺乏定义互操作的共同框架、数据质量低等问题。

关键词:大数据;科学数据;互操作;GRDI2020;IJIS;West Health

Key words big data; scientific; data interoperability; GRDI2020; IJIS; West Health

1 引言

大数据时代的计算机和数字设备产生并积累了海量的科学数据,科学研究从独立、小型的学术行会形态转移到大规模、更加互联和开明的科学家群体中。科学研究范式相应发生了根本性转变,进入到基于数据密集型计算的“第四范式”。这一范式的特点是科学研究建立在掌握尽可能多的科学数据基础之上。因此,迫切需要将科学数据纳入正式的学术交流过程,使之成为一种跟文献一样可以公开获取的资源。正如吉姆格雷描述的科学研究第四范式愿景:“能够实现所有的科学数据和文献的统一,创建数据文献交互操作的世界,更好的实现学术交流。”[1]

科学数据的互操作正是实现上述愿景的一个先决性条件,它帮助实现跨学科、跨社区的学术信息交流。CODATA中国委员会将科学数据的互操作列为大数据时代支撑科学研究的共性技术之一[2]。因此,实现科学数据的互操作,构建基于科学数据的第四范式对学术信息交流和创新具有深远的意义。

2 科学数据互操作概述

2.1 科学数据互操作概念

大数据时代越来越需要跨学科进行科学研究,比如地理观测领域依赖于多学科的科学数据分析,包括水文学、地质学、农学、地理学、生物学、GIS等。但是由于不同学科的系统和软件平台不同,产生的科学数据在格式、结构、语义关联、准确度等方面都存在差异。比如水文学计量长度的单位是米,数据格式是MIF,而地质学用的是千米,数据格式是GML。因此需要对科学数据实行必要的转换,实现就这一过程是科学数据互操作。

科学数据互操作作为整个互操作问题的一方面,目前还没有一个统一的定义,许多学者立足各自的视角对其提出了不同的观点。例如Scott A. Renner教授将科学数据互操作定义为跨越不同组织机构和系统的界限以一种统一、有效的方式正确阐释和理解科学数据的能力[3];Maurice教授认为科学数据互操作是为有效的信息交流而进行的数据管理活动,包括科学数据的清洗、耦合、融合、迁移以及信息提取等[4];Marijn Janssen教授认为科学数据互操作是两个或更多的数据集相互连接、结合、处理的能力[5];Nancy Ide教授等人把科学数据互操作分为语法互操作和语义互操作两方面。其中,语法互操作是指系统依赖于特定的协议进行相同格式的结构化数据交换,通常是通过XML格式和Web服务技术;语义互操作确保信息以相同的方式进行解释,这要求对不同本体的共同理解[6]。

根据以上学者对科学数据互操作的不同定义,本文认为科学数据互操作强调把不同格式和结构的数据集成在一起操作,可以理解为两个或更多的学科系统之间交换彼此的数据集信息并且使用所交换信息的能力。

2.2 科学数据互操作最新研究进展

大数据时代科学研究范式的变革要求科学数据是开放和互操作的,它的实现会极大推动科学研究的步伐。因此,学者们对其研究表现出极大的热情。会议方面,“种质资源数据互操作国际电子商务大会”(2013年12月)[7]与“第八届加拿大公共安全科学数据互操作研讨会”(2014年11日)[8]相继召开,科学家们共同探讨了各自领域不同数据源和资源的当前互操作状态以及面对的问题;2014年4月“语义互操作大会”在雅典召开,旨在促进语义互操作技术的发展[9]。

理论研究方面,美国SAFECOM国土安全项目[10]以及R. Rezaei教授[11]分别提出了用来定义和衡量科学数据互操作体系成熟的五个阶段。实践探索方面,张晓林教授[12]、JF Ethier教授[13]以及MA Dhuieb教授[14]等针对不同的应用场景构建了相应的科学数据互操作规范框架;何克清教授[15]、王芳教授[16]等对科学数据互操作标准协议的应用进行了深入研究。社会应用层面,爱尔兰Edward Curry教授[17]以美国Marijn Janssen教授[5]等试图通过关联数据和数据组合的方法促进科学数据的互操作;日本Majkic Z教授[18]、SB Datta教授[19]等通过构建新型的内涵数据库(Intensional RDB)来实现大数据的互操作。

3 国际机构科学数据互操作实践研究状况

大量国际组织、科研机构和政府部门等同样对科学数据互操作的研究表现出极大的热情。因此像欧盟GRDI2020科学数据基础设施建设项目、全球空间数据基础建设GSDI协会、美国安全数据研究组织IJIS、科学和教育组织OGCII、医学数据研究机构West Health、Kahua公司等各行各业均投入巨额经费致力于科学数据互操作的实践研究。欧盟GRDI2020项目、美国IJIS组织和医学研究所West Health是国际上三个比较知名的科学数据设施建设机构,面对海量且格式多样的科学数据,其投入大量资金与人力致力于实现日益增长的科学数据洪流之间的互操作,并提出了许多卓有成效的科学数据互操作实践方案,对于国际机构科学数据互操作的实践研究具有较高的代表性。

3.1 欧盟GRDI2020项目

3.1.1 项目简介

欧盟GRDI2020(Global Research Data Infrastructures)[20]项目是由欧盟第七框架资助的构建科学数据基础设施项目,该项目旨在2020年实现全球科学数据基础设施建设的战略愿景。2011年1月,GRDI2020项目发布了《全球科学数据基础设施:重大数据挑战》报告。该报告提出了构建全球科学数据基础设施面临的主要挑战和必须解决的问题,并指出为了探索利用海量数据,必须开发新型信息化基础设施,构建管理数字化、联网的科学数据环境。

3.1.2 研究进展和战略目标

针对科学数据互操作,欧盟GRDI2020项目指出科学数据互操作是影响科研合作和科学数据共享的根本性问题,也是科学数据基础设施建设中面临的主要挑战之一。该项目旨在通过“共享和共同参与”的战略来实现科学数据的互操作[21],主要包含:

(1)构建共享和综合的科学数据互操作框架。此框架是一个综合的模型,它对科学数据互操作的所有方面给出统一的定义,涵盖从技术层面到组织层面,以及现存的和即将产生的科学数据互操作方法。这样科研机构就能通过这个共享的模型形象具体地对数据互操作问题和解决方案进行比较,找到最适合自己的方法技术。该框架应该由现存的方案扩展而来,比如EIF(European Interoperability Framework)。

(2)制定科学数据互操作的共同标准。欧盟GRDI2020项目指出为机构制定互操作共同标准是实现科学数据互操作最有效和最理想的方案。针对不同机构的利益、文化及设备等方面的差异性,科研机构可以自发地构建小规模的“事实上的标准”(De facto standards)[22]。小规模群体发展成熟的技术方案是针对特定问题的、及时、合理的,并且是在群体的共同实践中达成一致的。这比在大规模群体中寻找适合自己的技术方案要更加高效。

(3)科学数据附有详细的溯源信息。这些信息包括科学数据开放的标准、数据格式、语义、数据进行互操作方式等。它为科研人员提供关于科学数据不同的见解和意见,方便科研人员发现和再利用科学数据。但溯源信息不是一成不变的,随着科学数据应用学科和机构的增加,要始终保证科学数据的来源、隐私、质量等随需要而不断改变。

(4)创建关于科学数据互操作的基础设施。此基础设施作为全球科学数据基础设施建设的一部分为各机构提供数据互操作服务。此基础设施包含数据互操作的各种技术工具和其对应的优缺点。基础设施包含的数据互操作工具和技术越多,对数据共享和再利用的促进作用就越大。但是预想的基础设施只包含综合的工具和技术,要针对特定场景的互操作及特定数据源的需求创建起来非常困难。

3.2 美国IJIS组织

3.2.1 组织简介

IJIS组织[23]是于2001年成立的一个联合政府部门和各私营企业的非盈利性组织,它致力于加强国家信息安全,提升各级司法、公共安全和国土安全部门的信息共享和保护机制。IJIS指出,公共安全数据的共享和互操作至关重要,只有及时、准确地理解海量和实时的安全数据才能有效预防犯罪的发生。因此,IJIS组织将公共安全科学数据互操作作为其重点项目之一,并专门设立PSDI(Public Safety Data Interoperability)委员会负责公共安全科学数据互操作的研究工作。

3.2.2 研究进展和战略目标

PSDI各安全部门已经充分认识到科学数据互操作的重要性,认为未来几年科学数据互操作将彻底改变公共安全通信中心的作用。PSDI指出公共安全科学数据互操作是指安全部门能够使用定义明确的并且被高度重复使用的操作流程来交换不同格式的数字信息。实现科学数据互操作的关键在于为各安全部门制定一个共同的标准协议[24],具体如下:

(1)PSDI将公共安全科学数据互操作形式分为结构化科学数据互操作和非结构化科学数据互操作两种。结构化科学数据互操作是指通信中心与其它相关部门如警察、消防、医院等之间的数据交换;非结构化的科学数据互操作是指通信中心与广大市民、私营部门、政治领导等之间的数据交换,它涉及各种普遍的数据格式如图像、视频、音频、文字等之间的交换。

(2)PSDI要求科学数据互操作必须为原生数据生产方制定一个共同的标准协议,协议规定以下几点关键问题:对于结构化科学数据的互操作,应该有一本“数据字典”来制定统一的词汇和语法,这样就能统一规定进行互操作的数据格式;对于非结构化科学数据互操作,生产方应该为图片、音频、视频等格式的数据设定一个常用的文件格式;对于所有类型的科学数据互操作,必须规定明确的操作流程,使其按照同样的操作流程完成。

(3)IJIS组织使用了NIME[25]作为政府和企业的科学数据互操作标准协议。NIME目前已发展到3.0版本,它为所有安全部门提供共享数据的互操作标准。这些标准在这些部门的具体实践中发展而来,贯穿科学数据互操作的整个生命周期。首先,它作为“数据字典”,里面规定了关于科学数据已经在各部门间达成一致的术语、定义、关系、格式等,比如在数据格式上全部使用XSD和EXCEL格式。其次,NIME提供关于科学数据互操作结构化的方法、技术工具以及操作流程等。NIME保证了安全部门人员能够准确、及时、完全的获取关键信息,加速了信息决策。

3.3 West Health医学研究所

3.3.1 研究所简介

West Health[26]是位于美国华盛顿的一个独立的非盈利性医学研究机构。West Health与其它研究机构共同合作,探讨和研究如何让独立系统的重要医学科学数据实现互操作,以开拓更前沿、精湛的医疗技术、政策和设施,使人们能够以低廉的价格享受到高品质的医疗服务。

3.3.2 研究进展和战略目标

2013年3月,West Health经过调查指出实现医疗科学数据的互操作能够在医疗系统方面每年至少节省300亿美元。但是现在由于缺乏科学数据互操作,科学数据存在于独立的系统中无法互通,医疗设备不能共同操作,医疗人员在技术上花费的精力比在病人身上多,严重束缚了治疗决策。为了解决上述问题,West Health专门成立了“医疗互操作中心”加大对医学科学数据互操作的研究。

West Health指出实现科学数据互操作需要所有相关利益者参与进来、共同合作。所有医疗机构以及协议的制定机构应该遵循以下六个关键步骤来实现[27]:

(1)认识到缺乏科学数据互操作是一个危机,尽快做出改变。所有相关利益者必须充分认识到科学数据互操作在医疗安全、效率和资金花费等方面的重要性,集体参与进来并迅速做出以下改变:协议制定机构召集所有相关利益者为科学数据互操作制定共同标准协议。所有医疗机构停止继续使用专有系统;不再购买不能连接的系统和一次性访问接口;开始基于开放标准的互操作协议进行采购。

(2)正确认识科学数据互操作问题。医疗设备每天都在产生可以用来提高医疗服务的海量科学数据,但是设备之间相互独立,不能连接和共享数据。我们需要一种可靠的方式实现跨设备、跨医疗系统、跨地区的科学数据共享和互操作。因此,要为设备供应商设置一个可预见的技术路线图,强调科学数据共享和互操作的中心作用;各机构开始共享科学数据来确保科学数据互操作协议的有效执行。

(3)加快对明确的可持续数据互操作标准协议的采用。协议制定机构要发展明确的、能够解决互操作问题的标准,同时保持标准和技术方法的现代化,不要停留在旧技术阶段以免阻碍了标准的创新。各相关利益者参与到标准的制定中去,确保标准能够满足自己的需求。

(4)确保科学数据的有效性、隐私性和安全性。各医疗机构用一种系统工程方法[21]来保证自身医疗系统数据的有效性、隐私性和安全性。协议制定机构在制定标准协议时同样要充分保证机构数据的有效性、隐私性和安全性。

(5)为医院、卫生系统和医务人员减少技术复杂性。目前医院在设备集成上面对太多的障碍和复杂性,导致医疗人员不得不在技术上花费比病人身上更多的时间和精力。因此,医疗机构要杜绝使用为医护人员增加负担或复杂流程的技术。协议制定机构创建的标准要保证机构以统一的方式来链接和访问数据。开发更简单、更容易实现、更方便使用和更现代化的标准。

(6)根据互操作标准协议开发新的技术方法使用数据流。医疗设备时刻在产生大量数据流,需要把原始科学数据转化为有用的信息。先进的数据分析工具能对数据流进行更好的挖掘。

通过以上三大国际机构针对各自状况给出了具体的科学数据互操作实践方案(见表1)。

可以看出,科学数据互操作包含多方面的任务,需要多方的共同努力。

首先,各相关利益方应该采取更加开放的心态与政策,其系统要足够开放以实现与不同利益方的不同系统在不同层次上的互联;各方对于其产生的科学数据应该附有详细的溯源信息,以帮助数据利用者对科学数据质量和语义的评估。

其次,制定标准协议仍是大数据时代解决科学数据互操作问题的重点和关键。对于标准协议的制定机构而言,应充分调查和比较相关利益方选用的元数据方案、技术平台、协议规范等异同点,并根据多方主体对科学数据互操作的需求设计针对不同应用场景的、简单易实现的互操作方案,避免反复定义标准协议导致互操作更加复杂和混乱。

再次,开发与使用先进的数据处理技术与工具将有效促进科学数据互操作的实现。大数据时代,仅靠过去单一的技术与工具已不能胜任海量数据的处理,我们需要更加善于开发相关的技术和工具,以支持从数据采集、清洗、管理、分析等整个数据处理周期。而这些工具与技术的使用,必定为科学数据互操作的实现提供强大的帮助和支持。

4 科学数据互操作实践研究面临的主要问题

4.1 科学数据开放政策落实困难

科学数据的开放与互操作是相辅相成的,科学数据开放是数据进行互操作的前提,数据互操作对科学研究的巨大促进作用促使各机构将科学数据开放。尽管有很多关于数据开放和数据共享的政策,但落实情况并不尽如人意。据调查,目前仅有25%的科学数据实现了共享,并且科研机构对待科学数据跨学科开放的态度一直在变化[28]。

中国科学院计算机网络信息中心侯艳飞工程师指出[2],科研激励机制,知识产权问题,国家安全、机密和隐私保护问题,成本问题,个体心理和组织文化问题以及有关技术和基础设施问题是数据科学时代制约科学数据开放政策落实的主要因素。

4.2 难以制定科学数据互操作共同标准协议

科学实验过程中,对科学数据的收集、处理、管理和归档等往往由不同的人按照各自的目的使用多种系统完成。系统和方法的多样性使得科学数据的格式、结构、语义关联、规模等方面千差万别。因此,必须制定标准协议对数据格式、通信协议、软件接口以及互操作的方法和技术工具等一系列要素进行结构化的统一。

但是由于不同机构的利益、文化、设备等众多方面的差异以及资金等问题,共同标准协议很难达成一致,并且其服务的范围越广,制定起来就越复杂和困难。各研究机构一致认为缺乏基于开放标准的共同协议是制约科学数据互操作实现的最大障碍。

4.3 缺乏定义科学数据互操作的共同框架

目前各学科和机构之间没有对科学数据互操作的各方面形成明确的定义和统一的结构体系。欧盟GRDI项目指出[21],缺乏定义科学数据互操作的共同框架看似微不足道,其实是阻碍科学数据互操作发展的一个根本问题,它导致了科学数据互操作体系不能协同地朝着共同的战略和方法发展。

科学研究中会不可避免地进行科学数据互操作,如果有定义科学数据互操作方法和技术的框架,科研机构就能寻找到其它机构已经发展成熟的技术方法来解决自己的问题,避免了这些发展成熟的技术方法只局限在某一学科或机构。

4.4 科学数据质量低影响互操作的有效性

大数据时代的科学数据产生速度、规模和复杂度的增加更容易产生各种类型的误差和错误。科学数据质量的多样性,包括不正确、不完整、不精确、不相关、不及时等对数据的有效性和实验结果会产生很大的影响。当数据质量低时,即使是相同结构的数据库进行科学数据互操作时也会出现问题。

中国科学院计算机网络信息中心黎建辉主任指出[2],目前数据质量理论和技术的研究在识别数据错误的理论和模型、定位和自动发现数据错误的技术和方法以及高修复错误数据的技术等各方面都面临着挑战。半结构化和非结构化数据的质量、统一的数据质量逻辑框架、分布式数据清洗等更是其中突出的挑战性问题。

5 结语

大数据时代的科学研究范式发生根本性变革,实现科学数据的共享和互操作,构建基于科学数据的、开放协同的科学研究新范式能够极大推动学术信息交流,加速科学研究发现与创新的步伐。

本文详细介绍了欧盟科学数据基础设施建设项目GRDI2020、美国安全数据研究组织IJIS以及医学数据研究所West Health三个具有代表性的国际机构对科学数据互操作的实践研究状况,发现科学数据互操作的实现需要多方的共同努力,制定基于开放标准的共同协议仍是大数据时代实现科学数据互操作的关键,开发与使用先进的数据处理技术与工具将有效促进科学数据互操作的实现。最后指出了目前科学数据互操作实践研究面临的主要问题,包括科学数据开放政策落实困难、难以制定科学数据互操作的共同标准协议、缺乏定义科学数据互操作的共同框架、科学数据质量低影响互操作的有效性等。

参考文献:

[1] GRAY J. Jim Gray on e-Science: a transformed scientific method [R]. Microsoft Research,2007:1-16.

[2] CODATA中国全国委员会.大数据时代的科研活动[M]. 北京:科学出版社, 2014:149,207.

[3] Renner S. A community of interest approach to data interoperability[J]. Federal Database Colloquium, 2001:1-2.

[4] van Keulen M. Managing uncertainty: The road towards better data interoperability[J]. it-Information Technology Methoden und innovative Anwendungen der Informatik und Informationstechnik, 2012, 54(3): 138-146.

[5] Janssen M, Estevez E, Janowski T. Interoperability in Big, Open, and Linked Data--Organizational Maturity, Capabilities, and Data Portfolios[J]. Computer, 2014, 47(10): 44-49.

[6] Ide N, Pustejovsky J. What does interoperability mean, anyway? Toward an operational definition of interoperability for language technology[C].Proceedings of the Second International Conference on Global Interoperability for Language Resources. Hong Kong, China. 2010.

[7] 种质资源数据互操作国际电子商务大会 [EB/OL]. [2014-11-20].https://rd-alliance.org/group/agriculture-data-interest-group-igad/post/international-e-conference-germplasm-data.

[8] 第八届加拿大公共安全数据互操作研讨会[EB/OL].[2014-12-01].http://www.citig.ca/the-eighth-canadian-public-safe

ty-interoperability-workshop-2014-11-30.aspx.

[9] 语义互操作大会 [EB/OL]. [2014-12-01].https://rd-alliance.org/semic-2014-semantic-interoperability-conference.html.

[10] Interoperability Continuum[EB/OL].[2014-11-15].http://www.safecomprogram.gov/oec/interoperability_continuum_broch

ure_2.pdf.

[11] R. Rezaei et al. Interoperability Evaluation Models: A Systematic Review[J].Computers in Industry, 2014,65(1):1-23.

[12] 梁娜,张晓林.机构知识库的互操作需求和互操作规范框架[J].现代图书情报技术,2013(9):1-7.

[13] Ethier J F, Dameron O, Curcin V, et al. A unified structural/terminological interoperability framework based on LexEVS: application to TRANSFoRm[J]. Journal of the American Medical Informatics Association, 2013: amiajnl-2012-001312.

[14] Dhuieb M A, Belkadi F, Laroche F, et al. Interoperability framework for supporting information-based assistance in the factory[C].The IFIP Working Group WG 5.1 11th International Conference on Product Lifecycle Managment,2014.

[15] 何克清,王翀. 大数据表示与服务的语义互操作方法及其标准[J]. 信息技术与标准化,2013(10):10-13.

[16] 王芳,王小丽.基于OAI协议的数字档案馆元数据互操作问题研究[J].现代图书情报技术,2007(3):18-24.

[17] Curry E. System of systems information interoperability using a linked dataspace[C].SoSE,2012: 101-106.

[18] Majkic Z. Intensional RDB for Big Data Interoperability[J]. arXiv preprint arXiv:1403.6089, 2014.

[19] Datta S B, Gupta V K. Performance Interoperability between RDBs and OODBs[J]. Research Journal of Recent Sciences,2012(1): 2502.

[20] 欧盟-GRDI2020 [DB/OL]. [2014-11-20]. http://www.grdi2020.eu/.

[21] Pasquale Pagano, Leonardo Candela, Donatella Castelli. Data Interoperability[J].Data Science Journal, 2013(6/7): 22-22.

[22] De facto standards- Wikipedia [EB/OL].[2014-11-20].https://en.wikipedia.org/wiki/De_facto_standard .

[23] 美国IJIS组织[DB/OL].[2014-11-20].http://www.ijis.org/.

[24] Scott Parker,Steve Wisely. Guide to information sharing and data interoperability[R].PSDI, 2009:2-3.

[25] NIME[DB/OL].[2014-10-20].http://www.niem.gov.

[26] West Health医学研究所[DB/OL].[2014-11-25].http://www.westhealth.org/institute/who-we-are.

[27] Dr. Joseph Smith, Dr. Doug Fridsma. Igniting an interoperable healthcare system[R].West Health, 2014:6-7.

[28] Data Policy-欧盟[EB/OL].[2014-11-25].https://www.jstage.jst.go.jp/article/dsj/12/0/12_GRDI-008/_pdf.

作者简介:杨京(1990-),男,山东理工大学科技信息研究所硕士研究生;王效岳(1961-),男,山东理工大学科技信息研究所教授;白如江(1979-),男,山东理工大学科技信息研究所副研究馆员。

作者:杨京 王效岳 白如江

第2篇:大数据公共治理:思维、构成与操作化

内容提要大数据公共治理是未来国家治理的重要特征,是指将大数据、物联网、云计算以及智能终端等技术与公共治理智能地融合,实时地收集、储存、处理和分析相关数据信息,以实现公共治理过程的智能化、精准化和数据化。服务性思维、时效性思维、共享性思维和开放性思维是大数据公共治理必须具备的四种思维要素。大数据公共治理主要由政府云服务平台、移动电子政务、数据开放运动以及制度保障四个方面内容构成。此外,政府还要进一步深化大数据技术在公共交通、公共安全、医疗卫生等领域的应用创新与具体操作,构建智慧政府。虽然当前大数据公共治理仍面临着发展瓶颈,但是大数据公共治理的前景和未来是无限的。

关键词大数据公共治理国家治理

十八届三中全会提出,要推进国家治理体系和治理能力现代化。在一定程度上,国家治理体系和治理能力的现代化就是政府治理能力和服务能力的现代化,就是要不断改进政府的公共治理能力,提高公共治理的效率与质量。十八届五中全会决定实施“互联网+”行动计划,发展分享经济,实施国家大数据战略。①可以说,在一切业务数据化的时代,无论是互联网金融、在线教育还是智慧城市,其核心都是数据化,人类将通过越来越普及的电子记录手段构建一个和物理世界相对应的数据世界。②因此,在大数据时代深入推动大数据公共治理的建设与应用,已成为当前推动政府治理能力现代化的内在需求和必然选择。

一、 大数据与大数据公共治理

互联网时代,“数据化”是其最重要的特征,数据就是生产力。2015年8月19日,国务院常务会议通过了《关于促进大数据发展的行动纲要》,这不仅表明我国大数据发展将迎来黄金时代,同时还会对政府、经济和社会运行产生革命性的影响。

1988年,《科学》杂志刊登了一篇题为“A Handler for Big Data”的文章,文中首次使用了“大数据(Big Data)”一词;2008年,Nature杂志推出了一期关于“Big Data”的专刊;③2012年3月29日,奥巴马发表“大数据研究和发展倡议”;“Obama Administration Unveils ‘Big Data’ Initiative: Announces $ 200 Million in New R&D Investments,” http://www.whitehouse.gov/sites/default/files/microsites/ostp/big_data_press_final_2.pdf.《华尔街日报》将大数据时代、智能化生产和无线网络革命称为引领未来繁荣的三大技术革命。邬贺铨:《大数据时代的机遇与挑战》,《求是杂志》2013年第4期。上述事件使得大数据概念被广泛地传播,并产生了全球性的影响。可见,大数据将成为未来国家创新和竞争的前沿领域。在当前具有高度不确定性和快速变化特征的数字化生存环境中,对大数据的高效利用已成为各国获取制信息权的关键。蔡翠红:《国际关系中的大数据变革及其挑战》,《世界经济与政治》2014年第5期。

那么,什么是大数据?从现代意义上来说,大数据可以说是计算机与互联网相结合的产物,前者实现了数据的数字化,后者实现了数据的网络化,两者结合赋予大数据新的含义。李金昌:《从政治算术到大数据分析》,《统计研究》2014年第11月。麦肯锡在其报告“Big Data”中把大数据定义为大小超出常规的数据库工具获取、存储、管理和分析能力的数据集。“Big Data: The Next Frontier for Innovation, Competition, and Productivity,” http://www.mckinsey.com/insights/business_technology/big_dat_the_wext_frontior_for_innovation.程学旗认为:“大数据是融合物理世界、信息空间和人类社会三元世界的纽带,因为物理世界通过互联网、物联网等技术有了在信息空间中的大数据反应,而人类社会则借助人机界面、脑机界面、移动互联等手段在信息空间中产生自己的大数据映像。”程学旗:《大数据系统和分析技术综述》,《软件学报》2014年第25期。目前,学术界对于大数据的定义尚未形成共识,呈现出多样化的趋势。

总的来讲,大数据从本质上是依赖数字化手段获取可自动记录、存储、分析的结构化、半结构化和无结构化数据。这是区别于以往有限的、不可扩充的结构化数据而言的,不仅仅是强调数据的海量性特征,还注重数据的复杂性、快速专业化分析处理以及数据的网络化等特性。那么,关于大数据的特征,可概括为以下三点:

第一,数据容量大、类型多样化。互联网的广泛应用使得在短时间内获取大量数据变得更加便利,而且获取数据样本逐渐逼近原始的总体数据样本。正如维克托·迈尔-舍恩伯格所言:“大数据不是随机样本,而是全体数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。”[英]维克托·迈尔-舍恩伯格、[英]肯尼思·库克耶:《大数据时代:生活、工作与思维的大变革》,盛杨燕、周涛译,浙江人民出版社,2013年,第27~67页。这意味着大数据可以不断扩充数据的容量,任何数据一旦形成就可以被记录、存储,避免了传统数据搜集过程中的数据类型简单、数据量有限和数据维度低等一系列弊端。2012年,国际数据公司(IDC)发布了《中国互联网市场洞见:互联网大数据技术创新研究2012》。报告显示截至2011年底,中国互联网行业持有的数据总量已达到1.9EB,预计2015年该规模将增至8.2EB。那么,1EB是个什么概念呢?截至2011年4月,美国国会图书馆藏书约1.5亿册,收录数据235TB,1EB约等于4462个美国国会图书馆的数据储存量。赵国栋、易欢欢等:《大数据时代的历史机遇:产业变革与数据科学》,清华大学出版社,2013年,第26页。其数据之大,可想而知。

大数据概念不仅意味着数据容量井喷式地增加,同时,数据类型也呈几何式增长。统计显示,结构化数据增长率大概是32%,而非结构化数据增长率则是63%,目前全世界非结构化数据已占数据总量的80%以上。余来文、封智勇、林晓伟:《互联网思维:云计算、物联网、大数据》,经济管理出版社,2014年,第173页。伴随着更多新的互联网媒体应用的出现,诸如新闻、微博、博客等各种平台上产生了海量的图片、声音、视频等非结构化数据,这使得数据类型更加多样化。

第二,数据挖掘实时性、存取速度快。这是大数据区别于传统数据的重要特性之一。传播技术的发展与普及使得数据呈现爆炸式的增长,这就要求数据存储与数据处理的速度也要相应地提升,才能满足快速增长的数据量并使其发挥作用。大数据产生有着明显的流动性与时效性特征,大都以数据流的形式存在,多数情况下必须要在极短的时间内响应并形成结果,否则数据效用就会过时,其价值也会大打折扣。除此之外,大数据的数据流量在每个时段的分布也并非是均衡、平稳的,它有可能会在某个时段数据流量激增和涌现出来。因此,大数据以上的特性都要求其必须实时储存数据,实时处理数据。

第三,大数据具有容错性,应用价值高。数据就是价值,但是孤立分散的、碎片化的数据是没有价值的。然而,大数据能够保存全体数据,呈现出数据原貌与全部信息细节。从这个意义上讲,大数据的容错性也就是说在巨大数据样本中如果出现一小部分非真实或是错误的数据不会对整个数据分析产生较大的影响和分析偏差。而且,数据量越大,其隐含的信息量也就越大,对其挖掘可能得到的有效价值也就越大。另外,大数据除了以上容量大、类型多样、处理迅速和应用价值高等特性外,还具有动态性、朱建平、章贵军、刘晓葳:《大数据时代下数据分析理念的辨析》,《统计研究》2014年第2期。相互交错性等复杂的特征。

公共治理是一项系统、宏大的工程,需要海量的数据作为科学决策与有效治理的参考依据。这不仅要求治理主体公共数据信息挖掘和存储能力的提升,同时还要具备快速甚至是实时分析和预测信息的处理能力。如前所述,大数据技术的特性和优势完全契合了公共治理的要求,不但节省了公共治理成本,而且提高了反应效率和决策质量。

可见,大数据技术不仅给人类思维方式、行为方式和生活方式带来了始料不及的冲击与改变,还为公共治理带来了机遇和挑战。对于社会而言,大数据不仅仅是一场技术革命,更是一场决策革命和治理革命,它正在开启一个新的未知空间,可能带来一场社会变革,特别是公共治理领域的变革与创新。因此,在DT时代,大数据公共治理将成为新的治理形态与操作选择。

所谓大数据公共治理就是指将大数据、物联网、云计算以及智能终端等技术与公共治理智能地融合,实时地收集、储存、处理和分析相关数据信息,以实现公共治理过程的智能化、精准化和数据化。总的来讲,大数据公共治理主要包括思维、构成和操作化三个方面的内涵。

二、大数据公共治理的思维要素

大数据,这一颠覆性的信息革命,正在悄无声息地重塑着我国的国家治理生态。郭建锦、郭建平:《大数据背景下的国家治理能力建设研究》,《中国行政管理》2015年第6期。单向度、以行政工具为主的传统政府管理模式越来越受到挑战和质疑。大数据时代对于公共治理提出了更高的要求,倒逼政府主动从内容、平台和服务上变革创新思维,不断提升公共治理的水平。“开放、分享、平等、协作”是互联网的精神,相应地,大数据公共治理也必须具备新的思维要素,才能适应碎片化和高度流动的网络社会。

第一,服务性思维。“用户至上”的思维是互联网思维的核心,而这种思维在公共治理过程中也同样适用。2015年国务院常务会议上,李克强总理指出要结合互联网思维的创新模式,从制度建设上破解“审批难”,强调政府在行政审批改革中更需要胆量和气魄,实行“限时办理”,严格“规范办理”,坚持“透明办理”,推进“网上办理”。《新年国务院第一个常务会议再次聚焦行政审批》,http://www.gov.cn/zhengce/2015-01/08/concent-2802073.htm.在市场行为中,消费者是商家的用户,而对于政府而言,它的用户就是人民群众以及社会经济中各种市场主体。以往,公共治理过程中存在服务意识淡薄、服务平台供给不足,设计不够完善、服务内容与群众需求无法有效匹配以及缺乏用户体验与反馈等问题。而在大数据时代,“服务性思维”是各治理主体必须具备的首要思维,如此才能满足社会公众日益增长的期望。

“服务性思维”主要包括两方面内涵:第一是服务意识的加强,树立互联网思维,遵循用户至上的理念。在互联网时代,体验经济和分享经济已经成为主流。政府以及其他主体也要学习电商普及的用户体验和用户需求理念,以服务为重点,寓管理于服务中。例如,“浙江政务服务网”针对全省的审批办件会在24小时内发出短信回执,请公众给予满意度评价,对给差评的事件及时予以反馈处理。第二是服务手段的提高。政府通过大数据技术和应用可以整合社会各方资源,依托互联网、物联网以及宽带移动通信来实现高效多元的治理模式,进而实现公共治理的智慧化。在大数据时代,政府必须革新服务形式、优化服务流程、提高服务手段,才能改变以往“办事难”的问题,提高公众满意度,真正实现便民利民。

第二,时效性思维。在大数据时代,时效性思维也是大数据公共治理必须具备的重要思维。时效性思维主要包含三个方面的内涵。首先,政府以及其他相关主体对于公众诉求的回应须具备时效性思维。由于互联网的运行不受时间和空间的限制,民众可能在任何时间、任何地点表达自身的利益诉求以及对政府的不满。如若政府部门未及时加以解决或作出有效回应,事件一旦经过互联网公共舆论的快速讨论、传播与放大效应,就极有可能演变为非常规性事件,进而影响政府的公信力和满意度。在互联网时代,全方位的信息流与公民的参与机制成为公共治理过程中政府与民众互动的桥梁,政府的回应也必须更加及时、明确。因此,政府必须突破公共治理的边界性思维,要针对民众诉求和不满做出即时甚至是瞬时的回应。其次,大数据时代政府及其他相关主体要逐步适应公众快速变化的服务需求和热点,顺应公众需求的时效性特征。政府手上掌握大量的数据资源,经过筛选与处理各类数据之后,通过分析多元异构数据之间的相关性并将其最大化地转化为政府科学决策的有效信息。大数据时代,个体需求是社会生产、国家服务所关注的核心,而大数据能实现对公众需求的精确感知。郭建锦、郭建平:《大数据背景下的国家治理能力建设研究》,《中国行政管理》2015年第6期。政府及其他相关主体利用大数据技术以用户的实时数据为基础分析民众的需求和情绪变动,能够准确分析出个人、组织与社群之间的相关性,以此为依据制定出“量身定制”的政策,从而实现公共治理的精细化与精准化。最后,在移动互联网时代,政府应急管理能力的重要性更加凸显,而运用大数据技术就可以使这一困难迎刃而解。如前所述,速度快是大数据的主要特征之一。应急管理的难度就在于要在极短的时间内和信息不完全的情况下做出快速而又正确的决策。大数据技术可以使政府部门及其他相关主体在短时间内快速掌握各种数据变量和不确定性因素,最大程度地缩短反应时间,甚至还可以实现提前预警。

第三,共享性思维。所谓共享,就是要依靠云计算和大数据理念,以互联网技术为平台,整合网上现有相关数据信息,实现政府监管与服务信息的互联互通、数据共享。当前,我国大部分地区信息化和数据开放建设过程中“信息孤岛”“信息盲区”现象严重,各系统之间缺乏统一的规划和标准,彼此之间无法互联互通。然而,随着大数据技术的迅猛发展和支撑,“信息孤岛”现象将大幅消减,信息资源共享也成为可能。另一方面,互联网与大数据导致政府各部门之间、政府与市民的边界更加模糊,使得公共治理模式也将随之发生极大改变。与工业时代以部门为中心、各部门独立办事的传统行政模式不同,大数据公共治理使得部门间的信息得以互联互通、数据共享。在大数据时代,“协同治理”协同治理主要特点是政府组织的权力体系从中心化向网状分布式转变;政府组织的规模从不断扩大到逐步缩小;政府组织的人员个体将趋于专家化。参见阿里研究院:《互联网+未来空间无限》,人民出版社,2015年,第149~151页。成为大数据时代公共治理的新模式之一,政府业务协同管理也将成为可能。

第四,开放性思维。开放性思维不同于共享性思维,共享性思维强调的是公共治理内部各主体之间的互联共享,而开放性思维则更侧重于向社会层面开放。互联网的开放是与生俱来的,那么,以互联网为平台的大数据自然也应该是开放的。所谓开放,就是指“有一些引导社会经济发展的数据,不涉及国家机密的,都应该向公众开放,以方便大家使用”。杨芳:《李克强“大数据词典”:共享、开放、安全》,http://politcs.people.com.cn/n/2015/0820/cloo1-27490984.html.以往,政府在决策过程中由于数据掌握不全面或存在偏差,无法了解民众的真实意愿与诉求,这在客观上为政府科学决策带来了诸多困难。然而,在大数据时代,政府依靠互联网与大数据分析,能够做到充分、全面地掌握各种真实信息,以此提高政府决策的质量。从另一个角度来讲,数据与信息的开放将政府的各种政务行为置于阳光下运行,这不仅会倒逼政府数据发布的真实性和规范性,还会增加政府决策的透明度和科学性。

因此,数据开放在很大程度上降低了政府与公众之间信息的不对称程度。从使用者角度看,“互联网显然有影响普通公民和弱势社会群体的潜质”,参见Bruce Bimber, Information and American Democracy: Technology in the Evolution of Political Power, Cambridge: Cambridge University Press, 2003. 因为互联网的使用者能够自由地获取大量的信息和专业知识,只要能想到的领域都有信息和专业知识来供他们自由地使用。另外,公众对于信息的充分掌握在很大程度上也唤醒了公众的权利意识,这就要求政府决策的开放性和透明性。社交网络打破了传统上公共和私密传播领域的屏障,把权力交还给用户,使官方政治和制度领域更容易受到公民的监督。Papacharissi Zizi, “The Virtual Geographies of Social Networks: A Comparative Analysis of Facebook, Linkedln and A Small World,” New Media and Society, vol.11, no.1~2, 2009, pp.199~220.

三、大数据公共治理的构成内容

对比国外,我国在“政府大数据”和“信息系统平台化”方面建设起步较晚,发展也显得缓慢和滞后,但随着社会对于数据外部性认识的不断深入以及国家顶层设计的驱动,我国有望在政府大数据领域步入一个“黄金时代”。因此,依托大数据手段来减轻公共治理和公共服务的现实压力,“让数据多跑路,让群众少跑腿”,“零次上门”办理和“电商式服务”等服务理念已经逐步成为主流共识,将成为未来大数据公共治理发展的方向。

第一,建设统一集中的政府云服务平台,促进业务协同和信息共享。

当前,我国大数据建设存在的弊端主要是部门之间业务协同无法达成,信息共享尚未实现。大多数城市信息化建设各自为政,政府网站、OA、财务管理软件等信息系统自行建设,独立运行和维护。虽然许多城市的政府部门都建有自己的机房,但是计算机闲置和重复建设现象普遍,政府数据碎片化严重,在线办公大都流于形式。因此,国家进一步加快建设基于云计算的政府数据中心,建设统一集中的政府云平台,不仅切合我国当下的大数据发展战略,还能从根本上解决“信息孤岛”问题。

统一集中的政府云平台应该是一个具备“一站式服务”的智慧平台,能够覆盖政府所有的权力事项和服务的全部内容,所有与此相关的事项都能够在平台上办理。但是,这个政府云平台不是所有技术和功能一个简单的叠加与拼凑,它的关键在于业务的协同、资源的聚合和数据的共享。在大数据时代,政府云平台是一个依靠互联网、大数据和云计算等技术建成的信息资源共享交换体系平台,并在此基础上实现公共治理和公共服务的电子化。同时,在大数据公共治理建设的过程中,政府云平台要通过数据集中促进信息公开,最终实现信息共享。

第二,发展移动电子政务,实现掌上公共服务。

自1969年诞生以来,互联网大致经历了阿帕网、TCP/TP交换协议、万维网和移动互联网四个阶段。据CNNIC数据显示,截至2015年6月,中国网民数量规模达668亿,网民手机上网使用率为889%,较2014年提高了31个百分点。CNNIC:《第36次中国互联网发展状况统计报告》,http://www.cnnic.net.cn.可以说,智能手机、平板电脑等移动互联网终端成为当下公众第一“触网入口”,这不仅改变着公众信息获取与传播的途径,扩大了公众社会交往的范围,同时还拓宽了公共治理的内容与方式。

由于手机微博与微信的广泛应用,移动互联网进入了“双微互动时代”。基于此,公共治理的模式也必须随之改变。相较于传统的电子政务,移动电子政务的优势不仅表现在服务的快捷高效、实时互联互动,还在很大程度上丰富了政府服务形式,拓展了政府服务的深度与广度。移动性、便捷性、实时性是其最主要的特征,这同时也带来了政府与市民之间的互动交流方式的变革,甚至在政务微信等渠道中还可能出现一对一的互动沟通和治理方式,拉近了政府与公众的距离。

一方面,移动电子政务有效提升了政府公职人员的治理能力与服务能力。在政府传统办公模式中,公职人员办公很大程度上受到时间和空间的限制,而且形式单一。在大数据时代,公职人员可以利用手机或者平板电脑随时随地进行现场办公,这不仅突破了时空的限制,还能够满足回应公众诉求时效性的要求。另一方面,移动电子政务拓宽了市民获取政务信息的途径,提高了市民主动获取政府信息和政治参与的意识。大数据时代,政府可以通过开发APP,将相关公共治理与公共服务事项及时发布到移动平台,供企业和个人查询、下载、使用。同时,市民也可通过移动智能终端及时地查询、获取政府信息和电子化的服务。较之以往自上而下的文件和命令形式,这种全新的政民互动方式有着明显的优越性,不仅体现在发布内容的表现形式和传播速度上,还在受众的覆盖面和社会影响力上占有优势。

第三,加快推动政府“数据开放运动”,实现数据共享。

如前所述,我国在政务信息化建设过程中积累了海量的数据资源,由于数据的分散化和碎片化使得这些信息资源失去了增值利用和深度应用的价值。因此,为了重新激活数据价值,数据开放应该成为公共治理过程中的一项基本职责。

截至2014年4月,已有63个国家制定了开放政府数据计划。③曹磊、陈灿、郭勤贵、黄璜、卢彦:《互联网+:跨界与融合》,机械工业出版社,2015年,第105、105~106页。与美国、英国等网络发达国家相比,我国政府的数据开放建设差距较大。作为国家的公共信息资源,大数据应该被提升到国家的战略高度。于浩:《大数据时代政府数据管理的机遇、挑战与对策》,《中国行政管理》2015年第3期。当前,国家正从顶层设计统筹规划,制定公共信息资源开放方案,加速数据开放。由国家统计局主持的“国家数据网”于2013年9月上线,数据涵盖社会经济的方方面面,既包括国家统计局生产的数据,也包括各有关部委的数据,还与主要国际机构数据库网址实现了集成对接。③2015年9月6日,国务院印发《促进大数据发展行动纲要》,纲要指出:2018年底前建成国家政府数据统一开放平台;2020年底前逐步实现信用、交通、医疗等民生保障服务相关领域的政府数据向社会开放。《国务院印发〈促进大数据发展行动纲要〉》,《光明日报》2015年9月6日。

大数据时代背景下,构建大数据公共治理是大势所趋,而数据公开、信息互联则是关键所在。数据开放的意义在于它能够使凝固的数据重新创造价值,并带动相关大数据产业的优化与升级,最终为转变政府职能助力。当然,数据开放不仅仅是传统政务公开的升级版,开放内容自然也不应该只局限于政府的政策文件、工作动态、通知公告等一些基础性内容,而是要开放政府部门掌握的数据资源。

当然,在数据开放的过程中要处理好三个关系:第一是数据开放与数据平等的关系。数据的自由流动是互联网的本质。在数据面前人人平等,政府在数据开放过程中要最大程度地消除技术障碍。与此同时,政府还应遵循民生数据优先开放的原则,优先开放社会公众关切度高、与公众生活息息相关领域的数据。第二是内网和外网、政府和市场之间的关系。内网要促进信息共享,加快业务间协同。外网则要注重开放,进一步激活数据价值。对于政府不擅长的数据开放与服务功能,国家可以在确保数据安全的前提下让渡相关权力,通过政府采购、业务外包等形式鼓励社会参与,降低公共治理成本。第三是要处理好数据开放与数据主权、数据安全之间的关系。未来信息主权与领土主权是同等重要的东西。王鹏、黄华冯、曹珂:《云计算:中国未来的IT战略》,人民邮电出版社,2010年,第71页。大数据时代,政府须重新审视信息安全的内涵,严格划定数据保密与数据开放的边界,建立数据安全保护防卫系统。

第四,大数据公共治理的法律制度保障。

大数据公共治理需要法律保障。一方面,大数据自身就会涉及个人隐私与敏感性的数据,如何界定个人信息采集的范围和方式,如何监管个人信息的存储与应用,这些问题的有效解决都依赖于完善个人信息保护的立法工作。正如约翰·帕克所言:网上的个人信息全方位覆盖了你从摇篮到坟墓的全部私人生活,慢慢地累计所有数据,直至在计算机数据库中形成一个“人”。[英]约翰·帕克:《全民监控:大数据时代的安全与隐私困境》,关立深译,金城出版社,2014年,第14页。因此,对于数据信息的保护与管理是大数据公共治理的一项重要内容。另一方面,国家还应完善关于网络数据安全和信息系统安全保护的相关立法工作,加快推动出台基础信息网络和互联网行业的法律法规,进一步完善对公共数据、涉密数据、隐私数据等数据类型的分类。同时,对于购买公共数据进行大数据应用,国家也要提供相应法律支撑和规范管理,在确保风险可控的前提下最大程度地开放数据,服务于社会与公众。

大数据公共治理需要制度保障。国家应建立健全大数据发展和应用统筹机制,加强中央与地方的协调,强化国家对数据资源的统筹管理,加快形成公共信息互联互通、共享共用的格局。同时,政府还应加快推进政府、事业单位等部门的数据标准规范体系建设,规范公共机构在数据采集、数据存储、数据分类、数据安全管理以及数据交易等关键步骤的行为与标准。另外,建立数据市场化应用机制,引导建立规范的数据交易市场试点,健全数据资源交易机制与价格机制,这些措施也应该成为政府推动大数据相关产业发展的重要举措。

四、大数据公共治理的实践应用与操作化

未来国家的核心竞争力很大程度上依赖于将数据转化为信息和知识的速度与能力。可以说,运用大数据来推动经济发展、完善公共治理能力与水平正成为全球范围的趋势和热潮。“用数据说话、用数据决策、用数据管理、用数据创新”也已成为我国大数据公共治理新的模式,这不仅极大地提升了我国公共治理的理念,还促进了国家治理的变革,有助于逐步实现政府治理能力现代化。

近年来云计算、大数据、移动互联网的出现和应用,意味着一个重要的临界点已经到来:信息技术不断成熟,经济性、便利性和性价比越来越高,安装和普及率也快速提升。阿里研究院:《互联网+未来空间无限》,人民出版社,2015年,第2页。当前,“我国互联网、移动互联网用户规模居全球第一”,国务院:《促进大数据发展行动纲要》,http://www.gov.cn/zhengce/content/2015-09/05/content-10137.htm.拥有丰富的数据资源和大数据应用市场优势。基于当前互联网的广泛运用与深度渗透,这为我国进一步拓宽大数据公共治理的具体应用与实际操作奠定了扎实的基础。

在美国、英国、日本、新加坡等全球电子政务领先国家,它们在公共治理过程中都已实现基于大数据挖掘分析并朝着智慧化、个性化、精准化的方向发展。当前,我国正处在构建“智慧政府”的关键性时刻,深化大数据技术在公共交通、公共安全治理、医疗卫生等领域的应用与操作具有重要意义。

1.大数据公共交通治理

大数据技术在公共交通中的应用可以实现政府部门数据化调控与精细化治理。政府部门可以通过城市摄像头、路况监测、汽车行车记录仪以及社交网络平台等手段,利用互联网和大数据技术获取有关汽车移动的海量数据和信息,对复杂的异构数据进行分析,从而建立智慧化的城市交通管理和服务系统。一方面,交管部门可以基于路况的实时监控实现动态管理,确保交通畅通安全;另一方面,公众可以通过数据信息的共享和实时路况选择最优出行路线,使得交通堵塞提前得到疏导,大大减轻交通拥堵状况。此外,大数据技术还可通过开发APP和导航软件,结合实际的地理位置和实时的交通状况合理规划与分配线路,提前避免交通拥堵。

2015年8月,上海市宣布开放了涵盖城市道路交通指数、地铁运行数据、一卡通乘客刷卡数据、浦东公交车实时数据、强生出租车行车数据、道路事故等十大方面上千GB的公共交通数据。以公共交通卡使用为例,公交卡的使用使得大数据技术在公共交通领域的应用与操作变得更加便利和可能。在公交卡使用的过程中,乘客上下车刷卡时都会产生数据,这就可以成为优化公共交通部门决策和治理的重要参考依据。

2.大数据公共安全治理

大数据的技术特性在很大程度上拓宽和延伸了公共治理的对象和范围,公共安全成为大数据技术在公共治理应用探索中新的领域。大数据通过其掌握的全面、充分的数据信息,对危机或风险出现的可能性进行智能化分析,进而提升公共治理过程中的风险防范水平与风险治理能力。相关主体也可以利用大数据技术预测危机与风险,在诸如恐怖活动、骚乱活动、自然灾难以及传染病等突发事件中赢得主动权。预测是大数据的核心价值,而人类生活也正在被大数据预测深刻改变。由于这些数据资源真实记录了社会实践的发展状况,是对社会全面、及时地反应。因此,基于数据采集、整合、分析、应用之后的决策是有效的、精准的和科学的。

大数据通过对海量社交媒体数据的分析,可以预测危机发生的可能,进而降低危机带来的灾难和损失。警务预测(Predictive Policing)就是美国警察部门基于大数据技术而兴起的一项新应用,它能够预测发生犯罪的地点以及罪犯的藏匿地点。大数据还可以针对地震、洪涝、高温、暴雨等灾害进行预测和提前告知,有助于减灾、防灾与救灾。可以说,大数据技术实现了公共治理的智能化、可视化和自动化,有利于构建快速反应、精准治理、智能防控的公共安全体系,有效地保障公共安全。

此外,网络科技的发展与风险是并存的,在发展大数据技术的同时,大数据的公共安全也成为公共安全新的威胁因素。大数据来源的广泛性以及传播的开放性意味着网络攻击者有了更多的破坏渠道,可以进行“高级可持续攻击(APT)”。王倩、朱宏峰、刘天华:《大数据安全的现状与发展》,《计算机与网络》2013年第16期。这有可能会导致公共数据丢失、公共数据泄露、公共数据破坏甚至是对数据的非法使用和滥用等一系列公共信息安全事件。因此,大数据公共安全治理不仅要在技术层面上完善大数据安全保护,还要进一步加大对大数据应用的精细化管理。

3.大数据技术在医疗卫生等领域的应用

互联网的灵感来自服务社会而不是满足于个人私利。[英]詹姆斯·柯兰、娜塔莉·芬顿、德斯·弗里德曼:《互联网的误读》,何道宽译,中国人民大学出版社,2014年,第49页。将大数据技术与医疗卫生等公共服务领域链接,不仅优化了民生服务,使便民、利民、惠民真正落到实处,还为政府解决民生问题、提供民生服务呈现了一种新的选择。

大数据技术在医疗中的应用可以进行疾病疫情预测,分析出疾病的来源并进行针对性预防和控制,有效地实现了对疫情的跟踪、了解与掌控。利用大数据技术还可以实现网上挂号、自助缴费与查询等功能,这极大地缩短了就医流程。此外,将大数据技术与公共健康链接可以实现患者医疗病例的数字化和共享。医生通过输入患者的身份证号就可以获取患者的历次医疗记录以及体检结果,从而为诊断提供数据化的参考。另外,在农村生活、城乡环境、社会救助、社区服务等领域进一步推广大数据应用,这对于构建惠及全民的公共服务体系和服务型政府有着重要意义。

五、大数据公共治理的现状与展望

近年来,我国大数据公共治理建设已经取得初步成效,浙江、上海、广东等地的大数据平台建设与数据应用创新实践发展迅速。然而,大数据公共治理的发展以及利用大数据技术履行公共治理和公共服务职能时仍面临着一系列的问题和发展瓶颈。

第一,政府数据资源整合差,碎片化与“信息孤岛”现象严重。如前所述,我国政府各部门以及公共治理主体在履行职能过程中积累了大量的数据资源。但是这些数据却分散在各个部门,缺乏有效的整合,使之成为一座座“信息孤岛”,甚至还会出现部门内部的数据交换都难以实现的情况。另外,许多部门大数据建设各自为政、流于形式,重复建设和计算机闲置现象普遍,政府开放数据不完善,即使开放的也与公众需求不完全匹配。正因如此,才会时常出现诸如“政府提供的服务不需要,公众需要的服务找不到”的尴尬局面。

第二,政府利用大数据技术的意识淡薄、能力较弱。当前,政府服务过程中“数据小农意识”现象明显,还是停留在传统“供给导向”的服务模式中。公职人员没有了解公众实际需求,只是从自身角度出发,一味套用传统的工作手段来开展工作,提供服务。这就容易导致政府网上服务模式与公众需求之间存在较大的偏差,服务信息不实用,办理深度不够等问题。另外,政府工作人员大数据思维缺乏,大数据应用与实际操作能力较弱,使得政府在推动大数据战略、大数据技术与应用的过程中阻力重重,难以取得有效成就。另外,我国在大数据领域发展滞后,技术和观念层面都存在欠缺。因此,未来我国在推进大数据战略的过程中必须让真正懂大数据的人去做应用。

第三,政府大数据的可持续发展不容乐观。创新政府服务模式成为新形势下政府转变职能、建设服务型政府的关键,也是政府大数据可持续发展的必然要求。各地的数据中心发展要树立“需求导向”和“用户导向”,让民众享受一站式、无缝隙、个性化的公共服务。只有以此为基础才能形成网上服务与实体服务、线上服务与线下服务相结合的一体化新型政府服务模式,才能最大限度地消除政府服务供给与公众需求之间的鸿沟,也能促进大数据产业可持续、良性发展。

就当前的发展情况来看,大数据公共治理建设的现状可概括为数据整合程度低、互联互通与信息共享难以实现、业务无法协同。政府希望各部门协同、迅速、有效地解决社会问题,而公众希望办事时以最低成本获取最优质的服务。大数据技术恰恰能解决这一问题,“它标志着人类社会正在从信息时代经由知识时代并快速向智能时代迈进”,涂子沛:《大数据》,广西师范大学出版社,2013年,第347页。最大程度地满足了提高公共治理效率与提升公共服务质量的双重需求。可以说,大数据的前景和未来是无限的。

可以预见,大数据将成为企业、社会和国家层面重要的战略资源。当前,政府及其他相关主体要以《促进大数据发展行动纲要》为契机,进一步深化创新公共治理应用模式,在服务内容、展现技术、显示方式以及后台业务等各方面实现无缝整合。而且政府要进一步加强农业和农村经济大数据建设,完善农业农村数据采集、管理和应用服务体系,深化大数据应用以提高农业生产智能化、农业服务现代化以及农产品经营的网络化。同时,国家要加快整合建设农业大数据中心,提高涉农数据的共享开放程度,构建农村高效便捷的服务体系和提供面向农业、农村、农民的综合信息服务平台。

另一方面,国家要进一步加大新信息基础设施建设,积极探索大数据产业链与产品体系。新信息基础设施正叠加于原有农业基础设施(土地、水利设施等)、工业基础设施(交通、能源等)之上,发挥的作用也越来越重要。阿里研究院:《互联网+未来空间无限》,人民出版社,2015年,第21页。基于此,政府及其他相关主体应大力发展大数据存储设备与管理、大数据分析软件、数据可视化、大数据一体机等相关软件和硬件产品,打造健全的产业产品体系,加快推动大数据与移动互联网、物联网、云计算等技术深度融合。

六、结语

在大数据时代之前,由于技术障碍、成本太高等因素制约,政府在公共治理过程中难以实现精确化推送和精准化服务。加之服务理念和服务方式的滞后、实践盲目、缺乏政民互动和政府回应被动等影响使得我国大数据公共治理建设面临的现实困境逐步凸显。然而,大数据和云计算技术完全契合了当前建设智慧政府的需求,可以有效地破解政府转型的困境。

未来,构建大数据公共治理主要聚焦在数据开放建设和云计算的基础设施建设,这不仅是政府的责任和义务,也是发展大数据公共治理的关键之举。政府的功能主要是采集、储存、分类和管理数据,构建基础设施平台,而企业和个人的功能则是深化和创新大数据应用。在数据开放和云计算的基础设施建设领域,由于技术专业性特征或成本因素的考虑,政府可以在确保数据安全的前提下让渡相关权力,鼓励商业公司和个人通过政府采购、业务外包等形式扩大社会参与,实现公私合作、协同治理。

当然,由于海量的数据掌握在政府及其他相关主体手中,必须确保它能够最大限度地造福公共利益,为社会公众所用,防止出现政府权力的扩张和对数据的滥用。界定个人信息采集的范围和方式、监管个人信息的存储与应用、完善个人信息保护的立法工作、购买公共数据进行大数据应用的法律支撑和规范管理等等,这些都应该成为国家实施大数据战略关注的重要问题。另外,数据开放必然会涉及数据安全和数据主权。政府须重新审视定义信息安全的内涵,严格划定数据保密与数据开放的边界,建立数据安全保护防卫系统,以确保信息系统和公共数据互联共享。

作者单位:华东政法大学政治学研究院

责任编辑:秦开凤

作者:高奇琦 陈建林

第3篇:城市管理数据化内容体系的操作路径

摘要:城市作为技术革命和现代文明的摇篮,不仅是一个复杂的综合体,同时也面临着许多挑战。在数据化时代下,大数据技术不仅有利于推动城市管理数据的互联互通、提升城市管理者的决策水平,还有利于提升协同创新能力、优化公共服务能力。城市管理数据化是指通过对数据的有效挖掘、分析与利用,将其转化为数据资产,进一步提高城市智能化、互联化水平,更好地服务于城市的各项管理工作。城市管理数据化不仅有其相应的内容体系,而且须设计具有针对性的路径,以确保城市管理数据化内容体系的操作化。

一、数据化时代的来临对城市管理提出了新的要求

(一)数据化时代的内涵

数据化是将采集的信息进行数据转化,这里包括了数据的采集和数据的处理两个方面。数据的采集主要是通过硬件来实现的。例如:手机的GPS传感器不断地定位我们的位置信息,对人和移动装置(比如汽车)的行为进行采集;重力传感器不仅仅对数字设备的横屏竖屏进行控制,而且能根据重心的位移来记步;手环的血氧传感器采集血氧信息,对健康数据进行监控并预防等;说到底就是在数字化的基础上把现实数据化。数据的处理是软件的算法及实现,包括各种软件程序,管理数据的文件系统和数据库系统,以及各种数据处理方法即算法。

数据化时代的到来让人与人、人与自然之间更加贴近。从一天的开始,我们睁开眼睛就可以从手机上听取世界各国的最新的动态与最热门的时事新闻;开车时,我们可以通过GPS带领我们到达目的地;休闲时我们可以通过微博、微信来与五湖四海的朋友们互动、分享生活;以及生活中各种软件为你解答生活中种种的疑惑;一天当中我们无时无刻不与数据打交道,正如中国工程院院士、中国计算学会大数据专家委员会主任李国杰所说到的:“在数据构成的世界,一切社会关系都可以用数据表示,人是相关数据的总和。”[1]

(二)数据化时代的特征

数据化时代的到来,使得数据资源的重要性不断彰显。我们可以通过数据分析获取商机、信息与机遇等功能,从之前少数的象牙塔学术精英扩展到现在的企业、科研机构、政府等生活中的各个领域都在不断更新与运用。其主要特点是:“由数量巨大、结构复杂、类型众多数据构成的数据集合,是基于云计算的数据处理与应用模式,通过数据的整合共享、交叉复用,形成的智力资源和知识服务能力。”[2]

1.数据容量大且完整性高

数据化时代的到来,让人们对信息的掌握展现出了前所未有的空间与潜力。随着各种电子设备、互联网和云储蓄等技术的发展,网络、社交网站、微博微信、手机APP、监测器、摄像头等都成为了数据信息的来源,人和物的所有行径都被记录在案。例如:谷歌公司每天要处理超过24PB数据,相当于104万8千多个GB,其数据处理量是美国国家图书馆所有纸质出版物所含数据量的上千倍;Facebook公司每天更新照片超过1 000万张,每天人们在网站上点击“喜欢”(Like)按钮或者写评论大约有30亿次;YouTube公司每月接待多达8亿的访客,平均每一秒钟就会有一段长度在一小时以上的视频上传;Twitter上的信息量几乎每年翻一番,截至2012年,每天都会发布超过4亿条微博。[3]再者,随着云计算的出现使得信息可以不断叠加,集齐全部数据成为一种可能,不再像以往那样以部分数据代替整体数据,产生偏差,毕竟个性只是共性的一部分,不能以偏概全。

2.数据种类繁多

网络化在生活、学习中的程度日益加深,几乎每个人都成为了信息的提供者,使得各种各样的数字化知识、信息不断在增加。科技的发达,也让复杂多变的信息转变为可以度量的数据。如今似乎真正进入了一个正如毕达格拉斯学派所言的“万物皆数化”的境地。社会的进步,经济的发展为人类的生活带来了多种多样的娱乐方式,活动中的信息被实时提取并输入数据库,促使数据化时代数据种类繁多且杂的特征也并不是无根据的。

3.预测功能之强大

数据积累之多不仅可以帮助我们发现已有的规律,还能根据这些材料善于预测其发展趋势,有效帮助人们提供行动建议。例如:“google流感趋势”(Google Flu Trends)利用关键词搜索预测禽流感的分布;内特·西尔弗(Nate Silver)利用大数据预测2012年美国选举结果;再例如我们生活中,淘宝会根据你的购买和浏览记录为你推送一些你感兴趣的商品,从而增加成交率;不论是法国数学家西莫恩·德尼·泊松(Simeon-Denis Poisson)认为人类行为的松柏分布,还是后来拉巴西(Albert-Laszlo Barabasi)又提出的幂定律,都表明了人类行为的可预测性。因此,现在通过对来自不同侧面的数据集整合,不同数据类型之间的关联性就凸显出来了,这时对数据进行分析,就能发现其中强大的预测功能。

(三)数据化时代对城市管理的新要求

城市作为技术革命和现代文明的摇篮,不仅是一个复杂的综合体,同时也应对着许多挑战。城市化进程的加快和生活水平的提高,加速了城市管理问题的爆发,消除“城市病”,加大城市的正能量成为新一代城市管理者肩负的使命。在数据化时代,大数据技术不仅有利推动城市管理数据的互联互通、提升城市管理者的决策水平,还有利于提升协同创新能力、优化公共服务能力。

大数据推动城市管理科学化必须从法律保障、发挥数据优势、优化管理实践等多个方面采取措施。要想在数据化时代有效对城市进行管理,必须以建立健全的法律体系作为其基础和保障。数据时代的数据种类繁多且复杂,要想合理提取有效的信息必须开展数据普查,理清已有数据基础,制定合理的数据准则,保障数据统一性;并不是一切行动都需要数据积累来指导行动的,有时实时信息才是解决问题的关键。最近几年,中国城市应急管理在城市管理中的地位越来越重要,自然灾害、交通事故、公共卫生等事故频发形成了城市管理中一道难以逾越的鸿沟,进行实时监督,由以往的“预报”转变为今日的“实时报”。保证数据的时效性,在提高城市危机处理的效率中是相当重要的。俗话说:“一个人幸福并不是幸福,全部人幸福才是真正的幸福。”所以在这个数据时代,我们要做到有福同享,把数据进行开放共享,使得社会各界都可以利用数据这个有效途径,一来可以使数据的利用率提高,二来这也是推动数据城市治理的一种发挥数据优势的途径。最后就是政务处理网络平台的构建,这是优化城市管理实践的具体做法,可以在这个信息时代帮助政府实现城市管理电子化、高效化、协同化以及有效监督。

在数据时代我们当然要做到“用数据说话、用数据管理、用数据来决策、用数据来创新”,充分发挥新型大数据技术的巨大潜力,做到对城市事务更透彻的感应、更深入的智能化以及更全面的互联协同,实现城市管理数据化。

所谓城市管理数据化也就是指通过对数据的有效挖掘、分析与利用,将其转化为数据资产,以进一步提高城市智能化、互联化建设,更好地服务城市的各项管理工作。

二、城市管理数据化的内容体系

(一)城市规划管理的数据化

John Friedmann说,规划是通过公众参与的政策制定与实施的过程。城市规划管理的数据化是指应用大数据技术、物联网技术、三维地理信息技术和云计算等技术,以城市规划的信息化为基础,制定统一标准体系、跨部门协作机制和构建三维规划平台以及公众参与规划平台。贯穿从规划编制、规划审批和规划实施等规划管理的全过程,去实现规划管理的标准化、协同化、三维化和公众化,从而进一步促进城市规划管理的科学性。

1.城市规划编制方法变革

传统的城市规划编制大部分都是采用地形图和文献等小样本实现的,基本上是靠经验判断和城市类比做决定,这种方法既不能满足居住者的需求,也缺乏合理性和科学性。大数据时代的到来,为城市规划编制提供了新的思维、理念和方法。比如我们可以通过对公交刷卡数据进行分析,从而清楚明了居民的出行活动,以此用来指导城市交通规划;[4]还有对社交网站数据进行分析,了解民众对其周围建筑环境的评价和感受,为城市的改造和建设提供依据,等等。

2.城市规划协调管控

城市规划体系、经济社会发展体系和土地利用体系是环环相扣的,数据化背景下,可以形成一套上下联动、左右协同的规划体系,有效实现三者合一。把居民活动、生态环境和交通流量录入数据库,从而绘画出一个全面、统一、精准的数据平台。这样就可以对规划编制进行统筹管理,做到规划一有变动,及时发现、及时协调、及时调整,避免一些不必要的问题出现。

3.公众参与性提高

数据时代,数据的产生、传播、分析和处理都是高速发展的。这弥补了之前专家领衔方式中公众参与度弱,回馈速度慢的漏洞。如今的技术可以把公民在社交网站、专业平台等时时产生的个体数据进行搜集和挖掘,简易分析后,专家就可以有针对性作出信息回馈(如图1),这样既可以解决公民的困难,又能抓住事件的重点。当人们的意见得到重视时,人们的参与热情也就跟着提升了。

(二)城市文化教育管理的数据化

舍恩伯格等认为,“大数据为学习带来了三大改变:我们能够收集对过去而言,既不现实也不可能集聚起来的反馈数据;我们可以实现迎合学生个体需求的,而不是为一组类似的学生定制的个性化学习;我们可以通过概率预测优化学习内容、学习时间和学习方式”。[5]

1.政策制定的科学化

在数据的支持下,教学问题不再是依靠各位老师头脑中的模糊经验去解决,而是基于对海量教学问题的描述以及教学问题解决方案的分析。早在2002年美国政府就以立法形式表明教育改革和决策必须有实证数据支持。之后我国也推出了“终身一人一号”电子学籍的管理方式。[6]这些从数据海洋中挖掘出来的事实真相以证据为支撑,更加有说服力。所制定出来的教育政策也更加的科学化,更加符合发展的需要,以及引导的作用。

2.教育方式的个性化

如果说互联网促进了教育的民主化,那么教育文化管理的数据化将实现教育的民主化。现如今人们对市场上流行着的各种大规模在线开放课程教育给予远大的厚望,基于大数据技术和学习分析,优质的教学、课程资源和服务等全部由数据的形式客观呈现出来。[7]如:对学生作业、讨论区以及提问问题进行分析可以发现学习者遇到的困难,从而对其有效干预,更好地开展适应性学习。再者教师也能够根据大数据的技术支持,认知最真实的自我,开展灵活多样的教学,彰显教学个性和智慧。[8]

3.教育评价的多元化

数据时代,我们可以通过技术层面来实现评价、分析以及促进教学活动的提升。我们可以通过对大量数据的归纳而总结出教学活动的规律;对学生进行多元评价,不只是停留在知识掌握的单一维度;走出评价结果的围栏,实现过程性评价;[9]教育评价作为教育过程中最重要的一个环节,通过科学的方式反思教与学的过程和方法,这样,教师和学生才能正视、接受问题,从而促进教学质量的提高。[10]

(三)城市社区管理的数据化

社区是社会的“细胞”,是社会工作的缩影。俗话说,“社区工作是上面千条线,下面一根针”。在数据化时代,树立科学发展观、不断创新社区管理机制和体制,实现数据化与社区管理的完美结合,让社区和谐发展、百姓安居乐业是我国现在城市社区管理的重要内容。实施管理的数据化可以做到每一寸土地都有人管理,每一户人家都有人服务,从而让“缩小管理范围,增加管理内容,提高管理效率,共享信息资源”[11]的精细化管理模式得以实现。

1.有效提升工作绩效

城市社区管理的数据化通过建立“e”平台,构建大数据系统,集中办理公民事务。由于城市化的发展,加大了社区的人口数量,社区推行网格化管理可以迅速收集人口综合数据、居民建议等一切信息,有效解决控制人员不足、管理不到位的问题;传统的社区管理需要大量的人手协同才能完成工作,而社区管理的数据化可以把各类繁杂的账表集中在一个平台,实现一体化运用管理;再者大数据容量大的优点,可以使我们快速检索出所需要查询的目标,如低保、失独老人、单亲家庭等项目。方便快捷的查询、全面信息的收集大大提高了社区的工作绩效。

2.全方面扩展社区服务功能

社会在进步,科技在发展,传统的公共服务手段已无法满足到居民的需求。而城市社区管理的数据化可以全面掌握社区居民的老、弱、病、残等信息,通过互联网向社会寻求帮助,提高社会透明度的同时做到精准化服务;社区服务平台、公众微信号的利用,可以让居民更加快速地了解到信息更新;民政、住房、计生、劳保等业务办理流程的信息在线公布便利了居民的查询,确保了阳光化运作,实现线上线下无缝对接;指定银行缴纳电费、水费、管理费等,减少人们在各个部门之间来回奔波,做到足不出户可以搞定一切的一站式缴费服务。

(四)城市环境管理的数据化

“十三五”后,我国的环境管理战略就逐步转变成了以质量改善为向导。环境系统的分布性、复杂性和动态性都使得传统的管理方法无法做到量化决策、动态调整的要求。环境管理的数据化依据各地监测到的网络布局、自采数据传感器的应用以及基于卫星遥感大数据与地面监测站点数据实时融合,可以为分析提供更全面的实时数据信息,从更微观的层面反映特定区域的环境质量情况,使得环境管理更加数字化、网络化和精细化。

1.环境规划编制

现如今我们已不再停留在“环境发生了什么事情”,而是通过对数据的分析可以到达“为什么环境会发生这样的事情”以及“环境想要什么事情发生”的地步。环境监测数据、企业污染排放数据、气象数据、治理投资数据等环境数据更新时间周期大大缩短并能做到深度分析,这可以给环境规划提供科学可量化的决策支持。比如我们通过仿真模拟新建项目会对环境造成什么样的影响从而合理调整新建项目的规模、选址、环保等要求。

2.环境质量管理

在质量考核为导向的背景下,必须锁定环境质量的改善。我国幅员辽阔,气候类型众多,各地区水文气象条件差异较大,同一地区不同时间,时空变化与分布特点也存在着较大差异,只有实施海量实时数据的有效分析,采取分季节分区域的总量精细化管理,实施分区域动态污染物容量总量控制,才能确保目标的实现。[12]例如微软提出的Urban Air模型利用监测站提供有限的空气质量数据,与交通流、道路结构、兴趣点分布、气象条件和人们流动规律等大数据结合,从而推出整个城市细粒度的空气质量。[13]

3.环境应急管理

近年来,我国环境事故进入高发期,频发的突发性环境事件直接威胁人民群众的身体健康和财产安全。大数据的应用可提高环境应急的管理效率和智能化水平,从而节省成本和减少不必要的损失。在日常管理中,收集海量实时数据,建立高效预算、机器预测的能力;事件发生后,全面感知事故的变化过程,快速集合多项关键信息辅助决策;事后评估,有效判定应急处置工作的状态与实际效果。[14]

4.公民参与环境保护

随着我国经济发展,人民群众的环保意识越来越高,对生活环境质量也提出了更高的要求。环境大数据下互联网和GPS设备的普及,通过文字、图片、文档、视频、地图等信息,为不同层面的公众提供广泛的环境信息,提高公众环境意识,提高公众的环境参与能力,进而提供差异化和精细化的公共服务,改善公民的环保感受。

(五)城市形象管理的数据化

凯文·林奇于1960在《城市意象(The Image of the city)》一书中指出城市形象是指公众对一个城市的内在综合实力、外在表象活力和未来发展前景的具体感知、总体看法和综合评价,反映了城市总体的特征和风格。当“城市”遇上“数据”,两者之间的结合一定会碰撞出不一样的火花。各类数据的挖掘以及运用,一定会为城市形象的塑造和传播带来更加合理的管理。

1.利于多元表达

“城市意向的确立及更高层次上城市软实力的提升,均离不开形象传播”,而作为城市形象传播的主要承载物,媒体扮演了至关重要的角色。在传统的城市形象传播中,都是以文字、图片、视频等手段再现城市拟态;但是城市形象管理的数据化使得传播主体不断优化,借助丰富的形态架构,生动简洁的传达信息。如北京故宫博物馆推出3D紫禁城虚拟世界来还原真实场景的原貌,投身于微信、微博等社交媒体,杭州确立的“无门票游西湖政策”等,都体现了城市形象管理的数据化。

2.人文精神的弘扬

城市的人文精神是城市发展的精神文化动力,也是提升城市品质的重要基础。通过对数据的收集和整合,比较容易找到城市人文精神在生活中的体现,我们可以在城市形象建立和传播中就这一部分进行大力传播,不断利用数据管理进行优化,从而建立为城市形象的文化名片。

3.利于监督评估

传统对各单位的监督和评估都是建立在一些总结报告和执法部门的检查上,第三方的补充信息和佐证则呈现严重缺失的状态。城市形象管理的数据化可以在公众的参与下建立一套科学、动态、开放的监督评估体系,真实、全面地回顾各部门的工作。如三亚、哈尔滨、德州等众多城市的城管执法局都建立了数字城管管理平台,信息采集员只要在街道上发现垃圾小广告、随意丢弃的垃圾、井盖丢失、乱摆放的小摊贩等问题只要简单拿起手机进行拍照,发送给公众平台并进行描述,就会有专人及时来处理。在维护了市容市貌的同时,还加大了公民参与的热情。

(六)城市危机管理的数据化

我国是一个社会危机和自然灾害多发的国家,大数据及其技术可以帮助城市在应对危机时,通过对事件数据的采集、分析、筛选、跟踪和应用,并结合自身城市的情况,从而实施科学的城市危机管理制度,帮助城市在不断变化的社会环境中做好危机管理,营造有利于城市发展的内外部舆情环境,不断提高居民的满意度。

1.提升了危机处理能力

跨领域性、衍生性、危害的全社会性是现代危机的特征,在此背景下,纵向分工的惯性与危机管理横向整合要求之间存在严重的功能性冲突和结构性矛盾,一个部门负责一种危机的模式也已无法适应当代危机管理的需要。[15]而城市危机管理的数据化是只用数据说话的,管理中产生的数据流只遵循数据本身的性质和管理要求,没有专业分工区隔的说法,能很好地解决因专业分工及体制问题而导致的信息壁垒。如风险地图、信息可视化技术、视频展示技术、三维地理信息展示技术等可视化技术,可以将城市危机的地理信息、应急物资储备信息、道路信息直接展现在应急管理系统界面上。

2.完善了反馈和评估机制

城市危机管理的数据化通过统一的大数据处理平台,监测采集实时事件发展态势数据和危机决策效果控制流数据,以此来构建危机的反馈数据仓库,完善其反馈机制。[16]大数据技术的利用,对网络舆论及其蕴含的社会情绪进行研判,有效感知社会公众所关注的社会焦点问题及其持有的各种观点,感知社会情绪发展动态,及时了解突发事件态势,灵活调整应急决策方案。再者评估途径的科技化以及公民群众参与感的上升都让评估显得客观。

三、简短的结论

现实实践中如何推进城市管理的上述内容体系真正实现数据化,我们需要从以下方面着手:

(一)健全相关法律体系

美国和日本都经历了长期的实践之后实现了信息公开、隐私保护的法律体系,而前国务院总理温家宝也提过“阳光是最好的防腐剂”,加之公民对信息公开要求的不断提高,使得如何在大数据这个双刃剑的信息时代,既发挥数据在城市管理中的运用,又能合理有效地保护到公民的隐私不受侵犯成为研究的重点。所以我们要做的是尽快建立健全我们国家关于保证信息公开的相关法律,做到有法可依,依法行事。目前我国关于数据信息公开的法津规范主要有《档案法》《保密法》《中华人民共和国政府信息公开条例》等一系列法津法规,其都存在着明显的不足,所以在健全法律上我们必须做到从原则上、范围上、操作上确定对公民隐私权的保护,杜绝酒店、火车购票网站、银行等主体发生的信息泄露事件再次发生。再者就是作为数据资源的生产者,人们有权查看政府、企业等掌握的个人信息,保证公民自由获取信息的权利。

(二)开展数据普查

数据就像一座巨大的金矿,但是我们都知道挖金的人必须需要技术和管理两道程序的有效配合,才能产出大量真金。而数据普查在这个数据金矿里就充当着勘察城市数据金矿储量和开采情况方法的角色。在我国城市管理中,每天都会产生大量的数据,由于机制设计和交易费用等因素常常都会引起信息孤岛的现象,数据不能被充分利用,这就要求我们做到数据高效收集和联通。而开展数据普查,城市管理者就可以清楚地知道政府拥有哪些真实可靠的数据,这些数据掌握在谁的手里,数据的价值如何以及是否实现“联合开采”,从而为城市管理者制定数据收集制度、数据整合制度、数据共享制度和数据管理制度提供基础。

(三)专业人员的培训

因为城市管理数据化的应用,与之相对应的人员将接手数据收集、数据分析、数据可视化等工作,做到用数据说话,但是这些都需要专业技术软件的应用。没有专业素养的技术人员,在操作时相关的专业知识,不仅不能有效的提炼有价值的数据,反而会给工作带来不必要的麻烦。所以我们应该重视这一方面人员的培养,有效对接这个数据时代到来给我们带来的工作职能变化。再者对领导人员而言,接受新鲜事物的速度相对是比较慢的,固有的行为方式可能早已在心中生根发芽,为了能够使决策者更好地利用数据来治理城市管理中的问题,我们还要加大对这些决策者对城市管理数据化的认识培训,使其能够得心应手地有效运用这些数据。

(四)政务处理网络平台构建

数据时代,人们每天行为中的点点滴滴都能快速转变为数据,加上在全民触网的大环境下,公众对政务服务需求已从单向的信息获取转变为交互的“一站式”办事服务。因此城市管理在已有的电子政务和“一站式”服务基础上需要进一步优化,构建强大的统一政务处理网络平台,用信息技术打破地理空间分散和政府部门分立的障碍,为公民提供多样化的咨询渠道和详细明了的信息、线上线下两种受理渠道、政务协同处理、处理效率和统计监督平台、智能化的档案管理等服务用来提升政府服务的信息化程度,提高服务的效率,实现城市管理的数据化、科学化。

说明:本文为2015年国家社科基金重点项目(15AZD077);广东省哲学社会科学“十二五”规划2014年度项目(GD14CZZ01);2014年广东省教育厅省级特色创新项目(广州大学“创新强校工程”人文社科类平台项目)(2014WTSCX058)。

参考文献:

陈潭.大数据时代的国家治理[M].北京:中国社会科学出版社,2015.

熊竞.大数据时代的理念创新与城市精细化管理[J].上海城市管理,2014(4):23-26.

[英]维克托·迈尔-舍恩伯格(Viktur Mayer-Schonherger),肯尼思·库克耶(Kenneth Cukier).大数据时代(Big Data)[M].杭州:浙江人民出版社,2013.

叶宇,魏宗财,王海军.大数据时代的城市规划响应[J].规划师,2014(8):5-11.

舍恩伯格.V.M,库克耶.K.与大数据同行:学习和教育的未来[M].赵中建,张燕南,译.上海:华东师范大学出版社,2014.

杨现民,王榴卉,唐斯斯.教育大数据的应用模式与政策建议[J].电化教育研究,2015(9):54-69.

杨现民,唐斯斯,李冀红.发展教育大数据:内涵、价值和挑战[J].现代远程教育研究,2016(1):50-61.

刘凤娟.大数据的教育应用研究综述[J].现代教育技术,2014(8):13-19.

喻长志.大数据时代教育的可能转向[J].江淮论坛,2013(4):189-190.

胡弼成,王祖霖.“大数据”对教育的作用、挑战及教育变革趋势——大数据时代教育变革的最新研究进展综述[J].现代大学教育,2015(4):98-104.

谢艳新.大数据时代下的社区服务管理机制研究[J].农业网络信息,2016(1):23-25.

常杪,冯雁,解惠婷,王世汶.大数据驱动环境管理创新[J].环境保护,2015(19):25-29.

郑宇.城市计算与大数据[J].中国计算机学会通讯,2013(8):8-18.

常杪,冯雁,郭培坤,解惠婷,王世汶.环境大数据概念、特征及在环境管理中的应用[J].中国环境管理,2015(6):26-30

祝兴平.大数据与风险社会的危机管理创新[N].光明日报,2015-09-05.

张俊杰,杨利.基于大数据技术的企业危机管理创新[J].商业经济研究,2015(22):94-95.

责任编辑:王 缙

作者:王枫云 陈亚楠

第4篇:操作数据库小结

一.查询操作

对数据进行查询操作时,有两种情况:一是查询单个值,二是 查询若干条记录。

1、 查询单个值

需要使用Command对象的ExecuteScalar()方法:步骤如下: (1)、创建Connection对象(数据库连接对象)。 (2)、创建查询用的SQL语句。 (3)、利用SQL语句和Connection对象创建Command对象。 (4)、打开数据库连接,调用Connection对象的Open()方法。 (5)、调用Command对象的ExecuteScalar()方法,返回一个标量值。 (6)、操作完成后关闭数据库连接,调用Connection对象的Close()方法。

2、 查询若干条记录

需要使用Command对象的ExecuteReader()方法:步骤如下: (1)、创建Connection对象(数据库连接对象)。 (2)、创建查询用的SQL语句。 (3)、利用SQL语句和Connection对象创建Command对象。 (4)、打开数据库连接,调用Connection对象的Open()方法。 (5)、调用Command对象的ExecuteReader()方法,返回一个DataReader对象。 (6)、调用DataReader对象的Read()方法逐行读取记录,如果读到记录返回Ture,否则返回False. (7)、使用(type)dataReader[列名或索引]的方式读取这一行中某一列的值。 (8)、关闭DataReader对象 (9)、操作完成后关闭数据路连接,调用Connection对象的Close()方法。

二、非查询操作

对数据库执行非查询操作时,包括增加,修改,删除数据,都使用Command对象的ExecuteNonQuery()方法,步骤如下:

(1)、创建Connection对象(数据库连接对象) (2)、创建增删改用的SQL语句。 (3)、利用SQL语句和Connection对象创建Command对象。 (4)、打开数据库连接,调用Connection对象的Open()方法。 (5)、调用Command对象的ExecuteNonQuery()方法执行命令,返回受影响的行数。 (6)、操作完成后关闭数据库连接,调用Connection对象的Close()方法。

本章总结

1、使用DataReader查询数据记录,通过Command对象的ExecuteReader()方法返回一个DataReader对象。

2、使用DataReader读取数据室每次调用Read()方法读取一行数据。

3、DataReader使用完后要调用它的Close()方法关闭。

4、使用Command对象的ExecuteNonQuery()方法对数据进行增删改的操作。

5、ExecuteNonQuery()方法返回受影响的行数。

6、ListView(列表视图)控件有5种视图模式,重点是Details 列表视图的Items属性表示包含在空间中的所有项的结合,每一个项都是一个ListViewItem,使用Items.Add()方法向列表视图中添加一项 调用列表视图项的SubItems.AddRange()方法添加它的子项

ListViewItem lviStudent = new ListViewItem(loginID);创建一个ListView项 lviStudent.Tag=(int)dataReader[“StudentId”]; lvStudent.Items.Add(lviStudent);//向ListView中添加一个新项 lviStudent.SubItems.AddRange(new string[] {studentName,studentNo,userState});//向当前项中添加子项

7、ContextMenuStrip(快捷菜单)控件可以与其他控件结合使用,通过设置控件的ContextMenuStrip属性来指定它的快捷菜单。

想鼠标右键单击文本框时出现快捷菜单,就选中文本框在属性窗口中找到它的ContextMenuStrip属性,选择已有的右键菜单控件 txtLoginId.Focus():

下拉列表:

创建Command对象调用Command对象的ExecuteReader()方法创建DataReader对象(sqlDataReader dataReader=command.ExecuteReader())使用DataReader的Reader()方法逐行读取数据(放回bool类型)读取当前行的某列的数据(cboGrade.Items.Add(dataReader[“列名”]))关闭DataReader对象,Close()方法

向数据库中添加数据:

创建Connection对象定义要执行的SQL语句创建Command对象执行ExecuteNonQuery()方法根据返回的结果进行后续的处理

双击显示出ID:

MessageBox.show(dataGridView1.SelectedRows[0].cells[“ColID”].value.ToString());

刷新:

1,BindStudentByLoginID(txtBox.Text) 2,listView.Items.RemoveAt(Listview1.SelectedIndices[0])//只能删除选中的行(选中第几个)

第5篇:数据库和操作系统

1.数据库系统优点:数据结构化;数据的共享性高、冗余度低、易扩充;数据独立性高;DBMS对数据进行统一的管理和控制

2. 数据库管理系统的主要功能:数据定义功能;数据操纵功能;数据库的事务管理和运行管理;数据库的建立和维护功能;DBMS网络中其他软件系统的通信功能,一个DBMS与另一个DBMS或文件系统的数据转换困难,异构数据库之间的互访和互操作功能等

3.数据库系统三级模式结构,优点:–模式(逻辑模式):模式结构的中间层,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。–外模式(用户模式):是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。–内模式(存储模式):是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。

–优点:三级模式是对数据的三个抽象级别,它把数据的具体组织留给DBMS管理,使用户能逻辑地、抽象地处理数据,而不必关心数据在计算机中的具体表示方式与存储方式。

数据库的逻辑独立性:当模式改变时,由DBA对各个外模式/模式作相应改变,从而保持外模式不变。因此依据外模式所编写的应用程序也可以不必改变。物理独立性:当数据库的存储结构改变时,由数据库管理员对模式/内模式映像作相应改变,可以使模式保持不变,从而应用程序也不必改变,保证了数据与程序的物理独立性。数据库之所以能够具有数据与程序的独立性,是由两级映射所提供的逻辑独立性和物理独立性所保证的。5.数据模型是对现实世界数据特征的抽象作用:用来描述数据、组织数据和对数据进行操作的三要素:数据结构、数据操作、数据的完整性约束条件

1.关系模型的完整性规则?在参照完整性中,为什么外键属性的值也可以为空,什么情况下才可以为空?

实体完整性规则:关系中的元组在主属性上不能有空值;参照完整性规则:外键得知不允许参照不存在的相应表的主键的值;

用户定义的完整性规则:用户根据具体应用的语义定义的完整性规则。当外键非本表的主属性时可以取空值。

2关系数据语言特点:具有完备的表达能力,是非过程化的集合操作语言,功能强,能够嵌入高级语言中使用。

分类:关系代数语言、关系演算语言(元组关系演算语言、域关系演算语言)、具有关系代数和关系演算双重特点的语言

3 关系的性质:任意两个元组不能完全相同;关系中元组的次序是不重要的,次序可以任意交换;关系种属性的次序是不重要的,次序可以任意交换;同一列中的分量必须来自同一个域,是同一类型的数据;属性必须有不同的名称,不同的属性可以出自相同的域;每一分量必须取原子量4.存储过程是指经过预先编译的SQL语句的集合,可以以一种可执行的形式永久地存储在数据库中。原因:运行速度快.模块化编程.减少网络通信量.保证系统的安全性

5.触发器是在满足某个特定条件时自动触发执行的专用存储过程;用于保证表中的数据遵循数据库设计者确定的规则和约束。该过程一经定义,任何用户对表的增加、删除、更新操作均由服务器自动激活相应的触发器,在DBMS核心层进行集中的完整性控制

SQL特点:综合统一;高度非过程化;面向集合的操作方式;以一同一种语法结构提供多种使用方式;语言简洁、易学易用。

数据管理技术经历三个发展阶段:人工管理阶段,文件系统管理阶段,数据库系统管理阶段。

函数依赖:(1)平凡函数依赖与非平凡函数依赖,定义:设R(U)是属性集上的一个关系模式。X和Y是U的子集。如果X→Y,且YX,则称X→Y是非平凡的函数依赖。如果X→Y,且YX,则称X→Y是平凡的函数依赖。

(2)完全函数依赖和部分函数依赖,定义:在R(U)中,如果X→Y,并且对于X的任何一个真子集X’,都有X’Y,则称Y对X完全函数依赖,记作:XY。若X→Y,但Y不完全依赖于X,则称则称Y对X部分函数依赖,记作:XY。

(3)传递函数依赖,定义:在R(U)中,如果X→Y,Y→Z,且YX,YX,则称Z传递函数依赖于X,记作XY。

关系:笛卡尔积D1×D2×…×D2的有限子集叫做在域D1,D2,….Dn上的n元关系,简称关系。

范式定义:第一范式(1NF):如果关系模式R的所有属性都是不可分的数据项,则称R属于第一范式,记为R∈1NF。

第二范式(2NF):若关系模式R属于1NF且每个非主属性都完全函数依赖于R的键,则R∈2NF。

第三范式(3NF):关系模式R中若不存在这样的键,属性组Y及非主属性Z(ZY),使得X→Y,Y→Z成立,且YX,则R∈3NF。

BC范式(BCNF):关系模式R∈1NF。若X→Y且YZ时X必为键,则R∈BCNF。

关系模式:关系的描述称为关系模式,它可以形式化地表示为R(U,D,DOM,F),关系模式有时也称为关系框架。关系模式是静态的、稳定的。主键:一个关系若有多个候选键,则选定其中一个为主键。候选键:若关系重的某一属性组的值能唯一地标识一个元组,则该属性组为~外键:设F是关系R的一个或一组属性,但不是关系R的键。如果F与关系S的主键相对应,则称F是关系R的外键,并称R参照关系。数据系统(DBS):是指在计算机系统中引入数据库后的系统,或者说数据库系统是指具有管理和控制数据库功能的计算机系统。 由数据库、操作系统、数据库管理系统、应用系统、数据库管理员和用户构成。

操作系统——控制和管理计算机系统的硬件和软件资源,合理的组织计算机工作流程及方便用户使用的程序和数据的集合。功能:处理机管理;存储管理;设备管理;文件管理;用户接口。特征:并发性;共享性;虚拟性;不确定性

多道程序设计概念:指在主存中间同时存放多道用户作业,使他们都处于执行的开始点和结束点之间。硬件支持:中断系统和通道技术。特点:它们在任一时刻必处于就绪运行阻塞三状态之一;宏观上并行;微观上串行。分时系统特点:同时性,独立性,及时性,交互性。实时系统特点:具有专用性,种类多且用途各异,最基本特征是事件驱动设计。系统调用:用户在程序中能用访管指令或软中断指令调用的,由操作系统提供的子功能集合,其中每一个子功能就是一个系统调用命令。与一般过程调用区别:运行在不同的系统状态;通过软中断进入,一般的过程调用可以直接由调用过程转向被调用过程,而执行系统调用时,有相应的系统调用命令处理程序。程序的顺序执行特性:当顺序程序在处理机执行时,处理机严格地顺序执行程序规定的动作;一个程序在机器中执行时,它独占全机资源,除了初始状态外,只有程序本身规定的动作才能改变这些资源的状态;程序的执行结果与其执行速度无关。 并发执行:指两个程序的执行在时间上是重叠的。程序并发执行特点:失去了程序的封闭性;程序和机器执行程序活动不再一一对应;并发程序间的相互制约。进程与程序的区别:1进程是程序的,一次执行,属于一种动态概念而程序是一组有序指令,是一种静态概念,进程是程序执行的动态过程,而程序是进程运行的静态文本2一个进程可以执行一个或几个程序反之同一程序可能由几个进程进程同时执行3程序可以作为一种软件资源长期保留,而进程是程序的一次执行,是暂时的4进程具有并发性,它能与其他进程并发运行而一般的程序没有这种特征5进程是一个独立的运行单位,也是系统进行资源分配和调度的一个独立单位。进程调度方式:非剥夺方式,剥夺方式。常用的进程调度方式:先进先出调度算法,短作业进程优先~,时间片轮转调度算法。

原语:由若干条机器指令构成的并用以完成特定功能的一段程序,他在执行期间是不可分割的及执行不能被中断(进程的建立,状态转换原语进程的撤销)死锁:一组进程中当某一进程提出资源的使用要求后是的系统中一些进程处于无休止的阻塞状态,在无外力的作用下,这些进程永远也不能继续前进,这种现象叫死锁起因。 两个或两个以上的进程同时对多个互斥资源提出使用要求是,有可能导致死锁必要条件1互斥控制2非剥夺控制3逐次请求4环路条件预防破坏四个必要条件1共享使用法2剥夺控制3资源静态分配和顺序分配法解除:1重启2撤销进程3剥夺资源4进程回退 临界区:各进程对临界资源操作的程序段得执行时互斥的把一次仅允许一个进程使用的资源称作临界资源文件的逻辑结构:一是有结构的记录式文件,二是无结构的流式文件 文件的物理结构:是从系统的角度来看文件,从文件在物理介质上的存放方式来研究文件(有连续结构,串联结构,索引文件)文件存取控制方法:存取控制矩阵;存取控制表;用户权限表;口令;加密 引入缓冲技术原因:缓和cpu和I/O设备速度不匹配的矛盾,提高cpu和设备之间的并行性;减少对cpu的中断频率,放宽对中断响应时间的限制缓冲技术分类:单缓冲、双缓冲、缓冲池。文件存储空间的管理方法:空白文件目录、空白块链、位视图存储管理4个主要问题:存储分配问题;地址在定位问题;存储保护;存储扩充问题。文件存取控制法:存取控制矩阵、存取控制表、用户权限表、口令、加密。分区分配可分为固定式分区,可变式分区,可再定位式分区和多重分区四种。控制器功能:

1、地址识别、2接受和识别命令指挥设备执行、3接受和记录设备的状态

4、数据交换、数据缓冲、差错控制。I/O控制方式:程序I/O方式,中断驱动I/O方式,DMA控制方式、I/O通道控制方式。分页与分段区别:1页是物理单位,是系统需要,短时逻辑单位是用户需要2页大小固定有系统确定,分页由硬件实现,段长度不固定,由编译时根据程序信息划分3分页的作业地址空间是一维线性空间,标识地址时只需给出一个逻辑地址分段的作业地址空间是二维。。给出段名和段内地址文件是一个具有符号名的一组相关连元素的有序序列,逻辑记录为最小单位。操作系统中负责管理和存取文件信息的软件机构称为文件管理系统即文件系统。文件基本功能:1文件的结构及有关存取方法2文件的目录机构和有关处理3文件存储空间的管理4文件的共享和存取控制5文件操作和使用网络操作系统就是计算机网络环境具有网络功能的操作系统分布式系统是一种特殊的计算机网络系统特点:1各节点的自治性2资源共享的透明性3各节点的协同性4系统的坚定性。处理机调度的基本单位是线程,资源分配的基本单位是进程。

二级目录缺点:缺乏灵活性,无法真实反映复杂的文件结构形式,不太适合大量用户和大量文件。多级目录缺点:层次较多,当用户在按名存取时比较麻烦。作业:用户一次请求计算机系统为它完成任务所进行的工作总和;作业流:由若干作业组成,在批量处理系统中通常把若干作业依次放在输入设备上,在操作系统控制下将其送入辅存,这样就形成了一个~。

第6篇:数据库维护计划操作说明

 数据库引擎 –> 管理 -> 维护计划 -> 右击 -> 维护计划向导

 点击“下一步”

 选择“每项任务单独计划”,点击“下一步”

 点击“下一步”

 点击“下一步”

 点击“下一步”

 点击“下一步”

 点击“下一步”

 点击“下一步”

 点击“下一步”

 点击“下一步”

 点击“下一步”

 点击“下一步”

 点击“下一步”

 点击“下一步”

 点击“完成”

第7篇:本科评估数据平台操作说明

前 言

近几年来,我国高等教育实现了跨越式发展,步入大众化阶段。教育部为了进一步保证高等学校的本科教学质量,开展了“普通高等学校本科教学工作水平评估”工作,以建立具有中国特色的高等教育质量保证体系。各高校充分重视评估工作,按照“以评促改,以评促建,以评促管,评建结合,重在建设”的原则,努力提高本科教学的质量和水平。

在充分总结第一轮本科教学工作评估的成绩和经验的基础上,为了充分利用现代信息技术,进一步提高评估工作效率和质量,教育部高等教育司和教育部高等教育教学评估中心于2007年底着手开始建设“全国高校教学基本状态数据库系统”,该系统的研制工作由华中科技大学、中山大学和北京师范大学承担。

系统利用信息和网络技术,按照教学工作的规律,把高等学校与本科教学工作相关的数据按照一定的逻辑关系组织起来,由此形成的反映教学运行状态的数据库。其作用如下:

1)为高校质量保障体系建设服务

高校通过数据采集和管理,可以加强信息化建设,准确把握自身的教学基本状态;利用系统中提供的数据分析和辅助评估功能,可以进行自评自测,以此建设和完善本校的教学质量保障体系。

2)为教学工作评估服务

评估专家通过登录本系统,可查看高校上报的数据,增加对高校的认识和了解,利用其中的教学评估系统,可以进行教学工作评估的初评,为进校评估打下基础。通过使用该系统,可减少专家进校考察的人数、时间和精力,减轻被评估高校负担,从而进一步提高评估水平和工作效率。

3)为政府提供预测决策信息

该系统将提供数据统计分析、挖掘、预测与决策等功能。在各高校按照要求将数据填报完毕后,系统可创建统计指标和统计报表,实现任意查询和关联分析,生成各种查询表、统计表以及分析、预测表,

I 用于教育预测和决策支持,同时方便高校和科研机构利用系统数据开展对比和分析,提高教育科学决策水平。

4)部分信息对社会公开,为公众服务,促进社会监督。 各高校上报并通过审核后,根据教育部要求,将向社会公众开放部分数据的查询权限,社会公众通过查询和对比高校的办学条件、教学工作等方面的数据,进一步了解各高校的办学情况,实现公众对高校教学工作的网上监督和评估,增强高校提高本科教学质量的动力。

全国高校教学基本状态数据库系统的开发和应用是一个复杂的系统工程,不仅涉及到指标体系的研究设计、数据库的设计、数据库各项功能的研发,还涉及到高校数据填报工作的组织管理、教育管理部门的数据审核、专家的使用、系统的使用培训和用户意见的反馈和修改等工作,因此,需要各有关高校在教育部的领导下,共同努力推进系统的推广与应用,对于在系统使用过程中的任何问题和建议,欢迎与项目组联系,以便不断改进和升级系统。

在此,向各试用高校表示真诚的谢意,并期待您的反馈意见和建议。

我们的联系电话:13476268247,13808646215,13986192365。 E-mail:leoxuna@gmail.com,xiaodong-xu@hust.edu.cn

全国高校教学基本状态数据库系统项目组

二〇一一年六月

II

目 录

前 言............................................................... I 第一章 系统初始化................................................... 1

1.1 系统登录............................................................................................................ 1 1.2 初始化本校信息 ................................................................................................. 2 1.3 用户设置............................................................................................................ 2 1.4 设置页面访问权限.............................................................................................. 3 1.5 在填报页面查看名词解释 ................................................................................... 4 第二章 数据指标体系说明............................................. 5

2.1 数据库指标体系的设计原则................................................................................ 5 2.2 数据库指标体系的研制方法................................................................................ 5 2.3 数据库指标体系的具体内容................................................................................ 6 第三章 典型页面介绍................................................. 7

3.1 普通文本型或数字型 .......................................................................................... 7 3.2 上传文件与下载附件型....................................................................................... 7 3.3 网址链接型 ........................................................................................................ 8 3.4 普通二维表格型 ................................................................................................. 9 3.5动态二维表格型 .................................................................................................. 9 3.6 多行文本输入页面............................................................................................ 10 3.7 通过Excel导入 ................................................................................................11 3.8 PDF文件下载 ....................................................................................................11 第四章 数据填报的组织工作.......................................... 12

4.1 参加培训会议并获取相关材料 .......................................................................... 12 4.2 完成本校信息初始化 ........................................................................................ 12 4.3 成立数据采集领导小组等机构 .......................................................................... 13 4.4 召开校内工作布置会 ........................................................................................ 13 4.5 网上填报数据................................................................................................... 13 4.6 确认填报数据并报送 ........................................................................................ 13

III IV

第一章 系统初始化

本数据库系统的网上填报地址为http://udb.hust.edu.cn(教育网)和http://udbt.hust.edu.cn(电信网),各高校根据本单位网络情况选择任何一个网址登录。登录系统后,请首先进行系统初始化工作。 1.1 系统登录

系统首页界面如图1所示,在登录区域输入用户名和口令后登录。学校登录用户名和口令由教育部主管部门或省级教育主管部门生成和密码初始化。

图1 系统首页界面

登录成功后,显示高校用户菜单,初始化本校信息、设置本校用户和设置用户访问权限。如图2所示。

图2 高校用户管理菜单

1 1.2 初始化本校信息

初始化本校信息包括初始化学校基本情况、校训办学思想、院系和其他教学单位情况、学科专业情况、学校面积、学校发展规划和校友会与社会合作等7个部分,这7个部分必须依次进行初始化,完成后才能开始填报表格。如图3所示。

图3 初始化本校信息

注意:在本系统中,所有填报表格中背景标记为灰色的数据项都是选填项,这些数据项在年报时可不填,在接受评估前一年应填上;没有标记的数据项为必填项,必填项如果没有填写,则无法提交。

1.3 用户设置 1.3.1 添加用户 为方便填写,本系统实行两级用户管理,学校级用户和院系用户,可以设置多名学校级用户,用于全校性数据的填报和所有数据的审核,院系级用户根据权限只能填报部分涉及院系数据的表格,一般来说可为每个院系设置一个院系级用户。在添加用户时必须指定用户级别,即:属于学校级用户还是某个院系的用户。添加用户的方法为用户管理添加校级用户,界面如图4所示。添加院系级用户方法类似。

图4 设置本校用户

1.3.2 设置用户权限

点击“用户管理”后,就进入到“设置用户权限”页面,如图5所示。

图5 设置用户权限

本系统中的用户分为管理员、信息管理员、数据管理员、数据录入员、数据查询员和信息报送员几个类别,可分别负责系统管理、信息发布与管理、数据管理与审核、数据录入管理、数据查询查询和数据报送等功能。

1.4 设置页面访问权限 系统管理员可对相应的用户分配特定页面的访问权限,如:指定院系用户填报某些表格,具体方式如图6所示。

图6 设置页面权限

1.5 在填报页面查看名词解释

在填报的过程中,每个页面,均可以通过点击该页右下角的“本页名词解释”来查看该页的每个数据项的内涵,以保证数据的有效性。如图7所示

图7 查看本页名词解释(数据项内涵说明)

第二章 数据指标体系说明

2.1 数据库指标体系的设计原则

数据库指标体系立足于反映高校教学工作的基本状态,既为本科教学工作评价提供数据支持,又为教育主管部门提供决策依据,同时为社会了解高校、对高校提出建议和意见提供渠道。在研制指标体系过程中遵循了下列原则:

1、科学性原则:数据库指标所采集的数据应真实、客观、准确,同时具有原始性,即:尽量不采集衍生数据,如增长率或比率,而是通过采集原始数据后,由数据库系统自动生成各项工作中所需要的衍生数据。

2、系统性原则:数据库指标体系应反映教学工作的全貌和规律,包括教学工作的环境、条件、主体、状态和效果;指标以定量数据为主、以定性描述为辅。

3、操作性原则:数据库指标应可测量,易采集,获取方便。同时要充分考虑数据采集和管理的工作量,通过教育部和学校两个层次的合理分工,将国家层次数据库的指标数量控制在一定范围之内。

4、导向性原则:数据库指标体系应反映教学工作的时代特点和要求。例如:在指标中加入高等学校教学改革与教学质量工程的内容,以推动“质量工程”相关工作的开展。 2.2 数据库指标体系的研制方法

数据库系统研制的主要目的之一是为高校本科教学工作评价服务,因此,遴选数据库指标充分考虑了我国各个时期、各类高校本科教学工作评价的数据要求;这些评价活动包括:上世纪90年代实施的本科教学工作合格评价、本科教学工作优秀评价、本科教学工作随机评价,以及本世纪以来实施的本科教学工作水平评估。

数据库系统指标体系反映了教学工作的基本状态,因此,数据库

5 指标参考了国外高校教学工作评价和质量保证体系的研究成果;例如:美国、英国等国家大学排行榜的指标体系,美国、英国、日本、澳大利亚等国家的高校内部质量保证体系的评价指标。此外,还借鉴了发达国家教育数据库的建设经验,同时注意与我国已有教育数据库的衔接。例如:本系统参考了美国教育部国家教育统计中心的数据库指标和结构,兼顾了与我国“高等教育基层统计报表”的数据共享。

从数据采集的深度来看,“全国高校教学基本状态数据库”作为国家层次的数据库,采集的数据包括学校、院系和专业等层次数据,不涉及所有教师、学生、课程等微观层次信息。涉及微观层次信息的数据库(教师库、课程库、课表信息、学生库、成绩库、设备信息库、管理制度网站)是各高校信息化建设的范围,由各高校自行建设和管理。国家层次数据库以校园信息化工程为依托,与高校层次数据库通过网络相联,并可相互访问。以此保证本数据库的高效率和低成本。 2.3 数据库指标体系的具体内容

为了方便各高校填报数据,课题组根据高校管理的特点,对所有三级指标进行了排列组合,形成了学校概况(在初始化中)、师资队伍、教育教学、教育经费、教学科研仪器、教学条件、学生基本情况、学生课外活动、科研情况、学科建设等十个数据群,最后还有一个特殊情况说明。同时,将数据库指标称为数据项,以便与评价方案中的指标相区别。

作为覆盖全国不同类型高校的教学基本状态数据库,应该既反映所有高校的共性,又反映不同学科、不同类型高校的个性,因此,该数据库系统除了上述反映共性的一个主库之外,还有三个反映个性的子库。这三个子库分别是:医药类院校或有医药类专业的综合性大学填写的医科信息子库(39个数据项)、体育类院校填写的体育信息子库(37个数据项)、艺术类院校填写的艺术信息子库(42个数据项)。

数据项以填报表格的形式呈现给高等学校,数据项的内涵通过名词解释的方式提供给用户。具体内涵及名词解释参考《全国高校基本状态数据库系统数据项内涵说明》。

第三章 典型页面介绍

本系统中有95个填报页面,但归纳起来,共有八种典型页面,在此分别介绍八种页面的填报方法,其他页面参考此八种页面。 3.1 普通文本型或数字型 普通文本型或数字型是指,在表格相应位置的文本框中输入普通文本或者数字,全部填写完毕后,点击“提交”或“确定”按钮即可。如表I 学校基本信息,该表为普通文本型,在相应文本框中填入相应信息即可,如图8所示。

图8 普通文本型填报页面

3.2 上传文件与下载附件型

上传文件型是指需要在填报页面指定的位置上传文件,一般为Word或Excel文件。如表Ⅵ 学校发展规划,在该页面中“发展战略规划”等指标需要上传文件,点击“文件上传”,找到要上传的文件开始上传文件,完成上传后然后点击下面的“提交”按钮,即可保存。如果要上传多个文件,需要先打包压缩,然后再上传。如果文件已经上传成功,则在相应的指标后面会出现“数据库已存在文件”的提示,

7 点击后面的“查看”按钮可以浏览已经上传到服务器上的文件。如图9所示。

图9上传文件型

下载附件是指把上传的文件进行打包压缩后下载到本地,用户予以保存,以便今后使用。例如:高校用户登录后会看到如下界面。

图10下载附件导航界面

在图10中,点击“师资队伍”后面“下载附件”,出现如下提示框

图11 附件保存界面

点击该连接,根据提示操作,可以把“师资队伍”的附件一次性地下载到本地。

注意:下载的附件是zip压缩包,查看里面的文件需要相关解压工具,如WinZip、WinRAR。 3.3 网址链接型 网址链接型是指在对应位置填报相关网址,系统可以通过点击“链接”按钮,打开所填写的网址。如表1-2 “师资队伍概况”中有学校教师库链接,填入教师库的网址后,点击右边的“链接”按钮,可打开相应的网页。如图12所示。

图12链接地址型

3.4 普通二维表格型

二维表格型是指填报的数据项构成一个二维表格,填报的数据分为行和列,行列的文本框内均需要填写数据。如“表Ⅴ 学校面积”,在该表中,行数据有学校产权、非学校产权、独立使用和非独立使用,列数据有占地面积,非占地面积等,在行和列交叉的文本框中填写相应的数据。表中数据之间可能会有一定的关联性,在填表时应予以注意,填写的数据要符合要求。如图13所示。

图13 二维表格

3.5动态二维表格型

有些表格是根据需要填写的数据量情况来手动添加行数,每次需

9 要输入一行新的数据时,要先手动点击“添加行”按钮,所有数据填写完成后,可以点击“提交”按钮提交所有数据,也可以点击每一行后面的“保存”按钮保存一行数据;数据保存后如需要修改时可以点每行后面“编辑”按钮,开始编辑每行的数据,修改完成之后请点击行后面的“保存”或表格下方的“提交”按钮进行保存。如果需要删除某行,则点击该行后的“删除行”按钮,该行数据就会被删除。例如“表1-1校领导基本信息”,在该表中,可以根据本校的校领导数量,通过逐次点击“添加行”按钮,添加多个校领导的信息。如图14所示。

图14 二维表格

3.6 多行文本输入页面

如图15所示,表单中有多行文本的输入框,一般情况都有输入字数的限制,输入的过程中文本框的下方有输入字数的提示。

图15多行文本输入界面

10 3.7 通过Excel导入

本系统对部分内容比较规范的表格实现了通过Excel导入的功能,如表2-27-1 院(系)教学效果——本科生学科竞赛获奖情况。首先点击“下载模板”,将Excel模板下载到本地电脑上,在本地电脑上填写该Excel文件的内容,注意在填写过程中不要更改Excel文件的结构,填写完毕后,点击“导入”按钮,选中填写好的Excel文件后,系统会自动将Excel中的内容导入到系统相应的表中。如图16所示。

图16 通过Excel导入

3.8 PDF文件下载

如图17,高校用户登录后会看到如下界面,在导出栏会看到“生成PDF”的链接,点击该连接就会把对应页面类别下所有上报的数据生成PDF文件,根据提示操作可以把PDF下载到本地进行查看。

图17下载PDF文件界面

每页填写完毕后,首先点击“提交”按钮保存填报好的数据,然后再点击“下一页”进入下一页的填报。如果需要跳转某特定页面,则点击“返回”或“返回导航”按钮,进入到导航页面,再打开相应的填报页面。

第四章 数据填报的组织工作

由于填报内容较多,时间较紧,为保证填报工作顺利进行,建议填报单位按照以下程序组织填报工作。 4.1 参加培训会议并获取相关材料

采集院校确定数据采集负责部门并派人参加教育部和项目组组织的培训会议,并领取相关材料,主要材料包括以下几个部分:

1. 《全国高校教学基本状态数据库系统用户手册》 2. 《全国高校教学基本状态数据库系统填报表格》 3. 《全国高校教学基本状态数据库系统数据项内涵说明》 4. 本校登录的用户名和口令

《全国高校教学基本状态数据库系统填报表格》与网上填报系统 《全国高校教学基本状态数据库系统数据项内涵说明》(以下简的填报页面一一对应,以方便院校填报数据的编制工作。

称《内涵说明》)是对填报表格中每个数据项进行内涵说明,供填报院校参考,《内涵说明》中的编号与《填报表格》中的表格编号一一对应,以方便查找。

在培训期间,填报人员获得本校登录系统的用户名和口令,以便回校后及时开展系统初始化和数据填报工作。 4.2 完成本校信息初始化

培训结束后,填报人员按照本手册第一章所述,登录系统并进行本校信息初始化,设置完成本校院系和专业信息,并为相应的职能部门和每个院系建立用户账号,设置密码,并赋予相应表格的访问权限。

12 4.3 成立数据采集领导小组等机构

各高校参加培训工作完成后,应成立数据采集领导小组以及办公室,应由学校主要领导担任组长,分管校领导担任副组长或常务副组长具体负责指导开展工作,各相关职能部门和院系主要负责人担任领导小组成员,成立领导小组办公室,设专门人员负责数据的任务分解、动员、填报、督促和检查工作,以保证数据填报进度和数据质量。 4.4 召开校内工作布置会

领导小组组织召开校内工作会议,召集各相关职能部门和院系进行数据采集和填报工作的动员与培训。在会议上,根据本校实际情况,将《填报表格》进行分解,下发到各职能部门或院系,并培训有关人员,使用网上填报系统。 4.5 网上填报数据

在规定的时间内,学校组织各职能部门和院系在网上进行填报,学校数据采集领导小组办公室注意检查填报格式和填报进度。 4.6 确认填报数据并报送

全部表格填报完毕后,校级管理员对所有数据的真实性、规范性和完整性进行核查确认。经学校领导核准后上传数据,报送给教育主管部门。

第8篇:SQL语言数据查询操作

实验三 SQL语言——数据查询操作

一、实验时间

二、实验地点:317室

三、实验条件与环境

1. 通用PC机

2. PC机必须安装Windows 2000系列、Windows XP系列或Windows NT操作系统平台

3. PC机还须安装Microsoft SQL Server 2000 任意一版本(个人版、标准版、企业版)

4. 最好有一台公用的SQL Server 2000 服务器

四、实验目的

1. 通过上机实验进一步加深对SQL查询语句的基本语法格式的掌握

2. 通过上机实验掌握单表查询的实现过程

3. 通过上机实验掌握多表关联查询的实现过程

4. 通过上机实验掌握嵌套查询的实现过程

5. 通过上机实验掌握集函数与谓词在Select语句中的使用

6. 通过上机实验加深了解Select语句与关系代数运算(如选择、投影、连接、除法等)两者之间的联系与区别

五、实验要求:

1. 本实验所有实验内容要求在规定时间(2课时)内完成

2. 实验内容中涉及到的各查询操作均通过SQL语言来实现

3.实验完成后需要书写实验报告

六、实验内容:

1.查询为工程J1供应零件的供应商号码SNO

2.查询为工程J1供应零件P1的供应商号码SNO

3.查询为工程J1供应红色零件的供应商号码SNO

4.查询没有使用天津供应商生产的零件并且当前工程所使用零件的颜色全部为红色的工程号JNO

5.查询至少选用了供应商S1所供应的全部零件的工程号JNO

6.找出所有供应商的名称和所在城市

7.找出所有零件的名称、颜色和重量

8.找出使用供应商S1所供应零件的工程号码

9.找出工程项目J2使用的各种零件的名称及其重量

10.找出上海厂商供应的所有零件号码

11.找出使用上海产的零件的工程名称

12.找出没有使用天津产的零件的工程号码

13.找出重量最轻的红色零件的零件编号PNO

14.找出供应商与工程所在城市相同的供应商提供的零件号码

15.找出所有这样的一些三元组,使得第一个城市的供应商为第二个城市的工程供应零件的名称为PNAME

16.重复第15题,但不检索两个CITY值相同的三元组

17.找出供应商S1为工程名中含有“厂”字的工程供应的零件数量总和

18.找出为工程供应零件的总数量不低于500的供应商号码及供应总数量,结果按供应商号码分类并且按供应总数量降序排列

七、实验总结:

数据查询是一种极为重要的面向数据库的数据操纵方式。实验完成后,请同学们总结一下SELECT语

句实现各种类型查询任务的一般过程和操作实现方法,并对利用SELECT语句实现各类查询任务的解题规律与方法作一总结。

第9篇:利用“电子口岸”海关数据操作方法

利用“电子口岸”海关数据 进行出口退(免)税明细申报操作指引

一、下载海关报关单已结关信息

1.进入电子口岸网站,点击“出口结关报关单”打开结关报关单下载介面

2.选择下载报关单范围(条件)

3.点击“查询”,系统会显示符合条件的查询结果

4.输入文件保存路径,点击“下载”将报关单信息下载到本地。

二、申报系统读入报关单数据及进行数据录入相关操作(以生产企业为例,外贸企业的操作方法基本一样)

(一)设置申报系统电子口岸卡信息

通过申报系统“系统维护→系统配置→系统参数设置与修改”,选择“功能配置I”,在“电子口岸卡信息(电子口岸数据应用)”项下输入IC卡号、IC卡密码,点击“确定”完成电子口岸卡信息的设置。

(二)读入电子口岸出口报关单数据

通过申报系统“基础数据采集→外部数据采集→出口报关单数据查询与读入”,进入操作界面后,点击“数据读入”,选择从电子口岸下载的报关单信息压缩文件进行读入操作。

(三)汇率及贸易性质配置 1.出口商品汇率配置

通过申报系统“基础数据采集→外部数据采集→出口商品汇率配置”,进入操作界面后,按币种增加当月出口商品对应的汇率。

2.海关贸易性质配置

通过申报系统“基础数据采集→外部数据采集→海关贸易性质配置”,进入操作界面后,按贸易性质增加对应的关联业务表。

(四)出口报关单数据确认

通过申报系统“基础数据采集→外部数据采集→出口报关单数据修改与确认”,进入操作界面后,先在左边的索引窗口中单勾选对应的报关单号,然后可以同“数据确认”或“批量处理”功能对勾选的报关单进行确认操作。报关单数据确认后,相关的电子信息将自动转入到对应的关联业务表中。若在数据确认后,发现勾选错报关单的,可以通过“数据恢复”功能将对应的报关单恢复为未确认状态,系统会自动删除关联业务表中对应的明细记录。

(五)补充出口明细申报数据指标

完成数据确认操作的,相关的出口明细记录自动转入到对应的关联业务表中,如关联业务表为“出口货物明细申报表”。

通过申报系统“基础数据采集→出口货物明细劳务录入→出口货物明细申报录入”,进入操作界面后,逐条记录进行修改,补充录入对应的出口发票号,并根据实际情况录入“业务类型代码”指标。

三、注意事项

(一)读入海关数据前,必须先完成电子口岸卡信息的设置,将电子口岸读卡器连接安装了出口退税申报系统的计算机,并插入电子口岸操作员卡。

(二)进行数据确认前,必须先完成出口商品汇率配置和贸易性质配置。

(三)数据确认后,需在出口货物明细申报录入操作逐条记录修改录入对应的出口发票号码,并根据实际情况录入“业务类型代码”指标。

(四)若读入下载的出口报关单数据时,系统出现海关数据出错的提示,企业可以在电子口岸“出口结关报关单”操作界面中,缩小查询范围并重新下载关单信息后,再进行数据读入的操作。

注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:iwenmi@163.com。举报文章