大数据行业调研报告

报告是日常生活与学习的常见记录方式，报告有着明确的格式。在实际工作中，我们怎么样正确编写报告呢？以下是小编整理的关于《大数据行业调研报告》，仅供参考，希望能够帮助到大家。

第1篇：大数据行业调研报告

大数据知识产权司法保护的调研报告

摘要：随着互联网技术的不断发展，大数据已经成为互联网产业中新的价值金矿，互联网企业在挖掘大数据产业价值的同时也对大数据的司法保护提出了迫切的需求，尤其是知识产权对大数据的保护。大数据案件的增多，也给司法审判带来了新的挑战。中关村法庭课题调研组在走访多家企业，并与行业专家座谈后，撰写了这份调研报告。该报告从大数据知识产权保护概述、大数据司法保护实践现状、现有知识产权法律框架下对大数据的保护、大数据类知识产权案件疑难问题分析、大数据司法保护的价值判断五个方面介绍了调研成果内容。

一、大数据知识产权司法保护概述

1、引言

隨着智能信息技术的不断发展，数据已经成为一种新的商业资本和一项重要的经济投入，可以为人类创造出新的经济利益和商业价值。大数据（big data）作为无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，需要通过新处理模式才能成为具有更强决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产2，因而催生着人类历史上的又一次信息革命，人类的生活方式、价值体系与社会模式也因此发生了重大的改变。2011年，美国麦肯锡公司发布的报告中显示，各国政府已经逐渐将大数据的发展上升到了国家战略的层面，包括美国政府的“大数据研究发展创新计划”（Big Data R&D Initiative）、欧盟“欧盟数字化议程和挑战”（The Digital Agenda for Europe and Challenges for 2012）、日本发布的“活跃ICT日本”综合战略以及澳大利亚和韩国发布的“公共服务大数据战略”等各种大数据国家战略，都标志着大数据的研发及产业应用已经引起了各国政府的重视，全球的“大数据”时代已经到来。全球领先的咨询分析机构Wikibon于2014年2月发布的《大数据企业营收和市场预测（2013-2017）》报告显示，2013年全球大数据企业（软件、硬件及服务）营业收入为186亿美元，同比增长58%；2014年全球大数据市场增长速度达到53%，总体规模为285亿美元；到2017年，全球大数据市场收入将达到500亿美元，这意味着从2011年起连续6年年复合增长率达38%。中国市场情报中心有关统计显示，2012年中国大数据市场规模为4.5亿元，同比增长40.6%。到2018年，中国大数据市场规模将达到46.3亿元。

2015年9月，我国国务院印发《促进大数据发展行动纲要》，力图全面推进大数据的发展和应用，将我国建设成为数据强国。2017年1月17日，工业和信息化部发布《大数据产业发展规划（2016-2020年）》，该规划以强化大数据产业创新发展能力为核心，明确了强化大数据技术产品研发、深化工业大数据创新应用、促进行业大数据应用发展、加快大数据产业主体培育、推进大数据标准体系建设、完善大数据产业支撑体系、提升大数据安全保障能力等7项任务，明确了“十三五”时期大数据产业的发展思路、原则和目标，将引导我国大数据产业持续健康发展3。

大数据系统和大数据产业给人类生活带来了诸多的益处，但随着智能信息技术的不断深入和创新，数据也呈现出体量日益庞大、类型愈加复杂的趋势。知识产权领域呈现资源急速增长且数据量庞大的特点，在此种情境下，为保障数据产业的发展，保护大数据集合表现形式及其实质内容的价值，究竟该如何基于法律自身的价值追求扮演社会规范的角色，运用知识产权相关法律制度来为大数据提供恰当的司法保护，实现大数据与知识产权法律制度的平衡，探究出新的数据知识产权保护模式，是一个值得探讨的问题。

2、大数据与知识产权法律制度的交叉

数据本身的可复制传播性和可重复利用性等特点，致使其客观上与知识产权有着千丝万缕的联系。在知识产权法域内而言，其应当是具有财产价值的排他性权利而产生的法律关系。虽然有些大数据产业中的原始数据是否属于知识产权法律制度中保护的客体有待厘清，但是如经过相关主体利用技术开发或智力创造加工后转化成为一种新的分析数据或者汇编集合，赋予其一定的独创性，则应当被视为可以受到法律保护的知识产品。具体而言，与大数据相关的主要知识产权应当包括数据信息的著作权、相关商业模式及操控分析数据的专利权、经由数据转化成为数据产品的商标权以及含有技术信息或经营信息中的商业秘密等。因此，我国知识产权法律体系中的《著作权法》、《专利法》和《反不正当竞争法》均可在一定程度上为大数据信息和大数据产业提供相关的法律保护。在适应新技术革命的基础之上，充分发挥司法保护知识产权的主导作用，从而真正地做到协调与平衡技术创新激励与个人权利的保护之间的关系。

3、知识产权制度对大数据信息和产业的司法保护概况

鉴于大数据集合的复制成本低廉的特征，围绕着大数据的产生和取得方式以及运用和维护的过程，现行知识产权司法保护制度充分发挥着其明确创新权属、协调大数据创新成果各主体利益分配机制的作用。

就数据本身而言，因其难以满足《著作权法》中关于“具有独创性并能以某种有形形式复制的智力成果”的规定，而难以通过《著作权法》进行保护。但“数据”的集合往往在其选择或者编排中具有独创性，由此可以通过《著作权法》中的“汇编作品”予以保护。世界贸易组织、世界知识产权组织、《伯尔尼公约》以及《TRIPs协议》都已经明确规定可以将数据信息作为汇编作品予以保护，我国《著作权法》也做出了类似规定。对于大数据信息而言，不为公众所知悉且能为经营者获得利益或者竞争优势、具有潜在商业利益的信息可以归入属于该公司的技术信息或经营信息，从而作为商业秘密4通过《反不正当竞争法》予以保护。我国《反不正当竞争法》第二章第十条明确规定了三种不得采用的手段侵犯商业秘密的行为。由于我国对不正当竞争行为的界定采用举例加概括的形式，因此有些难以成为商业秘密的数据信息还可以《通过反不正当竞争法》中的一般性条例进行保护。

大数据产业和技术的意义和价值不仅仅在于掌握庞大的数据信息本身，更体现在对具有意义的数据进行专业化的处理，从而实现数据的赋值、增值和价值显现。大数据通过挖掘、整理、计算等方式进行加工之后形成的特定算法或是计算机软件工具，以及通过软硬件与网络结合的系统解决一定的技术问题，此类具备鲜明技术属性的数据处理方式可以通过申请方法专利的方式进行保护5。

4、知识产权司法保护对大数据的促进意义

虽然我国现行的知识产权制度实行的是“双轨制”保护模式，即权利人可以通过知识产权行政主管机关主张权益保护，同时也可以通过法院诉讼的方式来维护自身合法权益，但由于知识产权保护的客体作为一种私权以及司法制度本身的制度优势，决定了司法保护知识产权是维护相关权益最重要的方式。

随着互联网、物联网等现代网络技术的发展，大数据作为能够广泛带动各行业向信息化、智能化、网络化发展的力量，已然成了企业乃至国家的核心竞争力。将符合知识产权特征的数据纳入知识产权体系，建立相关完善的知识产权数据保护模式，运用知识产权司法保护为大数据产业的发展保驾护航，保障数据产业的发展，能够形成一个良性的产业生态圈，促进社会经济的发展。

二、大数据司法实践中的现状

我国司法实践中有关大数据的案例，按照案由来分类，主要有以下几种类型：

1、民事案件

（1）隐私权纠纷

①原告王刃与被告北京奇虎科技有限公司隐私权纠纷案。6本案中，原告的手机号被被告的360手机卫士安卓版标记为“维特网络信息有限公司（合肥分公）”，因此被人怀疑为骗子。法院经审理认为，被告出示的证据可以证明原告所使用的号码已经在企业黄页被公开披露，原告在工商行政管理机关登记企业信息时亦将该手机号码予以登记，以备信息查阅，被告通过大数据比对功能，确定该手机号码与浙江维特网络信息有限公司合肥分公司相对应并进行标记，其信息并无错误，且软件标记的是企业信息，而非公民个人信息，庭审过程中也显示原告手机号在被告所有的软件上已再无此标记，据此，法院最终认定被告不构成侵权。

②原告朱烨诉被告北京百度网讯科技有限公司隐私权纠纷案。7原告认为被告利用网络技术，未经原告的知情和选择，记录和跟踪了原告所搜索的关键词，将原告的兴趣爱好、生活学习工作特点等显露在相关网站上，并利用记录的关键词，对原告浏览的网页进行广告投放，侵害了原告的隐私权。一审法院经审理认为，被告未经原告同意通过cookie技术收集和利用原告搜索信息，并根据原告的上网信息在被告合作网站上展示与原告上网信息有一定关联的推广内容，进一步利用了他人隐私进行商业活动，且该利用并非cookie技术使用的必然结果，已经构成侵犯他人的隐私权。二审法院经审理认为，网络用户通过使用搜索引擎形成的检索关键词记录，虽然反映了网络用户的网络活动轨迹及上网偏好，具有隐私属性，但这种网络活动轨迹及上网偏好一旦与网络用户身份相分离，便无法确定具体的信息归属主体，不再属于个人信息范畴；被告利用网络技术通过百度联盟合作网站提供个性化推荐服务，其检索关键词海量数据库以及大数据算法均在计算机系统内部操作，并未直接将被告因提供搜索引擎服务而产生的海量数据库和cookie信息向第三方或公众展示，没有任何的公开行为，不构成侵权。

（2）名誉权纠纷

原告浙江携银在线网络科技有限公司诉被告大公信用数据有限公司、大公國际资信评估有限公司名誉权纠纷案。8本案中，被告根据其收集整理的P2P网络借贷企业信用数据在大公资信上发布有关原告携银网的相关不利信息，原告认为构成侵权。法院经审理认为，根据被告大公数据对原告平台的持续跟踪监测，发布的报告涉及的事实基本属实，不构成侵权。

2、知产案件

（1）著作权纠纷

①原告中经网数据有限公司诉被告中华网国际网络传讯有限公司侵犯著作权纠纷。法院经审理认为，只要图表所表达的内容能体现制表人员独立的判断，则该图表就具有独创性。本案中，正是因为原告带有主观性的差值填补、季节调整，才使图表中某些“点&”的位置的安排体现了与其他公司所制作的图表的区别。横纵坐标轴刻度的选择，虽然受制于此类图表的特点，无论何人绘制，曲线走势图的大体走向可能会相似，但是因为坐标轴刻度选择上的主观性，使整个图表的形态会因绘制者不同的判断而呈现出区别。颜色背景的选择，虽与数据无关，但却亦属于绘图者针对其所绘制图表的美感所做的选择。因而本案所争议的曲线走势图图表具有独创性。故而被告在其网页上使用了原告网页上的“中经宏观经济预警信号&”图表10幅，“中经景气动向&”、“中经先行合成指数&”等曲线走势图68幅的行为，构成著作权侵权。

②原告上海汉涛信息咨询有限公司诉被告北京搜狐互联网信息服务有限公司侵犯著作权纠纷案。9法院经审理认为，原告大众点评网以及《北京餐馆指南》、《上海餐馆指南》二书所载涉案11家餐馆商户简介中的引号内文字，系由原告选摘自网友上传于大众点评网的关于各地餐馆的评论，引号内文字均系简单的日常用语，并非具有独创性的文字表达而不能成为《著作权法》所保护之作品，因而原告将该些文字融入到对餐馆的简介中不需要获得用户的许可。原告对涉案餐馆所做的商户简介具有独创性，可以成为《著作权法》所保护的作品，原告对涉案11家餐馆的商户简介享有著作权。

③原告济南白兔信息有限公司诉被告佛山鼎容软件科技有限公司著作权纠纷案。10法院经审理认为，原告对国家商标局商标公告中的商标信息内容进行了提取、分类和整理，并对商标标志中所含的文字、数字等进行了进一步提取和整理，同时还对商标信息后续的变更情况进行汇总，加入了自定义的字段信息等。原告对商标数据的编排和整理体现出独创性，涉案数据库构成汇编作品，原告对此享有著作权，可受《著作权法》保护。由于被告数据库中存在多个含有原告暗记的商标标志，在被告不能证明前述数据来源于其他地方的情况下，可以认定被告实施了复制原告数据库多个商标的数据的行为。

（2）不正当竞争纠纷

①原告北京阳光数据公司与被告上海霸才数据信息有限公司技术合同、不正当竞争纠纷一案。11法院经审理认为，《SIC实时金融》信息作为一种新型的电子信息产品，应属电子数据库，在本质上是特定金融数据的汇编，这种汇编在数据的编排和选择上并无《著作权法》所要求的独创性，不构成《著作权法》意义上的作品，不受《著作权法》的保护。但原告作为特定金融数据的汇编者，对数据的收集、编排，即对《SIC实时金融》信息电子数据库的开发制作付出了投资，承担了投资风险。该电子数据库的经济价值在于数据信息的即时性，原告正是通过向公众实时传输该电子数据库的全部或部分内容而获取收益，原告对于该电子数据库的投资及由此而产生的正当利益，应当受到法律保护。被告未经原告许可，其行为违反了经营者在市场交易中应当遵循的诚实信用原则和公认的商业道德，损害了原告的合法权益，已构成不正当竞争。

②原告上海汉涛公司诉被告北京爱帮公司不正当竞争案。12法院经审理认为，大众点评网的商户简介和用户点评，是原告搜集、整理和运用商业方法吸引用户注册而来。原告为此付出了人力、财力、物力和时间等经营成本，由此产生的利益应受法律保护。对于大众点评网的商户简介和用户点评，虽然被告爱帮网注有“在大众点评发表”字样和链接标识，但爱帮网已对全部商户简介内容和绝大部分点评内容进行了充分展示，网络用户一般不会再选择点击大众点评链接标识。因此，爱帮网的商户简介和用户点评已经构成对大众点评网相应内容的实质性替代，必将不合理地损害汉涛公司的商业利益。被告的这一经营模式违反公平原则和诚实信用原则，违反公认的商业道德，构成不正当竞争。

③原告北京集奥聚合科技有限公司诉被告刘国清、北京青稞厚成科技有限公司不正当竞争纠纷案。13法院经审理认为，大数据系互联网技术高速发展的产物，表现为通过网络技术无差异地收集网络用户上网信息，根据需要对数据进行整理、挖掘和分析，形成一定的数据库，用于投放广告或者其他用途。原告与青稞公司均从事大数据服务，向客户提供精准广告服务，二者间具有竞争关系，刘国清将其技术资历作为公司的业绩向投资人进行广告宣传，故刘国清的行为显然违背了其对原告应负的竞业禁止义务，损害了原告的权益。青稞公司在知晓刘国清的竞业禁止义务情况下，接受刘国清出资并聘任其担任公司的首席技术官，从事与原告相同业务，该行为违反了公认的商业道德及诚实信用原则，损害了原告的合法权益，应承担赔偿责任。

④原告北京微梦创科网络技术有限公司与被告北京淘友天下技术有限公司等不正当竞争纠纷案。14法院经审理认为，淘友技术公司、淘友科技公司并没有基于《开发者协议》，在取得用户同意的情况下读取非脉脉用户的新浪微博信息，其获取前述信息的行为没有充分尊重《开发者协議》的内容，未能尊重用户的知情权及自由选择权，一定程度上破坏了OpenAPI合作开发模式，违背了在OpenAPI开发合作模式中，第三方通过OpenAPI获取用户信息时应坚持的“用户授权+平台授权+用户授权”的三重授权原则，违反了诚实信用原则和互联网中的商业道德；同时淘友技术公司、淘友科技公司未经新浪微博用户的同意及新浪微博的授权，获取、使用脉脉用户手机通讯录中非脉脉用户联系人与新浪微博用户对应关系的行为，违反了诚实信用原则及公认的商业道德，破坏了OpenAPI的运行规则，构成不正当竞争行为。

⑤原告上海钢联电子商务股份有限公司与被告上海纵横今日钢铁电子商务有限公司不正当竞争纠纷案。15法院经审理认为，原告通过组建资讯团队形成的钢铁行业内完整的钢材、特钢、炉料等各项数据库的数据信息系原告付出大量劳动所获得，该数据信息能够为原告带来利益，体现了原告的竞争优势，故原告对其数据信息享有合法权益。两被告关于原告的数据信息是市场公开的信息、不具有独创性的抗辩意见，缺乏事实和法律依据，不予采信。

⑥原告衢州万联网络技术有限公司诉被告周慧民等侵害商业秘密纠纷案。16法院经审理认为，原告主张保护的“BOX网络游戏社区”网站数据库中的用户信息，能为原告带来经济利益且具有实用性，且该50多万个注册用户名、注册密码和注册时间等信息不易为相关领域人员普遍知悉和容易获得，且原告对上述信息采取了保密措施，故上述信息符合商业秘密的构成要件，是原告拥有的商业秘密，依法应受法律保护。

（3）技术服务合同纠纷

原告上证所信息网络有限公司与被告新华富时指数有限公司合同纠纷案。17法院经审理认为，被告未经原告许可与新加坡交易所共同开发上市了“中国A50指数期货”，在此过程中被告虽未将上海证券交易所实时股票行情直接提供给他人使用，但“中国A50指数期货”的基础即是上海证券交易所编制的中国A50指数，其成份股包含了在上海证券交易所上市的38种股票，被告根据这些实时股票行情和深圳证券交易所的12种实时股票行情编制了动态的、即时的中国A50指数，故被告开发、上市“中国A50指数期货”的行为，实质就是利用原告按约提供的上证所实时股票行情开发了衍生产品，该种行为显属违反合同约定。

表一：涉大数据案件的类型分布图18

上述案件涉及到民事和知识产权领域，我们之所以将民事案件纳入到案例中，是因为这类案件对我们研究大数据企业的商业模式有重要作用，有助于理清行业中存在的一些问题。大数据目前仍属于一种新兴事物，IBM对大数据给出了“4V特征”的定义即：大数据量（Volume）、快速变化（Velocity）、内容庞杂（Variety）和（不）精确性（Veracity）。也正因为大数据拥有的这些属性，导致大数据作为一种新兴事物目前在我国法律中找不到对应的权利类型。大数据从其产生、收集到整合、利用，各个阶段都有可能产生法律纠纷。目前司法实践中涉及到大数据的案例除却隐私权、名誉权等民事案件外，知产领域主要涉及著作权、不正当竞争、技术服务合同纠纷。

三、现有知识产权法律框架下对大数据的保护

大数据的基本处理流程包括采集、存储、分析和结果呈现等环节。采集到的数据因存在语义模糊、数据缺失等问题而无法直接使用，所以采集环节还应包括数据的预处理。19数据存储的同时亦进行着数据管理，经分析和处理所得数据成果需通过应用而发挥其最终价值。因此，可以将数据的处理流程大概划分为数据采集与预处理、数据存储和管理、数据处理与分析、数据成果呈现与应用四个阶段。20在当下现实语境下谈及的大数据并非仅是数据本身，而是指数据和大数据技术的综合。

在现有知识产权法律法规框架内，可以通过《著作权法》、《专利法》以及《反不正当竞争法》对大数据及其成果进行保护。根据数据处理流程和阶段的不同，对数据以及数据成果的保护路径又各有所偏重。

1、数据采集与预处理阶段的保护

该阶段涉及数据的取得、汇总以及初步的筛选工作，该阶段中采集到的数据内容大多可以通过《著作权法》予以保护，但是其中包含的一些来源于客观的信息或是用户的网络留痕数据不符合《著作权法》所要求的独创性要件，因此难以通过《著作权法》进行保护。

该阶段数据中的以文字、图片和视频等形态呈现的内容可以通过《著作权法》予以保护。司法实践中较为常见的数据内容有以下三类：第一类，软硬件服务商自行收集、整理后上传至自有平台的数据，比如某门户网站房产频道中关于某楼盘的介绍性文字和图片；21第二类，网络媒体自行或委托创作以及经授权可以使用的资讯类内容，比如新闻资讯类网站中资讯新闻；第三类，网络用户自行制作和提供的内容，比如社交平台中用户发布的文字、图片以及视频，电商网站中的用户评价、旅游网站中旅友的游记等。22作品受著作权保护的前提条件是具有一定的独创性且能够构成《著作权法》意义上的作品。这三类数据内容在具有一定的独创性且能够构成《著作权法》意义上的作品的情况下，即可以通过《著作权》法予以保护。

在司法实践中，第二类的资讯类内容通过《著作权法》进行保护的难度不大，但是第一类和第三类数据类型想要通过《著作权法》进行保护，不仅要满足构成作品的前提条件，还需要确认其权利归属情况。尤其是在第三种数据类型中，数据内容的产生基于用户自行制作和提供，在数据赋权仍未在法律层面进行确认的情况下，平台商对该部分数据享有何种权利或者权益，平台商以何种身份维权，仍是司法实务中的一个难点问题。从另一方面而言，采集数据同样不能侵犯他人的权利，不仅包括不侵犯他人的著作权，同样包括不侵犯他人的商业秘密以及不违反网络爬虫类“君子协定”。其中商业秘密以及“君子协定”所涉及的诚实信用原则以及商业道德原则将在下文加以详细阐述。

2、数据存储和管理阶段的保护

对于收集来的海量的结构化和非结构化数据，收集者需要运用手段和技术对其进行存储和管理，在该阶段中多涉及数据的集合和汇总，比如数据库、数据仓库、云数据库等。23该部分内容也可以通过《著作权法》予以保护。

《伯尔尼公约》明确将数据信息作为汇编作品予以保护，《与贸易有关的知识产权协议》第10条第2款规定：“数据或者其他材料的汇编，无论采用机器可读形式还是其他形式，只要其内容的选择或安排构成智力创作，就应该给予保护。”我国《著作权法》第十四条规定：“汇编若干作品、作品的片段或者不构成作品的数据或者其他材料，对其内容的选择或编排体现独创性的作品，为汇编作品，其著作权由汇编人享有，但行使著作权时，不得侵犯原作品的著作权。”在数据的存储和管理阶段中形成的数据库，如果在内容的选择或者编排上体现出了一定的独创性，即可以将该数据库作为汇编作品通过《著作权法》予以保护。前述济南白兔信息有限公司诉佛山鼎容软件科技有限公司著作权纠纷案，法院即认定了原告对商标数据的编排构成汇编作品。

大数据要在《著作权法》上获得保护，首先需要满足独创性的要求，但现实中多数数据来源于客观事实，数据的收集也多来自公开领域，基于某些用户的使用习惯或是行业惯例，故而收集到的数据信息可能无法给予数据采集者太多的个人创作空间，而对于那些缺乏独创性的数据集合则无法通过著作权给予保护。由此，如何界定某一数据集合是否具有一定的独创性，也成为通过著作权对其进行保护的一个难点。需要着重指出的是，著作权保护的是数据的选择或编排方法，而非数据选择或编排的内容，对于大数据而言，他人可轻易改变编排方法，但实质性内容可能仍然一致，该种情况下对于大数据本身的保护也是一个难题。

3、数据处理与分析阶段的保护

对庞大数据集合进行处理和分析能够得到具有应用价值的数据或者数据产品。在此阶段数据的价值得到了巨大程度的提升，具有商业价值的数据可以通过商业秘密予以保护，为分析处理数据所使用的方法可以通过方法专利予以保护。

通过数据处理和分析获得的数据成果一般都具有相当的经济价值，由此该类数据成果的实用性要件不难满足，在司法实践中该类数据成果的秘密性和保密性才是论证其构成商业秘密的难点。前述北京阳光数据公司与上海霸才数据信息有限公司技术合同、不正当竞争纠纷案中，法院认定原告阳光公司的《SIC实时金融》数据分析格式符合商业秘密的构成要件。本案中涉及了两种常见的与数据资产相关的商业模式——租售数据模式与租售信息模式。租售数据模式是指售卖或者出租广泛收集、精心过滤、时效性强的数据。24。而信息與数据不同，是指经过加工处理，承载一定行业特征数据集合。25

上述案例中，阳光公司的上游权利人——向其有偿出售行情数据的商品交易所和证券公司采用的就是租售数据的模式。该种模式中，经营者通常掌握大量的客户数据，而这类数据最为显著的特征是实时性，经营者在租售数据前通常已经完成对数据的预处理。租售数据模式的另一种形式表现为掌握数据的公司利用数据为客户提供增值服务，如销售导航仪的公司，同时为客户提供即时交通信息服务。26租售数据的商业模式同时催生出专业的数据交易平台，如贵阳大数据交易所等。由于经营者尚未对这些数据进行分析处理，权利人也通常不会对其采取保密措施，所以此时的数据无法通过商业秘密予以保护，且若数据本身无法构成《著作权法》意义上的作品，权利人也不能通过《著作权法》寻求保护。故而，对此类数据往往只能通过双方之间的合同条款加以保护，或通过《反不正当竞争法》第二条所规定的一般的诚实信用原则或商业道德原则加以约束。与实时性的数据不同，法院认定阳光公司将从交易所处获取的单个的、分散的行情信息源进行统一编排、加工整理，形成了再生信息源性质的综合行情信息，并认为此类信息具有较强的实用性和价值性。27阳光公司所采用的即为租售信息模式，其特点是权利人对收集而来的数据进行深度整合萃取，并通过庞大的数据中心及专用渠道加以传播。28与原始数据不同，此时的信息往往经过深入的整合和处理，因而更容易满足商业秘密的构成要件，进而通过商业秘密的方式加以保护。

专业化处理实现使数据“赋值”和“增值”，专业化处理过程中所使用的挖掘、整理、计算等方式方法可以形成特定的算法，甚至是计算机软件工具，再通过软硬件以及与互联网的结合解决一定的技术问题，这些都具备鲜明的技术属性，可以划归到计算机程序的发明专利之列，通过申请方法专利予以保护。但是，专利权的产生不同于著作权的自动产生，要求具有相当的新颖性且需要通过行政机关的审查才能取得，所以作为专利权进行保护的前提即为专利权的获得。目前，我国关于专利权的审查标准相对严格，是否能够顺利通过审查取得专利权亦成为是否能够获得知识产权保护的先决性条件。

4、数据成果呈现与应用阶段的保护

数据成果呈现与应用是数据处理流程中的最后一个环节，也是数据“赋值”后数据价值的变现阶段，该阶段不仅会将较为抽象的数据转化为相对具象的成果，更会将该具象成果与具体的商业活动相结合，促使数据成果商业利益最大化。

从数据处理与分析到数据成果呈现与应用，这一过程不仅需要投入大量的时间，更需要投入大量的人力和物力，这其中离不开开发人员的大量智力性投入。从现有情况来看，数据成果的具象化多以应用软件的形式出现，而该种类型软件的开发和运行均依托于大量相关数据的收集和分析，这一点有别于传统的应用软件。现阶段开发的一些具有人机交互功能的软件即属于这种类型，比如微软公司开发的人工智能软硬件“小冰”、亚马逊开发的智能音箱以及还在研发完善阶段的无人驾驶技术。该类数据成果的具象化如果以软件的形式存在，则可以通过软件著作权予以保护。涉软件案件的审理过程中，关于软件的比对往往是案件审理的重点和难点，加之大量开源软件的存在，如何在软件开发过程中的自由再发布原则与软件著作权作为一种绝对性权利予以保护之间进行平衡，对通过软件著作权保护数据成果提出了挑战。

在数据呈现与应用阶段，相关主体还可能将数据成果通过构架运营某种商业模式的方式进行应用。在现有法律法规框架下，商业模式暂时还无法在整体上通过知识产权进行保护，但这并不影响将该商业模式内的某些构成要素通过知识产权进行保护。

在四个数据处理阶段中还会产生一些无法通过特别法进行保护的内容，例如违反“爬虫协议”的君子协定或者开放接口协议等采集数据的行为，该部分内容的保护可以通过《反不正当竞争法》第二条的遵循诚实信用原则和公认的商业道德原则予以保护。前述上海汉涛公司诉被告爱帮公司不正当竞争纠纷案中，即通过认定爱帮公司的经营模式有违公平和诚实信用原则、有违公认的商业道德而构成不正当竞争，对大众点评网中的内容予以知识产权法意义上的保护。

四、大数据类知识产权案件疑难问题分析

大数据类知识产权案件中可能涉及的知识产权问题相对其他案件更加全面，在大数据采集、应用、交易、保护等多个阶段均可能涉及个人信息保护、著作权保护（含软件著作权保护）、方法专利的保护、商业秘密保护及不正当竞争的保护，还有可能受到《反垄断法》的调整等，有时更是多个问题的融合。其中个人信息由于属于《网络安全法》、《侵权责任法》的调整范围，不在本章关于知识产权的讨论内进行探讨。

（一）著作权的保护

依据著作权法基本理论，思想与表达二分法是区分某一客体能否成为著作权法上保护客体的方法，因此，有观点认为UGC（User Generated Content）即用户提供的内容，如某些评价等可以作为著作权法中的“作品”而受到著作权法的保护29。但某一用户提供的单一内容并不能构成“大数据”，认识此类数据时，应全面考虑用户提供的内容，因平台在获取相关数据时无法确认其创作者的真实性，故整体去认知相关内容能否成为大数据，还应有所区分。此类问题在实践中较易区分，基本的著作权法理论即可成为指导。因此，从《著作权法》角度保护的大数据内容，疑难问题体现在两个方面：一是对数据库的保护；二是对使用软件进行数据采集时，软件的著作权法保护。

1、数据库的著作权法保护

著作权法保护与反不正当竞争法保护是目前两种主要的数据库保护模式。司法实践中选择《著作权法》进行保护的案例相对较多，数据库的保护在国际上的法律依据已经明确：《TRIPs协议》第10条第2款规定：“数据或其他材料的汇编，无论采用机器可读形式还是其他形式，只要其内容的选择或安排构成智力创作，即应予以保护。这类不延及数据或材料本身的保护，不得损害数据或材料本身已有的版权。”《世界知识产权组织版权条约》第5条也明确规定：“数据或其他资料的汇编，无论采用任何形式，只要由于其内容的选择或排列构成智力创作，其本身即受到保护。这种保护不延及数据或资料本身，亦不损害汇编中的数据或资料已存在的任何版权。”因此，数据库的著作权法保护是基于汇编作品产生的，其独创性体现应在于数据的选择、编排，数据库的体系和结构等，而不是对数据本身的保护。

2、大数据软件的著作權法保护

大数据软件可能遭受的侵权行为表现为两种类型：一是抄袭行为，即大数据软件作品源代码直接雷同；二是第三方恶意修改大数据软件作品，对大数据软件服务进行屏蔽、修改界面等。此类案件中，通常涉及如下问题：

一是技术中立抗辩，即软件提供了某种技术，技术不侵权，从而软件不侵权的抗辩逻辑。而该问题的实质是软件是提供数据还是提供技术。目前，多数情况下，提供行为指向的客体是混同的，因此能够使用技术中立进行抗辩的情况愈来愈少，只有单纯的技术才可能不被苛责。

二是实质性相似的判断，司法实践中两款软件的比对常成为案件难点。我国法院关于软件作品实质性相似的侵权判决，包括其他类型作品的实质性相似的侵权判决中，基本上是参照作品架构、语言风格、表达形式等要素，综合性地考虑是否构成实质性相似，30具体操作方法借鉴了美国法院三步检验法，即：抽象——过滤——对比法。

（二）方法专利在大数据保护中的构成要素分析

方法专利对于大数据的保护体现在两方面：一种是数据挖掘中，数据挖掘专利就是指对数据挖掘开发者或委托开发人对数据挖掘技术，或对数据挖掘获取的信息向国家审批机关申请专利，经依法审查合格后获取的专有权；或者说，数据挖掘专利是指对数据进行处理，并获取有益知识的计算机技术的专用权，31其本质是一种计算机程序的方法发明，对于涉及计算机程序的专利能否获得专利权的授权，在实践中存在较大争议，其实质是对于算法能否受到专利法保护的争论。美国法院在判例中认为：即使申请涉及的系统包含了计算机程序，只要该程序通过一系列数学计算产生了实用和有形的技术效果，仍然可被授予专利权。32我国目前对此区分两种情况予以处理：如果仅仅利用计算机程序实现了某种数学计算方法和规则，则无法被授予专利权，也就是说在对数据进行挖掘之时，只是利用数据编写了一套体现某种智力活动的规则和方法的程序，则不能构成方法发明；如果计算机程序的执行是一种正确利用自然规律的技术手段，并且能够解决具体的技术问题，例如通过数据规律的概括使某种程序可以自然读取某人的身份信息，则该程序属于技术方案或其组成部分，应当受到《专利法》的保护。

另一种方法专利是涉及商业方法的专利，例如收集、统计用户信息的方法，金融机构交易数据分析方法等等，此類方法究竟属于“智力活动的规则和方法”还是属于可授权的专利，存在较大争议。美国等国家已承认商业方法在一定条件下可以被授予专利权，但判断标准尚未统一。33我国今年4月1日起实施的《专利审查指南》将专利保护范围扩展至含有技术特征的商业模式、商业方法，这对于随着网络发展不断创新出的商业模式和商业方法的维权具有重要意义。

（三）《反不正当竞争法》在大数据类案件中的保护

1、数据库的反不正当竞争法保护

上文讨论了对数据库的著作权法保护，但著作权法理论仅仅对独创性的选择和编排进行保护，并非针对数据库中的具体内容，而数据库中的内容确是真正具有经济价值的产物，因此作为《著作权法》的补充，《反不正当竞争法》对数据库进行了进一步的保护。同时，对于难以成为“汇编作品”的数据库，《反不正当竞争法》也可达到使“智力投入”得到保护的效果。制作人对数据库投入了大量资金、劳动，只要竞争者利用了数据库中的数据，可认定竞争者的行为违反了《反不正当竞争法》规定的诚实信用、公平等基本竞争原则，构成第2条第2款意义上的不正当竞争行为。34同时，如数据库符合商业秘密的条件，也可作为商业秘密进行保护。

2、商业秘密的保护

我国《反不正当竞争法》中对商业秘密的定义为“不为公众知悉、能为权利人带来经济利益、具有实用性并经过权利人采取保密措施的技术信息和经营信息”。因此，能够受到《反不正当竞争法》保护的商业秘密类数据不包含为公众可见的用户点评等数据信息。调研中多数企业对自己的数据采取了技术措施以商业秘密的形式予以保护，而第三方以不正当手段获取、使用商业秘密的行为大量存在，企业在寻求法律保护此类数据时的难点是举证：原告不仅要对哪些数据构成其商业秘密进行举证，还应对其使用了某种技术保护措施进行保护进行举证，同时要对侵权方的不当手段进行举证。

上述对于数据的反不正当竞争法角度的保护，主要来源于《反不正当竞争法》的基本原则，即维护竞争者之间地位平等，遵循公平、诚实信用的基本原则，从知识产权促进竞争的反面为限制不当竞争提供了法律保障。

（四）数据的垄断和排他

对于无形的数据进行权利界定，其规制对象智力成果均属于无形资产的范畴。单个数据本身的价值难以通过知识产权相关规定予以保护和规制，但是数据的分析和挖掘价值却可以通过知识产权的保护进行方方面面的规制。那么，某一数据主体通过数据采集得到的数据能否成为其垄断资源？调研中，我们发现，目前已经出现的数据寡头与数据联盟之间的矛盾已渐现端倪。数据寡头利用其多平台的特点，收集大量数据进行相应的分析，在数据的采集、运用上享有了当然的话语权，但这种垄断地位不应是数据本身的性质，大数据的技术本身应当具有非排他性，即任何一个经过投入的主体，在对数据的采集和利用过程中均可以通过大数据的技术手段对数据加以一定形式的利用。

五、大数据司法保护的价值性判断

由于海量数据的存储和复制，多借助于互联网的分发和获得，在此过程中存在包括提供电信接入服务、支付服务、浏览器服务、内容服务和平台服务等多个环节，围绕不同时期和环节形成多维数据，企业间争夺产权将会形成争议，而且企业的商业模式和广告分成也将受到影响，甚至可能出现假造数据的情况。对大数据知识产权保护，应当遵循如下原则：

1、人本原则

人本法律观是相对于神本法律观发展起来的，马克思曾指出：“人是法律的出发点” “全部人类历史的第一个前提无疑是有生命的个人的存在”35。无论是科技还是法律，其发展和完善都应当为人类服务，脱离了这个本质，就会损害到人类自身整体的利益。

（1）法律是因人而生，因人而存的。36大数据的发展和完善应当遵循保护人类基本的自由、平等、安全、尊严价值，促进社会的福祉发展的作用。在数据采集和使用过过程中，对于涉及到个人隐私、信息安全方面信息的数据应当采取一定的保护措施，必要时可以对大数据行业进行立法规范，设置一定的行业准入门槛，防止数据采集和交易过程中损害个人自由、尊严、隐私等情况出现。

（2）一种观念认为，基于大数据行业发展前景，使用人工智能制作出的各种形式的图文，充其量只能是一种逻辑的表达，其表达方式是非常有限的，不应当被视为作品。如果我们能够设置人工智能使其像人类一样“思考”，它也只是在感官上更甚于常人，而不会产生感觉，其工作成果一般不应视为作品，不能通过作品的形式获得保护，而应视为一种财产，即人类使用工具劳动获得的收益。还有一种观念认为，人工智能根据预置在程序架构中的逻辑以及使用人工智能的命令，随机组合各种图文创作了作品，作品著作权应当归属于程序开发者及使用者，但双方已经根据协议进行约定的除外。上述两种观点中，我们倾向于前者。

2、适度采集、隔离使用原则

（1）适度采集

大数据企业存在不同的样态，不同的主体对于数据的兴趣和癖好也不一样。初始采集过程中，企业对于原始数据收集往往是兼收并蓄，尽可能多地收集各类数据，但是往往有些数据涉及到敏感信息，如个人的账户、密码、身份等等，如果这类数据被买卖，将会造成难以估量的后果。对于这类涉及到特定信息的数据，应当慎重采集，采集后还应对数据信息进行脱敏处理。将个人信息进行大规模交易，可能会涉及到刑事责任。

（2）隔离使用

从法律层面来说，应当加大对数据采集的必要性管理，对于特定信息禁止收集、存储和使用。采集和使用的环节应当进行隔离，并在企业间、企业各个部门之间对信息进行必要的分离管理。采集和使用应当分开进行，这样有利于明确责任主体。建立采集和使用行为分离机制，一方面有利于保护特定的主体的隐私、商业秘密等利益，另外一方面能够有效地预防犯罪，防止信息外泄的恶性事件。

3、应当遵循合理避让的原则

大数据基本形成或存储于服务器或者云端上，有些企业的数据是以原始状态存储的，有些企业则是采取模型式存储，传输和存储环节存在不完善的地方，可以为其他企业抓取。在互联网环境下，即便数据保护已经逐步完善，如通过https的方式加密传输，但是由于分享和传播的需要，他人仍然可以接触到数据并加以破解，导致数据外泄。以下几点需要我们特别注意：

（1）通过爬虫或者其他方式，对于企业数据的抓取，会损害企业的正当权益，不仅会导致数据财产的丢失、泄密，还有可能引起服务器运行的紊乱。通过这种不劳而获的方式获得他人的财产进而进行售卖，会造成恶性竞争的问题。

（2）在企业竞争过程中，可能存在各种矛盾，但竞争对手之间应当避免对于大数据的计算结果采取过度解读，从而形成对某一特定企业的恶意解读，损害企业的合法权益，即便这种解读是客观真实的，竞争企业间也应当避免类似情形。

（3）企业之间通过网络开放协议，或者通过线下方式单独订立协议的，对于加密或者开放的数据及数据统计结论，应当采取合理避让的方式，在竞争对手之间避免出现恶性竞争，防止利用大数据做出对竞争对手的侵权。

4、利益平衡原则

在数据采集、收据挖掘和数据交易等环节，数据本身并不产生价值，而是基于其二次开发和深度加工形成的分析报告才产生显著价值。虽然有些公司开放了数据接口，但这并不意味着他人可以任意取用，而是需遵守一定的协议。整个数据加工的流程产业链中，存在多种情况，数据采集和挖掘以及交易都有可能被第三方干扰，人员流失也可能导致技术和客户资源外泄。基于大数据产业链的整体比较复杂的情况，对于数据的保护应当遵守利益平衡的原则，特别是公共利益的保护，以有效的制度救济作为补充手段，在知识产品的生产和流转的动态过程中，始终使知识产权人的利益和社会公众的利益保持一种平衡，37在数据的生产交易环节加强保护，通过适当的知识产权方式方法保护创新。例如：

（1）在采集时，应当平衡用户利益和平台利益。数据采集者和用户之间是对立统一体，用户可以基于大数据获得更多的有用信息或服务，而采集者可以获得一定的利润回报。但用户是否有权禁止他人对自己进行数据进行收集、为自己“画像”，目前还存在争议。理论上来说，数据采集者可以根据用户行为进行客观记录，但应当保证这种记录不被用于非法用途。而采集者也可以根据用户的癖好和习惯，向用户推荐更多用户关心的信息，方便用户快捷精准地获得资源。

（2）在加工时，应当平衡数据采集者和数据中介服务机构之间的利益。在数据的整理、存储、挖掘中，也应该平衡各方利益以及对于安全的需求、统一性的需求和便利性的需求。各方应当在数据加工时遵循一定的规范，按照行业或者国家标准来进行，但目前我国尚缺乏有效的规范。

（3）在数据交易中，还应当防止各种敏感数据，包括涉及到商业秘密、个人隐私或者其他涉及到法律权益的数据在市面流通，为交易双方提供合法公平的市场环境。

5、鼓励数据流动、分享原则

大数据本质上是一个数据拼图，如果企业将大数据作为企业经营的版图，引起行业恶性竞争或者数据垄断，必然损害整体的数据行业发展，进而损害到社会公共利益。大数据的垄断与大数据的本质背道而驰，最终毁掉的是大数据本身的价值。38对此，我们需注意以下几点：

（1）鼓励企业将其经营的数据在脱敏以后加工进行交易，甚至于免费进行分享，会促进行业的整体发展，但是这种机制必须在一定的安全保障下进行。

（2）对于传统企业来说，大量的运营信息的数据化及数据化成果采集、挖掘和使用将会是未来的行业发展的重点，有价值的数据将会被逐步垄断，导致需方和售方博弈。在一定时期内，完成数据化将会导致技术、人才竞争的加剧。

（3）数据版图之争成为下一个纠纷热点，围绕传统行业数据加工和挖掘和新兴市场主体的数据采集都会引发激烈的竞争。整体互联网法依赖于分享机制的形成，公开的技术分享将会大大促进行业整体进步。

6、法律伦理原则

人工智能（AI）是使用计算机科学的概念、程序和方法从事认知过程的科学，实际上就是一种机器模仿人类智力活动的技术。人工智能研究的创始人之一的明斯基（Marvin Minsky）在1968年用一句话集中概括了人工智能研究的实质：“让机器从事需要人的智能的工作的科学”。39人工智能容易引发伦理困境，如前文所述，技术虽然具有中立性，但是使用技术的人却具有一定的意图，在对于人工智能模仿人类的活动所产生的法律效果缺乏评估的情况下，还是应当慎重认定相关法律行为和法律责任。从本质上来说，人工智能所遵循的是设备预先内置的逻辑思维能力，也就意味着这种规则的是由人类创作的，而人类使用人工智能进行二次学习的过程会产生下一阶段的活动，但由于无法预先评估机器在學习后会具备哪些能力，将会导致一些法律问题。例如高速行驶的无人智能汽车，在极端情况下，可能要面临着杀死乘车人还是行人的问题，具体决策都是根据计算机自动识别和评估来完成的，如果通过事先预置的智能系统进行决策，将会导致灾难性后果，甚至人工智能开发者也需承担刑事责任。但如果将这种情形下的决策权移交给驾驶者，就能相对缓解法律伦理困境。

大数据案件近年来逐步增多，与以往的涉互联网案件显著不同的是，以往案件的多以“信息”为载体，而大数据模式以“全息”为载体。大数据模式采用全息的多维度、多样态来解读数据，在数据采集、数据分析和数据产权、数据成果等问题上争议非常复杂。我们通过提炼一定的规则方法，希望能够在大数据产业起步阶段，助力促进产业健康发展，培育和净化市场环境，优化社会创新的氛围。

作者：郭振华刘君婕刘佳欣游美玲韩乔亚陈昱晗

第2篇：广安市人工智能大数据新职业培训调研报告

摘要：在“互联网+”的大背景下，大数据应用为人工智能技术的开发提供了广阔的空间，打破了传统模式和现实束缚，为数字经济带来了新的发展机遇。目前在大数据支撑下，人工智能在金融、教育、大健康、汽车、零售、安防等领域都有涉及，催生新技术、新产品、新产业、新业态、新模式。在智慧时代，支持和鼓励高校和企业开展和提供人工智能大数据课程和技能等相关培训，加强对员工的再就业培训和指导，确保在岗职工的顺利转移。从提高公共就业服务质量的角度出发，利用调查数据和相关指标，对人工智能大数据背景下广安市的就业公共服务质量进行比较和分析，进行了实证分析，并设定了观察变量：就业政策，职业介绍所，就业培训，专业公共服务，以提升广安市的新职业发展。

关键词：人工智能;大数据;新职业培训;调研报告

人工智能(AI)是第四次科技革命的主要技术之一，起源于上世纪50年代，人工智能技术的发展对各行业产生了巨大的冲击，技术手段的进步促进了各行业工作方式的改革，并衍生出相关新职业，人工智能大数据新职业培训尤为重要，就这一个课题进行了深入调研：人工智能时代的到来促进着行业的发展和变化，目前人工智能应用到各领域后，业务效率不断地提高，工作失误也明显降低，各行业的竞争力都在不断地提升，这是人工智能技术对各行业发展的积极影响。各单位人员在工作中也需要不断地改进，适应目前的行业发展形势，跟上人工智能时代的步伐，通过不断的学习，来提升自身的综合素质。特别是疫情发生后，各层面对人工智能和大数据等新职业的定位和重视度加强，各地政府应适应时代发展需要进行新职业人才的推动。

一、广安市人工智能技术培训市场现状调研

课题组采用的研究方法：以实证研究为研究范式，运用文献研究、问卷调查、数据分析等研究工具，探讨人工智能时代职业培训在工作环境和技能变化中的发展策略。

(1)文献研究法。通过图书馆、档案馆、互联网等渠道收集人工智能时代职业培训、工作环境和技能要求等相关研究资料。

从图1、图2可以看出，我国人工智能大数据产业的发展预期非常乐观，2018年我国共有163家人工智能产业园区，2019年新增产业园区138家，国内人工智能产业园区总数达到301家。分区域来看，我国人工智能产业形成以京津冀地区、长三角地区、珠三角地区协同发展的格局，尤其东部沿海地区为重点部署区域。

(2)问卷法。采访了人工智能专家和相关职业适龄劳动力，深入了解人工智能对职业培训的影响、工作环境变化对适龄劳动力的技能要求，了解职业培训的未来发展情况。

网络发布调查问卷QQ、微信群6个，收到问卷调查表46份。

(3)专家咨询法。10月16日，由中国人工智能学会、重庆市人工智能学会主办，重庆邮电大学、科大讯飞股份有限公司承办的“2020大数据智能化发展暨人工智能创新发展高峰论坛之信息科技前沿论坛”在重庆邮电大学成功召开。加拿大皇家科学学院院士、波兰科学院外籍院士，加拿大阿尔伯塔大学 Witold Pedrycz教授作题为“Explainable AI through Information Granules： Challenges and Perspectives”大会特邀报告。他分析了人工智能和大数据的发展趋势，阐述了智能行为，以及解释其行为的过程。讲述了AI的可解释性能力和建模能力。最后，分析了人工智能和大数据任务中抽象层、概念层、数据层等不同层次的关键技术。该专家讲座紧跟计算机科学前沿，能夯实理论基础，更好地指导地方进行行业应用具有极强的现实指导意义。

同时，李国杰院士指导出：大数据与人工智能是信息时代的新阶段，其产业分布如图3.

(3)现场考察法。通过到机关、企事业单位进行考察，了解新职业在广安的实际分布、人才岗位等情况。

到市经信局、人社局、市经开区、华蓥市经开区、云量科技、工信化平台等进行调研，并配合四川省海外归国高层次服务团汤影博士一同调研。开展了人工智能大数据新职业的企业运营、人才培养等调研，并针对关键技术进行指导，并在广安市产教合作、人工智能大数据领域的建设等方面提出了6点建议。同时，对市帮帮团第十团成员、广安职业技术学院计算机类专业教师、广安市各企事单位信息技术人员进行了人工智能大数据的2场科普讲座。汤影博士建议，应在全市机关企事业单位中形成一种人工智能大数据的新职业理念，才能发挥发新时代信息技术的革命，从而助推广安市数字经济的发展和智慧城市建设。

(4)数理分析法。对收集的数据资料进行过滤和整理，更具体地了解人工智能时代工作环境的发展特征，分析当前工作中适龄劳动力的技能应用情况，得出更合理、科学的调查结果。

国家《新一代人工智能发表规划》要求加强基本理论研究和基础设施部署。其主要是面向人工智能应用的研究开发，涉及人工智能基本理论和基础设施的部署少，在未来的实施中应当高度重视。

以广安为代表的中小城市人工智能技术调查与情况分析

(一)市场意识高

从问卷数据来看，大部分受访者来自广安市各企事业单位，86.72%的受访者听说过人工智能技术，这说明人工智能技术在中小城市的市场普及率较高，这将是人工智能大数据在中小城市发展的良好机遇。

(二)利用率低

市场意识是一个行业发展的前提，利用率是其发展的必要条件。一个行业最根本的目标是盈利，没有盈利的行业是无法立足于市場的。对于人工智能技术来说，利用率是其盈利的基础。调查显示，中小城市当中只有7.26%的受访者经常使用人工智能技术，92.74%的受访者不使用或偶尔使用人工智能技术。低利用率导致了人工智能技术的盈利水平低，也是人工智能技术未来发展中需要关注和改进的地方。因此，要想该新职业在智慧城市发展中起推动作用，首先要提高人工智能技术的利用率。

(三)人工智能发展的类型相对较差

人工智能技术作为一个新兴产业，在替代劳动力、提高生产效率方面仍然发挥着重要作用。从问卷数据来看，广安本地大部分受访者的人工智能技术主要销售饮料、零食、日用品等销售类商品，而只有极少数人工智能技术在其他产业中涉及较浅，这进一步反映了中小城市人工智能技术使用的产品类型相对匮乏的缺陷。

二、广安市人工智能行业存在的问题

广安市人工智能产业存在三大障碍，主要体现以下：

1.人工智能的应用技术过于复杂，对基本理论一无所知。基本技术积累薄弱，把技术看得过于重要。 “由于结构失衡的问题，人工智能产业似乎建在技术领域。”在创新技术上似乎没有进展。由于基层技术积累薄弱，人工智能的核心环节受到很多因素的控制，阻碍了人工智能的发展。

2.尽管人工智能在概念上和实际中很流行，但企业和政府领导人对技术的了解很少，缺乏对人工智能推广的思想。他们也无法准确的评估人工智能的商业价值。随着工业发展的气氛相当活跃的今天，人工智能面临着同质化和碎片化的风险。这将延长人工智能商业化的周期，并加强人工智能未来发展的周期性变化。缺人工智能和传统工业，缺乏专业技术人才和跨界人才限制了工业的发展。从人力资源开发的角度来看，我国政府或单位人工智能领域的学科和人工智能建设涵盖的学科非常广泛，相关学科的分散化需要提高形成和训练以形成联合力量的人才的数量和质量。当前，提供人工智能的学校很少，接触的时间短，学科的创新型强。目前，我国还没有出现人工智能和传统产业界限的超高技能人才，也没有为新兴产业中人工智能的应用和推广做出重在举措。

3.人工智能发展气氛似乎并不活跃。尽管人工智能的概念目前正在引起人们的关注，但是公司和政府仍然没有完全理解该行业的发展和缺乏思考。普遍高估并急于兑现人工智能的近期商业价值。工业发展的气氛是也是受到时代发展的影响，面临着同质化和碎片化的风险。这可能会延长人工智能商业价值的偿还周期，并加剧该行业未来发展中的周期性波动。

4.缺乏专业能力人才。人工智能大数据是一个新兴产业。技术和工业的快速发展出现了人工智能和传统产业的矛盾，从而限制了工业发展与实体经济发展之间的深度融合，对新兴产业与传统产业的有效利用更需要专业人才的应用和推动。

三、广安市人工智能大数据新技术培训措施方案

着眼于未来人工智能大数据将会是未来最有发展前景的职业，更好地利用人工智能，作为培训与开发的从业人员必须做出有效应对，广安市应当在人工智能大数据新职业培训方面发力，让人工智能在培训开发模块发挥最大效用：

1.重新定义和发展人工智能的重要性。一是发展大数据和人工智能需要高度重视计算机系统结构和基础软件。二是在企业发展的前提下，通过培训员工的人工智能大数据的途径，通过线上结合线下的模式促使员工了解人工智能大数据发展前景，员工利用人工智能更好地胜任工作。而在人工智能引领下的培训与开发，要与员工的意愿达成一致、员工的工作积极性与企业推广人工智能技术的力度成正比，逐渐使用人工智能取代其他的工作方式，改革创新学习方法，制定一定的激励措施，促使企业与人工智能之间实现整体转型。

2.面对信息技术和人工智能的飞速发展，从业人员应作为培训和发展的模块，积极学习人工智能大数据相关知识，主动接触人工智能，积极创造学习人工智能的良好环境，并利用人工智能来应对复杂而重复的任务。进一步促进人工智能在新职业的发展。

3.人工智能使企业发展更高效，构建起组织智能和建立网络：建立可供个人使用的文化资源，以增强人工智能影响;诸如人工智能语音，图像和集成分析之类的技术将被用于将接收者人为地引入到训练系统中，并且可以同时获得响应方法。人工智能提供的AR技术在一定程度上模仿了接收者的文化有效性和实用性，注重创新型人才能力培养在 “互联网 + ”、大数据、云计算等新技术以及经济社会快速发展的共同驱动下，人工智能引发的产业变革与技术进步必然会影响人才需求取向。

4.注意创新型人才的培养与指导，例如精通互联网人员，懂得AI技术操作、云计算、AR等，人工智能随着时代的发展而发展，与企业人才管理应用相结合，进一步创造力发展，提高人们的创新意识，摆脱传统的枷锁，以适应全方位的发展，提高企业的竞争力和核心技术开发能力，面对单一的发展模式。在人工型智能的参与下，各个部门能更好地转变，对人们的要求也越来越高，以及必须提高自身技能以适应企业的发展。

5.支持新型职业的招商引资。利用人工智能大数据技术，可以对数据进行爬虫，并对数据进行挖掘，精准分析企业的需求要素，找到招商引资的切合点，从而分析出双方的共有、共需、共谋发展的素材，更有利用招商引资的成功。

6.加大新职业及其职业标准的开发力度，适应现代服务业发展的需要。由于现代服务业依托电子信息等高技术，其新职业和新岗位产生的速度很快。因此，要保证现有从业人员和未来从业人员能从事现代服务业，新职业和新岗位开发必须与现代服务业发展同步。同时，要充分发挥相关行业协会在制定行业发展规划、行业职业标准、职业技术培训方面的积极作用，鼓励行业协会组织开发与现代服务业相关新职业、新专业和新工种，加快发展适合现代服务业的新专业人员及其专业水平需要发展。因此，广安要提高服务业水平，新职业和新工作的发展必须与现代服务保持一致同步业务发展。

作为培训和发展的实践者，我们需要从辩证法的角度学习人工智能，并学习通过正确的方向将人工智能引导到良好和稳定的趋势。公司的效率和发展模式阻碍了人工智能的发展。通过从智能技术培训设置，学习时间调整和使用人工智能计划中改善人工智能的推广，智能技能系统可以制定详细的企业工作模式，见下图1。

四、广安市各机关事业单位及企业的科普知识措施-

1.大数据信息资源的利用

随着大数据与人工智能专业备案机构和企业的增多，大数据与人工智能等新型综合专业的建设，培养具有创新能力和实践能力的创新型人才，成为广安市探索和思考的方向。为新旧动能转化提供人才支持的能力和行業要求。加强广安市各企事业单位的科普知识，让各级人民了解以信息化、大数据、云计算、物联网为代表的科技知识，了解职业发展趋势的变化。随着智能时代的到来，广安各级单位都可以适应人工智能时代的发展。企业发展和智能的结合已经成为新兴产业最重要的主题。未来学习者能力模型的构建，鼓励员工学习以AI超脑为核心的大数据和人工智能技术。辅助新职业政策的科学制定、促进新职业均衡发展、提高新职业质量、优化工作成果和教学等方面发挥了重要作用。

2.增加政府投资

广安市政府应加大科普投入，积极引导和帮助扩大科普经费渠道，重视对企事业单位的科普投入。在政策上，要适当扶持一些相对薄弱的开发单位和企业，特別是供应不足的开发单位和企业。此外，有必要在政府的科研计划中纳入关于科普的规定。

3.通过大众媒体普及科学

近年来，通过大众媒体传播，特别是新媒体、新业态的蓬勃发展，社交网络方兴未艾，成为科学传播的广阔渠道。

五、结论

由于我国开始实施人工智能化比较晚，因此适合学习的资源相对稀缺。人工智能大数据培训多是由网上的视频。媒体资源开发和应用可以促进人工智能的发展，人工智能学习网站的建设对于职业发展具有重要意义。建立人工智能大数据的专业学习网站可以充分共享优秀的学习资源，分享人工智能学习的经验，并为大多数人工智能大数据公司或单位和学习者提供有效的学习和交流平台。在共建和共享人工智能学习资源时，可以将成熟地区的经验作为政府机构和企业、学校科普结合起来。广安市在人工智能大数据新职业培训应与高校结盟，紧跟时代步伐，加大人才培养的力度，提高员工培训热情，增强培训效果，使之充分应用于新兴产业中，从而增强广安市企事业单位的核心竞争力。

参考文献：

[1] 曾显荣. 人工智能时代女性就业面临的机遇与挑战[J]. 经济师， No.365(07)：38-39.

[2] 贡国;吴访升;杨淑芳;景征骏;人工智能视角下的职业教育大数据应用——现实挑战、应用模式和智慧服务[J];江苏教育研究;2018年27期

[3] 何中华. 大数据环境下面向图书馆资源的跨媒体知识服务研究——以四川铁道职业学院为例[J]. 科学咨询(教育科研)， 2020， No.679(03)：13-14.

[4] 潘天君. 人工智能时代职业培训发展研究[D]. 2019.

[5] 庄西真. 要关注”新基建”对职业教育与培训提出的新要求[J]. 职教论坛， 2020， No.716(04)：3-3.

作者简介：

曾德贵(1972年1月27日—)，男，汉族，籍贯：四川泸县，学历：本科，职称：教授，主要研究方向：电子信息技术。

广安市硕博人才帮帮团第十团市人才办2020年度重点调研课题。

作者：曾德贵

第3篇：大数据时代咖啡行业营销策略

摘要：大数据时代的到来，为咖啡行业的发展提供了技术支持。为了改变传统营销模式的弊端，企业必须明确自身营销定位，探寻可行的营销方法，增强咖啡产品营销效果。文章分析了大数据时代营销活动与传统营销的差异，结合咖啡行业的营销定位和当前营销中存在的问题进行分析，提出有效的营销策略，以期进一步提高咖啡行业营销水平，为消费者提供优质的服务体验。

关键词：大数据;咖啡行业;体验式营销

DOI：10.13939/j.cnki.zgsc.2022.06.124

1 前言

社会经济水平的提升，让人们更注重物质生活和精神文化层面的享受，随着人们对咖啡的需求逐渐增多，关于咖啡的营销问题也成为该行业发展的重要内容之一，为了增强消费者的服务体验，增加企业的经济收益，必须结合大数据时代发展特点和咖啡行业发展前景进行分析，找准咖啡行业的营销定位，引进现代化营销模式，满足消费者的个性化需求。

2 大数据时代营销活动与传统营销的差异

大数据时代背景下各个行业逐步建立集生产、管理、营销、服务于一体化的行业体系，咖啡行业的营销方式也发生了极大的改变，与传统咖啡行业营销模式相比，大数据时代咖啡营销模式的针对性更强、营销范围更广、影响力更大，既能满足行业市场和企业发展的需求，也可以为消费者提供更好的服务体验。从目标顾客选择角度来看，传统营销企业选择的消费顾客多是标签化群体，通过筛选和标记，确定营销方向，大数据时代营销活动更加倾向于个人概念的群体，允许通过私人订制的方式，扩大消费群体，突出咖啡行业营销优势;从产品管理角度来看，传统的咖啡营销模式通常会采用线下销售这一形式，这种单一化的销售模式无法体现营销的有效性，使许多消费者对咖啡产品信息了解不够全面，影响咖啡产品对外销售，而大数据销售可以利用信息技术，借助网络平台公开产品信息，通过平台进行线上宣传和推广，增加产品营销渠道类型，扩大咖啡产品的市场竞争力;从咖啡馆选址角度来看，以往咖啡行业的营销范围主要集中在人流密集的商业圈，所需的租金成本较高，势必也会提高咖啡商品的市场销售价格，难以获得更多的利润。[1]而现今的营销地址主要分布在虚拟商圈，企业可以通过网络进行销售，突破传统营销地址租金成本高的难题，打破时间和空间的局限，使选址更具灵活性，提高大数据时代咖啡行业营销的可行性;从市场定价角度来看，大数据时代咖啡商品的定价会根据市场的变化而变化，加之大数据技术被广泛地应用于咖啡行业营销工作中，多数企业采用生产、营销、消费一体化服务体系，节省了许多营销成本，保证商品从出厂到销售整个过程的透明，在减轻营销人员的业务量的同时，也提高了咖啡营销的效率，发挥了大数据营销的优势。

3 大数据时代下咖啡行业的市场营销定位

第一，强调服务体验。服务是影响咖啡行业营销的重要因素之一，尤其在大数据时代背景下，各行业的市场竞争压力逐渐增大，咖啡行业要通过营销把握市场发展机遇，必须增强服务意识，采用市场调研和网络调查等方式，深入分析消费者的实际需求。同时，咖啡馆注重系统化培训，针对在岗人员开展服务知识、销售技巧以及咖啡简餐制作等培训活动，培养员工的服务意识，强化员工的业务能力，并结合咖啡行业的市场发展前景，依靠产品创新、包装设计、环境体验和情感体验等手段，为消费者提供更多独特的服务体验。

第二，侧重感官体验。顾名思义，感官体验主要是指利用消费者的五觉，建立感官体验，在大数据时代，咖啡行业在营销过程中侧重于增强消费者的感官体验，能够通过视觉、听觉、嗅觉等器官感觉，吸引消费者的注意力，满足消费者的个性化购买需求。比如，一般情况下，企业会将咖啡馆建立在相对安静且环境优美的公园附近或者建立咖啡书屋，消费者在食用咖啡中，还能阅读书籍，享受轻松安静的时光，这在一定程度上满足了消费者的个性化需求。[2]

第三，突出情感体验。注重消费者的情感体验是大数据时代下咖啡行业营销的重要手段，其主要指企业通过合理的营销渠道或者途径，向消费者提供更加全面的产品信息，为消费者带来积极的消费体验，减少消费者的负面情绪，加强消费者对咖啡品牌的认可，助力企业树立良好的品牌形象，以品牌效益促进消费，提高咖啡馆的经济效益。因此，要求企业在对咖啡行业进行营销定位时，尽可能从消费者的角度出发，了解和分析消费者的心理需求，提供多元化情感體验。

4 当前咖啡行业营销存在的主要问题

第一，营销观念较落后。大数据时代，咖啡行业营销人员可以利用互联网向全国或者世界各地宣传咖啡产品，但由于部分营销人员的观念落后，缺少对新技术和新软件的应用，仅凭线下宣传这一种营销手段，难以将宣传工作落实到位。同时，部分营销人员的品牌意识相对薄弱，在宣传过程中未树立良好的咖啡品牌形象，使消费者无法感受到咖啡品牌文化，导致咖啡在对外销售中很难得到广大消费群众的认可和支持。

第二，产品缺少多样性。部分地区在自然环境和经济条件上占据一定的优势，所生产的咖啡产品质量较高，颇受消费者的喜爱。但在大数据时代背景下，咖啡行业要实现自身发展，单靠把控产品质量还不够，也需要企业创新咖啡产品的生产和营销类型，而多数企业未意识到生产营销的重要性，在咖啡产品生产中仍旧使用简单粗略的原料进行加工，流向市场上的产品也多为速溶咖啡原料，在一定程度上制约了咖啡行业的发展。同时，企业对产品的包装设计不够重视，采用色调偏暗的材料，不能吸引消费者的注意力，无法带给消费者更好的视觉体验。[3]

第三，营销渠道单一化。显而易见，大数据时代背景下，传统的生产、经销、零售、消费这一线下营销模式已经无法适应咖啡行业发展需求，面对激烈的市场竞争，多数咖啡行业的企业逐渐意识到大数据在咖啡营销中的作用，利用互联网技术，开发网络营销平台，以网购或者直播带货的形式对外销售产品。但仍旧存在部分企业坚持应用传统营销模式的现象，未能深入到消费者群体中，不了解消费者的心理需求，而是盲目地向消费者推销产品，不仅造成咖啡营销的效率低，还容易造成咖啡消费的盲目性，增加消费成本，不利于咖啡行业可持续发展。

5 大数据时代咖啡行业营销发展有效策略

（1）加强与消费者交流。咖啡行业要实现可持续发展的战略目标，除了要重视产品生产和内部管理等工作外，还要注重咖啡产品的市场营销，运用有效的营销手段，扩大咖啡产品的市场竞争力。首先，企业可以利用大数据收集和整合消费者的购买反馈信息，听取消费者的意见或者建议，深入分析消费者的消费行为，加强与消费者之间的沟通和交流，力求通过创新产品满足消费者的个性化需求;其次，企业要不断提升服务水平，开启售后服务通道，切实解决消费者的利益问题。还可以设立消费者反馈卡，给予消费者一定的优惠金额，为消费者提供更好的服务，获取消费者对产品的信任;最后，企业可以利用大数据技术对咖啡产品进行宣传和推广，通过与社交媒体上的红人合作，提高咖啡品牌的知名度和营销力度。[4]

（2）创新产品营销渠道。针对传统的营销渠道类型少，难以实现产品信息传递和营销路径多元化的状况，要求咖啡行业注重产品营销渠道的创新，采取线上线下相结合的营销方式，利用网络平台公布产品信息，使消费者获得准确且全面的产品信息，扩大咖啡的销售范围，满足大数据时代咖啡行业营销发展需求。同时，企业应加强与广告商的合作，以广告宣传进行推广，让咖啡广告在各大软件或者视频网站上播出，优化产品营销手段，增强咖啡宣传效果。此外，企业可以借助抖音、快手或者微博等社交软件，注册官方账号，并寻找优秀主播向广大消费者介绍咖啡信息，增加消费者对咖啡品牌的认识和了解，突出大数据营销的价值。

（3）开启交叉营销模式。大数据时代背景下，咖啡行业的产品类型日益增加，而市场存在盲目性和自发性，消费者在选择商品类型时，很难快速寻找到性价比较高的咖啡产品，极容易影响顾客的消费体验。为了有效解决这一问题，要求企业注重大数据技术的应用，借助大数据分析消费者在咖啡选择方面的消费习惯，将消费数据进行整合，寻找顾客的消费共性，在此基础上实行交叉营销模式，增强咖啡营销效果。[5]一方面，企业可以应用互联网技术或者大数据技术，对同一类型的咖啡产品进行系统化的分析，将产品原料添加、生产和定价信息以直观化的数据形式呈现出来，便于顾客在短时间内作出正确的消费选择，从而购买到物美价廉的咖啡产品;另一方面，采用组团营销方式，根据大数据营销的基本要求，结合咖啡行业发展和消费者的心理需求，对不同类型的产品进行组合，创新产品的营销模式，扩大产品的使用群体，建立如咖啡+书店、咖啡+餐厅、咖啡+博物馆等，丰富“咖啡+”的内涵，提高咖啡产品的运营效果，增加企业的收益。

（4）注重消费者体验感。消费体验是大数据时代咖啡行业营销的重要手段之一，主要包括服务体验、感官体验、情感体验以及环境体验等，通过对消费者的视觉、听觉、嗅觉、触觉、味觉等器官的刺激，促使消费者购买咖啡产品。如今，咖啡行业在营销过程中，尤其要重视消费者的体验感，采用体验式营销模式，关注消费者的综合体验，为消费者提供优质服务，满足消费者的个性化消费需求。结合咖啡行业市场发展前景，制定合理的互联网营销方案，利用美团或者微博等软件，向消费者的移动客户端推送宣传信息或者在一些社交媒体平台发布活动内容，通过经营空间和聚合受众，吸引更多的消费者购买产品，提高咖啡产品的营销效果，增强消费者的体验感。[6]

6 结论

大数据时代咖啡行业发展面临着很大的机遇和挑战，而营销作为企业获取经济效益的重要方式，咖啡行业要提升市场竞争力，必须重视产品营销的作用，结合当前咖啡行业营销观念落后、产品单一化严重和营销渠道狭窄等问题进行分析，明确服务体验、感官体验和情感体验等营销定位方向，加强与消费者之间的沟通和交流，通过创新产品营销渠道和实行交叉营销模式，增强消费者的体验感，提高企业的经济效益，促进咖啡行业可持续发展。

参考文献：

[1]张晓燕.大数据时代咖啡行业营销策略分析[J].中小企业管理与科技，2020（31）：106-107.

[2]陈旭晔，毛可进.瑞幸咖啡品牌营销策略研究[J].科技经济市场，2020（8）：159-160.

[3]张智，常志远.移动互联网背景下云南咖啡营销策略研究[J].现代营销，2020（10）：68-69.

[4]王韻雅.移动互联网时代下TY咖啡竖屏短视频营销策略研究[D].桂林：桂林理工大学，2020.

[5]马昕晨.微博营销信息传播质量影响因素的SWOT分析——以“雀巢咖啡”为例[J].办公自动化，2019，24（15）：54-56.

[6]安宁.A咖啡营销策略分析[J].福建质量管理，2020（3）：100-101.

[作者简介]刘娟（1981—），汉族，上海人，硕士，研究方向：市场营销。

作者：刘娟

第4篇：中国大数据行业调查报告

公司使用大数据的基本情况

无论你是来自互联网行业、通信行业，还是金融行业、服务业或是零售业，相信都不会对大数据感到陌生。据调查报告显示，32.5%的公司正在搭建大数据平台，处于测试阶段;29.5%的公司已经在生产环境实践大数据，并有成功的用例/产品;24.5%的公司已经做了足够的了解，开发准备就绪;基本不了解的只占3000+用户的13.5%。

现有公司大数据的使用情况

其中，大家对大数据平台提出的的主要需求有：36.5%是进行海量数据的离线处理，比如大数据BI;23.2%是为了大量数据的实时处理，比如在线交互式分析;40.3%的公司的大数据平台则同时负责这两种业务。

大数据平台主要负责的业务

传统观念下，大数据往往是大型互联网公司的玩物。然而，通过本次调查，我们却发现在那些对大数据平台有需求的公司中，研发团队规模远没有我们想象的大，29.11%的研发团队仅有1-10人，次居第二的10-50人的规模占到了25.77%,两种规模的研发团队就超过了一半。可见，当下大数据的需求已不止步于大型公司。

研发团队规模从传统架构到大数据时代应用程序架构的转变往往都会遇到一些问题和挑战。在对计算框架门槛调查中，非专业人士难于入手这一难题的比例达到了46.5%，这对企业人才的培训提出了迫切的要求。

当下计算框架使用过程中存在的问题

打造大数据平台需要企业克服诸多问题和挑战，尤其是安全性和可靠性方面。

大数据平台打造的主要挑战大数据技术现状大数据技术在开发者或从业人员的应用中逐步走向成熟，这些成熟的技术在开发人员的探索中得到了初步的稳定发展，公司的使用便是对这些技术的肯定。包括开发语言，数据分析语言、数据库等在内的大数据工具，究竟哪个更适合自己的业务，相信开发者们都有自己的评判标准。

在众多的开发语言中，大数据平台开发者们尤为青睐Java，占到了总比例的65%，远远超过其他开发语言。值得一提的是，Hadoop本身就由Java实现的。

大数据开发语言

在大数据分析语言中，SQL的使用比例达到了64%，是R语言使用者人数的2倍之多。我们从中不难看出SQL-on-XXX项目的前景;同时从R的支持率上，也看到了更多非技术人员，比如数据分析师对低门槛分析类语言的需求。

大数据分析通常用的语言

在大数据存储上，HBase则以67.55%的比例位居榜首，远超其他数据仓库，当然这点与Hadoop原生支持是分不开的。

大数据存储中适合的数据库

对存储在HBase或Cassandra这样NOSQL数据库中的数据进行复杂查询，Solr、Elasticsearch、Splunk等主流的搜索引擎差距并不大。

对存储在NOSQL数据库中的数据进行复杂查询，比较合适的工具大数据未来发展

诚如上文所说，许多对大数据有需求的公司并不一定具备强大的研发团队，在大数据处理过程中往往遭遇众多挑战。那么，在面临这些挑战时，开发者最迫切需要的是什么?

为了解决公司中的实际问题，39.28%的人希望拥有更犀利和通用的计算框架;37.88%的人希望能拥有更好的数据挖掘算法;21.59%的人则对保障性更高的运维有了更多的期盼。

为了解决公司的实际问题，最希望拥有的新技术

良好的大数据计算平台能够有效地支撑企业的海量数据，对于下一代通用大数据技术平台，Spark和Hadoop是公司的主要选择。同时，我们也看到了新贵Spark的发展前景，对比老将Hadoop，差距也仅有3.7%。

人们看好的下一代通用大数据计算平台

现有公司中，大数据平台已包含的部件位居前三的主要是SQL数据库(90.3%)、NoSQL数据库(50.7%)和HDFS(47.2%)，在此基础上，公司计划添加的部件主要包含SQL数据库(57.2%)、Spark(41.5%)和NoSQL数据库(26.9%)。从各公司已有大数据部件和计划添加的部件可以看出，SQL数据库和NoSQL数据库在公司的大数据平台中发挥了重要的作用，得到了各公司的青睐。

现有大数据平台已包含的部件

现有大数据平台计划添加的部件

为了获取更高的收益，企业在前期需要进行有效地成本投入，对大数据平台的投资，公司更加不会吝啬，其中被调查的人群中，45.7%的人所在企业有追加投资大数据平台的打算，同时，公司也期望能够通过多种途径完善大数据平台，主要的完善途径包括基于开源平台自主研发、购买成熟的解决方案，使用公有云。

企业期望完善大数据平台的途径

使用公有云也是企业期望完善大数据平台的有效途径之一，在选择公有云平台方面，企业也面临着很大的倾向性，45.26%的人将阿里云作为首选。

公有云平台的选择大数据技术培训

技术培训能够对开发者起到一定的指导作用，使得听众可以系统全面的把握新技术的知识脉络，了解技术的发展趋势。在此次调查活动中，69.4%的被调查者表示从未参加过大数据平台构建的技术培训。对于技术培训的形式，49%的人希望是线上培训，收费，成系列型的大数据解决方案，专攻一个方向，解决实际问题;37%的被调查者还是希望免费进行技术培训，即使不成系列，无论是线上线下，能听一节是一节。虽然收费在一定程度上影响了开发者对大数据技术培训的热情，但是能够切实解决实际问题，得到技术和能力的提升，仍是相关技术人员追求的培训目标。

更适合的技术培训形式

那么，对开发者来说，大家特别期望从技术培训中获取的知识又会是什么?

第5篇：中国核电行业大数据—-金准报告

自 1951 年 12 月美国实验增殖堆 1 号(EBR-1)首次利用核能发电以来，世界核电至今已有 60 多年的发展历史。据金准数据统计，截止至 2016 年 6 月，全球共有 444 座反应堆并网发电，并网发电量 387741 百万瓦特;全球共有 62 座反应堆处于建设当中，在建容量 66029 百万瓦特。我国共有 33 座反应堆并网发电，并网发电量 29577 百万瓦特;在建机组 21 座，在建容量 24036 百万瓦特。

我国核电发展至今已有四十余年，经历了核电起步、适度发展、积极发展和安全高效发展 4 个阶段。

我国核电发展的四个阶段

近年来，伴随着我国核电站建设步伐的加快，我国核电产量逐年快速增加。核电年发电量由 2001 年的 174.12 亿千瓦时增长至 2015 年的 1695.18 亿千瓦时，年复合增长率达到 17.65%。2015 年，全国发电量达 56184 亿千瓦时，其中核电发电量占比 3.02%，并继续呈现占比快速提升的态势。

近年来我国核电产量和占总发电量比例

2015 年我国电力生产结构

据金准专家统计，截止至 2015 年 10 月底，我国在建核电机组 25 台，总装机容量 2751万千瓦。2016 年 9 月 16 日，国家核电副总经理郑明光在伦敦世界核协会会议中表示，“中国拟在未来 10 年兴建超过 60 座核电厂。其中未来 5 年将建造约 30 座核反应堆，之后的五年将兴建更多座。中国主要核电企业将至少一年新建两座核反应堆。”考虑到内陆核电技术逐渐成熟，内陆核电有望审批通过，认为，在接下来的数年，我国核电站建设将保持持续高增长的态势，且增速有望进一步提高。目前，按每年新审批 6-8 台核电机组计算，每台投资约 200 亿元，总体市场空间约为 1200-1600亿元/年。核电装备投资占总投资比约为 50%，核电设备的市场空间约为 600-800 亿元/每年。

二、海外市场空间广阔

在我国核电事业高速发展的同时，海外市场也为我国核电设备企业提供了广阔空间。2016 年 9 月 15 日，英国政府在重新评审后批准中法企业共同参与投资欣克利角 C 核电项目，这意味着以中广核为代表的中国核能企业正式进入英国核电市场。这是中国核电第一次参与发达国家的核电项目，极具标志性意义。此外，自 2010 年起，我国陆续展开了对阿根廷、巴基斯坦、埃及、英国、南非等国家的核电项目出口洽谈工作，目前已获得多国核电项目订单，在建核电项目正稳步推进。目前，在我国“一带一路”沿线的 65 个国家中，有 28 个计划发展核电项目，规划核电机组台数达到 126 台，装机总规模约为 1.5 亿千瓦，按核电造价 1.7 万元/千瓦测算，“一带一路”沿线国家核电项目投资将达到 2.5 万亿元。此外，西方发达国家、非洲、南美国家对核电站的需求亦非常强烈。预计未来十年，我国核电产业海外出口将逐渐打开，核电设备海外市场空间将呈现高速增长趋势。

我国核电出口项目概览

三、关注核电后市场的投资机会

乏燃料是使用过的核燃料，通常由核电站的核反应堆产生。据金准数据统计，截止至 2015 年，全球在运核电机组已经产生了 35.1 万余吨乏燃料，按照当前核电装机规模，每年还将产生约 10000 吨乏燃料。对于乏燃料，目前国际上通行的有两种处理方法：一种是不进行乏燃料后处理，燃料棒在核电站反应堆内燃烧完后将其长期暂存、永久贮存、直接处置，被称为开式核燃料循环;另一种是对乏燃料进行后处理，回收其中的铀和钚，再加工成燃料组件进行重复利用，称为闭式核燃料循环。我国主要采取闭式核燃料循环的乏燃料处理方式。

压水堆核电站核燃料循环图

目前，法国、英国、日本、印度采用闭式燃料循环;美国、加拿大、西班牙、瑞典、芬兰等则采用开式燃料循环，将乏燃料作为核废物进行长期处置即一次通过。也有一些国家采取观望策略，尚未决定如何处理乏燃料。

乏燃料水池

乏燃料贮存格架

乏燃料水池是储存和冷却乏燃料组件和破损燃料组件，以及对燃料组件进行检查、修复、运输等水下操作的场地。在反应堆的一个运行周期结束以后，就会将反应堆中约 1/ 3 堆芯的乏燃料组件卸到乏燃料水池中进行冷却。刚卸出的乏燃料组件有着较高的衰变热，在水池中冷却多年以后，衰变热降到足够低就可以将其运到后处理厂或永久贮存场。

乏燃料贮存格架是核燃料循环中的核心设备，广泛应用于乏燃料在堆贮存、中间离堆贮存以及后处理厂贮存。随着我国核电行业的快速发展，乏燃料水池和乏燃料贮存格架市场空间广阔。然而，受制于乏燃料贮存格架中关键的功能材料——中子吸收材料等方面的限制，一直未能实现国产化，依赖国外进口，不仅产品供货价格昂贵，而且技术和供货周期上受到制约。

核电作为一种清洁高效能源，是我国增加能源供应、优化能源结构、应对气候变化最重要的选择之一，把核电规模搞上去应当作为能源战略的一个重点。本文客观分析了过去几年来我国核电发展情况，并预测了未来几年的核电良好的发展趋势。经过多年实践，我国已经掌握了成熟可靠的核电技术，具备了加快核电发展的条件。我国核电建设将在2008-2010年迎来一波高峰，近年来相应机组完工并网，带动核电在运装机容量快速增长。

独特优势：清洁环保、运行稳定、安全高效

清洁环保：我国能源消费过度依赖煤炭等化石能源，在全国总装机容量中，火电比例一直居高不下，引发了一系列环境问题。根据中电联数据，每燃烧1吨标准煤将产生二氧化碳2620千克，二氧化硫8.5千克，氮氧化物7.4千克和280千克炉渣，带来严重的环境问题。而在核电生产过程中，二氧化碳、二氧化硫、氮氧化物和粉尘等物质均为零排放。根据中电联数据，2016年全国累计发电量6.0万亿千瓦时，其中核电累计发电量为2132亿千瓦时，同比增长约24.4%，约占全国总发电量的3.5%。与燃煤发电相比，2016年全年核能发电相当于减少燃烧标准煤约6568万吨，减少排放二氧化碳约17208万吨，减少排放二氧化硫55.83万吨，减少排放氮氧化物48.6万吨。

▲图表1：2015年煤电污染物在全国排放量中的占比(%)

▲图表2：2016年全国各电源发电量占比(%) 安全高效：从安全性来看，根据概率安全分析，以AP1000为代表的三代核电站事故率低至10-6次/年，比我们生活当中的大部分行业都要安全。核电站有三层防护屏障，防止发生泄漏。核电站周围一年的辐射剂量和乘坐一次飞机相当。从高效性来看，核能要比化学能大得多，一座百万千瓦的煤电厂每年要消耗约300万吨原煤，而一座同样功率的核电站每年仅需补充约30吨核燃料，后者仅为前者的十万分之一。

运行稳定：目前大部分核电站处于基荷运行，不参与调峰。基荷运行可以提高燃料利用效率。核电的换料周期相对固定，一般都是连续运行12个月或180个月换一次料，所以核电站的运行方式高效稳定。2016年，光伏发电、风电、水电、火电和核电发电设备利用小时数分别1103小时、1742小时、3621小时、4285小时和7042小时。核电发电设备利用小时数远高于其他电源利用小时数。

▲图表3：核电辐射与日常生活辐射对比(毫希)

▲图表4：2016年全国各电源利用小时数(小时) 政策利好，核电未来发展空间大

我国政府始终秉承安全高效发展核电的方针，在未来能源规划中对核电提出了较高的目标，且近几年的能源政策中核电规划始终保持一致。根据近年来陆续发布的《能源发展战略行动计划(2014-2020年)》、《电力发展“十三五”规划》及《“十三五”核工业发展规划》等文件的规划目标，到2020年，核电装机容量达到5800万千瓦，在建容量达到3000万千瓦以上。坚持安全发展核电的原则，加大自主核电示范工程建设力度，着力打造核心竞争力，加快推进沿海核电项目建设。建成三门、海阳AP1000自主化依托项目，建设福建福清、广西防城港“华龙一号”示范工程。开工建设CAP1400示范工程等一批新的沿海核电工程。深入开展内陆核电研究论证和前期准备工作。认真做好核电厂址资源保护工作。

▲图表5：近年核电规划汇总

2018-2020年核电或将迎来建设潮。根据金准数据，截至2017年11月20日，我国投入商业运行的核电机组有37台，累积装机容量约3581万千瓦;在建核电机组19台，累计装机容量2200万千瓦。我国核电装机容量占比仅为2%，距离2015年全球核电装机容量平均占比6.4%还有很大差距。在建19台核电机组在2020年前全部投运，届时核电装机容量达到5781万千瓦，基本完成5800万千瓦的装机目标。但是上述规划中还有3000万在建容量需要在2020年前开工，这就意味着未来三年内将开工建设30台百万机组核电站，平均每年开工建设10台。

▲图表6：2016年全国各电源装机占比(%)

▲图表7：2016中国与全球核电装机占比(%)

▲图表8：截至2017年11月我国商运核电机组

▲图表9：2017年11月我国在建核电机组

技术路线明确，三代核电建设稳步推进

三代核电技术路线是CAP系列和华龙一号。目前，我国的第三代核电技术路线主要有两种，一种是引进消化吸收再创新的CAP1000和CAP1400，另一种是中核和中广核自主研发的HPR1000(华龙一号)。AP1000依托项目为三门核电1/2号机组和海阳核电1/2号机组，华龙一号示范项目为福清5/6号机组和防城港3/4号机组。

▲图表10：AP1000首堆工程节点

困扰核电审批的问题将被消除，2018年或将是国产三代核电大批量建设元年。从2016年至今，尚未有新的核电机组开工建设，其主要原因就是三门1号机组(AP1000首堆)未能实现商运，以及“华龙一号”技术路线未能完成融合。近期，这两个困扰核电建设的因素都将被消除。2017年7月，三门核电1号机组热试结束，《华龙一号技术融合方案》也得到复批。目前三门核电1号机组已经开始装料前准备，完成装料后，核电机组将进入带核状态，这标志着AP1000全球首堆并网发电已经不远了。华龙一号后续项目的审批工作也将陆续展开。预计2018年或将迎来新一轮核电建设大潮。

CAP1400初步设计方案已于2014年通过审查。CAP1400大量采用非能动技术，技术先进，但是设备制造难度较大。大量设备系首次制造使用，没有工程实践经验，示范项目进展可能较为缓慢。华龙一号在能动安全的基础上采取了有效的非能动安全措施，技术较为成熟，工程难度较小。华龙一号示范项目福清5/6号机组和防城港3/4号机组已于2015年开工建设。

▲图表12：筹建中的核电机组

核电企业积极布局海外和小堆，带来核电市场新增量

金准专家认为核电“走出去”战略初现成果。2013年10月，国家能源局《服务核电企业科学发展协调工作机制实施方案》首次提出核电“走出去”战略。国际原子能机构预计，2016年至2025年十年间，除中国大陆外，全球约有60-70台100万千瓦级核电机组建设，海外核电市场空间将达1万亿元。我们认为我国核电出海的时机已经成熟，中国核电企业凭借国内充足的订单，三十年的技术积累、相对低廉的造价及充沛的资金实力，有望在全球核电竞争中脱颖而出。目前我国核电三大核电集团正积极布局全球市场。近年来已于巴基斯坦、英国、阿根廷等多个国家签署了核电站项目合作协议并取得了一系列实质性进展。

▲图表13：中国国产核电走出去战略布局

小堆市场前景广阔。国际原子能机构(IAEA)将小堆定义为300MW以下的核反应堆。目前，随着核电技术的不断发展，多功能模块式小型堆逐渐成为各相关企业后续的重点规划产业。核电小堆不仅可以用作发电，而且可以进行工业供热供汽，为城市供暖，还可用于海水淡化和海洋开发，市场前景广阔。

盈利能力：装机容量加速扩张，核电公司盈利能力有望大幅提升

核电盈利能力主要由装机容量决定。核电公司的盈利模式主要由上网电量和度电利润决定。由于核电设备利用小时数有政策保证，基本维持在7000小时左右，所以核电的上网电量主要由装机容量确定。度电利润则由上网电价和成本确定。核电参与市场交易的占比很小，根据中国核电和中广核电力2017年半报告显示，2017上半年，核电市场交易电量约为169亿千瓦时，占上网电量的15%左右。未来几年内，核电的上网电价主要参照核电上网标杆电价0.43元/千瓦时。

《保障核电安全消纳暂行办法》颁布，核电利用小时数有保障。2017年3月，国家发改委、国家能源局印发了《保障核电安全消纳暂行办法》。其中规定，在市场条件受限地区，优先发电权计划按照所在地区6000千瓦以上电厂发电设备上一年平均利用小时数的一定倍数确定。

▲图表14：2020年前将投产机组

▲图表15：核电装机容量预测(万千瓦) 总结

金准专家认为，我们应积极推动第3代核电技术的引进消化，促进国内先进核电技术的加快开发，掌握先进压水堆技术，实现堆型的标准化规模发展，提高核电设备的国产化水平。同时，积极推进第4代核电技术的自主研发，使其及时进人商业化准备阶段。核安全是核电发展的生命线，来不得丝毫马虎。大规模发展核电，需要进一步提高安全监管水平，全面加强核电设计、制造、建设、运行等环节的安全管理和质量管理。

规模发展核电，还需要配套形成铀浓缩能力，加快建设乏燃料处理工程，健全核燃料循环体系，使核电发展得到充分的资源保障。

规模发展核电，更需要及早培养相关人员，形成人才队伍，为核电发展提供人才保障。

第6篇：“大数据”助银行业监管

——现场检查系统在湖北的实践

基于数据大集中的监管手段——现场检查系统(EAST系统)应运而生。现在，运用EAST系统进行建模分析，从系统中直接筛选符合条件的信息，实时跟踪数据异动，仅用一分钟就能迅速筛查出过去需要好几天才能查出来的贷款挪作保证金等违规情况，现场检查质效得到大幅提升。

这一系统已经在提升监管水平与效率等方面发挥了重要作用。从实践来看，湖北银监局组织了专业团队，认真做好制定实施规划、夯实数据基础、强化科技支撑等先期工作，顺利成为省局版EAST系统首批试点单位之一。由于EAST系统采集数据具有大规模、细颗粒、标准化、自动化等特点，易于进行海量数据的筛选、关联、比对等操作，正好与信用卡的业务特点以及所秉承的“大数法则”风控基础相契合。

在对辖内某银行信用卡业务的现场检查中，湖北银监局以风险管理、收费管理、质量管理等常见违规问题为切入点，利用EAST系统分析功能建立了一系列模型，提取了不少违规疑点信息，实现“精确打击”。

信用卡疑似套现在交易数据上常有一些异常表现，如每笔交易金额较大、先还后借且交易间隔时间短、为得到最长免息期交易一般发生在还款日附近等等。根据这些疑点信息，湖北银监局建立了相关模型，筛选出近千笔存在套现倾向的交易，督促该银行做好风险排查和防范工作。通过EAST系统建立模型还筛选出恶意透支的可疑名单，下一步将通过现场检查核实催收情况综合判断。信用卡业务作为EAST系统运用的“标靶”，为下一步这一系统延伸到对银行信贷业务、表外业务及外部风险的现场检查打下了扎实基础。

从实践中来看，通过EAST系统的数据直接对接，一方面可以有效克服以往银行机构手工数据录入的选择性规避和操作失误，确保了数据的真实性和一致性;另一方面可以依托系统数据的前期跟踪、监测和分析，准确定位疑点，有效聚焦风险，大幅缩小检查范围，提升检查针对性，实现非现场监管和现场监管的高效联动。EAST系统还能够充分及时地对数据信息进行处理，为监管人员及时

- 1 -

捕捉、监测、分析银行风险创造了有利条件，提升了对风险的识别、预判、预警能力，从而将各类风险隐患更好地消灭在萌芽阶段，提高银行业整体风险防控水平。

为更有效地推广EAST系统的运用，上下间的协调联动非常重要。应努力将EAST系统打造成一个开放式平台。同时，还应建立跨部门的联动工作机制。由于EAST系统科技含量高、技术难度大，推广工作中应注重集成监管人力资源，发挥各部门专业优势，建立沟通联络机制，加强科技与业务部门的融合，提高试点工作效果。EAST系统可以为现场检查提供线索，为非现场监管提供情况验证，同时也为市场准入提供参考意见;现场检查和非现场监管可以运用EAST系统将问题查深查透，这样才能将EAST系统用活用足，将其效用发挥到极致。(作者单位：湖北银监局)

链接

EAST系统是银监会自2008年起推出的现场检查系统。这一系统颠覆了过去用抽查代替普查，用点上的问题推测面上的问题的监管模式，构造了先进的现场检查系统平台和灵活的系统架构，实现了对银行业金融机构海量数据的有效挖掘和深度分析，不仅大大提高了现场检查效率，而且为“精确打击”提供了技术上的支持，是我国银行业监管技术的重要突破。

- 2 -

第7篇：大数据在教育行业中的应用

1. 大数据在实验室管理方面的应用

海量数据已经使我们进入了大数据时代，数据信息的来源、传播速度和传播数量正在影响、改变着人们的思维方式和生活、工作习惯。近年来，基于“大数据”的实验室管理系统的开发以及互联网的实验室管理技术正在兴起。但真正被业内人士承认的教育领域的大数据应用却为数不多，其中被公认的当数东华大学的智能实验室项目。

2009年，东华大学教务处处长吴良提出实验室智能化管理的思路，并将材料学院作为试点单位。实验室智能化管理即用物联网的方式把实验室里所有的仪器设备都管理起来。实验室智能管理过程中记录了学生在实验室内所有的活动情况，包含学生进入实验室的情况，使用的仪器设备情况，使用仪器设备时长等，以及所有仪器的电流、电压都可以监控。如今，东华大学所有学院的实验室都纳入了智能实验室的管理。东华大学通过实验室智能管理系统进行各个方面的数据采集，并对数据进行深度挖掘，形成了各种各样的图表。从图表中可以看出哪些实验室申请的设备根本不必购买，哪些实验室不再需要拨钱。实验室的使用率和第二年的经费完全挂钩，最后实现教育经费使用的集约高效;也可以结合大数据的分析和模拟，建立新型的实验教学课程。

另外，华东大学智能实验室利用云平台(东华云)通过服务器虚拟化和实验教学资源管理系统进行管理，简化了管理流程, 节约了管理成本, 提高了服务器资源申请的灵活性，实现了实验资源管理的信息化和透明化。目前，东华大学智能实验室还实现了24小时开放无人管理、跨学院使用等人工无法实现的管理，数据显示，智能实验室的管理对学生学习自主性的提高有显著影响，学生在实验室的时间甚至超过了在教室的时间。

2. 大数据在校园网用户行为分析方面的应用

经过多年的积累，人类的数据量、数据处理技术和能力都得到了质的飞跃，大数据时代给人类社会带来了诸多具有革命性的变化，而校园网的出现则是传统“言传身教”教育的一次革命。中职学生思想尚不成熟，自律力和识别能力不强，对于开放式的网络有些迷茫。校园网学生用户行为分析的研究是通过对校园网络的测量和分析，挖掘和发现网络中呈现出来的各种行为规律，同时识别一些异常网络行为，最后将用户行为分析展示。这样以便学校采取对应的策略及措施引导中职学生健康上网，从而使校园网真正成为学生获取知识的平台，提高学生的整体综合素质。

广东省电子职业技术学校罗萍设计了一个基于大数据的校园网学生用户行为分析系统，该系统从网站浏览信息、网站发帖留言、搜索关键词、网络购物等四个维度来描述基于校园网的学生用户行为。通过对网络内容的分析，可以进一步细化到学生用户在网络中具体网络行为、发表的言论和帖子、对网络资源的兴趣偏好是什么等等，从而有效掌握学生的上网行为动态。

随着计算机技术的迅速发展，大数据时代的网络行为已经成为当前学生校园生活中的一项重要活动内容，正在悄然的改变着学生的学习和生活。因此，深入研究学生网络行为，理性分析学生网络行为特点，动机和需求，以及如何引导学生合理运用网络资源，树立健康的上网理念，构建有益的校园网络环境，已经成为目前学校研究的重要课题。

3. 数据挖掘在学习分析及干预中的应用

教育领域已经开发和应用了多款学习分析系统，主要集中在绩效评估、学习过程预测与学习活动干预三个方面。

绩效评估: 如美国 Northern Arizona University 研发的 GPS( Grade Performance Status) 系统，可实现全校在校大学生的课堂学习绩效评估。该系统能为教师提供最新的学生出勤情况、学生的反馈意见，为学生提供教师的最新评价以及重大事项的提醒。

学习过程预测: 如澳大利亚 University of Wol-longong 研发的 Snapp( Social Networks Adapting Ped-agogical Practice) 系统。该系统可以记载和分析在线学习者的网络活动情况( 如学生在线时间、浏览论坛次数、聊天内容等) ，使教师能深入了解学习者的行为模式，进而调整教学方式，最大化地为学习者提供适应的教学指导。

学习活动干预: 可分为人工干预和自动干预，现在主要集中在人工干预上，借助绩效评估工具和学习活动预测工具，由教师完成学习干预。自动干预是未来学习分析技术发展的方向，大数据将为这一目标的实现提供强大动力。

在教育管理改革方面，学习分析能为高职院校教育管理系统的方方面面提供指导教学管理活动的相关数据。依靠这些数据，高职院校管理部门可以有针对性地完善不足之处，修订教育管理方案，优化教学资源配置，并最终评估修订方案及资源配置情况。

在教学改革方面，学习分析技术能真正意义上营造信息化的教学环境，保证教师提供的学习服务契合学习者个性化学习、协作学习的需要。传统教学模式中，教师无法保证所提供的学习资源能真正满足学生的学习需求，无法适时调整和分配资源，无法提供个性化地学业指导，无法及时了解学习过程中出现的障碍与疑惑。这些问题都限制了高职院校教育改革的深度，而学习分析技术恰恰可以弥补这些缺陷。通过应用学习分析的相关工具和大数据技术，教师可以及时获取学生的学习行为数据，从而支持一种既能体现教师主导作用，又能兼顾学生主体地位的新型教学方式，以最大化地激发学生的潜能，为新世纪培养创新性人才。

在学习方式改革方面，学习分析技术的作用在于: 自动识别学习情境，能够从大量纷杂的数据中自动分析出学习者的特征信息，根据其需要推送适应的目标资源，并提供学习建议以协助学习者修订自己的学习任务;学习者可以实时调整自己的学习计划，预约辅导以解答学习疑惑;在特定情况下，还可以通过锁定学习者所在地理区域、学习特点等因素划分学习小组，以满足个别学习者的协作学习需求。此外，学习分析能为在校学生提供个性化的学习指导建议，以帮助学生规划在校学习路径，明确其学业成就的期望。

4. 大数据在课程建设方面的应用

大数据时代学习者在数字化学习过程中留下很多数字碎片，通过分析这些数字碎片，我们将会发现学习者的各种学习行为模式。梁文鑫指出：大数据对课堂教学带来的主要影响是使教师从依赖以往的教学经验教学转向依赖海量数据教学分析进行教学，使学习者对自我发展的认识从依赖教师有限理性判断转向对个体学习过程的数据分析，从而使传统的集体教育转向对学习者的个性化教育。

目前流行的大规模在线开放课程(Massive Open Online Course，MOOCs)教育，MOOCs 教育被寄予厚望的主要原因是学习分析技术和大数据对它的支持，有了学习分析和大数据技术，优质的教学、课程资源和服务等通过数据真实客观的被呈现出来。比如：对每一门课程资源和支持服务系统的建设和维护都建立在学习者使用过程的数据分析基础上，从而使提供的课程内容更符合学习者的需求、教学指导更具有针对性，进而提高了学习者的学习积极性，促进了学习成功的实现。学习者在 MOOCs 平台上学习时，教师和程序可以通过大数据对学习者的学习行为进行理性干预，比如：通过预测认知模型为学习者自动提供适合的学习内容和学习活动方案，通过作业情况、留言板以及讨论区的问题讨论情况可以发现存在学习困难的学习者，以确保可以及时对其学习进行有效干预等。

大数据的应用可以实现大规模在线教育的同时可兼顾学习者的个人需求，大数据对海量数据的高速实时处理技术可以为在线教育平台实时洞察学习者的变化、把握学习者的需求、提高学习效果提供支持，还可以对学习过程中产生的不相关信息进行深度分析，以预测和把握学习者的需求变化。

5. 大数据在助学贷款方面的应用

国家助学贷款始于2000年，此后,全国各地普通高等院校陆续开办国家助学贷款业务。但由于政策设计的缺陷、学生个人的诚信缺失、银行的积极性等多方面的问题,贷款业务开展出现较大差异东部好于西部,南部优于北部,部属院校高于地方院校。年国家修正贷款政策,加大贷款工作力度和政策扶持力度,国家助学贷款工作才得以继续进行。但国家对家庭经济困难学生没有给出界定,更缺乏界定标准,因此各高校在确定助学贷款资助对象时,只能依靠学生个人陈述、老师自己的判断、同学之间的投票等方法对困难学生加以界定,以致帮困助学工作困难越来越多。同时,由于信息沟通缺乏有效的渠道,管理缺少统一的工作平台,很大程度制约了贷款工作的开展,影响了学校、银行工作的积极性。缺少信息的沟通,造成信息的不对称,也影响了工作的开展,出现管理的滞后。

2005年，郑爱华作为课题负责人,组织完成校内课题“济南大学帮困助学问题及对策研究”,主持申报了山东省科学技术发展计划软科学科学项目“山东省国家助学贷款中的问题成因及对策研究”,同年获得立项,项目编号：B2005016。

助学贷款决策支持系统是济南大学研究的山东省省级课题“山东省国家助学贷款中的问题成因及对策研究”的子课题之一。目的在于通过该系统,建立家庭经济困难状况指标评价体系,包括评价指标的设立、指标分值的量化、最后计算机进行决策计算,输出决策支持的结果,帮助学校确定贷款资助对象,建立贷款信息数据仓库，并将贷款信息通过计算机进行处理,实现快捷、方便、及时、准确的数据动态管理,克服银行、学校、学生、主管部门之间的信息不对称问题，实现科学决策、信息化管理的目标，有利于山东省助学贷款工作的健康发展,有利于减轻学校贷款工作的管理难度,降低贷款成本,为帮困助学工作开辟有效的途径。

河北省教育厅学贷中心河北省学生贷款管理中心于2007年开始实施助学贷款信息化建设,将先进的计算机技术应用到国家助学贷款管理工作中,建立“河北省国家助学贷款管理信息系统”,使学生对国家助学贷款的申请、学校对助学贷款的管理、银行对学生申请的审批以及其间的各种信息的交互等都实现网络化。 6. 基于大数据证据的教育教学决策

在美国，教育大数据为美国政府、教育管理部门、学校与教师做出合理的教育教学决策提供了可靠的证据。整体上，美国建立了严格的教育问责制度，包括利用州教育问责系统(State Accountability Systems)对各州教育发展情况进行全方位评价，借助于学区级评价系统(District-level Evaluation Systems)评价各学区、各学校的整体教育质量，并要求学校与学区要对后进生进行基于数据的支持性学习干预(Data-driven Interventions)。美国联邦政府以及各州政府基于对教育大数据的分析结果评价各州或州内学区的教育进展水平，并以此作为教育投入的依据以及教育政策制定的根据。

美国学校一般利用基于大数据的教育评价支持本校在规划学校整体发展、优化学生管理、制定教学质量改进计划等方面的教育教学决策。据统计，97%的美国中小学利用来自整个年级或整个学校的教育大数据确定学校需要提升的关键领域;分析学生的个体数据以便于分班或安排相关学习支持服务，包括了解哪些学生需要特殊支持或更多支持。47%的美国中小学通过专门的评价人员分析不同教师讲授同一教学内容或同一教师以不同教学策略讲授同一教学内容时产生的数据，评价教师的教学质量并提出教学方式变革计划。而83%的学校在利用教育大数据尤其是本校产生的大数据了解本校教师教学发展的现状与需求，并据此决策如何支持本校教师的教学发展。

学校教师可以利用教育大数据改进与优化自己的教学决策。整体上，教师可以利用大数据分析需要在何种时机对哪些学生以何种方式安排何种教学内容。教师利用本班学生产生的大数据，或同时借助与外部大数据的对比分析，可以深度评价本班学生的学习表现与学习效果，可以有效分析学生的学习偏好与个性化需求，分析学生群体的学习需求，同时也可以利用数据分析哪些学生更适合在一起进行小组学习，分析怎样分组才更合理。对于那些有学习困难的学生，通过对大数据的利用，可以分析出学生在什么环节、什么类型内容学习方面存在问题，分析哪些因素可能在影响学生的学习，这样便于给出适当的学习支持与干预。

那么，大数据从何而来?美国在教育评价的实施过程中主要依托覆盖全美的立体化教育数据网络，同时注重数据质量保障，有效地解决了教育评价“大数据从何而来”的问题。

国家级、州级(State-level)、学区级(District-level)以及校级(School-level)在内的各级各类教育数据系统(Educational Data System)均服务于教育问责体系。这些数据系统之间相互关联，数据互通，形成立体化数据网络，为美国教育评价用大数据的获取提供了基本的依托。

在国家层面，美国有由教育部与各州教育管理部门及一些企业协同创建与发展的教育数据机构EDFacts，建设了“教育数据快线(ED Data Express)”，还有美国国家教育统计中心(National Center for Education Statistics)，主要任务在于与教育部内部各机构、各州教育管理部门、各地教育机构合作提供可靠的、全国范围内的中小学生学习绩效与成果数据，分析各州报告的教育数据以整合成为联邦政府的教育数据与事实报告，为国家层面的教育规划、政策制定以及教育项目管理提供了有力的数据支持。

2005年，美国教育部启动了“州级纵向数据系统项目(The Statewide Longitudinal Data Systems (SLDS)Program)”，旨在帮助全美各州“设计、开发与利用州级纵向数据系统以便有效地、准确地管理、分析、分类处理与利用每一位学生的数据”，至今全美有47个州至少获得过一次本项目资助。

州级与学区级数据系统主要为区域性教育评价提供数据支撑，其中主要包括本州/学区学生的成长数据，教育工作人员在工作方面的安排与准备等相关数据，以及其它关于学与教条件的关键数据，比如教师人数、学生入学率、学生与学生家长及学校教职员工对于学校氛围、条件等方面的评价数据等，认为这些数据直接反映学校与学区在让学生做好毕业准备方面取得的进展情况。各州的教育数据系统基本都具有测量学生的成长(Student Growth Measures)、提供高中学习反馈报告(High School Feedback Reports)、实施学业预警(Warning Systems)的功能。学校常常利用四种类型数据系统来收集、整合教学过程数据或评价数据：一是在校学生的实时信息系统(Student Information System)，其中包括学生出勤率、人口学特征、考试成绩、选课日程等数据;二是数据软件坊(Data Warehouses)，其中保存了学校当前或历史上的学生、教职员工、财政方面的信息;三是教学或课程管理系统(Instructional or Curriculum Management Systems)，支持学校教师接入教学设计工具、课程计划模板、交流与协作工具，支持教师创建基准性评价;四是评价系统(Assessment Systems)支持快速地组织与分析基准性评价数据。 7. 大数据在招生方面的应用

数据挖掘是一项新兴的技术，是商业智能的重要组成部分。近年来，随着高校数据收集量的不断增加以及教育决策对量化分析结果的愈加依赖，数据挖掘在美国高校管理中的应用呈显著上升趋势。许多研究表明这项技术能帮助大学管理人员更好地分析数据，从而获取潜藏的、有用的信息和知识，最终提高决策效率。

加州大学9所分校在校长办公室的统一协调下通过“综合评审”的原则招收本科生。“综合评审”包括两个步骤：第一步是对申请学生的合格性通过多种方法进行确定;第二步是对合格学生的所有背景、特征及技能进行综合评定，并以此为标准做出录取决定。加州大学虽然保证录取所有合格的学生，但由于有的分校或专业竞争激烈，例如伯克利分校、工程专业等，因此不能保证完全按学生的报考志愿录取。在这种情况下，所有合格、但未被报考分校录取的学生，将被推荐到两所加州大学制定的分校，以确保尽可能录取每位合格的学生。另一方面，这两所分校也通过录取这些“落榜”的学生来增加其入学人数。由于加州大学的录取审核工作是由各分校负责进行，招生的最后决定到四月初才能见分晓。这时许多学生可能同时接到其他大学的录取通知，并需要在短期内选择自己要上的大学。因此，从吸引合格学生入学的角度来说，这时再向学生推荐这两所大学为时已晚。为了提前做好这一工作，校长办公室招办在一月份申请截止日期之后就对申请学生的录取情况进行预测，并将这些合格但极有可能被拒的学生名单提供给这两所分校，供他们提前向学生宣传学校的情况，鼓励学生来这两所学校就读。校长办公室用来完成这项预测分析研究的工具就是SAS Enterprise Miner数据挖掘技术。

通过这项数据挖掘技术，加州大学可以更有效的招收合格的学生。 8. 大数据在学习成果评估方面的应用

随着大学教学模式由传统的“行为主义”方式向“构建主义”教学过渡，如何更有效地对学生成绩进行评估也成为广大教师和评估工作人员面临的挑战之一。除了利用传统的考试方法对学生所学知识进行考核外，越来越多的授课教师侧重对学生的学习行为进行评价，譬如合作意识、创新精神、实践能力，等等。这些评价结果更有利于帮助学生提高学习效率，特别是应用知识的能力。但靠传统的评价方法很难有效地完成类似的评估工作，或者说评估结果的可靠性难以得到保证。近几年来，许多学者尝试利用数据挖掘技术提高评估效度。

哈佛大学的研究人员娇蒂·克拉克(Jody Clark)和克里斯·戴迪(Chris Dede)在这方面的尝试非常值得借鉴和参考。他们通过复杂的教育媒体收集丰富的与学生学习行为有关的数据，然后利用数据挖掘技术对其进行分析和研究。

评估结果的价值体现在：1)完成对学生的形成性评估，为教师及时提供信息反馈;2)完成对学生的总结性评估，以真实的实践表现为基础了解学生最终掌握知识的情况;3)根据学生的个性特征，深层了解学生的学习行为以及学习成效;4)合理评判学生合作学习和解决问题的能力;5)通过对学生的学习行为规律和学习成效之间的“路径”关系进行“挖掘”，洞察学生的学习动态。

9. 衢州市柯城区依托大数据为学生“私人定制”成绩单

近年来，随着大数据成为互联网信息技术行业的流行词汇，教育逐渐被认为是大数据可以大有作为的一个重要应用领域，有人大胆地预测大数据将给教育带来革命性的变化。大数据技术允许中小学和大学分析从学生的学习行为、考试分数到职业规划等所有重要的信息。衢州市柯城区以大数据为依托，为学生“私人订制”成绩单。

2015年开始，衢州市柯城区启动教学质量诊断系统项目，采用CC教学测评系统对每个学生进行数据分析，为学生出具“学业诊断分析报告单”。“学业诊断分析报告单”基于对学生一个学期以来成绩的大数据分析，通过“单科成绩对比图”、知识点掌握情况分析表、知识点的个人掌握率和班级平均做对比表，将学生考试各科目考察的每一个知识点的掌握程度作出相应的分析，从数据中分析学生对知识点的掌握程度，对个人能力如识记能力、运用能力做出综合评价，为学生的学业作出一份细致全面的“体检诊断报告”。“学业诊断分析报告单”为学生提供了知识、能力掌握上的优势和不足信息，学生可通过分析原因，提高学习的针对性和有效性，减少重复的试题训练，进而有效减轻学习负担。教师可通过分析了解学生在知识、能力掌握方面存在的优势和缺陷信息，实施补教性教学，从而提高教学质量，促进学校教学、学生学习方式的改革和发展。 10. 大数据在学生扶贫方面的应用案列

西安交通大学学生处立足大学生资助工作实际，按照教育部“教育扶贫，十三五期间实现‘精准资助’”的要求，结合陕西省教育厅关于教育精准扶贫的工作思路，扎实开展了一系列“绿色通道”迎新工作：利用大数据完成学生贫困程度的精准识别，通过实地家访将绿色通道延伸到新生家中，开展“知心工程”让资助教育沁入学生心中，建立七位一体的资助系统让学生没有任何后顾之忧。西安交通大学提供给每个贫困生的，不仅是金钱的资助，更是被尊重及自信积极的人生态度。

资助大数据实现精确认定。在新生来校报到之前，通过“西安交通大学家庭经济困难学生综合认定系统”挖掘学生家庭经济困难指数，认定家庭经济困难学生情况，并以此为依据，主动引导特困新生在家中即可通过网上申请“绿色通道”并顺利入学，消除特困生家庭的后顾之忧，在此基础上与各书院共同主动开展有针对性的帮扶工作。

资助全覆盖实现精准帮扶。学校为每一位通过“绿色通道”入学的学生发放全套床上用品“爱心大礼包”，体现学校的关爱。新生入学后学校将陆续通过“奖、助、贷、补、勤、免、偿”七位一体的资助体系给予学生持续资助，确保每一位学生不会因为经济困难而影响学业。学工系统还通过“知心工程”工作体系，全面跟踪家庭经济困难学生情况，建立建全贫困生信息库。今年学校还将特别为建档立卡户新生每人发放一学期的生活费。 11. 希维塔斯学习”(Civitas Learning)利用大数据帮助学生提高成绩

在教育特别是在学校教育中，数据成为教学改进最为显著的指标。通常，这些数据主要是指考试成绩。当然，也可以包括入学率、出勤率、辍学率、升学率等。对于具体的课堂教学来说，数据应该是能说明教学效果的，比如学生识字的准确率、作业的正确率、多方面发展的表现率——积极参与课堂科学的举手次数，回答问题的次数、时长与正确率，师生互动的频率与时长。进一步具体来说，例如每个学生回答一个问题所用的时间是多长，不同学生在同一问题上所用时长的区别有多大，整体回答的正确率是多少，这些具体的数据经过专门的收集、分类、整理、统计、分析就成为大数据。

现在，大数据分析已经被应用到美国的公共教育中，成为教学改革的重要力量。为了顺应并推动这一趋势，美国联邦政府教育部2012年参与了一项耗资2亿美元的公共教育中的大数据计划。这一计划旨在通过运用大数据分析来改善教育。联邦教育部从财政预算中支出2500万美元，用于理解学生在个性化层面是怎样学习的。其中，“希维塔斯学习”建立了高等教育领域最大的跨学校数据库。

“希维塔斯学习”是一家专门聚焦于运用预测性分析、机器学习从而提高学生成绩的年轻公司。Civitas Learning提供了一套应用程序，学生和老师可以在其中规划自己的课程和安排。“希维塔斯学习”各种基于云的智能手机第三方应用程序(APP)都是用户友好型的，能够根据高校的需要个性化。这意味着高校能聚焦于各自不同的对象，相互不同地用这家公司的分析工具开展大数据工作。

该公司在高等教育领域建立起最大的跨校学习数据库。通过这些海量数据，能够看到学生的分数、出勤率、辍学率和保留率的主要趋势。通过使用100多万名学生的相关记录和700万个课程记录，这家公司的软件能够让用户探测性地知道导致辍学和学习成绩表现不良的警告性信号。此外，还允许用户发现那些导致无谓消耗的特定课程，并且看出哪些资源和干预是最成功的。

12. 电子科大利用大数据寻找校园中最孤独的人

从硅谷到成都，大数据，这个新鲜的话题正在全球同步热传。一场关乎每个人生活、工作和思维的大变革正在悄然发生，大数据时代迎面袭来。

到底什么是大数据?大数据”是“数据化”趋势下的必然产物。数据化的核心理念是：一切都被记录，一切都被数字化。电子科大的周涛解释到，“大数据要求数据能充分发挥其外部性并通过与某些相关数据交叉融合产生远大于简单加和的巨大价值。”比如，国家电网智能电表的数据可以用于估计房屋空置率，淘宝销售数据可以用来判断经济走势，移动通讯基站定位数据可以用于优化城市交通设计，微博上的关注关系和内容信息可以利用于购物推荐和广告推送„„

他们做过一个有意义的课题——寻找校园中最孤独的人。他们从3万名在校生中，采集到了2亿多条行为数据，数据来自学生选课记录、进出图书馆、寝室，以及食堂用餐、超市购物等数据。通过对不同的校园一卡通“一前一后刷卡”的记录进行分析，可以发现一个学生在学校有多少亲密朋友，比如恋人、闺蜜。

最后，通过这个课题找到了800多个校园中最孤独的人，他们平均在校两年半时间，一个知心朋友都没有。这些人中的17%可能产生心理疾病，剩下的则可能用意志力暂时战胜了症状，但需要学校和家长重点予以关爱。

第8篇：2017年大数据行业就业前景怎么样

大学生就业：做好职业规划是关键

近年来，高不成低不就、先就业再择业、与企业需求脱节等大学生就业问题日益凸显，甚至可以说已经成为了严重的社会问题。据悉，2013年全国普通高校毕业生总人数将达到699万人，而相关数据显示2013年应届毕业生签约率不足3成。如何突破瓶颈，顺利实现就业?不仅是学生要思考的问题，更是社会需要迫切解决的难题。对此，成都国信安认为，实现顺利就业，大学生需要回归到职业发展的原点——职业规划。

为什么要做职业规划

不可否认的是，无论是何种职业，都需要完整的知识架构体系作支撑，而知识架构体系的构建需要长时间的积累。理论上，现阶段的高校教育虽然在培养完全符合企业需求的人才方面存在一定困难，但其课程体系可以使学生具备企业需求的基本能力素质。而现实中我们发现，很多大学生显然没有具备这一能力。

之所以这样，一个重要原因是很多大学生缺乏准确的自我定位。在高校中，一个普遍的现象是学生自身爱好与所学专业存在严重错位。这类学生在学习过程中往往是抱着“六十分万岁”的心态，学习效果可想而知。同时由于缺乏自我规划，这类学生也很难系统掌握自身爱好所属的知识架构体系，因此在毕业时就容易遭遇本专业能力缺失、业余爱好能力不强的窘境。自身素质能力与企业需求不匹配也就不难理解。

何时做职业规划

正如上面所讲，知识架构体系的构建需要长时间的积累，因此对大学生而

言，大一期间就需要进行职业规划并不断完善。笔者了解到，虽然像中软卓越这样的培训机构会对每一位参加培训的学员进行人才测评，根据其特点进行就业指导，但这样的就业指导应该是锦上添花而非雪中送炭。可喜的是，现在很多高校都在开设就业指导的选修课，也会邀请一些知名公司或机构的管理人员给学生做职业规划的讲座，这些都是非常有意义的举措。

怎样做职业规划

职业规划是一个综合性问题，涉及学生、学校、企业等多个方面。当难以有效改变外界因素时，大学生需要更多发挥主观能动性。笔者建议大学生从以下三个方面做出努力：

首先，树立正确的职业规划认知。很多学生认为做职业规划就是要确立未来工作的职位，其实则不然。总体而言，职业规划是对未来职业发展方向的规划，大学生在此过程中需要确立自身的职业方向、系统掌握职业发展所需的基础能力架构。以中软卓越所在的IT培训行业为例，无论是培训开发还是测试，都需要掌握软件工程、开发语言、数据库、数据结构等基础知识。

其次，从兴趣出发。如果对未来发展有明确的方向，学生就可以根据规划原则构建自身的知识架构体系;而对于对未来发展缺乏明确认知的学生而言，则可从自身兴趣出发，设定一到两个发展领域并以此规划所应掌握的知识架构体系。除此之外，大学生应尽可能多的参加社会实践活动以增强社会实践能力。

再次，积极与在职人员沟通。与在职人员进行沟通一方面有利于准确把握真正的企业需求，另一方面也能对自己形成职业指导，因此中软卓越特别建

议大学生把握每一次与在职人员沟通的机会，聆听更多来自外部的“声音”。

如果大家想了解更多可以登陆我们的官网http://进行了解

第9篇：大数据读书报告

网络13-1戴崇卓

大数据的概念

大数据(big data)，指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。

在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样捷径，而采用所有数据进行分析处理。

大数据的5V特点(IBM提出)

Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实性)。

大数据的意义

现在的社会是一个高速发展的社会，科技发达，信息流通，人们之间的交流越来越密切，生活也越来越方便，大数据就是这个高科技时代的产物。阿里巴巴创办人马云来台演讲中就提到，未来的时代将不是IT时代，而是DT的时代，DT就是Data Technology数据科技，显示大数据对于阿里巴巴集团来说举足轻重。

有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类，而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似，大数据并不在“大”，而在于“有用”。价值含量、挖掘成本比数量更为重要。对于很多行业而言，如何利用这些大规模数据是赢得竞争的关键。

大数据的结构

大数据就是互联网发展到现今阶段的一种表象或特征而已，没有必要神话它或对它

保持敬畏之心，在以云计算为代表的技术创新大幕的衬托下，这些原本看起来很难收集和使用的数据开始容易被利用起来了，通过各行各业的不断创新，大数据会逐步为人类创造更多的价值。

其次，想要系统的认知大数据，必须要全面而细致的分解它，我着手从三个层面来展开：

第一层面是理论，理论是认知的必经途径，也是被广泛认同和传播的基线。在这里从大数据的特征定义理解行业对大数据的整体描绘和定性;从对大数据价值的探讨来深入解析大数据的珍贵所在;洞悉大数据的发展趋势;从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈。

第二层面是技术，技术是大数据价值体现的手段和前进的基石。在这里分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程。

第三层面是实践，实践是大数据的最终价值体现。在这里分别从互联网的大数据，政府的大数据，企业的大数据和个人的大数据四个方面来描绘大数据已经展现的美好景象及即将实现的蓝图。

大数据的应用

洛杉矶警察局和加利福尼亚大学合作利用大数据预测犯罪的发生。 Google流感趋势(Google Flu Trends)利用搜索关键词预测禽流感的散布。统计学家内特.西尔弗(Nate Silver)利用大数据预测2012美国选举结果。麻省理工学院利用手机定位数据和交通数据建立城市规划。

梅西百货的实时定价机制。根据需求和库存的情况，该公司基于SAS的系统对多达7300万种货品进行实时调价。医疗行业早就遇到了海量数据和非结构化数据的挑战，而近年来很多国家都在积极推进医疗信息化发展，这使得很多医疗机构有资金来做大数据分析。

大数据的趋势

趋势一：数据的资源化

何为资源化，是指大数据成为企业和社会关注的重要战略资源，并已成为大家争相抢夺的新焦点。因而，企业必须要提前制定大数据营销战略计划，抢占市场先机。

趋势二：与云计算的深度结合

大数据离不开云处理，云处理为大数据提供了弹性可拓展的基础设备，是产生大数据的平台之一。自2013年开始，大数据技术已开始和云计算技术紧密结合，预计未来两者关系将更为密切。除此之外，物联网、移动互联网等新兴计算形态，也将一齐助力大数据革命，让大数据营销发挥出更大的影响力。

趋势三：科学理论的突破

随着大数据的快速发展，就像计算机和互联网一样，大数据很有可能是新一轮的技术革命。随之兴起的数据挖掘、机器学习和人工智能等相关技术，可能会改变数据世界里的很多算法和基础理论，实现科学技术上的突破。

趋势四：数据科学和数据联盟的成立

未来，数据科学将成为一门专门的学科，被越来越多的人所认知。各大高校将设立专门的数据科学类专业，也会催生一批与之相关的新的就业岗位。与此同时，基于数据这个基础平台，也将建立起跨领域的数据共享平台，之后，数据共享将扩展到企业层面，并且成为未来产业的核心一环。

趋势五：数据泄露泛滥

未来几年数据泄露事件的增长率也许会达到100%，除非数据在其源头就能够得到安全保障。可以说，在未来，每个财富500强企业都会面临数据攻击，无论他们是否已经做好安全防范。而所有企业，无论规模大小，都需要重新审视今天的安全定义。在财富500强企业中，超过50%将会设置首席信息安全官这一职位。企业需要从新的角度来确保自身以及客户数据，所有数据在创建之初便需要获得安全保障，而并非在数据保存的最后一个环节，仅仅加强后者的安全措施已被证明于事无补。

趋势六：数据管理成为核心竞争力数据管理成为核心竞争力，直接影响财务表现。当“数据资产是企业核心资产”的概念深入人心之后，企业对于数据管理便有了更清晰的界定，将数据管理作为企业核心竞争力，持续发展，战略性规划与运用数据资产，成为企业数据管理的核心。数据资产管理效率与主营业务收入增长率、销售收入增长率显著正相关;此外，对于具有互联网思维的企业而言，数据资产竞争力所占比重为36.8%，数据资产的管理效果将直接影响企业的财务表现。

趋势七：数据质量是BI(商业智能)成功的关键

采用自助式商业智能工具进行大数据处理的企业将会脱颖而出。其中要面临的一个挑战是，很多数据源会带来大量低质量数据。想要成功，企业需要理解原始数据与数据分析之间的差距，从而消除低质量数据并通过BI获得更佳决策。

趋势八：数据生态系统复合化程度加强

大数据的世界不只是一个单一的、巨大的计算机网络，而是一个由大量活动构件与多元参与者元素所构成的生态系统，终端设备提供商、基础设施提供商、网络服务提供商、网络接入服务提供商、数据服务使能者、数据服务提供商、触点服务、数据服务零售商等等一系列的参与者共同构建的生态系统。而今，这样一套数据生态系统的基本雏形已然形成，接下来的发展将趋向于系统内部角色的细分，也就是市场的细分;系统机制的调整，也就是商业模式的创新;系统结构的调整，也就是竞争环境的调整等等，从而使得数据生态系统复合化程度逐渐增强。

大数据的IT分析工具

大数据概念应用到IT操作工具产生的数据中，大数据可以使IT管理软件供应商解决大广泛的业务决策。IT系统、应用和技术基础设施每天每秒都在产生数据。大数据非结构化或者结构数据都代表了„所有用户的行为、服务级别、安全、风险、欺诈行为等更多操作‟的绝对记录。

大数据分析的产生旨在于IT管理，企业可以将实时数据流分析和历史相关数据相结合，然后大数据分析并发现它们所需的模型。反过来，帮助预测和预防未来运行中断和性能问题。进一步来讲，他们可以利用大数据了解使用模型以及地理趋势，进而加深大数据对重要用户的洞察力。他们也可以追踪和记录网络行为，大数据轻松地识别业务影响;随着对服务利用的深刻理解加快利润增长;同时跨多系统收集数据发展IT服务目录。

大数据分析的想法，尤其在IT操作方面，大数据对于我们发明并没有什么作用，但是我们一直在其中。Gartner已经关注这个话题很多年了，基本上他们已经强调，如果IT正在引进新鲜灵感，他们将会扔掉大数据老式方法开发一个新的IT操作分析。