it运维管理工作总结

2023-01-10 版权声明 我要投稿

工作总结是当代年轻人的重要成长方式。根据自身的工作情况,编写详细的工作总结报告,可使我们在不断的反思、吸取教训、目标优化的过程中,对自身进行科学合理的评价,改进自身的工作不足之处,从而得出有利于自己成长的宝贵经验。以下是小编收集整理的《it运维管理工作总结》,希望对大家有所帮助。

第1篇:it运维管理工作总结

业务应用:IT运维管理的核心

由于信息技术的渗透性和先导性,信息技术已成为国内外企业战略决策的制定和调整、生产经营过程中的计划、组织、管理和控制不可或缺的重要工具以及公司核心技术的主要载体,信息技术促进了生产经营过程的集成化和科学化,从而成为各公司降低成本、维持技术领先地位的战略举措。

近年来,国内外各企事业单位都十分重视信息化建设,把加快信息化建设作为提高生产经营管理水平、促进业务流程优化、加强内部控制、提高决策质量和效率的重要手段。结合中国石油发展战略和业务需求,中国石油出台了统一的“十一五”信息技术总体规划,F5(企业信息系统管理)项目便是“十一五”信息技术总体规划中的一项,目标是建立集成的监控管理平台和统一、完善的运维管理体系,提高中国石油信息技术基础设施的可靠性和性能,从而保证中国石油各业务系统的高可用性,彻底改善IT服务的管理水平,提高客户满意度,降低IT服务支持成本。

被动的传统IT运维管理

市场研究机构Gartner调查发现,在导致IT基础设施出现故障的原因中,源自技术或产品方面的因素其实只占了 20%,而因为运维管理方面的原因则占到80%,可见IT系统运维及管理是相当重要的。企业每年对IT部门投资都不少,但是得到的效益却没有体现,问题仍然时常发生,感觉好像所有的投入都打了水漂。

企业的IT运维部门是一个吃力不讨好的部门,因为IT运维就是在后台默默地保证信息系统的正常运行,只有在问题发生的时候才想到还有IT部门的存在。这种现象是由于IT运维管理还处于传统模式,即无相应的运维监控软件或者是仅仅单独使用某项监控软件而没有联合使用。这种传统的IT运维管理是被动的管理,是孤岛式的管理,是与业务应用没有联动的管理。

1.被动管理

传统的IT运维管理是救火式的管理。通常是用户先于IT人员发现问题,然后再找到IT部门要求解决问题。这是由于传统的IT管理采用人工方式管理基础设施,网络管理是从各种IT基础设备出发的,仅仅是保障各类IT设备如服务器、数据库、存储设备、交换机等等基础设施的正常运行。

不采用任何管理软件,仅仅靠运维人员定期轮询,或者执行某项命令来检查设备,在系统规模较小时,只要参与运维的技术人员足够负责,人工运维方式是可以满足日常运维需要的。但是,当应用系统达到一定的规模后,这种运维方式的弊端就暴露出来了。轮询一遍要花费几个小时,这样,轮询周期越长也就代表越需要更久才能发现故障。这种被动式管理IT导致有了问题不能及时发现。

2. 无关业务、孤岛管理

有些企业虽然采用某一种或几种监控软件来监控IT基础设施,但这些监控软件都各自独立运作,没有进行对业务的整合监控。如果用户投诉业务应用不畅通,很难定位故障源,到底是网络、应用程序、数据库还是其他后台系统出了问题,或者是各部门踢皮球,都说自己所负责的设备正常?

好一些的IT主管会把各个部门集合到一起开会,讨论问题根源。传统的IT运维管理方式是各类设备的管理各自为政,丝毫没有关联性。处理故障不便于追根溯源。每个人的精力有限,在专业应用系统赖以生存的各基础设施支撑单元上很难做到专、精、准的多面手角色,加之由于管理范围的界定和监控手段的限制,运维人员很难直接判定问题是出在基础网络、系统服务器、数据库还是应用系统自身,故障难以定位将直接导致业务恢复时间的推迟,影响业务系统的正常运行,大大降低服务质量。

将IT运维与业务相关联

IT运维是在后台默默地保证各项业务应用系统的正常运行。IT运维工作是无形的,怎样把这种无形的运维变为有形、甚至量化,这就要把IT的运维与业务相关联。传统的IT运维管理中,基础设施的运维工作不能和业务相结合,仅仅是在设备管理的层面上。这就导致IT管理的成绩没有体现。想想看,如有业务应用不正常,那网络或者服务器之类的任何一种基础设备的正常运行又有什么用呢?业务应用是“1”,设备是“0”,没有了正常通畅的业务应用,那其他的都是空谈。只有在业务应用畅通的前提下,基础设施管理才有意义,才能体现IT运维管理的价值。

因此我们需要帮助企业IT:部门了解用户使用感受,关联真实用户感受和系统性能,指导问题事件定位和原因诊断 。

企业信息化发展过程首先是基础架构建设阶段,这个阶段主要是采购一些硬件和应用软件。随着采购的不断扩大,企业的IT组件不断完备,IT系统初具规模,这就产生了IT运维和管理的要求,即网络和系统监控(NSM)阶段,监控网络连通性和系统可用性,此阶段主要还是对IT设备的监控。随着企业业务日趋复杂,IT系统进一步扩大,这时就产生了对IT服务流程进行管理的需求,上升到第三阶段,即IT服务管理(ITSM)的阶段。以上三个阶段都是IT间接产生业务价值的阶段,对业务的顺畅起辅助监控的作用。

企业业务系统对IT系统依赖的不断增强,企业开始关心IT服务对业务带来的影响,强调从业务目标角度出发来管理IT,也就是到达第四个阶段——IT与业务融合的阶段,即BSM(Business Service Management,业务服务管理)阶段。企业可以根据业务目标对IT服务进行调整,以确保IT能够支持业务目标,从而直接产生业务价值(如图2所示)。

如今各类重要的IT应用系统相继在中国石油发挥着举足轻重的作用,所以IT应用系统的可用性尤其重要,例如ERP、OA、邮件、门户等各类重要的系统如果出现中断,都会给企业造成大量的经济损失,所以除了需要对各类应用系统部署冗余的设备以备保证其高可用性,同时也需要对应用系统进行监控和管理,并且进行关联管理。业务系统的可用性是由底层的各类基础设施的状态所决定的,因此建立一个有效的业务模型,将与某个业务相关的底层IT基础设施关联起来,该业务模型能够有效地定位故障根源。这样ERP的管理员只需要关心ERP业务的可用性,而没有必要去关注每台主机的性能参数和启动的进程,不但大大节约了运维时间,而且也提高了运维效率,使故障持续时间大大缩短了。

基于BSM的IT运维

当前中国石油IT运维管理的需求就是从业务出发,建立基于BSM解决方案的新型IT运维。

新型的IT运维管理系统要做得到的就是基于BSM架构的业务管理。

首先,要实时掌控最终用户对IT服务的使用体验,根据制定好的SLA(Service Level Agreement,服务等级协议)来管理业务服务的质量,这样就可以根据业务影响和SLA来对IT服务进行管理。

其次,通过端对端的应用交易时间测量,实现业务要求端对端的可见性;从最终用户的角度,来测量业务服务的响应性能,主动帮助运维人员在第一时间发现问题,以便在问题对用户造成不利影响之前,及时得到隔离、诊断和修复,把它们对业务的干扰降到最低。

第三,提供业务服务、应用及底层IT系统构架部件之间的映射关系。这种解决方案通常会基于一种称为CMDB(Configuration Management Database,配置管理数据库)来实现。通过服务依存关系映射技术,来展现业务服务、应用和底层IT系统构架部件之间的动态关系,这样就增进了对各种IT元素的掌控和理解。

第四, 借助业务服务与IT基础设施的依存关系,对告警事件进行管理。当IT系统的组件产生告警时,结合收集上来的底层的IT系统告警事件,对它们进行过滤、关联、聚合,根据对业务服务影响的严重性,来进行排序处理。

传统意义上的CMDB是服务流程中的一部分,是ITIL中最重要、最核心的概念之一,在以业务为核心的IT运维中,CMDB也是业务建模的主要工具。CMDB通过自动发现工具收集和一定范围的IT基础架构基础信息,包括配置项和关系,建立IT基础架构模型;并通过端到端的业务服务拓扑图来可视化展示业务系统所有部件和关联关系。

把这四方面的功能整合起来,从最终用户的角度来衡量业务影响和风险;自动发现业务服务、应用和底层IT系统构件,并建立依存关系;理解用户感受,监控用户业务响应时间 ,在用户受影响之前发现问题,以求满足下列功能:

1. 通过基于角色的业务视图,提供业务流和服务的可见性;

2. 从最终用户的角度来衡量业务影响和风险;

3. 设置和检测业务过程的SLA,了解应用性能对业务的影响;

4. 24×7小时端到端监控,从浏览器到后台实时监控所有交易;

5. 理解用户感受,监控用户业务响应时间 ,在用户受影响之前发现问题;

6. 主动发现和按优先级管理关键业务问题;

7. 通过自动把业务和底层运营信息建立关联来缩短平均问题修复时间;

8. 自动发现业务服务、应用和底层IT系统构件,并建立依存关系;

9. 通过联合的CMDB,来为IT环境提供一个“统一的真实数据”视图,这样就可以为用户提供一个主动的、以业务为中心的BSM解决方案,帮助用户极大地改善业务服务的性能和可用性,降低服务突然中断带来的风险。

提升IT部门的作用

以前,IT运维部门救火队式的混乱状况导致无法判断IT运维总体表现的好坏。而IT部门又是公认的成本中心,这就导致了在很多企业中IT部门总是承受着很多批评,IT人员的工作热情也不高。

而现在,IT运维部门实现了主动发现问题、提前处理故障;IT运维管理与实际的业务应用挂钩,IT运维部门的工作由无形化为有形;促进IT部门从成本中心向利润中心转变,这一切既有利于IT人员发挥其工作热情,也有利于IT部门在整个企业地位的提升。

中石油的IT运维管理就是要基于BSM模式来建设,F5项目就是要实现基于业务来管理IT,也就是要提高信息技术基础设施的可靠性和性能,降低支持成本,对基础设施的规划进行最佳的决策和采用更好的系统支持策略。同时,获取与业务运行相一致的信息技术服务与实践,整合网络、系统、数据库和应用系统管理等关键业务,从而服务于数据大集中趋势下数据中心运维模式的建立和各专业应用日常运维的需要。

作者:孟一飞 张岩

第2篇:国内企业IT运维管理水平提升建议

[摘 要] 本文首先提出IT运维管理的发展趋势,并对国内企业IT运维管理现状进行分析。在现状分析的基础上,结合IT运维管理领域的发展趋势,提出国内企业IT运维管理存在的问题。在充分借鉴IT运维管理最佳实践以及结合国内企业IT运维现状特点的基础上,提出一套适合国内企业运维特点、满足企业未来IT发展需求的IT运维管理模式,以及提升IT运维管理水平的建议。

[关键词] ITIL;IT运维管理;国内企业

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 06. 014

[

近几年,国内企业均将建成世界(国际)一流的大型公司作为其发展目标,这就需要与之匹配的信息系统平台作支撑。自2000年以来,国内大型企业的信息化工作进入到一个快速的发展时期。按照整体规划,国内大型企业已经实现了集中建设的目标,今后将继续推进系统深化应用,并实现集中化运维管理,这给传统模式的运维工作带来了巨大的挑战。因此,亟需构建一套先进规范、运行高效的运维管理体系来满足提升管控能力的要求。

1 IT运维管理发展趋势

1.1 向集中化管理转变

集中化管理是当前IT运维管理的发展趋势,对主机设备、网络设备、存储设备、备份设备、数据库、中间件、应用软件、桌面系统等进行“集中监控、集中维护、集中管理”成为企业IT运维管理的必然选择。

1.2 注重与业务的融合

IT运维管理体系越来越注重与业务的融合,正逐步向业务靠拢,IT部门正在由从一个纯技术中心逐步转向服务导向的中心,目标更是直指业务中心。同时,以业务为中心,驱动IT系统的建设和运营管理,在提高IT效率的同时推动业务价值的形成。

1.3 以ITIL为最佳实践,指导运维工作

目前,ITIL作为当今IT运行服务管理的主要方法论已经被欧洲、美洲、澳洲、亚洲的很多企业采用,全球已经有1万多家知名的公司在参考里面的方法管理自己的IT系统。ITIL已被认为是世界IT服务管理领域的标准,同时也使得ITIL在IT服务管理中应用越来越广泛。

1.4 向自动化管理发展

目前,越来越多的企业开始运用专业化、标准化和流程化的手段,来实现运维工作的自动化管理。通过自动化监控系统能及时发现故障隐患,将IT运维服务由“被动”变为“主动”,防患于未然。例如,全天候自动检测与及时报警能够实现IT运维的“全天候无人值守”,大大降低IT运维人员的工作负担。与此同时,通过自动化诊断能够最大限度地减少维修时间,提高服务质量。因此,对于越来越复杂的IT运维来说,自动化管理是提升IT运维管理的过程,也是未来一个重要的发展趋势。

2 国内企业IT运维管理现状

2.1 IT运维管理现状

随着信息化的逐渐深入,企业的应用系统日益复杂,特别是数据集中之后,业务对IT持续运行的需求日益强烈,同时保证系统7×24正常运行也变得尤为重要。IT服务管理理念引进中国后,国内信息化的建设在参照了国际的流行趋势后,结合国内企业的现状进行运维管理体系的建设,在一些企业取得了重大成就,并且国内企业充分结合ITIL最佳实践和企业的IT运维管理的现状,从整体上提升了IT系统的运维管理水平。

通过调研中石化、中海油、国家电网、中烟信息4家企业的IT运维管理现状,从运维体系、流程、工具、团队4个方面进行对比分析(见表1)。从表1案例来看,IT运维管理都借鉴ITIL国际标准建立了相关流程,并遵照实施,其共同之处体现在以下4个方面:

从运维体系来看,中石化、中海油、国家电网、中烟信息均采用三级运维体系架构。

从运维流程来看,服务交付域和服务控制域中涉及的事件、问题、变更、发布、配置5个流程已得到全面应用,这5个流程是快速响应和解决用户提报问题的关键流程,直接决定运维服务水平高低。通常与流程相关的关键绩效指标会在与客户签订的服务级别协议(SLA)中体现出来,之后这些指标会在内部团队和外部供应商之间进行分解,以保证服务的可靠性和可用性。

从运维工具来看,多采用与ITIL流程吻合度高、先进、应用广泛的运维管理平台,如SM7和Remedy。这些平台的应用,使运维人员和运维流程得到固化;同时,也使知识库的作用得到最大限度的发挥,运维服务能力得到不断提升。

从运维团队来看,出于信息安全的考虑,大多为内部支持队伍,且少有将全部运维工作外包出去。这些内部支持队伍均取得ISO 20000认证,或者运维相关资质如CCOE认证。

2.2 IT运维管理存在的问题

在现状分析的基础上,结合IT运维管理领域的发展趋势,可以看出国内企业在以下几个方面需要改进。

2.2.1 向集中化管理转变各企业的运维水平参差不齐,缺乏工具支持

目前各企业的运维管理水平也存在较大差距,有些企业已经初步建立了运维管理流程和工具,但在实际执行效果上并不尽如人意;更多企业的运维管理工作还处在不尽规范的状态,缺少相关的管理流程和工具,更多的是依靠运维人员的个人能力维系业务系统的运维管理。另外,有些企业的信息系统运维工作缺乏有效工具的支持,运维流程效率的体现很大程度上依赖于适当工具的使用,包括监控系统去获取客观的数据,IT服务管理平台掌握对运维流程关键点的控制等。

2.2.2 系统建设与运维并举,运维管理环境和运维团队尚不稳定

目前从总体来看,国内企业的信息化还处在建设和运维并行的阶段,而且这种特点还将持续较长一段时间。这种并行特点给统一和整合的IT运维管理体系的建设带来了环境和团队方面的挑战。

2.2.3 量化考核和评价机制需进一步完善

目前,国内企业的IT部门量化考核和评价机制还不完善,缺乏服务质量评价指标体系。而为配合运维管理工作规范化的开展,应提前制定必要的管理制度、绩效衡量和质量评价体系等,这些内容是实现运维管理工作目标的必要手段。

3 国内企业实施IT运维管理的对策建议

未来,运维管理模式的建设方向是一体化集中管控模式。为此,国内企业在设计运维管理模式时,必须考虑组织特点和未来的发展方向,尤其要考虑,随着基础设施、应用的大集中模式的实现,未来国内企业会搭建以IaaS、PaaS为主,逐步尝试SaaS的私有云,集中化的运维管理模式必须能够支撑未来企业云环境的管理。

3.1 IT运维管理模式建议

借鉴IT运维管理发展趋势,结合国内企业的现状特点,建议IT运维管理以统一的技术工具平台为支撑,遵照统一规范的运维流程执行,明确出人员角色,涵盖三级运维体系。IT运维管理体系的建设涵盖组织模式、管理制度、管理流程、绩效考核、知识管理、技术支撑等内容。

3.1.1 组织模式

为了实现一体化集中管控的运维管理,建议将运维管理机构、运维服务机构到后台支持团队3个层次进行统一,按照业务设立统一的运维团队,为用户提供统一的IT运维服务。

3.1.2 制度规范

管理制度体系分为“信息化运维管理办法”、“各服务管理流程序文件”、各信息系统项目根据具体情况再制定实施细则和操作指南以及表单4个层次(如图1所示)。

3.1.3 管理流程

建立统一的服务管理流程,包括分别面向用户的服务支持流程,如事件、问题等流程。以及面向客户服务交付流程,如容量管理、可用性管理等流程。

3.1.4 绩效考核

绩效考核从IT运维管理体系的目标出发,按照组织、流程和岗位角色分解,形成“IT运维组织KPI关键绩效指标—流程KPI—角色岗位KPI”3层相互关联的绩效考核指标体系。

3.1.5 知识管理

整合知识资源,建立一套“统一、集中”的运维知识管理平台,以便为总部及所属企事业单位IT运维工作提供支持。

3.1.6 技术支撑

建立集中统一的运维管理平台,包括服务流程平台、监控平台、知识管理平台等。

3.2 提升IT运维管理水平的建议

3.2.1 各企业参照统一标准搭建运维管理体系

各企业运维管理体系采用急用先上的原则,将目前存在的问题最突出的内容、日常运维中最不可或缺的内容建设完成,按照系统搭建运维服务台,建立统一的用户服务体系及内部管理体系,具备必要的运维管理能力,改变目前无流程、无工具或流程执行不到位的现状,初步搭建规范统一的运维管理体系。

3.2.2 配套运维管理工具,提升体系的执行效率和效果

通过运维工具可以实现对IT服务过程工作流程的精确管理,将人员和流程固化,实现运维人员、流程、技术的有机整合,实现常规及突发状态的应急管理,实现运行故障的提前预警。同时,从管理、制度和技术等角度出发,将系统运维工作相关信息、资源进行整理、分类,建立统一的、不断丰富、完善的运维知识库,为运维人员学习培训、信息共享提供方便,从而提升管理体系的执行效率和效果。

3.2.3 建立持续优化机制,确保体系高效运转

运维管理体系建设是一个持续发展、不断改进的过程。体系实施后,在规范日常工作的同时,注重加大自检力度,成立检查小组,定期检查数据、记录及职能角色等执行的合规性,产出表单的完整性,认真出具自检报告。对体系执行过程中存在的问题提出改进措施,并跟踪监督落实。同时,随着人员素质和知识水平的提升以及运维管理模式的转变,运维管理体系也需持续改善,改进和优化运维管理流程,以适应业务部门和管理不断升级的需求。因此,要建立持续优化管理体系机制,加强管理投入,定期度量和持续优化管理体系,确保体系高效运转下去。

主要参考文献

[1]庞玉东,樊少明.基于ITIL的中国石油IT运维管理体系研究[J].信息技术与标准化,2012(8),50-53.

[2]李长征.国家部委IT运维管理体系案例[J].电子政务,2008(12):26-33.

作者:王月 李明

第3篇:面向业务服务的供电企业IT运维管理研究

【摘要】供电企业在实际的发展过程中,需要不断的提高自身的业务服务质量,才能够实现较好的经济效益。而要想提高业务服务质量,需要应用科学的管理方法,这样才能够促进供电企业的良好发展。因此,本文主要针对于面向业务服务的供电企业IT运维管理进行了相关方面的分析和研究,希望通过本文的探讨,能够提高供电企业的市场竞争力,使供电企业能够获得更大的经济效益。

【关键词】业务服务;供电企业;IT运维管理

前言

供电企业的业务服务工作涉及到的内容较多,如果没有一套行之有效的管理方法,将会直接影响到供电企业业务服务工作的顺利开展,导致业务服务不全面,业务服务水平较低等问题的发生,严重的造成供电企业的经济损失,无法使供电企业获得长远的发展。从目前供电企业的现状来看,在应用IT运维管理的过程中仍然存在着很大的问题,因此,需要充分的利用业务服务的相关理论,不断的提高IT运维管理的水平,实现良好的管理效果。

1.面向业务服务的IT运维管理概述

实际上,业务服务管理是IT运维管理的高级阶段(具体如图1所示),但是,在实际应用IT运维管理进行管理中,出现管理效果差、管理效率低等问题,无法确保运用IT运维管理实现良好的管理效果[1]。因此,在实际的工作中,为了确保供电企业的管理质量,应该通过业务服务管理的理论,通过这个IT运维管理的高级阶段去指导IT运维管理工作,使IT运维管理能够有一个正确的管理方向和目标,不断的纠正在管理中存在着的问题,确保应用IT运维管理进行供电企业相关业务管理的过程中能够实现最佳的管理效果,促进供电企业的良好发展。

图1 业务服务管理与IT运维管理之间的关系

2.面向业务服务的供电企业IT运维管理的实施步骤

业务服务管理是建立在IT运维管理基础上的更高一级的架构,因此,在实施的过程中,主要需要完成如下几个方面的实施步骤。(1)由于现有的IT运维管理架构存在着很大的不足,因此需要进一步整合IT资源系统,做好IT资源系统的完善工作,结合IT资源系统中的漏洞以及在实际应用中存在着的问题进行针对性的改善,才能够实现较好的整合效果。(2)建设一个强大实用的运维分析系统,实现故障隐患和关键指标的有效监测,让运维人员能够把精力从事后处理转为事前预防,最大限度地提高业务应用的服务水平[2]。(3)构建科学的管理体系,通过构建管理体系能够确保IT运维管理工作更加合理和科学,并且能够进一步明确如何进行业务服务,如何进行业务评估以及如何解决业务服务中的问题,确保供电企业业务服务的质量和水平。(4)从面向业务的角度出发,解决IT集中运行监控系统未能覆盖的监控需求[3]。总之,按照如上几个步骤进行IT运维管理的改善和整合,有助于提高IT运维管理的质量,并且逐渐的向业务服务管理发展,实现整个供电企业管理水平的提高。

3.面向业务服务的IT运维支撑平台的设计分析

3.1 进行总体规划

在进行面向业务服务的IT运维支撑平台的设计过程中,首先需要进行总体性的规划,才能够实现良好设计的效果,在规划中,主要涉及到如下几个方面的内容。(1)用户体验管理。在IT运维支撑平台的设计中,其中用户体验管理是一项非常重要的内容,主要是由于供电企业是为用户提供电力服务的,只有让用户对服务满意,才能够最终获得经济效益。因此,用户体验管理非常重要,通过在IT运维平台中设计该项管理功能,能够发现业务服务在功能点和地域之间的差异和优势,发现潜在隐患和快速定位问题[4]。用户体验管理系统可解决监控死角问题,并在发生故障的应用系统对用户产生不良影响之前进行预警。(2)应用管理。所谓的应用管理主要就是指能够对故障进行实时的管控和管理,及时的发现并且解决故障,充分的展現其运维的对象,并且按照业务的相关要求提供相应的监控结果等等。(3)监控整合。在供电企业进行业务服务的过程中,很多的业务服务存在着很大的交叉性,如果不对其进行科学合理的整合,将会严重的浪费现有的资源,增加供电企业的经济成本,不利于供电企业经济效益的最大化。因此,在进行IT运维支撑平台设计的过程中,还需要对供电企业现有的资源进行实时的监控和整合,将一些交叉业务进行整理,精简供电企业的业务内容,能够提高供电企业管理的效率,确保供电企业的良好发展[5]。

3.2 关键技术的实施

面向业务服务的IT运维支撑平台的设计需要运用先进的技术才能实现,下面针对于在进行IT运维支撑平台设计中的一些关键性的技术进行具体的分析。业务依赖分析。实际上,在整个IT运维支撑平台中,其各项资源都是互相联系的,各项资源在实际的应用中也需要通过其他资源的相互辅助完成的。而业依赖分析技术主要就是指能够及时的对IT运维支撑平台中的各个资源进行故障的定位,及时的发现各项资源的运行情况,如果出现故障,能够确保及时的发现并且及时的进行处理,以免对其他的资源造成影响,避免供电企业业务服务质量下降;系统安全机制。由于在IT运维支撑平台中,会涉及到大量的数据交换和传输,而供电企业的客户群是非常庞大的,不同身份的客户需要通过网络对自己需要的信息资源进行查询,在这个过程中涉及到安全与隐私的问题。通过建立系统安全机制,运用相关的安全技术,能够保证数据的安全交换以及用户的身份认证和授权,确保用户的信息资料不被泄露,做好相应的保密性工作,确保供电企业的业务服务质量;防抖动设计,指的是为了消除瞬时出现的故障又很快的恢复正常的现象进行设计,抖动想象是IT设备在运行过程中经常出现的问题,IT运维管理系统中经常运用的抖动指标有内存利用率、CPU负载等,做好IT运维管理系统的防抖动设计才能更好的提高管理效率,提升供电企业的服务水平;阀值的设计,一般情况下,供电企业在采用IT运维管理的过程中,很多监控指示都不能根据单一的阀值对其进行分析和处理,要结合不同时段的阀值来分析,例如,CPU负载检测在上班期间设计一个阀值的范围,在非上班期间再设计一个阀值范围,通过对阀值的设计,才能确保IT运维管理的全面性,更有利于提高供电企业的业务服务水平。

4.结束语

本文主要针对于面向业务服务的供电企业IT运维管理进行了相关方面的分析和研究,通过本文的探讨,我们了解到,IT运维管理是一种行之有效的管理措施,但是,在应用的过程中的问题也是非常大的,在实际的应用中,应该充分的利用业务服务的理论,进一步对IT运维管理进行改进,能够实现较好的管理效果,确保供电企业业务服务的水平,有助于提高供电企业的市场竞争力,促进供电企业的快速发展。

参考文献

[1]张铁,王森,黄国祥, 张伟,张立勇,黄黎冰,郑小芳.供电企业企业IT运维管理机制的探析[J].现代商业,2010(29).

[2]周宇洁.IT运维管理的最佳实践[J].洛阳理工学院学报(自然科学版),2009(02).

[3]李娜.IT运维管理:信息技术与管理学的融合[J].中国电力企业管理,2009(24).

[4]甘雯.基于ITIL的集中化IT运维管理流程设计与实践[J].广西通信技术,2008(01).

[5]费百明.加快供电企业发展的必由之路——科技兴电[J].农电管理,2012(04).

作者:王旭勇

第4篇: it运维管理工作总结一

至20XX年10月底,XX有限公司在xx公司的运维又届满一年的时间了。在这为期一年的运维工作当中,xxxx的业务飞速发展,设备数量不断增加,人员的技术水平和业务知识有了显著的提升。我们的队伍在技术水平和管理经验上也有了本质的提高。

一、细致缜密的完成计划中的日常运维工作:严把质量;服务至上;严格要求;技术领先。

1.承接运维工作初始信息技术部的各位领导就对我们的运维工作给予厚望,并提出了认真完善服务水平的方针。我们在服务过程中严格按照这一要求,以对保障xxxx的发展,对用户负责的精神,把“严把质量,服务至上”的原则贯穿于日常工作的各个环节之中。使本运维期过程中的客户满意度有了非常显著的提高,多次获得了用户的认可。

2.对于在工作中信息技术部提出的新要求、新方案,我们及时相应配合,本着“严格要求”的原则,对于提出的要求科学性的分析研究,及时提出完整周密的解决方案,并拟请用户试行或测试后实施。有力的保障了运维工作的及时有效性。

对于提高服务业务技术水平上,按照信息技术部的统一规划,按时完成一系列的既定培训计划。按照“技术领先”的原则,通过技术上的培训提高了业务水平和解决故障的效率;通过制定有效的安全机制和培训,健全了xxxx信息外包人员安全机制;通过保密制度的培训使运维人员能够树立自觉维护xxxx的信息安全防范意识;通过客户服务意识的培训提高了客户的满意度。

二、吸收先进经验,保质保量的完成运维的各项任务:运维期内主机、服务器、网络和桌面均没有发生严重的生产安全事故,对于一些潜在的威胁也都在得到信息技术部门的批示下,审慎周密的完成了整改工作。运用先进的技术和经验提高劳动效率和运维工作质量:

1.运用先进的运维工具提高劳动效率。通过监控软件随时保持信息的及时性、可控性,一旦发生问题可以迅速定位和修复。

2.经过信息技术部指导,我们在运维工作中大量了采用WEB2.0技术。使我们在高效完成运维工作的情况下,为xxxx节约了大量的费用投入。

3.在工作的过程中注意新技术和新方法的学习和收集,对于有利于运维工作的成功方案及时整理并提交信息技术部。经过5年来的维护工作存储了大量的知识库信息。

三、适应任务需要,及时解决运维过程中的遇到的问题:

1.在运维过程中遇到突发问题及时与信息技术部门相关人员进行沟通,对于紧急情况的处理按照《应急预案》进行对应处理。在节假日安排主要人员进行值班和备勤,保障24小时均能及时相应。

2.在运维工作过程中,积极协助新增设备的各项实施工作,获得了信息技术部的肯定;在到货、验收、集成方案和安装调试过程中提供全程保障;对于数据的迁移、备份,各人按照自己的职责,在制定详尽的计划后、经过信息技术部的批准严格按照方案实施;

3.在配合一些公司的重大活动、事件时,为应对信息技术部人员不足的情况。我们一方面做好运维工作的情况下,另一方面派出部分或全部人员协助信息技术部的各项工作,以弥补其人力不足的状况;

4.对于机房的升级改造过程中积极配合,全程派员监理施工过程,及时出具各种施工方案和设计资料。施工完成后及时完善各类图表的变更、标识。

5.配合行政部门做好资产管理工作,对于资产管理系统派出专门人员参与学习,并对备份、升级方案及时提出自己的建议;对于办公室提出的节能减排的倡议积极响应,主动采取措施避免能源和材料的浪费;多次配合办公室进行资产统计、巡检、登记工作。

四、认真完成运维工作中的汇报、总结和知识积累工作:

1.《知识库》通过连续2年的整理已经形成了成体系的完整运维知识全集,方便了各类人员通过权限管理可以随时查找所需的运维信息,为提高运维工作效率提供了基础保障。

2.日常报告:共提交《运维日报》309份、《运维周报》52份、《机房温度周报》52份、《运维月报》12份、《运维半年报》一份、《运维年报》一份、《桌面工作记录单》1914份、《磁带存取记录表》12份。

3.工作报告:《变更报告》70份、《故障报告》5份、《数据安全保密措施报告》、《节日值班表》2份、《加班表》1份。另:《磁盘空间使用报告》等不定期报告;

4.图表:《电路电源拓扑图》、《机房及机架布局图》、《网络拓扑图》、《san环境拓扑图》、《电话配线架对应图》、《ip及工位、电话统计图》、《外包人员信息系统登记表》等。

5.其他报告:《外包人员信息安全管理建议》、《文件服务器使用管理建议》等。

通过以上的工作和措施,我公司顺利的完成了本期xxxx的运维工作任务,从根本上满足了设备运维的各项要求。任务的圆满完成,有赖于信息技术部正确的领导和大力协助;仰仗于xxxx健康发展的大好形势;得益于双方长期形成的信任与默契。

一年的时间很快过去了,在此向各位领导申请续约新的一年的运维合约。并且,在新的维护其中间维持上一年的全部合同条款,维持原来的运维价格不变。在新的运维期内,我们将保持冷静的头脑,继续发扬自身优势,多方弥补存在的不足,提高服务的水平和层次,在信息部的指导下,与各部门的同仁团结协作,大力配合,携手共进,高标准高质量完成各项运维任务。希望在新的运维期内能够更好的配合信息技术部的工作完成xxxx的各项要求和任务。

望各位领导批准。

it运维管理工作总结二

本月工作中,运维服务正常,所有电脑设备处于良好状态。保证服务质量,提高各科室人员对本月IT运维的满意度。对工作负起责任,任劳任怨,遵纪守法,服从管理,体现自我价值,为***提供更好的服务。以下是6月所有故障进行总结分析和情况描述。

1、IT运维服务共49次

本月IT运维服务工作中,统计数据如下:

办公系统故障:6次,出勤:2次,打印机/复印机:9次,电脑故障:9次, 中普数据:8次,其他故障:15次。

2、维修及耗材情况

(以上不含复印机耗材及易耗品)

5月份添加打印耗材6次总费用为:2660元 5月硬件维修2次总费用为:3130元 6月份添加打印耗材1次总费用为180元

3、IT运维服务描述和说明

一、盘点电脑资产,合理分配电脑资源

结合5月份所做的电脑资产盘点中,将年限已到期电脑进行帐上报废。由于6月份是重新续约,需对单位所有电脑设备进行清点,并分类设备哪些处于保修期内,或保修期外。共清点电脑主机:125台,显示器:141台,笔记本电脑:61台,打印机:55台。其中保修期内设备共有:142台,保修期外设备共有:252台。在4月份,本单位进新采购电脑30套(清华同方),打印机5台(OKI820B黑白)。为保证各科室日常办公和******需要,对******科室增加新打印机5台,目前使用状态良好。清点在本年报废年限已到的电脑共有38台,后期将在不影响用户使用的情况下进行更换。

二、******安防设备增加

在接到此任务前,幸好之前有过一些监控工程相关的技术知识。为增加监控需要实地考察当前安防系统设备情况以及线路走线管道。具体难度在于布线方面,其他技术方面基本解决,在这方面没什么太大技术含量只要稍微接触下基本都懂。天花板离地面较高,并且天花维护通道夹窄实施难度较大,由其工程部去完成。在技术方面,了解到摄像头的清晰度由线数决定,共购买了3个600线的摄像头,这是目前主流使用的。为了减轻布线工程人员负担,采用了集中供电器,就是所有摄像头都在同一个供电器上面供电12V。也就是在布线时不需要再另外从其他地方拉电线接插座。因为所有楼层的供电都是用集中供电的方面,供电器在楼层的某一处。决定录像质量的不是摄像头,而是录像机。录像机有几种录像模式。分别:cif、2cif、dcif、D1,也有更高。目前******安防设备有四台,录像质量全部为CIF,分辨率为352*288,保存天数约为48天,其中一台约为18天。

三、复印机、打印机耗材维修

6月份打印机耗材加粉量1台,复印机更换碳粉共有5次。打印机:整体性能稳定,整月来故障基本为零。复印机方面:负责保养公司每两星期上门进行保养,对复印机零件部位进行清理,其中检查一科,审理科复印机需要更换零件。检查一科由于鼓芯老化复印效果出现印痕,影响打印效果必须更换,总费用为840元,目前打印效果良好。审理科复印机损坏两个部件,经保养公司鉴定均为人为损坏,可能在取出卡纸的时候关侧板用力过猛,导致热敏鼓挂勾和双面导板断裂必须更换。此部件需要厂家定购,经两个星期后重新装上使用,总费用为:2290元。后续将定期查看是复印机状态,以确保发挥其最大性能。

四、出勤

出勤这工作是一个重要的学习机会,每次接到出勤任务前的一天我都会检查一次所有工具是否正常。一次在石井的出勤中,企业是一间电子商务企业,企业员工应该有100多人,在财务部门里有多套系统管理软件运作,就像工厂的整条生产线。售前,售后,发货,退货管理等。在系统里查询到数据有500万条以上,单导出一个数据表花费30多分钟,如此大数据量背后支持的服务器也不简单,在机房里有7台服务器,其中4台为linux系统。在这里才发现自已的知识不足,对linux系统接触甚少,对于一些命令早已忘记,而且那时已经是下班时期,管理员也没在场,最后搞到8点才完工。这次工作虽然辛苦,但收益良多,增长了不少见识,同时也发现自已的不足并在以后会不断努力学习,除了提高自已的技术水平外,更重要的是加强人员沟通。

it运维管理工作总结三

时间飞逝,一晃而过,弹指之间2011年已过半,作为公司的一名计算机软件管理员,在公司领导及各部门各同事的帮助下,我顺利的完成了各项工作。在具体工作中,我努力做好服务工作。为了今后更好地工作,完善不足,特此将我半年的工作情况做一个总结:

一、工作总结:

工作内容:我负责的工作主要有二个方面(一)、根据公司需求,负责公司网络应用系统,公司网站的开发,公司网络应用系统服务器的安装、配置和维护工作,公司网络应用系统用户帐号及权限的管理。(二)、负责公司网络和计算机软件的维护工作;公司计算机上软件的安装、调试及软件在使用过程中出现问题的解决;公司网络资源的权限分配;对公司人员提供必要的技术支持服务。

工作完成情况:

(一)、完成公司网站的前期资料收集准备工作,制定出建站操作流程,此项目根据公司需求可随时启动,并短时间能够完成建站工作。

(二)、完成公司资产管理系统的用户需求收集整理工作,并与多家软件公司多次沟通,最终根据需求选定在集团公司的用友财务平台上增加资产管理模块,达到资产管理与财务的时时同步。现项目因需集团财务平台的升级到新版本后才能增加我们所需的模块而暂时搁置,等集团平台升级后可再启动。

(三)、完成公司OA系统的日常维护工作,调整OA论坛板块,增加公司新闻、意见建议、纪念建党九十周年、纪念辛亥革命一百周年等板块并及时更新其内容,让员工及时了解公司新闻动态,提高自身思想觉悟。完成对OA系统帐号的管理工作,赋予每个帐号相对应的使用权限,对新入职、离职员工帐号做到及时添加和删除,对各地托管资产管理员帐号按地区分别分组。

(四)、在日常工作中及时响应了各部门的电脑软件、硬件、邮件、网络、打印机的维护。公司目前有近80多台电脑,由于机器较多且大多数为省店临近报废的旧机器,日常出现故障的情况较为常见,主要的电脑故障有:硬件故障,系统故障,网络故障,软件故障等,很多机器由于长期使用,导致系统中存在大量垃圾文件,系统文件也有部分受到损坏,从而导致系统崩溃,重装系统,另外有一些属网络故障,线路问题等。做到了尽可能的降低设备使用故障率,在其出现故障的时候,并做到了能在当地解决就当地解决,不能当地解决的也在最短的时间内给予了解决,保证了公司计算机的正常使用。

(五)、对公司每台电脑安装防病毒软件,避免了病毒在公司局域网内自我复制相互传播,占用局域网的网络资源,甚至使得系统崩溃,丢失硬盘的重要资料等各种危害,并及时的对软件进行升级,定期的清除隔离病毒的文件夹,定期的对每台计算机系统补丁软件补丁进行更新,防止了病毒和黑客通过系统漏洞进行的破坏和攻击。

(六)、对院内租赁产业重新布上网线,给租赁户提供网络服务并提供一定的计算机技术支持服务,给资产部租赁业务提供支持。

(七)、协助安全主管整理打印安全回执表并分地区上传到OA系统的公共文件夹,供相关部门和领导随时调阅。

(八)参与 office 2007软件使用培训,提高自身业务水平。

二、查找不足 反思改进

半年来,我始终坚持严格要求自己,勤奋努力,在自己平凡而普通的工作岗位上,努力做好本职工作,从不把情绪带到工作中。回顾半年来的工作,我在思想上、学习上、工作上取得了新的进步。但我也认识到自己的不足之处:

1、自己的思路还很窄对现代网络技术的发展认识的不够全面,自己对新技术掌握速度还不够快。

2、有时候在一些突发故障比较集中时,没有分清轻重缓急,科学的去安排时间,导致少数问题处理不及时。

3、公司网络IP设置没有做系统规划,导致有时候有IP冲突而导致网络中断的情况发生。

三、提高认识 持续进步

总结了过去,方能找到不足!对于下半年的工作计划,在总结上半年工作的同时,针对自己不足之处,我也做出了初步设想:

1、在硬件条件允许的情况下安装网络流量检测软件,对局域网进行监测,及时发现网络故障和排错,使网络快速高效的运行。

2、在继续完善公司网络的同时,加强理论和业务知识学习,不断提高自身综合素质水平。把工作做到更好。

3、等省店全部搬离我们接管机房后,对公司所有电脑设备进行统一计算机名称,分单位部门给予不同的IP段并对硬件情况、IP地址详细登记造表方便管理。

4、领导交办的每一项工作,分清轻重缓急,科学安排时间,按时、按质、按量完成任务。

上半年的工作已顺利完成,有收获也有缺憾,在下半年,我会继续秉着兢兢业业,恪尽职守的态度,把工作做得更好,让自己的能力得到进一步的提高。

第5篇:IT运维管理

目录

定义

IT运维管理包含内容

运维员三大法则

在网络的基础设施建设完成之后,整个网络处于运行状态,IT部门采用相关的管理方法,对运行环境(包括物理网络,软硬件环境等)、业务系统等进行维护管理,我们把这种IT管理的工作简称为IT运维管理。

IT运维管理包含内容

IT运维是IT管理的核心和重点部分,也是内容最多、最繁杂的部分,主要用于IT部门内部日常运营管理,涉及的对象分成两大部分,即IT业务系统和运维人员。其管理内容又可细分为七个子系统:

第一、设备管理:对网络设备、服务器设备、操作系统运行状况进行监控,对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web等的监控与管理;

第二、数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复;第

三、业务管理:包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理,主要关注该业务系统的CSF(关键成功因素Critical Success Factors)和KPI(关键绩效指标Key Performance Indicators);

第四、目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理;

第五、资源资产管理:管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互;

第六、信息安全管理:该部分包含了许多方面的内容,目前信息安全管理主要依据的国际标准是ISO17799,该标准涵盖了信息安全管理的十大控制方面,36个控制目标和127中控制方式,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等;

第七、日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段IT运行维护管理的每一个子系统中都包含着十分丰富的内容,实现完善的IT运维管理是企业提高经营水平和服务水平的关键。

运维员三大法则

【此法则适用GPL协议,欢迎各位自由发挥】第一法则,运维员不得危害服务器的安全运行,偷窥篡改服务上的数据,或袖手旁观服务器受到入侵;第二法则,运维员必须保护自己,除非违背第一法则;第三法则,运维员必须服从运维经理的命令,除非违背第一和第二法则。

第6篇:IT运维管理六大趋势

为应对不断变化的IT网络,Gartner发布的2013年对众多公司和组织机构具有战略意义的十大技术与趋势,关于IT运维管理包括以下六大趋势:

趋势1:支撑数据大集中管理

2013年,大数据成为IT界最受关注的话题之一,大数据正在从专注于个别项目向对企业战略信息架构的影响上转移,对数据量、种类、速度和复杂性的处理正迫使许多传统方法需要发生改变。同时为企业内部和运维产品提供商带来前所未有的难题,大数据时代,随着企业IT架构的不断扩展,服务器、存储设备的数量越来越多,网络也变得更加复杂,从而给运维工作带来了巨大的挑战,特别是分支机构众多的大型企业或垂直层级较多的政府单位,为了保障良好的用户体验和数据时效性,运维工作显得十分艰巨。IT监控系统每分钟要进行上万个数据采集已非易事,而对采集上来的海量数据进行处理和分析才是更难的挑战。如果数据未经过处理,这就对运维没有任何意义和价值。因此,在大数据集中趋势越来越明显的2013年,在此背景下具备实时采集和海量分析能力的IT运维管理产品将会成为数据分析应用的新增长点。

趋势2:虚拟化监控管理同等对待

在虚拟化诱人的高额回报面前,相对滞后的IT运维管理已经让众多CIO熬过了艰难的2012.在虚拟化后,IT运维部门需要对新增的虚拟网络、数据存储、虚拟机、ESX/ESXi主机数量、集群对象提供一种全新的管理方式。而这种方式就是消除虚拟化主机“不可见”的特殊性,尤其是在支持边缘应用的虚拟机和支撑核心应用的物理服务器同时存在环境中,IT运维产品需要具备“同等对待”的能力。很多方法可以实现这种管理模式,比如,在虚拟交换机和虚拟机之间仍然采用“实体连接”的方式进行管理,等等,这样才能消除虚拟化运维的死角,才能支撑传统数据中心全面升级换代至“云数据中心”。

趋势3:存储系统融入一体化监控

大数据、虚拟化对运维人员来说如临大敌,存储则是所有企业面临的另一个挑战。其稳定性、性能都是确保核心任务运行关键,存储系统发生事故、灾难往往给企业形象和业务连续性带来极大的威胁。

趋势4:主机监控更加细化

在Gartner发布的2013预测中,IT操作流程自动化成为了影响数据中心发展的技术之一,而实现IT管理流程自动化仍是IT管理人员降低IT操作成本和复杂性的一个关键目标。另外,在影响数据中心的技术中配置管理数据库(CMDB)将继续在企业IT运营基础设施中扮演重要的角色。这些对主机系统更加完备运维工具可以帮助IT运营的建立、维护、可视化和监视逻辑应用程序或者服务拓扑管理和跨系统的依赖性。

“工欲善其事,必先利其器”,利用自动化的IT运维工具力争出错率趋近于零,可以有效减轻人工控制流程的负担,同时也对提高业务服务质量起到事半功倍的效果。而在主机层面的监控只有做到精细化,便可有效的预测、预防、隔离、诊断和解决发生的问题,掌握各种系统资源的利用情况。另外,IT运维产品的发展趋势决定了,要在企业复杂的异构网络环境和系统面前毫不畏惧,有这种实力才能实现业务系统所依托的网络平台资源、服务器资源、应用系统资源、信息服务资源等进行统一综合管理。

趋势5:BSM运维产品认可度攀升

从IT运维管理在企业收益价值链的位置来看,以往的IT基础设施管理、IT设备维护和管理、IT服务流程管理等,只是对业务发挥着间接辅助作用。而唯有IT与业务融合的创新管理模型,才能对用户业务开展有直接价值,这也正是2012年众多企业用户对BSM理念进行了广泛讨论和最佳实践的原因。而在厂商层面,必须将产品与BSM理念耦合度做到最紧密,才能帮助那些缺少IT运维项目实施经验企业实现这个终极目标。我们从更多的用户层面上了解到,在2013年的起点处开始,许多CIO极其所带领的团队都希望利用BSM产品将业务清晰化、视图化,并在此基础之上才更好地执行SLA(Service-Level Agreement,服务等级协议)在企业中的兑现。

趋势6:运维产品紧跟企业发展步伐

IT运维管理的需求是随着企业规模与成长速度逐步调整形成的,从技术与管理两个维度来分析,企业IT运维管理一般可分为三个阶段:IT基础设施管理阶段、综合业务管理阶段、全域集中管理阶段。而在实际运维中,企业则可以通过对着三阶段的了解,“对号入座”。

根据据IDC预测,2013年58%的新IT投资决策将由企业高管直接参与,而这个趋势在过去三年里上涨了80%.那么,企业高层在规划IT投资时,为了避免“失控”, IT运维部门就需要向决策层提供这种准确的战略信息, 因此,IT运维工具必须要能提供每个分支机构的IT运维状况,真正起到大海捞针的作用,在剔除非关键信息的基础上完成决策支撑。

第7篇:系统运维管理-IT基础设施运维管理规范

IT 基础设施运维管理规范 文件编号:运维-002-V1.0

目录

运维管理规范-------------- 4 1. 目的 ------------------------ 4 2. 适用范围 ------------------ 4 3. 规范性引用及参考 ----- 4 4. 本文术语,定义和缩略语 --------------------------- 5 5. 基本要求 ------------------ 6

5.1运维管理原则----- 6 5.2制度和流程管理6 5.5供应商管理 -------- 7 5.6督促检查 ----------- 7 6. 运行维护 ------------------ 8

6.1日常操作及监控分析 -------------------------- 8 6.2 数据与介质管理 - 8 6.3机房管理 ----------- 9 6.4 网络管理 ---------- 9 6.5 弱电管理 --------- 10 6.6桌面维护 ---------- 10 6.7服务器及系统变更 ---------------------------- 11

6.8 配置管理 --------- 12 6.9 事件与问题管理 12 7. 应急管理 ----------------- 12

7.1应急准备 ---------- 12 7.2应急处置 ---------- 13

运维管理规范

1. 目的

为规范公司运维工作,使相关工作具有持续改善及相互协作性,同时加强计算机设备的管理及维护,确保维修工作的及时性,降低计算机设备的报修率,实现业务与技术的融合,将业务部门与IT 部门紧密结合在一起,根据公司管理要求及计算机应用的需要,由运维部制定。

2. 适用范围

本规范规定了运维管理工作的要求。

本规范适用于维信理财集团(中国) 总部,包括全国各分部及门店。

3. 规范性引用及参考

◆ IT 服务管理国际标准ISO/IEC 20000 ◆ 企业获得ISO/IEC 20000认证的权威指南 ◆ 全球著名IT 服务管理书库(ITSM Library) ◆ IT 服务质量管理原则

◆ 理解ISO/IEC 20000在IT 服务中的地位 ◆ ISO/IEC 20000规范和实践准则 ◆ IT 服务管理国际标准ISO/IEC 20000 ◆ GB/T 20269—2006 信息安全技术 信息系统安全管理要求

◆ ISO 31000:2009 风险管理 原则和指南(Risk management -- Principles and guidelines)

◆ JR-T 0060—2010 金融信息系统安全等级保护基本要求 ◆ JR/T 0074-2012 金融IT 服务管理基本规范 ◆ 中国金融标准化报告(2011)

4. 本文术语,定义和缩略语

1、 IT: Information Technology 信息技术

2、 DNS: Domain Name Service 域名服务

3、 DHCP: Dynamic Host Configuration Protocol 动态主机配置协议

4、 VPN: Virtual Private Network 虚拟专用网

5、 OA: Office Automation 办公自动化系统

6、 ISO: International Organization for Standardization 国际标准化组织 编订日期:30.7.2014 批准日期: 生效日期:

7、故障: IT设备或系统丧失规定的功能,导致服务中断或降质,或对正常运行造成潜在威胁。

8、异常: IT设备或系统的状态发生超出预期的变化或性能指标参数超出正常范围,有可能引发或已经引发故障,需要引起运维人员关注或处理。

9、资料: IT设备或系统的运行记录,包括IT 设备或系统的配置、故障历史记录、软硬件扩容或调整记录、权限变更申请记录等。

10、运行维护:本规范中的运行维护包括IT 基础设施维护、IT 应用系统运维维护、安全管理、网络接入、内容信息以及综合管理等。

5. 基本要求

5.1运维管理原则

公司按集中与分散相结合的原则,设立机房、各部门配备电脑。计算机系统本着“总体规划、分步建设”的方式实施建立。

计算机系统建设应综合考虑成本、费用、效率、效果、先进性及适用性,选择最优技术、经济方案。

5.2制度和流程管理

运维管理制度应包括但不限于机房管理、网络与系统管理、数据和介质管理、配置管理、安全管理、监控管理、文档管理、设备和软件管理、供应商管理等制度。

运维操作流程应包括但不限于日常操作、事件处理、问题处理、系统变更、应急处置等流程。

5.3 文档管理

对运维过程中涉及的各类文档进行管理,可按照制度文档、技术文档、合同文档、审批记录、日志记录等进行分类,并妥善保存。 5.3.2 对文档的版本应当进行控制。

文档在使用时应能读取、使用较新版本,防止作废文件的逾期使用。

5.4设备和软件管理

建立计算机相关设备和软件管理制度,对设备和软件的使用、安装、维修(升级)等进行规范。明确设备和软件管理责任人。对设备进行标识,标识应放在设备明显位置。

规定设备和软件的使用年限,定期进行盘点,并对设备状态进行评估和更新。

对外送设备的维修进行严格管理,防止数据泄露。

对拟下线和拟报废设备的存储介质中的全部信息进行清除或销毁。对正式下线设备和软件交指定部门统一管理、保存或处置,并保留相应记录。设备和软件报废应符合公司现行资产管理规定。

5.5供应商管理

对供应商支持运维服务的相关活动进行统一管理。

在与供应商签订的合同中明确其应承担的责任、义务,并约定服务要求和范围等内容。

应定期收集、更新供应商信息,组织对供应商的服务质量、履约情况、人员工作情况等内容进行评价,并跟踪和记录供应商改进情况。加强运维外包服务管理,主要包括:

a) 明确外包公司应当承担的责任及追究方式;

b) 明确界定外包人员的工作职责、活动范围、操作权限; c) 对外包人员工作情况进行监督和检查,并留存相应记录; d) 对驻场外包人员的入场和离场进行管理; e) 定期评估外包的服务质量; f) 制定外包服务意外终止的应急措施。

5.6督促检查

定期检查审计,对运维制度的执行情况和运维工作开展情况定期进行检查和审计,以督促运维工作持续改进。

指定人员负责对日常操作执行情况进行检查,确保运维管理制度和操作流程的有效执行。对检查和审计结果采取纠正、预防措施。

6. 运行维护

6.1日常操作及监控分析

未经许可,任何人不得随便使用电脑及相关设备。不得更换电脑硬件和软件,拒绝使用来历不明的软件和移动设备。

电脑发生故障时,使用者作简易处理仍不能排除的,应立即报告IT ,非专业管理人员不得擅自拆开机箱或调换设备配件。

计算机及其相关设备的报废需经过IT 部门或专职人员鉴定,确认不符合使用要求后方可申请报废。

运维应采取各种监控措施,配备视频、语音、系统监控和报警工具,对影响信息系统正常运行的关键对象,包括机房环境、网络、通信线路、主机、存储、数据库、核心交易业务相关的应用系统、安全设备等进行监控。

主要监控指标具体如下:

a) 机房:电力状态、空调运行状态、消防设施状态、温湿度、漏水、人员及设备进出等;

b) 网络与通信:设备运行状态、中央处理器使用率、通信连接状态、网络流量、核心节点间网络

延时、丢包率等;

c) 主机:设备运行状态、中央处理器使用率、内存利用率、磁盘空间利用率、通信端口状态等;

d) 存储:设备运行状态、数据交换延时、存储电池状态等;

e) 安全设备:设备运行状态、中央处理器使用率、内存利用率、端口状态、数据流量、并发连接数、安全事件记录情况等;

6.2 数据与介质管理

配合数据应用部,对核心业务数据进行周备份,并每季度进行恢复性测试。

对设备和人员出入进行管理。进入机房应限制和监控其活动范围,并有专人陪同;未经批准不得接入生产环境。

6.3机房管理

对机房环境、供电、空调、消防、安防等基础设施的运行维护、设备和人员出入、机房工作人员等进行规范管理。

应指定机房管理负责人。 确保机房环境整洁和安全,包括:

a) 应定期检查防水、防雷、防火、防潮、防尘、防鼠、防静电等措施的有效性;

b) 应保持机房环境卫生,设备摆放合理,归类; c) 不得随意出入机房。

d) 未经审批不得接入其它用电设备。

6.4 网络管理

确保网络、系统的正常运行。网络管理应包括: a) 绘制网络拓扑图,并保持更新;

b) 应保持网络设备的可用性,及时维修、更换故障设备; c) 应负责网络系统的参数配置、调优; d) 应定期对系统容量进行检查和评估;

e) 应定期检查网络设备的用户、口令及权限设置的正确性;

f) 应定期对整个网络连接进行检查,确保所有交换机端口处于受控状态; g) 应对网络信息点进行管理,编制信息点使用表,并及时维护和更新,确保与实际情况一致。计

算机网络跳线应整齐干净,跳线标识清晰;

h) 应制定网络访问控制策略,应合理设置网络隔离设施上的访问控制列表,关闭与业务无关的端口;编制文档并保持更新;访问控制策略的变更应履行审批手续。

权限管理应包括如下要求:

a) 权限分配应履行审批手续,权限设置后应复核; b) 应按照最小安全访问原则分配用户权限; c) 应在用户账户变化时,同时变更或撤销其权限; d) 应定期检查权限设置的有效性。

6.5 弱电管理

严格按图纸施工,在保证系统功能质量的前提下,提高工艺标准要求,确保施工质量。质量检查制度,现场管理人员将定期进行质量检查并贯穿到整个施工过程中。统运行验收:当设备安装完毕并调试运行无误后,由公司派现场调试人员进行系统联调,并向上级汇报调试结果。运维对弱电设备的综合管理,包括技术资料、档案的收集。同时,每月一次对弱电设备运行状况进行检查,并及时处理汇报问题。

6.6桌面维护

日常数据注意事项:

a. 个人文件(Excel 、Word 、PDF 等)建议员工不要存放在系统盘(通常为C 盘),可以存放在其它盘符。

b. 工程师可通过多种方式或途径来告知员工如何进行日常文件的备份,如:口述、邮件、培训等。

c. 未经许可,禁止使用U 盘,移动硬盘,手机或其它外设,如:网盘、邮箱等,盗取公司内部文件。

重装系统前注意事项:

a. 询问用户有哪些相关数据需要备份,如桌面、我的文档、收藏夹、邮件等。b. 用户Email 的备份:如客户端为Outlook 则导出相关OST 或PST 文件;硬件损坏需更换或维修时,运维人员进行测试,明确是否真实异常,不可随意更换。

关于账号、权限、密码

a. 必须严格按照公司制定的IT 策略进行管理,不可私自制定规范。 b. 禁止私自把个人管理员权限借给他人或告知他人。

c. 禁止为他人开设规定以外的权限,如:本地管理员、其他部门目录访问权限、上网权限、电话权限等。

d. 更改任何类型用户权限时需得到相关审批层级确认才可执行。 e. 如电脑无特殊应用需求,则一律为“user”普通权限。

f. 人员离职时,总部和分部应及时通过OA 确认,删除离职人员的相关账号与信息。

g. 妥善保管自己所知的密码。

6.7服务器及系统变更

不得在服务器上使用带有病毒和木马的软件、光盘和可移动存贮设备,使用上述设备前一定要先做好病毒检测;不得利用服务器从事工作以外的事情,无工作需要不得擅自拆卸服务器零部件,严禁更换服务器配套设备。不得擅自删除、移动、更改服务器数据;不得故意破坏服务器系统;不得擅自修改服务器系统时间。

使用空闲主机,对服务器系统补丁进行升级测试,运行平稳后,各服务器升级安装补丁,弥补系统漏洞;为服务器系统做好病毒及木马的实时监测,及时升级病毒库。

管理员对管理员账户与口令严格保密、重要数据库,网站,APP 等服务器由研发配合定期修改密码,以保证系统安全,防止对系统的非法入侵。

任何无关人员不得擅自进入主机房,需要进入的须征得服务器管理人员同意。应注意保护机房内的设备和物品,未经允许的非管理人员不得擅自操作机房内设备。

严禁携带易燃易爆和强磁物品及其它与机房工作无关的物品进入机房,机房内严禁吸咽。除管理员外,任何人不得随意改动服务器内系统及环境配置。

除系统管理员或授权参加系统管理的人员外,任何用户不得以任何方式获取(或企图获取)超级用户权限。

6.8 配置管理

明确配置管理负责人。

建立配置文档库,对服务器、存储、网络、安全设备,操作系统、应用软件、数据库等进行管理。

定期对配置进行备份及文档库归类。

及时检查并定期审计,对发现的不一致情况及时纠正修改。

6.9 事件与问题管理

对运维事件的处理进行规范,对发生的所有事件,根据事件的影响程度和影响范围评估事件处理优先级并及时处理。

对所有事件响应、处理、结束等过程进行跟踪、监督及检查。对问题进行分析、提出解决方案,通过变更管理审批后部署实施。

7.应急管理

7.1应急准备

明确网络、系统等事件的应急指挥决策机制,负责网络与系统事件的预防预警、应急处置、报告和调查处理工作。

网络与系统应急管理应遵循“谁主管谁负责、谁运行谁负责”、“统一指挥、密

切协同;注重预防、减少风险;科学处置、及时报告;以人为本、公平优先”的原则。

应急准备应符合如下要求:

a) 系统管理员、网络管理员、安全管理员等关键岗位应熟练掌握应急预案,能有效处置相关事件;

b) 在自身力量不足以满足应急要求的情况下,应与相关供应商签署服务保障协议。协议内容应包

括双方联系人、联系方式、服务内容及范围、应急处理方式等。应定期检查和评估协议的执行情况,确保服务保障措施落实到位,确保在应急处置中相关单位能提供及时有效的技术支持;

c) 应建立有效的应急通讯联络系统,确保信息畅通;

7.2应急处置

在发生网络与系统事件后,迅速采取应急措施,尽快恢复信息系统正常运行,如有重要情况应及时上报。

暂时无法确定事件原因、责任和结论的,应先给出事件的初步分析判断,并组织力量尽快查找原因,给出解决方法,采取整改措施。

第8篇:IT运维系统标准篇---桌面管理

http://

现在,随着电脑在企业中的普及,大部分企业的硬件和网络环境已初具规模,企业中的联网电脑多则数百上千台,这些电脑往往运行着从办公系统到业务系统的各种前端应用,它们的稳定性、可靠性、安全性以及性能等方面的因素,不仅直接影响着电脑使用者的工作效率,而且对整个企业的IT应用效率和管理成本以及安全性产生重要影响。

企业在桌面和设备管理领域,通常遇到什么方面的问题和挑战呢?电脑感染病毒、被安装木马,有些不明程序不断抢占IP地址造成其他机器无法正常工作,还有部分员工使用BT、电驴等下载工具时有发生。如果同时有多台计算机感染网络病毒或者进行非法操作,非常容易导致网络阻塞,从而致使其他正常网络业务无法使用。企业桌面管理解决方面已经成为企业网络运行管理系统不可缺少的重要组成部分,越来越受到网管人员和企业领导的普遍重视。

概括起来,这些问题即是IT资产的统计和追踪、软件和操作系统的安装、日常维护、安全监控和管理、应用监控等。由于桌面设备经常更新,对企业到底有多少设备,每台设备的配置情况如何,各台设备是否按规定安装了安全产品、是否及时打上了补丁?对这些信息很难有一个实时的掌握,致使IT管理常常处于被动状态。这些问题完全可以通过桌面管理软件得到解决。

新一代桌面管理平台标准

新一代桌面管理平台可以相互高集成度、支持多种平台、支持异构网络、功能完善、易于部署,应用灵活、方便,从而能够帮助企业用户实现桌面设备配置和安全管理。支持多级级联安全设计,采用"集中管理、分布部署"方式,可以支持大规模客户端的统一管理,确保安全策略实施的有效性,分布式部署体系满足了大型企业用户服务的需求。

新一代桌面管理平台不仅能够自动显示网络中的所有节点信息以及软硬件信息,而且能够将这些信息与组织人事信息合理组合在一起,从而方便网络中的所有资源得到统一管理和配置。另外,桌面管理平台能够通过控制管理客户端用户安装的软件以及运行的程序来对其行为进行控制,从而达到一个网络和主机的统一管理,极大地提高了安全管理力度。

新一代桌面管理平台可以提供了客户很方便的像可执行程序、MSI安装包或者文档数据文件自动下发与安装的功能。支持参数方式增加软件分发时安装选项,可以使得IT管理员很方便快速部署软件,极大地降低了IT管理员的工作强度,提高工作效率。并且可以按照部署范围进行分发,不会影响企业整体网络带宽。

新一代桌面管理平台具有完备的IT资产管理、员工行为审计、桌面终端安全管理、终端网络准入控制等主要功能,与国内外同类产品相比较,具有非常高的性能价格比,同时能实现对企业所有终端设备的远程支持及软件分发,不仅大幅度减少了IT人员现场支持的次数,同时能够确保软件和应用升级的顺利进行。桌面管理平台采用WEB方式,自动补丁模块最基本的功能就是按照即定的策略对桌面终端进行补丁的自动检测、服务器对所需的补丁下载和自动安装。

http://

新一代桌面管理平台解决方案

新一代桌面管理平台解决方案是为企业管理者量身定做的联网桌面终端综合管理平台,其在设计时就遵循了ITIL/ITSM规范及国家信息安全标准等原则,定位桌面管理系统的架构、性能、功能和管理界面。因此,桌面管理解决平台方案具有符合国内企业IT架构和管理模式,且真正适合用户最迫切需求的桌面系统管理平台。

新一代桌面管理平台解决方案不仅能够采集到桌面电脑固定的软硬件配置信息,跟踪软硬件配置变动信息,而且能够进一步获取桌面电脑的网络连接信息、用户信息。IT资产管理不应该是孤零零的设备管理,而应该是结合人的管理。帮助企业建立IT资产台帐管理机制,从IT资产采购、维修、报废等全过程进行管理可控。

桌面管理平台可以解决企业大量的桌面安全管理问题,提升IT服务部门的工作效率,解决大部分手工操作工作,对员工行为操作做审计并规范。终端桌面安全管理技术的兴起是伴随着网络管理事务密集度的增加,作为网络管理技术的边缘产物而衍生的,它同传统安全防御体系的缺陷相关联,是传统网络安全防范体系的补充,也是未来网络安全防范体系重要的组成部分。因此,终端桌面安全管理技术无论在现在还是未来都应当归入基础网络安全产品体系之列。

Broadaview广通桌面管理套件是一个完全集成的、跨平台的模块化桌面管理平台解决方案,能够在单一的控制台上对管辖范围内各种终端设备的桌面进行远程控制和管理,方便地对企业复杂而易变的桌面设备资产进行高效跟踪和统计,远程安装和配置操作系统和应用程序,帮助企业解决桌面管理所遇到的各种"难题",使IT管理人员从大量的重复工作中解放出来。

Broadaview广通桌面管理套件采用模块组件化设计,主要功能模块是全独立,可以分离、可以集成。完全按照用户的网络现状、实际信息化管理需求进行选择组合,真正做到按客户所需提供合适服务。广通桌面管理套件参考BS7799的资产分级管理要求,可以实现非常灵活的资产分组、分级,对不同组别的资产,可以采取不同的安全管理策略,切实保护用户IT投资,提高IT运维效率。

第9篇:IT运维项目管理心得—风险管理

过在PMP的学习,结合多年的IT运维项目实施管理工作经验,我对项目管理中的风险管理有了进一步的学习和认识,我真正认识PMP项目管理在现实生活中的运用。

风险管理是预防、规避项目风险的主要手段,是完成项目计划内的期限、预算内费用、规定的技术指标等的重要保障。在每个风险管理周期都应该做好从设计、合同、进度、质量、费用、沟通等管理工作中收集相关信息,并将这些信息反映在风险管理过程中的各环节工作中,并及时进行反馈。

现将我对项目风险管理的理解总结如下:

1、做好风险识别

在项目启动阶段,将对项目需求及项目实施过程中可能面对的风险进行全面的识别,结合公司已有的风险评估表,对识别出来的风险进行评分。

2、做好风险管控

在项目实施阶段,对前期已识别的风险,按照不同的风险等级进行管控,针对高危等级的风险(如:客户关键业务系统宕机)通过外包(购买原厂服务)或采取一定措施降低风险值的方式解决(提供专业人员提供24小时值班监控);针对中等级的风险,则制定相应的风险解决方案(如:巡检、定期保养、设备实时监控),来减少或缓解风险的发生概率;针对低等级风险,则采取定期监控方式。

3、做好风险监测

风险监测是持续不间断进行的过程,主要包含跟踪已识别的风险,监测残余风险和识别新的风险,形成风险管理监控报告,对重新识别的风险进行排序形成风险评估表,为管理人员提供决策的量化依据。通过对风险的良好监测和控制并形成风险管理监控报告,在风险发生前做出有效决策,减少风险造成的损失。(慧翔天地广州学员黄贤裕)

上一篇:初三致家长的一封信下一篇:省委党校培训心得体会