运维工程师工作计划5篇(运维工程师工作总结范文)

时间:2023-05-31 14:12:40 工作总结

  时间在转瞬中流逝,从来都不等人,我们又将续写新的诗篇,展开新的旅程,写一份计划,为接下来的工作做准备吧!拟起计划来就毫无头绪?下面是范文网小编分享的运维工程师工作计划5篇(运维工程师工作总结范文),供大家参阅。

运维工程师工作计划5篇(运维工程师工作总结范文)

运维工程师工作计划1

  2018运维工程师个人工作计划

  古人云:“凡事预则立,不预则废。”无论做什么事,只有事先做好准备、制定计划才能成功。下面是由小编为大家整理的“2018运维工程师个人工作计划”,供您参考,希望对您有所帮助!

  2018运维工程师个人工作计划(一)时间一晃而过,弹指之间,自从20xx年x月份刚进入公司,我是第一次接触公司、接触通信行业、接触公司网络管理及维护。虽然跟我的专业和技能都一致,但所有的实际经验都是第一次,让我没有任何准备,同样也打消了任何顾虑,人生就是这样,所有的一切都是要从第一次开始,没有接触过、干过并不可怕,领导给了我机会,让我有了一次尝试、一次展现自己的平台,那么我一定会更加倍的努力做好工作才是最大的回报。并且也是对自己的一次肯定。

  经过一段时间的工作及陌生环境的磨合,专心钻研业务知识,努力提高理论知识和业务工作水平。遵纪守法,踏实工作认真完成领导交办的各项工作任务,使自己渐渐的融入和适应到新的工作环境中。过去的大半年里在领导和同事们的悉心关怀和支持帮助下,通过自身的不懈努力,在思想、学习和工作等方面取得了新的进步。现总结如下:

  一、公司电脑日常维护工作

  刚一开始接手工作的时候,发现公司大部分工作电脑都没有安装安全防护软件和升级系统补丁;员工随意安装系统及应用软件,致使公司局域网内病毒隐患严重、工作不稳定和系统崩溃,工作秩序被打乱,员工不严格要求自己,上班时间聊QQ、玩农场、看娱乐网站等;为此公司和个人工作经常受到影响,工作效率降低。针对这种情况,我采取了以下措施:

  1、先对公司员工进行一次基本知识培训,让员工了解到计算机的正确使用方法,病毒防范,重要文件的备份等。从而大大提高了员工对电脑使用的熟练程度。

  2、先恢复良好的秩序。电脑使用时如发现故障和需更改设置,必须先报告公司运维人员,由专门人员来进行专业及针对化的操作,个人不能私自进行改动,进行这样做的目的避免由于人为的盲目操作使某一台电脑的故障影响整个局域网内的其它工作,使故障扩大化,并延长了解决问题的周期。

  3、使员工使用统一的、经过安全测试的系统及应用软件,安装、设置统一的杀毒软件、防火墙等安全防护软件,且经过努力实践,并在每台机器上设定了自动系统补丁升级及定期查杀规则。

  4、对于个人的关键性数据资料、邮件进行路径转移备份,使这些数据远离危险故障点,避免意外丢失所带来的严重后果。操作系统进行常规定期备份,便于事后的还原。

  5、对于网络管理进行了监管工作,公司所有电脑安装了行为管理软件后,员工工作效率逐步提高,自觉性得到明显改进,从而净化了公司网络办公环境。

  经过一段时间的贯彻和工作,先前的混乱现象得到有效控制,现公司的十余台电脑,工作状态稳定,没有出现大面积的系统崩溃和故障。

  二、网络的日常维护

  路由器及交换机的维护管理,确保公司网络运行正常,员工正常利用网络资源。加强路由器的规则设置,优化外网接口,内部员工合理地分配带宽流量,使公司的网络能稳定有效地工作。

  三、公司网络制度管理和完善

  公司经过一段时间的运转,各个部门的规章制度通过大家一起研究、探讨、立会并完善制定了各项规章制度,计算机管理也形成了制度,大家按章办事,使之成为一种工作习惯。同时公司的资产管理及日常的文书表格非常混乱和环节上的缺失。为此特地制作了一批表格、登记申请单及统计表。使得公司资产和资源得到有效的管理和控制,杜绝管理上的失控和资产流失。

  四、公司服务器平台管理与维护工作

  公司发展逐步扩大,对于公司所有的业务支撑平台-服务器,为重中之重;本年度我司服务器相应出现几次重大故障,分别如下:

  1、网络故障七次,重大一次,因服务器遭DDOS 攻击,导致我司服务器无法正常工作。事后通过紧急处理后得以恢复正常。其它几次分别为机房断电、网络升级、电信与联通DNS 解析故障影响到我司服务器平台网络连接不正常。

  2、系统故障三次,其中一次为短信平台服务器系统文件损坏,导致系统崩溃。经过技术部采用紧急预案措施在两小时内得以恢复系统。

  3、其它故障共计5次,因联通网关溢出,无法与我司IVR 服务器数据库网关同步,导致用户无法正常订购与使用我司亲情相伴业务。经过出现几次重大故障后,技术部多次研究与讨论,制定出一套完善的应急措施与日常维护计划。尽量归避风险及减少事故发生,同时确保做到问题提前预防、及时发现、迅速解决并恢复正常运营。

  4、针对服务器出现在问题所在,在技术部其它同事的配合下完成服务器的重新部署,访问权限及安全性的提高,数据库优化等相关措失后,目前服务器已运行正常。

  5、公司针对员工的工作岗位与职位重新部署了FTP 服务器的访问权限与互联网访问,使每个员工都能把重要的文件放到服务器上相关部门的文件夹里作备份,且通过内外网均可实现访问FTP 服务器,大大方便了员工在外出差或在家里随时提取相关资料,且员工的访问权限不一样,故某些与自己无关或公司重要资料进行了保密设置,从而大大提高了公司重要资料的完整性与保密性。

  总结本年度的工作,尽管有了一点点的进步和成绩,但在一些方面还存在着很多的不足。比如:工作经验不足,对公司的网络与办公环境未得到很大的改善;遇到困难的时候与领导沟通不够等等,这都有待于在今后的工作中加以改进。

  在新的一年里,将百尺竿头,更进一步,20xx年的大致工作计划为:

  1、在公司内部使用一种简便、有效的软件工作平台,使之便于公司所有员工的工作、交流、探讨,发布公共信息等(如OA 软件)。

  2、利用投影仪设备资源制作会议幻灯片为员工培训计算机操作及工作常用软件知识的小窍门,争取进一步提高全公司工作人员的专业化及工作效率。

  3、解决企业网站制作等专业性知识问题,业余时间强化学习并能胜任网站管理工作。

  4、进一步增强IT 系统和网络系统的稳定性和管理,使用更为高效的域控制系统来代替目前的工作组局域网,使内、外网连接任意,在任何地方工作都能连接本公司服务器资源。

  5、重新改建机房机柜网络布线,使机柜走线更加美观,同时方便以后维护时线路排除更加明了,直观。

  6、在资金允许的情况下对公司办公电脑、网络、会议系统布署方案升级优化,进一步提高员工工作效率,为公司节约成本开支。

  7、学习更多的网络知识,充分的将一些新的技术应用到公司当中来。为公司提供更优质、更便捷、更效率、更节能的办公方式。

  20xx年,是全新的一年,也是自我挑战的一年,我将努力改正过去一年工作中的不足,强化理论和业务学习,不断提高自身综合素质,把新一年的工作做好,为公司更好的发展尽一份力!

  2018运维工程师个人工作计划(二)悄然间,20xx年已经接近尾声,这一年,在部门领导和同事们的理解支持、关心帮助下,我顺利地度过了人生中的重要时刻,如期休了产假,特别感谢大家在工作生活上给予的照顾!现将一年来的工作总结如下。

  一、网络思政工作

  1、启动了学校官方微信公众平台新版运营,进一步提升了平台的服务性能和用户体验。

  新版微信公众号服务菜单采用了主屏模块化显示的方式,简洁明了,便于操作,大大提升了用户体验。新版微信公众号落户校内服务器,一卡通查询、财务查询、师生e线、迎新系统等服务菜单进行实名认证,平台的安全性大大提升。对试运营期间出现的各类问题,如个别栏目自动抓取时间间隔太长、实名绑定定期解绑、财务查询工资明细不显示、就业快车信息源调整、精彩活动栏目过期活动不予展示等数十个细节问题进行了改进,用户体验进一步提升。

  新版微信公众号设置21个服务项目,在保留原有14个服务项目基础上,新增7个服务菜单,进一步提升了服务性能。通知公告(教师版、学生版)一卡通查询、财务查询、师生e线、迎新系统、智能问答等7个新增服务菜单,再加上原有的班车查询、校历查询、精彩活动、就业快车等项目,基本覆盖了师生学习工作生活的各个方面,校内师生一站式服务目标基本达成。

  2、加强原创校园网络文化作(产)品的研发力度,活跃校园网络文化氛围。

  一年来,带领学生团队积极进行原创校园文化作品研发。共计推送42次,推送图文信息157条,其中《小白说事》25期、《伊所欲言》14期、《漫谈》27期、《矿大人的一天》3期。其中微视频《矿大人的一天:矿大的大爷大妈们》点击量9100余人次,点赞数114人次,反响良好,《江苏教育发布》搜狐新闻客户端进行了专题推送。漫谈之《矿大混搭漫画,萌萌的》得到徐州电视台、都市晨报专题报道,引起广泛关注。

  在《中国青年报》微信公众平台发布的“全国普通高校微信公号排行榜”上,我校官方微信(服务号)“XXXX大学”位列“全国普通高校微信公号综合影响力TOP100排行榜”第21名,两篇图文消息分别位列“全国普通高校单周文章阅读量TOP100排行榜”第19名、第80名,总体排名在江苏高校位列第二。

  设计制作了以“小白”为代言人的官方微信形象标识,制作了校园原创网络文化作品画册:《小白说事》、《伊所欲言》、《漫谈》。制作了官方微信品牌形象产品:便携玻璃杯、小白形象卡套、纪念版明信片。

  3、利用官方微信平台开展线上线下互动,用心打造官方微信活动品牌。

  精心策划开展了官方微信公众平台发布1周年暨校庆106周年系列活动。活动采取线上抽奖、线下兑奖的形式,共计发放各类奖品近3000份,活动持续期间,平台总用户数从增长至,增粉4904人,官方微信的知名度和影响力进步一提升。组织开展读书节名家讲座(北大张颐武教授、作家叶辛)抢票体验互动活动。700余人次参与了抢票活动,活动增粉200多人次,效果良好。而每年万圣节、圣诞平安夜等活动更是有上千名同学报名,官方微信活动品牌效应逐步凸显。

  4、推动学校新媒体运营工作队伍内涵建设。

  本人注重在新媒体运营方面的思考和积累,上半年受邀为信电、外文、艺术、文法四个学院新闻传播中心骨干做了题为《高校微信公众平台运营实务》的讲座,对学院新媒体工作进行交流指导。组织了辅导员赴上海开放大学参加沪外高校辅导员网络素养春季培训班,提升新媒体工作队伍网络舆情导控水平。

  5、开通XXXX大学“头条号”,拓展网络思政平台。

  上半年,与“今日头条”运营方取得联系,详细调研高校入驻头条号的有关信息,开通了XXXX大学“头条号”。组织新媒体中心相关人员进行消息推送。

  二、常规宣传管理工作

  1、做好橱窗宣传主题规划和一月一评一比及橱窗修缮等工作。20xx年,组织各学院展出宣传橱窗9期,共计发布橱窗选题28个。做好部门宣传橱窗的主题规划和图片订阅,全年共更新12期宣传橱窗,内容全面、新颖,解说详细,受到学生喜欢。对部门及各学院宣传橱窗损坏进行了全面维修更换。

  2、坚持做好公教区阅报栏、校车站台橱窗等的更新维护。坚持每天按时更新报纸,全年更换报纸近XX期。对公教区阅报栏锁具、磁贴等进行了全面更换。

  3、做好敏感日期、重大事件期间户外宣传阵地的维护。重点做好了节点户外宣传栏、宣传橱窗等户外宣传阵地的维护,确保校园户外宣传纯洁有序。

  三、创新点

  1、起草了《XXXX大学微信公众平台管理办法》。针对全校各级微信公众平台的登记、备案、建设等提出原则性意见,校内微信公众平台管理工作进一步规范化、秩序化。

  2、撰写了我校“礼敬中华优秀传统文化”活动成果《诵唱读写,传承经典》上报教育部,被评为全国高校特色展示项目。相关成果材料入选教育部20xx年“礼敬中华优秀传统文化”系列活动示范项目成果汇编。

  2018运维工程师个人工作计划(三)依据 “改革为动力、以创新促发展、以管理创效益”的部门工作总体思路,突出抓好信息网、邮运网的运行安全,在上半年完成的工作基础上继续推进以下几方面的工作:

  一、信息网方面

  1、进一步加强信息网运行维护管理工作,确保信息网的安全运行。

  2、继续做好信息网的建设和应用工作,加强长效业务和高效业务的科技开发和支撑力度,着力推进科技项目转化为生产力的工作。

  3、进一步加强邮政设备和计算机网运维基础管理工作。

  4、继续抓好应用软件开发工作。

  5、进一步做好邮政设备和计算机网组巡工作。

  6、为有效地支持新建、改建网点建设,将配合相关部门参与建设方案中线路、设备的布局设计,根据需要拟订计划,组织做好网点改造过程中设备的安装、调试等工作。

  7、继续组织做好全局设备的管理工作。

  8、根据江苏省邮政信息网管理运行维护指标体系,并结合部门kpi指标要求,完成综合网、金融网运行维护管理工作,确保综合网、金融网的安全运行,各项技术和运行指标达标。

  二、邮运网方面

  1、进一步巩固和完善邮运网路组织,继续加强网络运行管理。

  2、进一步完善邮件分拣封发体制、关系。城区投递局进一步实施分拣前置,提高封发质量和封发的有效性,达到全面提高网络运行效益和效率的目的。

  3、进一步加强中心局生产作业系统运行质量的管理。

  4、完善邮区中心局生产作业系统应急机制。

  5、深化和扩大邮区中心局“三化”改革的成果,在速递内部处理环节实施“三化”改革,提高速递专业的市场竞争能力、实现速递生产管理从简单粗放向科学精细转变。根据生产流程和操作管理工作,修改完善“三化”实施方案,并强化对执行情况的监督检查,全面提高网络运行质量和综合管理水平。

  三、车辆方面

  1、完善和健全车辆的基础管理制度,规范车辆使用,做好车辆管理规范化、标准化工作。结合我局的特点,进一步细化,制订符合我局实际的邮政车辆管理制度、考核办法,规范基础管理资料,提高车辆的管理水平。

  2、继续开展车辆检查工作,做到制度化,经常化,努力提高车辆的完好率。

  3、加强邮政车辆动态管理。加强对车辆运行、维护、消耗、新旧程度等情况的分析,及时掌握车辆的动态,以提高车辆管理的科学性。

  四、其他工作

  1、加强对基层的的调研工作。深入到挂钩单位了解生产、经营等情况,帮助分析、解决提出的实际问题,促进其业务的发展。

  2、完成对全区相关责任单位08年度的考核工作。

  3、编制部门工作计划,制订相关预算工作。

  4、做好邮政储蓄银行独立运行、速递一体化运行过程中的支撑工作。

  5、加强信息网、邮运网和车辆性能安全运行的定期或不定期的检查工作。

  6、加强对县局的对应管理。

  7、完成局交办的其他工作。

运维工程师工作计划2

  智慧和平指挥大厅运维工程师工作规范

  1.机房巡检:工程师每天到达“智慧和平”现场,先去大屏幕后方机房检查机房温度是否过高,空调是否正常开启,检查机柜里各设备是否正常运行,开启大屏幕检查大屏幕是否显示正常。如有迎检接待任务需长时间开启大屏幕时要不定时间去机房观察机房温度,空调是否正常运行,以保证大屏幕正常运行,如有异常立即向接口人反应情况并记录在巡检表上。开启“智慧和平”前端演示用电脑,逐一检查电脑是否可以正常使用,各功能模块系统是否可以正常登陆,开启音响功放检查音响、麦克风、视频会议终端是否正常,反应给接口人并记录在巡检表上。

  2.智能探头点检:每周登陆智能监控系统查看所有智能探头是否正常显示,探头位置是否移动,恢复移动过探头到预置位,不能正常显示的记录在点检表上,并交由接口人联系维保商尽快维修。

  3.每天下班前询问接口人第二天是否有接待任务,问清楚具体时间,具体部门,制定合适的演示方案,如有接待任务,提前准备好演示方案,并根据现场情况适当调整方案。 4.如有接待任务,工程师和讲解员需着正装,领导到达参观现场工程师需起立站好,等领导全部入席后方可坐下,根据现场接口人要求做好功能演示,参观结束后工程师应起立并

  站到大厅边上,待领导全部退席后方可继续其他工作。5.现场主管记录每天工作内容并形成工作日志,每周五总结本周的重点工作和完成情况。制定下一周的工作计划并形成工作周报交由接口人存档。

运维工程师工作计划3

  运维工程师学习计划

【篇1:运维工程师要这样做职业规划】

  运维工程师要这样做职业规划

  你知道要怎么做运维工程师职业规划吗?今天就和乔布简历小编我一起来学习一下吧。

  关键词:运维工程师职业规划

  伴随着国内软件行业的发展扩大化,更多更复杂的系统出现了,为了确保系统能够做到稳定运行,要求有更多的运维工程师。那我们就一起来看看运维工程师的职业规划吧。

  1、从行业角度看,中国互联网在高速发展同时,网站规模和架构也越来越大、越来越复杂;因此对专职运维工程师的要求就会越来越急迫,特别是对有经验的优秀的运维人才需求量大,而且是越老越值钱;目前国内针对运维工程师职业规划基本上都是选择毕业生培养(限于大公司),可塑性强,比较认同并容易融入企业文化。2、从个人角度,运维工程师技术含量及要求会越来越高,同时也是对公司应用、架构最了解最熟悉的人、越来越得到重视。

  3、网站运维将成为一个融合多学科(网络、系统、开发、安全、应用架构、存储等)的综合性技术岗位,给大家提供一个很好的个人能力与技术广度的发展空间。

  4、运维工作的相关经验是运维工程师职业规划的一个重要因素。并且将会变得非常重要,而且也将成为个人的核心竞争力,具备很好的各层面问题的解决能力及方案提供、全局思考能力等。

  5、特长发挥和兴趣的培养。由于运维工程师职业规划非常广阔,更容易培养或发挥出个人某些方面的特长或者爱好,如内核、网络、开发、数据库等方面,可以做得非常深入精通、成为这方面的专家。6、如果真要以后不想做运维了,转到其它岗位也比较容易,不会有太大的局限性。当然了,你得真正用心去做。7、技术发展方向:网站/系统架构师。

  一个清晰的运维工程师职业规划无疑是对运维工程师的最好的保障。运维工程师,只有更加用心地去学习基础的、核心的东西,关心数据库版本演进过程中新特性的变化,才能顺应时代变化。

  运维工程师要这样做职业规划

原。

  5、对于网络管理进行了监管工作,公司所有电脑安装了行为管理软件后,员工工作效率逐步提高,自觉性得到明显改进,从而净化了公司网络办公环境。

  经过一段时间的贯彻和工作,先前的混乱现象得到有效控制,现公司的十余台电脑,工作状态稳定,没有出现大面积的系统崩溃和故障。

  二、网络的日常维护

  路由器及交换机的维护管理,确保公司网络运行正常,员工正常利用网络资源。加强路由器的规则设置,优化外网接口,内部员工合理地分配带宽流量,使公司的网络能稳定有效地工作。

  三、公司网络制度管理和完善

  公司经过一段时间的运转,各个部门的规章制度通过大家一起研究、探讨、立会并完善制定了各项规章制度,计算机管理也形成了制度,大家按章办事,使之成为一种工作习惯。同时公司的资产管理及日常的文书表格非常混乱和环节上的缺失。为此特地制作了一批表格、登记申请单及统计表。使得公司资产和资源得到有效的管理和控制,杜绝管理上的失控和资产流失。

  四、公司服务器平台管理与维护工作

  公司发展逐步扩大,对于公司所有的业务支撑平台-服务器,为重中之重;本年度我司服务器相应出现几次重大故障,分别如下:

  1、网络故障七次,重大一次,因服务器遭ddos攻击,导致我司服务器无法正常工作。事后通过紧急处理后得以恢复正常。其它几次分别为机房断电、网络升级、电信与联通dns解析故障影响到我司服务器平台网络连接不正常。

  2、系统故障三次,其中一次为短信平台服务器系统文件损坏,导致系统崩溃。经过技术部采用紧急预案措施在两小时内得以恢复系统。3、其它故障共计5次,因联通网关溢出,无法与我司ivr服务器数据库网关同步,导致用户无法正常订购与使用我司亲情相伴业务。经过出现几次重大故障后,技术部多次研究与讨论,制定出一套完善的应急措施与日常维护计划。尽量归避风险及减少事故发生,同时确保做到问题提前预防、及时发现、迅速解决并恢复正常运营。4、针对服务器出现在问题所在,在技术部其它同事的配合下完成服务器的重新部署,访问权限及安全性的提高,数据库优化等相关措失后,目前服务器已运行正常。

  5、公司针对员工的工作岗位与职位重新部署了ftp服务器的访问权限与互联网访问,使每个员工都能把重要的文件放到服务器上相关部门的文件夹里作备份,且通过内外网均可实现访问ftp服务器,大大方便了员工在外出差或在家里随时提取相关资料,且员工的访问权限不一样,故某些与自己无关或公司重要资料进行了保密设置,从而大大提高了公司重要资料的完整性与保密性。

  总结本年度的工作,尽管有了一点点的进步和成绩,但在一些方面还存在着很多的不足。比如:工作经验不足,对公司的网络与办公环境未得到很大的改善;遇到困难的时候与领导沟通不够等等,这都有待于在今后的工作中加以改进。

  在新的一年里,将百尺竿头,更进一步,2011年的大致工作计划为:

  1、在公司内部使用一种简便、有效的软件工作平台,使之便于公司所有员工的工作、交流、探讨,发布公共信息等(如oa软件)。 2、利用投影仪设备资源制作会议幻灯片为员工培训计算机操作及工作常用软件知识的小窍门,争取进一步提高全公司工作人员的专业化及工作效率。

  3、解决企业网站制作等专业性知识问题,业余时间强化学习并能胜任网站管理工作。

  4、进一步增强it系统和网络系统的稳定性和管理,使用更为高效的域控制系统来代替目前的工作组局域网,使内、外网连接任意,在任何地方工作都能连接本公司服务器资源。

  5、重新改建机房机柜网络布线,使机柜走线更加美观,同时方便以后维护时线路排除更加明了,直观。

  6、在资金允许的情况下对公司办公电脑、网络、会议系统布署方案升级优化,进一步提高员工工作效率,为公司节约成本开支。 7、学习更多的网络知识,充分的将一些新的技术应用到公司当中来。为公司提供更优质、更便捷、更效率、更节能的办公方式。2011年,是全新的一年,也是自我挑战的一年,我将努力改正过去一年工作中的不足,强化理论和业务学习,不断提高自身综合素质,把新一年的工作做好,为公司更好的发展尽一份力!

【篇3:浅谈it运维工程师职业规划】

  浅谈it运维工程师职业规划

  随着国内软件行业的发展和扩大化,有更多更复杂的系统出现,为了保证系统的稳定运行,需要有更多的it运维工程师。合作企业对于it运维工程师的需求量也是越来越大。如果您想要进入运维管理领域这一行,那么你就应该了解这个行业,而且也要明白运维管理员。在这里我们就来一起看看it运维工程师职业规划吧。

  1、从行业角度来看,随着中国互联网的高速发展(目前中国网民已跃升为全球第一)、网站规模越来越来大、架构越来越复杂;对专职it运维工程师的要求会越来越急迫,特别是对有经验的优秀运维人才需求量大,而且是越老越值钱;目前国内针对it运维工程师职业规划基本上都是选择毕业生培养(限于大公司),可塑性强,比较认同并容易融入企业文化。

  2、从个人角度,运维工程师技术含量及要求会越来越高,同时也是对公司应用、架构最了解最熟悉的人、越来越得到重视。

  3、网站运维将成为一个融合多学科(网络、系统、开发、安全、应用架构、存储等)的综合性技术岗位,给大家提供一个很好的个人能力与技术广度的发展空间。

  4、运维工作的相关经验是it运维工程师职业规划的一个重要因素。并且将会变得非常重要,而且也将成为个人的核心竞争力,具备很好的各层面问题的解决能力及方案提供、全局思考能力等。

  5、特长发挥和兴趣的培养;由于it运维工程师职业规划非常广阔,更容易培养或发挥出个人某些方面的特长或爱好,如内核、网络、开发、数据库等方面,可以做得非常深入精通、成为这方面的专家。

  一直以来运维工程师的角色被蒙上了各种神秘面纱,平时他们是默默无闻的幕后工作者,很少被人关注。而一旦企业出现技术故障,大家就会立刻呼叫他们,这时候的他们又会像消防员一样迅速灭火,随时要面对应急情况,比如数据库性能优化、数据库备份与恢复、数据迁移以及故障排除等。一个清晰的it运维工程师职业规划无疑是对it运维工程师的最好的保障。在漫漫的it生涯中,it运维工程师,只有更加用心地去学习基础的、核心的东西,关心数据库版本演进过程中新特性的变化,才能顺应时代变化。青麦人才祝愿所有想从事、已经从事it运维工程师职业的it人都有一个美好的未来。

运维工程师工作计划4

  运维工程师工作计划

【篇1:系统运维工程师年终个人工作总结及下年工作

  计划】

**公司系统运维工程师年终个人工作总结及下年工作计划

  时间一晃而过,弹指之间,2010年悄然而至,自从2010年3月份刚进入公司,我是第一次接触公司、接触通信行业、接触公司网络管理及维护。虽然跟我的专业和技能都一致,但所有的实际经验都是第一次,让我没有任何准备,同样也打消了任何顾虑,人生就是这样,所有的一切都是要从第一次开始,没有接触过、干过并不可怕,领导给了我机会,让我有了一次尝试、一次展现自己的平台,那么我一定会更加倍的努力做好工作才是最大的回报。并且也是对自己的一次肯定。经过一段时间的工作及陌生环境的磨合,专心钻研业务知识,努力提高理论知识和业务工作水平。遵纪守法,踏实工作认真完成领导交办的各项工作任务,使自己渐渐的融入和适应到新的工作环境中。过去的大半年里在领导和同事们的悉心关怀和支持帮助下,通过自身的不懈努力,在思想、学习和工作等方面取得了新的进步。现总结如下:

  一、公司电脑日常维护工作

  刚一开始接手工作的时候,发现公司大部分工作电脑都没有安装安全防护软件和升级系统补丁;员工随意安装系统及应用软件,致使公司局域网内病毒隐患严重、工作不稳定和系统崩溃,工作秩序被打乱,员工不严格要求自己,上班时间聊qq、玩农场、看娱乐网站等;为此公司和个人工作经常受到影响,工作效率降低。针对这种情况,我采取了以下措施:

  1、先对公司员工进行一次基本知识培训,让员工了解到计算机的正确使用方法,病毒防范,重要文件的备份等。从而大大提高了员工对电脑使用的熟练程度。

  2、先恢复良好的秩序。电脑使用时如发现故障和需更改设置,必须先报告公司运维人员,由专门人员来进行专业及针对化的操作,个人不能私自进行改动,进行这样做的目的避免由于人为的盲目操作使某一台电脑的故障影响整个局域网内的其它工作,使故障扩大化,并延长了解决问题的周期。3、使员工使用统一的、经过安全测试的系统及应用软件,安装、设置统一的杀毒软件、防火墙等安全防护软件,且经过努力实践,并在每台机器上设定了自动系统补丁升级及定期查杀规则。

  4、对于个人的关键性数据资料、邮件进行路径转移备份,使这些数据远离危险故障点,避免意外丢失所带来的严重后果。操作系统进行常规定期备份,便于事后的还 原。

  5、对于网络管理进行了监管工作,公司所有电脑安装了行为管理软件后,员工工作效率逐步提高,自觉性得到明显改进,从而净化了公司网络办公环境。

  经过一段时间的贯彻和工作,先前的混乱现象得到有效控制,现公司的十余台电脑,工作状态稳定,没有出现大面积的系统崩溃和故障。

  二、网络的日常维护

  路由器及交换机的维护管理,确保公司网络运行正常,员工正常利用网络资源。加强路由器的规则设置,优化外网接口,内部员工合理地分配带宽流量,使公司的网络能稳定有效地工作。

  三、公司网络制度管理和完善

  公司经过一段时间的运转,各个部门的规章制度通过大家一起研究、探讨、立会并完善制定了各项规章制度,计算机管理也形成了制度,大家按章办事,使之成为一种工作习惯。同时公司的资产管理及日常的文书表格非常混乱和环节上的缺失。为此特地制作了一批表格、登记申请单及统计表。使得公司资产和资源得到有效的管理和控制,杜绝管理上的失控和资产流失。

  四、公司服务器平台管理与维护工作

  公司发展逐步扩大,对于公司所有的业务支撑平台-服务器,为重中之重;本年度我司服务器相应出现几次重大故障,分别如下:

  1、网络故障七次,重大一次,因服务器遭ddos攻击,导致我司服务器无法正常工作。事后通过紧急处理后得以恢复正常。其它几次分别为机房断电、网络升级、电信与联通dns解析故障影响到我司服务器平台网络连接不正常。

  2、系统故障三次,其中一次为短信平台服务器系统文件损坏,导致系统崩溃。经过技术部采用紧急预案措施在两小时内得以恢复系统。3、其它故障共计5次,因联通网关溢出,无法与我司ivr服务器数据库网关同步,导致用户无法正常订购与使用我司亲情相伴业务。经过出现几次重大故障后,技术部多次研究与讨论,制定出一套完善的应急措施与日常维护计划。尽量归避风险及减少事故发生,同时确保做到问题提前预防、及时发现、迅速解决并恢复正常运营。4、针对服务器出现在问题所在,在技术部其它同事的配合下完成服务器的重新部署,访问权限及安全性的提高,数据库优化等相关措失后,目前服务器已运行正常。

  5、公司针对员工的工作岗位与职位重新部署了ftp服务器的访问权限与互联网访问,使每个员工都能把重要的文件放到服务器上相关部门的文件夹里作备份,且通过内外网均可实现访问ftp服务器,大大方便了员工在外出差或在家里随时提取相关资料,且员工的访问权限不一样,故某些与自己无关或公司重要资料进行了保密设置,从而大大提高了公司重要资料的完整性与保密性。

  总结本年度的工作,尽管有了一点点的进步和成绩,但在一些方面还存在着很多的不足。比如:工作经验不足,对公司的网络与办公环境未得到很大的改善;遇到困难的时候与领导沟通不够等等,这都有待于在今后的工作中加以改进。

  在新的一年里,将百尺竿头,更进一步,2011年的大致工作计划为:

  1、在公司内部使用一种简便、有效的软件工作平台,使之便于公司所有员工的工作、交流、探讨,发布公共信息等(如oa软件)。 2、利用投影仪设备资源制作会议幻灯片为员工培训计算机操作 及工作常用软件知识的小窍门,争取进一步提高全公司工作人员的专业化及工作效率。

  3、解决企业网站制作等专业性知识问题,业余时间强化学习并能胜任网站管理工作。

  4、进一步增强it系统和网络系统的稳定性和管理,使用更为高效的域控制系统来代替目前的工作组局域网,使内、外网连接任意,在任何地方工作都能连接本公司服务器资源。

  5、重新改建机房机柜网络布线,使机柜走线更加美观,同时方便以后维护时线路排除更加明了,直观。

  6、在资金允许的情况下对公司办公电脑、网络、会议系统布署方案升级优化,进一步提高员工工作效率,为公司节约成本开支。 7、学习更多的网络知识,充分的将一些新的技术应用到公司当中来。为公司提供更优质、更便捷、更效率、更节能的办公方式。2011年,是全新的一年,也是自我挑战的一年,我将努力改正过去一年工作中的不足,强化理论和业务学习,不断提高自身综合素质,把新一年的工作做好,为公司更好的发展尽一份力!

【篇2:运维工作规划】

  运维工作简介 ? 系统简介

  一、服务器数量与用途

  二、运维管理范围与职责

  管理范围

  本平台内所有架构,运维部负责公司业务系统运行维护工作。

  职责

  保障公司游戏服务器的正常运行、网络的畅通。严格岗位制度、明确工作职责,规范工作流程。工作规范化,制度化,加强文档管理力度。

  三、组织结构

  根据运维工作的范围和性质,下设三个小组: 系统维护组 应用维护组 技术值班组

  四、服务维护

  系统维护

  1.检查安全日志 2.检查系统日志 3.检查应用日志

  4.记录并核对各系统磁盘容量 5.记录并核对各磁盘文件数量 6.记录并核对系统账户 7.记录并核对系统服务

  8.记录并核对系统进程cpu内存 pid 线程数 9.查询系统更新

  应用维护

  1.检查各应用程序状态

  2.记录并核对各应用程序配置 3.记录并核对应用系统文件 4.记录并核对应用系统文件md5 5.测试各应用系统功能

  6.记录并核对各应用系统cpu内存 pid 线程数 7.检查应用程序更新

  网络维护

  1.检查服务器连接数量 2.检查上行下行带宽记录值 3.检查网络损耗峰值

  4.检查并记录各服务通信端口 5.检查并记录通信延迟 6.分析带宽负荷 7.分析访问量

  硬件维护 1.检测并记录各硬件温度 2.检查驱动状态 3.检查各硬件状态

  数据库维护

  1.检查备份文件 2.核对备份时间 3.核对备份内容 4.查询并记录锁定 5.查询并记录sql效率 6.对比数据内容

  7.交接班进行日志数据库备份 8.实时检查日志数据库

  五、服务器实时监控

  1.磁盘文件增减监控 2.通信效率监控 3.服务器使用率监控 4.服务器性能监控

  5.网络上行下行带宽监控 6.数据库操作监控 7.硬件温度监控

  六、工作内容

  1.设备管理:对网络设备、服务器设备、操作系统运行状况进行监控和管理。

  2.应用/服务管理:对各种应用支持软件如数据库、中继、cdn以及各种通信或特定服务的监控管理,如dns、web 等的监控与管理。

  3.数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复。

  4.数据管理:包含对公司自身核心数据系统的运行情况的监控与管理,对于数据的管理,主要关注该数据系统的消耗与增长。

  5.内部系统管理:该部分主要对于本公司需要统一发布或因人定制的内容管理和对公共信息的管理,如客服系统、推广系统。

  6.资产管理:管理本公司服务系统的资产情况,是逻辑存在的,并能够与本公司财务部门进行数据核对。

  7.信息安全管理:目前信息安全管理主要依据的是企业安全组织方式、资产控制、人员安全、物理与环境安全、通信与运营安全、访问控制、数据连续性管理等。 8.日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供运维日志报表、提供解决经验与知识的积累与共享手段。? 应急预案 一、预警机制

  二、预警上报处理流程

  运维过程中出现重要故障或紧急情况时,按以下规定流程进行处理及汇报。在遇到故障时,及时汇报上级领导并采取措施及时解决,具体汇报流程如下:

  一级预警

  1.当通过监控或得知系统出现故障时,首先在最短的时间查看故障点状态,并分析故障原因。 2.运维工程师在排查出故障后,立即着手解决。

  3.在故障排除后,通知组长并对所发生故障的设备进行事后跟踪。 4.在故障排除后,运维工程师应对故障原因及解决办法进行详细说明。

  二级预警

  1.当通过监控或得知系统出现故障时,首先在最短的时间查看故障点状态,并分析故障原因。

  2.运维工程师在排查出故障后,如能够立即解决,则立刻解决故障,如需要相关技术人员到现场,应立即拨打技术工程师联系电话,请求立即到现场进行故障排除。 3.立即报告运维中心主管人员,主管人员应通过电话或当面把故障报告给相关技术部门。

  4.在故障排除后,运维工程师应对故障原因及解决办法进行详细说明。

  三级预警

  1.当通过监控或得知系统出现故障时,首先在最短的时间查看故障点状态,并分析故障原因。

  2.运维工程师在排查出故障后,如能够立即解决,则立刻解决故障,如需要相关技术人员到现场,应立即拨打技术工程师或第三方技术部门联系电话,请求立即协调进行故障排除。

  3.立即报告给运维中心主管人员,主管人员应通过电话或当面把故障报告给相关领导部门,在故障完全排查清楚后以书面形式递交“故障报告单”。

  4.在故障排除后,运维工程师应对故障原因及解决办法进行详细说明。

  四级预警

  1.当通过监控或得知系统出现故障时,重复分析并确认故障原因。 2.立即报告给运维中心主管人员,主管人员应通过电话或当面把故障报告给相关领。

  3.在故障排除后,运维工程师应对故障原因及解决办法进行详细说明。

【篇3:运维年度工作计划】

  2015年工作计划

  结合公司今年运营发展的思路,我部门今年将重点提升网络服务质量,提高运维人员综合业务素质。

  一 运维部基本情况: 运维部主要维护十二师辖区和乌鲁木齐市区两部分,其中十二师辖区内有五大团场片区,共有用户(穿线用户)实际使用用户为,三网用户2237户,现有维护员13人。

  市区维护26个小区,共有用户, 现有维护员2 人.二 2014年运维部维修故障分析2013年全年故障发生共起,占总用户数的% ,故障率为,主要分为:马赛克,装

  修改线,公用电停电,用户光纤损坏,拆迁,机顶盒坏等。1小区共用电停电造成的故障占运维故障的50%,主要原因是:不能及时补电,交纳电费受

  小区物业的控制.2 用户光纤损坏(人为和自然、工程)占10%,加强日常线路维护。3老机顶盒损坏5%,主要原因,大部分用户是2009年左右的用户,使用寿命已到,造成故

  障.4 用户装修改线15%造成线路不通,和用户光纤的损坏造成二次熔接。5 拆迁用户的维修10%.6 其他原因占10%.三 2014年机房维护情况说明现有机房10个,计划新增机房1个,存在的问题,分机房停电不能及时供电第一时间到现

  场解决故障,存在很大的安全隐患。四2015年的工作计划

  1、重点解快因用电造成的故障,与小区物业部协商取得供电支持,计划在今年年初对辖区

  内的共用电改造工作。

  2、抢修组已做到责任制到片区及时处理光纤故障,做好对用户禁止装修改线的宣传工作。

  3、为了提高机房安全运行传输质量,加快建设网路机房监控设施,预计建设现有分机房 11个。

  4、维护人员的综合业务素质 ,加强培训,年初针对运维网络技术和公司考核管理的培训

  计划一周一次上半年,下半年两周一次和对新进员工的资质培训,月度考试与工资挂钩,提升

  运维人员的服务统一标准,5、完善安全生产制度,搞好安全生产工作。(1)每月定期对机房进行寻查、巡检工作。(2)对运维人员不定期抽检技术性工作流程。

  6、加强运维人员的市场营销意识,新业务推介与提成.

  7、今年需建设好主干线的环路(列如:师机房至104团,104团至西山等)和网管系统,做好网络运行质量.。

  8、今年运维部计划分5个大片区其中城区26个小区,用户户其中现有三网用户

  1509户,3人一辆车维护,西山、104团三网用户6211户,3个人维护,头屯河农场三网用户7421户2人维护,三平农场三网用户

  户2人维护,五一农场三网用户7090户,2人维护,抢修组4人一辆车负责5个大片区光缆

  用户光纤、主干光缆的维修维护,9、今年工程部改造老校区的光纤到户的同时改造维修量较大的老有线电视小区。(列如:

  五一农场诒心园小区一期,楼兰酒厂,光华学校等)。

  10、由于公司的网路不只是传输有线电视还传输了数据业务而且用户不断增加,光缆全

  部是寄挂或借用在别人的管道和木杆抢修查找断点耽误时间,不能及时修复,由其晚上对运

  行维修带来很大困难,今年计划建设好主干线的环路(列如:师机房至104团,104团至西

  山等)和网管系统,做好网络运行质量。

  11、积极配合工程部做好城郊主干网、本地传输网、及弱点管道和各团场分机房建设,竣工验收工作及维护等其他工作任务。

  12、落实运维部的各项管理制度,明确目标管理,理顺工作流程,为了更好地为用户服

  务,从而提高用户满意度建立良好的天娱传媒口碑。运维部

  2015年11月8日篇2:运维部下半年工作计划 运维部下半年工作计划

  为了使运维工作顺利进行,运营部下半年工作计划如下:

  1、进一步推进服务器的规划部署、搭建,以及对服务器构架、网络进行优化和调整。 2、利用监控平台nagios实时监控服务器、网络设备及业务系统的运行状态、性能。根

  据监控和处理结果,及时记录相关信息,定期汇总运营信息。

  3、优化公司网络、邮件服务器、语音系统以及解决常见的操作系统、网络和应用故障。

  4、负责突发性事件的快速响应和处理,解决服务器和网络故障。 5、与开发人员配合沟通,解决运行过程中的相关问题。

  6、对日常运营数据的整理分析,然后对服务器状态监测,游戏出现问题的解决。

  7、配合商务及市场部做好相关工作。篇3:运维部2013年终工作总结及2014年工作计

  划[1]古交分公司运维部

  2013年工作总结及2014年工作计划2013年运维部在分公司直接领导下及全体部门员工的勤奋努力下,顺利完成网络维护、网络建设、网络安全等任务,有力的保证了古交数字电视及互动业务发展,全年来的工作总

  结和2014年计划如下:

  一、网络维护及建设 1,城农网维护建设

  1)、在分公司的正确领导及相关部门的大力支持下,运维部全体人员的勤奋工作。城农

  网维护截止12月份,运维部共处理用户故障电话报修 次,安装普通用户户,搬迁用

  户户,开通副机用户 户,安装互动用户户,以旧换新 户,互动副机户,提

  高了网络覆盖量,更有力的提升了市场竞争力。

  2),完成网络新建工程立项项,实施项等几个光节点网络覆盖面积,促进了业务

  发展和业务收入的增加。2,网络优化建设

  在分公司领导亲自带领下,全年对全市所辖网络进行了数字互动电视整体转换前的规划

  与设计。为2014年全面开展互动业务打下一个坚实的基础。对已开通互动业务的小区,加大 了维修力度,并对局部不符合条件的小区进行了小范围的局部改造,使其具备开通互动业务的技术条件。通过走访互动用户,普遍反映收视效果良好。

  二、机房维护及消防安全工作

  1、在分公司分管领导的指导下制定了《机房值班制度》及《机房维护及消防制度》,根

  据制度明确了机房值班人员,建立和完善各项维护制度和加强机房资料及文档的管理,机房

  设备检修清扫,做好“三防”工作,确保设备正常运行,保证信号安全传输。

  2、积极配合总公司和机房对纤、跳线等工作。对机房进行不定期检查,遇到安全隐患及

  时排除并上报,遇到节假日和重要传输时期,都做好了安全上报等工作。

  3、不定期对机房的消防工作进行安全检查,就一些存在的问题进行了及时整改,消除了

  存在的安全隐患。

  三、加强技术培训,提高队伍素质 运维部承担分公司运维和工程建设的主要队伍,面对工程建设、网络安全等重要任务,要在短时间内保质保量完成,无论是组织工作,还是技术工作都存在较多的难题。为此运维

  部把开展技术培训作为一项确保工程质量、进度的重要措施来抓,采取走出去请进来的方式,不但多次派员工参加总公司的培训学习,经常利用部门开会时间组织运维人员进行集中学习

  培训,还和西山分部的运维人员进行面对面经验和技术的交流,提高了维护人员的技能。

  四、安全工作方面 1、城农网网络安全

  根据城农网网络安全特性制定,明确片区运维人员为城农网网络安全巡查维护人员。片区运维人员对辖区内的光、电缆进行巡查并作好日志,对存在隐患的地方及时上报。

  3、维护人员人生安全注重安全生产,全年人员无重大伤亡事故发生。运维部多次开展安全学习来加强员工安

  全生产意识,提高自我保护的能力。4、车辆安全

  运维部严格按照《车辆安全管理办法》来管理车辆,禁止无证驾车,严禁公车私用,严

  禁酒后驾车,严禁开英雄车等。对分公司运维车辆进行不同程度的修理维护,杜绝带病车辆

  上路有效加大车辆安全程度。

  五、存在问题及不足

  1、目前运维部整体须加强思想认识、提高工作效率、提升服务水平。 2、特别注重安全生产,搞好网络干线巡检工作。

  3、运维部目前缺乏新技术、新业务的尖端人才,针对下一步的数字双向网络、数据等新

  业务,加强能承担新的维护任务技术的培训及业务学习。

  4、加强运维文档的管理,提高维护质量。做好每月必须及时认真上报的各类报表。

  5、随着城区、农村网络的进一步扩大,运维人员不够的问题制约着运维部的快速反应机

  制。

  6、进一步提高运维部人员的福利待遇,提高工作积极性。

  六、2014年工作计划

  1、继续抓好网络维护质量管理和科技维护水平,提高网络运行质量。 2、继续抓好、抓实干线巡查工作。

  3、积极配合做好城农网、城区管道网络建设服务等工作的准备开工建设及其他工作任务。

  4、按计划搞好网络新建、小区新建的立项及建设和竣工及验收工作。 5、落实运维部的各项管理制度,明确目标管理,理顺工作流程,提高工作效率、提升服

  务水平。

  6、完善安全生产制度,搞好安全生产工作。 古交分公司运维部程永亮 2014年1月7日篇4:年底运维工作安排 erp运维组年底运维工作安排10月份erp四期及部分单位erp/eam整合项目上线后,erp系统已经涵盖了各单位财务、项目、物资及人资等核心业务。由于年底业务量增多,系统使用量变大,对运维支持工作也

  提出了更高的要求。为了保证各单位年底结算工作的顺利完成,erp运维组加大支持力度,通过值班、现场支持及协调第三方资源等方式,力图从人员和技术上给予充分的保障。具体

  安排如下: 一. 值班安排 1.值班运维电话: ? 客服电话 ? /3746/3747/4742 财务、物资、项目运维电话 ? 人资运维电话 2.紧急联系人员电话:

? 葛树峰 erp负责 *** ? 程祥华 人资负责 *** ? 张世明 财务负

  责 *** ? 何明星 物资负责 *** ? 吕孝飞 项目负责 *** ? 何志

  勇 系统管理员 ***

  3.值班人员安排:各业务组功能顾问轮流值班,技术顾问配合,确保在用户做业务时间范围内有运维人员进行支持。

  二. 现场支持人员安排 1.张家口、承德现场支持 张家口、承德县局在7月份开始上线使用erp系统,10月运维工作完全由电科院运维组

  负责,由于县局业务在上线试运行期间并不是很多,而是集中在年底12月份,考虑到用户对

  系统还不是很熟悉,运维组安排进行现场支持。补充说明:由于目前项目模块支持人员比较少,而且要支持年底各单位项目决算工作,项目业务全部采用集中支持方式。2.项目年底转资工作现场支持 500kv项目转资在2009年7月完全移交到电科院erp运维组负责,220kv整合项目从11

  月份开始陆续移交,为了解决年底项目大批量竣工决算问题,运维组与埃森哲整合项目实施

  组联合进行各单位220kv以上项目转资的支持,具体支持人员安排如下:

  三. 年底其他重点工作安排 1.财务对帐工作 2009年12月8日在年度结算会议上启动各单位年底对帐工作,该项工作主要由埃森哲

  负责进度管理,由运维组和埃森哲咨询顾问共同进行对帐支持,具体工作安排和完成时间节

  点参见《华北电网公司erp和远光账务核对培训材料》。2.物资集约化年底上线物资集约化年底上线,首先实现物资主数据的统一、物资集约化管控和部分高级应用功 能,其中物料编码和供应商的切换及管控功能对目前系统影响比较大。该项工作的支持主要由埃森哲负责,erp运维组进行跟进和协助支持,erp运维组受理用

  户关于这方面的问题后,尽量及时解决,不能处理转交给在供应链管理中心的埃森哲大物流

  团队。

  3.大生产、大营销、大物流机构调整支持10月份,生技部召开大生产机构调整讨论会,考虑到财务成本核算一致性问题,推迟到

  2010年1月份开始在系统中调整,但数据收集和规划工作需要在年前开始准备。该项工作牵涉业务部门和系统模块比较多,目前已形成大生产的调整方案,大营销和大

  物流的调整步骤也可以参考大生产的方案。12月21日开始启动各单位机构调整的数据收集

  工作,该项工作由运维组和埃森哲联合支持,牵头负责人员为葛树峰(erp负责)和何国顺

(埃森哲项目经理)。篇5:系统运维工程师年终个人工作总结及下年工作计划 **公司系统运维工程师年终个人工作总结及下年工作计划 时间一晃而过,弹指之间,2010年悄然而至,自从2010年3月份刚进入公司,我是第一次接触公司、接触通信行业、接触公司网络管理及维护。虽然跟我的专业和技能都一致,但所有的实际经验都是第一次,让我没有任何准备,同样也打消了任何顾虑,人生就是这样,所有的一切都是要从第一次开始,没有接触过、干过并不可怕,领导给了我机会,让我有了

  一次尝试、一次展现自己的平台,那么我一定会更加倍的努力做好工作才是最大的回报。并

  且也是对自己的一次肯定。经过一段时间的工作及陌生环境的磨合,专心钻研业务知识,努

  力提高理论知识和业务工作水平。遵纪守法,踏实工作认真完成领导交办的各项工作任务,使自己渐渐的融入和适应到新的工作环境中。过去的大半年里在领导和同事们的悉心关怀和

  支持帮助下,通过自身的不懈努力,在思想、学习和工作等方面取得了新的进步。现总结如下: 一、公司电脑日常维护工作

  1、先对公司员工进行一次基本知识培训,让员工了解到计算机的正确使用方法,病毒防

  范,重要文件的备份等。从而大大提高了员工对电脑使用的熟练程度。

  2、先恢复良好的秩序。电脑使用时如发现故障和需更改设置,必须先报告公司运维人员,由专门人员来进行专业及针对化的操作,个人不能私自进行改动,进行这样做的目的避免由

  于人为的盲目操作使某一台电脑的故障影响整个局域网内的其它工作,使故障扩大化,并延

  长了解决问题的周期。

  3、使员工使用统一的、经过安全测试的系统及应用软件,安装、设置统一的杀毒软件、防火墙等安全防护软件,且经过努力实践,并在每台机器上设定了自动系统补丁升级及定期

  查杀规则。

  4、对于个人的关键性数据资料、邮件进行路径转移备份,使这些数据远离危险故障点,避免意外丢失所带来的严重后果。操作系统进行常规定期备份,便于事后的还原。

  5、对于网络管理进行了监管工作,公司所有电脑安装了行为管理软件后,员工工作效率

  逐步提高,自觉性得到明显改进,从而净化了公司网络办公环境。经过一段时间的贯彻和工作,先前的混乱现象得到有效控制,现公司的十余台电脑,工

  作状态稳定,没有出现大面积的系统崩溃和故障。

  二、网络的日常维护 路由器及交换机的维护管理,确保公司网络运行正常,员工正常利用网络资源。加强路

  由器的规则设置,优化外网接口,内部员工合理地分配带宽流量,使公司的网络能稳定有效

  地工作。

  三、公司网络制度管理和完善 公司经过一段时间的运转,各个部门的规章制度通过大家一起研究、探讨、立会并完善 制定了各项规章制度,计算机管理也形成了制度,大家按章办事,使之成为一种工作习惯。

  同时公司的资产管理及日常的文书表格非常混乱和环节上的缺失。为此特地制作了一批表格、登记申请单及统计表。使得公司资产和资源得到有效的管理和控制,杜绝管理上的失控和资

  产流失。

  四、公司服务器平台管理与维护工作 公司发展逐步扩大,对于公司所有的业务支撑平台-服务器,为重中之重;本年度我司服

  务器相应出现几次重大故障,分别如下:

  1、网络故障七次,重大一次,因服务器遭ddos攻击,导致我司服务器无法正常工作。

  事后通过紧急处理后得以恢复正常。其它几次分别为机房断电、网络升级、电信与联通dns

  解析故障影响到我司服务器平台网络连接不正常。

  2、系统故障三次,其中一次为短信平台服务器系统文件损坏,导致系统崩溃。经过技术

  部采用紧急预案措施在两小时内得以恢复系统。

  3、其它故障共计5次,因联通网关溢出,无法与我司ivr服务器数据库网关同步,导致

  用户无法正常订购与使用我司亲情相伴业务。经过出现几次重大故障后,技术部多次研究与讨论,制定出一套完善的应急措施与日常

  维护计划。尽量归避风险及减少事故发生,同时确保做到问题提前预防、及时发现、迅速解

  决并恢复正常运营。

  4、针对服务器出现在问题所在,在技术部其它同事的配合下完成服务器的重新部署,访

  问权限及安全性的提高,数据库优化等相关措失后,目前服务器已运行正常。

  5、公司针对员工的工作岗位与职位重新部署了ftp服务器的访问权限与互联网访问,使

  每个员工都能把重要的文件放到服务器上相关部门的文件夹里作备份,且通过内外网均可实

  现访问ftp服务器,大大方便了员工在外出差或在家里随时提取相关资料,且员工的访问权

运维工程师工作计划5

《谈网站或其他服务器运维》,这里只谈运维工程师所要做的细节工作,让人们知道运维工程师到底都在做些什么,至于上级所要做的,只是提一下,不做参考。

  以下是个人观点,我说的只是我自己的想法,也是我发展的目标。你可以有异议,我们是来交流的。你对的我肯定会向你学习。因为我也在摸索。运维工程师至少要能做以下的工作:

  1,网络工程师的工作

  你至少要能配置CISCO 6509以下的设备,熟悉各种网络协议,否则网络出问题的时候你会傻掉。

  2,系统工程师的工作

  你至少要理解各种系统服务,在出问题的情况下要迅速解决问题,而不是等系统工程师来解决。

  3,安全工程师的工作

  我不要求你一定要会各种网络编程,但是在服务器收攻击的情况下,没有防火墙的情况下,做一些简单的处理工作。

  4,存储工程师的工作

  至少要熟悉各个厂商的设备,各种备份和还原的办法

  5,测试工程师的工作

  在新版本上线之前,你至少要协同测试工程师做测试工作,因为你是运维人员,不了解程序架构导致无法解决故障,你也有一份责任。

  6,研发人员的工作

  运维工具都需要自已开发,熟悉开发语言,需要有过实际开发经验,否则工作会非常痛苦,我深有体会。

  7,英语

  不想说了,我的最大痛苦就在这里

  8,好的沟通者 不出问题时候你可以打游戏睡觉,出问题的时候要能和项目人员沟通,快速解决问题,而不是推;我知道有很多人能推责任,你可以做替死鬼,但是离开这个工作你还能找到更好的;把责任推到别人身上的人,下次出问题的时候,绝对没人帮你。你要能和各个兄弟部门关系非常的密切,出了问题有兄弟帮你担责任;也要能非常扯皮,没事在会议上把别人都搞定。

  9,库房管理员

  数万台服务器让你来管理,任何丢失或者损坏都是不负责任和失职的表现。

  10,运动员

  不要回家就睡觉,有空还是运动下吧;在服务器down机的时候,机房恰巧就你一个人,机柜没有空间,你需要更换一台HP 585 4U的服务器,满配约80公斤的服务器,你怎么做?

  11,责任心

  这个我不想说什么,这是你的职业精神。

  12,组织者

  给你2个啥都不会的民工,再给你2000台服务器,要求你2天把服务器装完,你咋办?

  13,1-7条中,你必须有一条非常精通,是这个行业的专家。否则过了32岁,没有公司要你。

  大家看了肯定觉得这个人是神仙,但是这必须是你慢慢能做到的,至少是我6年来运维经验的一点总结。

  因为现在的公司都在用招聘民工的钱招聘神仙,其次我也是想让各位看看,运维工程师要担负多少责任。

  我去面试过的一些公司都说,你什么都会,什么都不精。我说对,正是需要我们这些什么都会的人领导什么都精的人。

  我这句话没有贬低大牛的任何意思,只是当时一个临场的发挥。虽然说完就知道这个面试白来了,但是我还是想为广大的运维工程师出口气。

  不怕千招会,就怕一招精。这仍旧是我给大家的建议。

  最后给大家最后最大最重要的建议,做什么工作都可以,千万别做SA。我把SA的定义成:speedine answer而不是system admin。为什么?你可以想象一下哪些工作需要快速响应。网络工程师需要,机房网络骨干交换机故障,整个机房所有服务器无法连接,需要快速响应不?系统工程师需要,系统出问题了,要快速响应不?安全工程师需要,服务器被攻击了,要快速响应不?存储工程师需要,公司核心存储有问题了,要快速响应不?

  你可以做研发,出了问题可以测试,可以想办法慢慢解决;你可以做DBA,出了问题可以推到网络工程师或者系统工程师身上,说不是DB连接问题;你可以做测试工程师,你说有问题这个东西就可以不上线??在出问题的时候,倒霉的就是SA,所以不要再争论SA包含哪些工作,SA就是一个倒霉的快速响应者,你想,哪个SA 24小时不开手机?哪个SA 晚上可以舒服的睡觉或者安心的出去度假?走在路上一听到和自己手机短信铃声一样的,利马下意识的抓出自己的手机看看是不是服务器报警;晚上和老婆 XXOO00,一个电话过来,立马停下,抓出手机看流量图;包里放着笔记本,但是因为还要开机,太慢,拿着手机上putty ping或者telnet机器??

  这就是大家羡慕的SA,你也不要抱怨自己做了SA,生活就是这样。所以不要再争论哪些xxx员应该归属于SA,系统管理员或是运维工程师,如果想做这行,就安生的当一个“快速响应者”,这是你的职业,也是你需要做到的。作为一个SA,你肯定经历过通宵好几天加班做事,你肯定经历过饭买来已经忘记了吃,你肯定经历过几天加班没睡觉,着个沙发坐下就失去知觉睡倒??没有经历过不能说你不好,只能说你管理的机器太少。

  我公司是每月发21天工资,某两月我一月发了44天工资一月发了47天工资,创全公司建司7年来加班记录??项目做完自然也就落了个部门通告表扬,然后的结果就是健康情况急剧下滑,然后就是某天晚上在机房内加班一通宵,穿着短裤进机房,然后一个通宵被机柜下面的冷风吹了个关节炎??这就是做SA的代价。

  以下是一些实际经验,发给大家做参考,有任何问题可以mail我,answer3ai@

  有的东西是企业机密,我不能透露也不能给你相关文档。

  一,架构设计

  现在你要做的,就是设计你的服务器架构和网络架构。这要先看你的网站是做什么的,每日有多少的人数访问,例如,我打算站点初期每日有左右的访问量,和1000人左右的并发量。我可以用我的人数并发量1000×站点中每个页面的平均大小200k×每个访问用户可能要打开4个网页=800 000k=800M的网络流量(当然这个数字肯定是非常的过分,至于为啥,自己可以想下)

  然后可以用测试环境用软件检测在你的真实环境下的服务器压力,比如在2000人在线的情况下,服务器的cpu占用多少,内存占用多少。

  那么你可以得到你大致配置,其实市面上的标准服务器配置都足够你用了,比如现在的DELL 1950,HP DL360G5,IBM X???(忘记了)

  等服务器,足够我跑一个这样简单的网站。其实说白了,双奔3都够,真的。当然你网站的流量比我要大的多,那你可以买的更好一点的服务器。或者负载均衡器。

  网络架构

  站点现在是一台独立服务器,未来采用的是分布式架构,比如是一台服务器,是一台服务器??

  mysql是一台服务器。这样你要算服务器要多少台,交换机要多少口,防火墙要买什么级别的。

  哪些服务器可以放在一个防火墙下,哪些服务器不用防火墙保护,哪些服务器是内网服务器,需要什么样的网络连接,最好是画出大致拓扑,方便你预算设备花费。

  服务器交换机等设备选型和购买

  说的简单点就是买什么机器,你可以和google一样开始,买几台pc作为你的网站服务器,也可以自己组装一台服务器

  或者也可以和我一样,去挑选品牌服务器当然,现在你要看你服务器做什么的,你可以亲自去电脑城看组装服务器,也可以打电话到IBM,HP,DELL的各地销售商让他们送服务器来测试,当然你不要告诉他们你只买一台,那你就别指望测试了。我告诉供货商需要200台服务器,一个F5,10台CISCO 2960交换机,3个NETSREEN206防火墙,一个EMC CX500+满硬盘 那么不到3天,所需要的4台测试服务器,就送来了??当然,不要牛了这么多最后只买1台,那么你晚上走夜路会被人打的。

  最后就是价钱问题了,这个你自己看着办吧。让你公司的财务或者采购出马砍价付钱就是了。当然,除了服务器的服务,你最好还是想想有利于自己的服务,比如人家公司可以帮你拆箱子了什么的。我做的最弱智的一件事情就是,来了400台服务器,50个交换机,8台EMC,我一个人花了一星期把箱子才全部拆完??

  机器选型的时候你也要为自己考虑,比如HP的ILO功能,可以让你远程BIOS级操作服务器,比如浪潮的自动资产管理等等,为自己管理服务器提供便利,否则机器10来台还好,100台还一般,我这里3万来台,我不死几百遍了。丢失一台服务器,几个月工钱就没了??

  二,IDC选择

  首先要看你服务的地区是哪里,然后再去找当地的电信机房。毕竟,虽说全国已经互联了,但是各地的网速还是有差异的。

  或者说有的IDC机房利用率高,虽然出口带宽大,但是利用率高的结果是导致你网速慢的原因之一。

  我的做法是在全国各个机房的服务器用pingplus这个软件进行一周的的流量测试。可以看到平均丢包,最大延时等等。

  当然,你也可以到你目标服务的地方,找个可以上网的地方进行网络测试,比如说网吧包个机器??

  好了,网络测试完了。那么你已经决定去哪个IDC了吧。

  然后你就可以电话或者自己提着礼品登门拜访一下IDC服务商的老大了

  当然,你也可以找代理服务商,因为他们拿到的价钱有时候比电信或者网通给你的价钱低,但是,关键还是一个服务,因为你毕竟服务器放在那,晚上关键着急没人给你重启,机器出了问题其实按个F1就可以解决的问题,服务商的值班人员不懂。你就只能打晚上的打飞机去机房维护吧。

  提着东西拜访一下服务商老大是礼节性的东西,东西不在多而在精,这样你未来谈事情人家也给你绿色通道,做事情要好做很多。当然,我也不反对你空手去,你一次租个100个机柜+10G带宽,人家还是很优惠的。哈哈。大家都是混口饭吃,也不至于难为你什么。

  最后你要知道现在的中国还是卖方市场,你给人家牛,那你买的产品只能是??蒙牛 然后是开始去参观机房

  细心的检查一下空调数量,空调出厂和最后维护日期,网络布线类型和架构,是否可扩展,主备从电力等。

  基本都是非常关键的东西,出问题了,人家可以给你更换一个新的,服务很好,但是你服务器挂一天的损失是多少,你可以自己掂量。

  还有机柜电力,现在的机柜放置16台1U的服务器是正好,多了过于热,少了资源浪费;但是你发现人家只让你用10安培电力,过了要交钱买电;

  或者不限制你用电,但是插线板只有10个,你还真买个托线板去转接?你要想想你一个托线板挂了,你服务器要挂几个?

  最后,我的一个机房包间里140个机柜,2个空调,结果某天挂了一个空调,虽然6小时人家IDC商就给更换了一个空调机(这速度已经非常快了),结果我机器至少被热死了100台以上,机器是HP的,机器过热,HP会自动关机,而且会不让你启动。你崩溃不?注:不是给hp做广告哈。

  三,服务器上架

  好了,要是你买的服务器到了,你会发现你接到电话后,楼下一个N大的“擎天柱”集装箱车给你送服务器来??(某次我收2000台服务器就是这样的阵势);在这里有个重大的提示,你们财务给厂商下单的时候,收货地址一定要写对。比如 XX路XX号XX大厦XX楼XX室,你写到xx号,送快递的会给你堆到院子里,你写到xx楼,送快递的会给你送到电梯口,你写到xx室,他们才会给你搬到室内。因为送货的都是服务器厂商找的,你因为这个事情去联系厂商修改送货地址,至少要多等N小时。而且他们视你的单子的数量和楼层,判断来多少搬运人员。而且,一定要把服务器搬到你指定的地方再签字收货,否则??嘿嘿??

  我最霉气的是:来了20台机器(还好不多),下着大雨人家给我往院子里一丢,让我自己搬上19楼,我没推车没啥的??

  你可以说,找电信的帮忙撒,废话,这个我还不知道。那我告诉你,我在某电信大楼工作时,从CCIE到机房主管到机房工作人员,全部是美女??

  虽然我在这个地方只干了5天活,我的同事们口水都有3尺长??你还叫人家给你搬机器不? 你可以说,雇民工撒,我又不是没雇过,钱得你自己支付,公司不给你报销的话,爽不?

  下面是拆箱子,面对着堆积如山的2000台服务器,我是连抬手的力气都拿不出来??当时机房只有我们公司3个人+电信值班2个人??

  这时候,我的办法是??我打电话找来了2队收废品的:

  这么多箱子,除了机器和电源线留下,里头的导轨光盘等等你全部拿走,谁拆的多谁拿的多??

  最后按照我的要求帮忙搬到机柜上??于是我们5个人是监工??看人家拆箱子搬机器。

  于是人家2队人找来了30多号人,一早上把2000台机器全部拆箱子完毕放到机柜上。

  要是我们几个人拆,估计????

  最后再说个行价,服务器箱子一个价值5块钱甚至更多。你服务器到了,卖卖箱子请大家吃饭吧。别让扫地的阿姨拿走,几个无所谓,10来个箱子,够大伙儿吃顿烤肉了??还有EMC的木箱子??拿去养个小鸡小鸭的??

  42U机柜1U的服务器最好是16台。你就看着上吧。呵呵

  四,安装系统和布线

  好了,面对几千台服务器开始装系统,我不知道你会怎么想??

  全部是1U服务器有什么办法安装系统?(我们公司穷,买不起刀片;而且电信不配合,要是上刀片,电路你们自己拉线,价钱还是原来的价钱;最重要的??我们公司以人为本,宁愿多养个人也不愿意买个好服务器让人失业),而且不允许GHOST,因为你这是服务器,不是网吧??GHOST出来的系统,我不知道谁用过,爽不。我自己是郁闷郁闷到了,莫名问题的时候,你就知道GHOST还是靠不住的。

  其次,我们公司安全部要求:必须得一台一台安装,先安装光板的系统(比如没有SP的WIn2000),然后手工打SP4补丁,不能网络打补丁。于是我们就光盘堆成山。最扯淡的,为了快,我做了一个补丁共享的服务器,所有的补丁CP的本地来打。结果忘记拔网线,导致人家说我们是插了网线打补丁,有中毒的危险,需要重装。我直接崩溃?? 办法1,你可以1台1台慢慢装,反正这么多机器,你可以管公司要更多的时间。但是我们公司一般是机器到了,最多2-3天就要要,一向是那种计划不如变化快的没有计划没有进度管理的“小”公司,项目组拿着鸡毛当令箭,牛x哄哄的公司。郁闷!

  这个时候前期的准备就比较重要了(我公司多用windows2003),因为首先我要装一个光系统,再打驱动,再打补丁,再安装远程控制软件。一台机器装完大约要1小时多点。那么机器多了怎么办?光盘不够怎么办?等等问题就来了。

  我的办法是,我一看TMD全部是DVD,IBM的机器直接佩combo,公司给我们发的全部是CD,娘的,典型的没有最慢只有更慢,出了问题闲你慢的领导班子。于是只好自己出钱买了DVD,用软件把RAID,网卡,显卡其他驱动做到光盘里,需要安装的软件也直接做成自动安装的方式,补丁也刻录到光盘里(我们要求补丁必须单打,不能安装集成补丁的ISO,shit),这样弄,你只用把光盘往光驱里一丢,分区一分,就可以下一台机器了。然后等你在去关注这个机器的时候,已经可以设置IP插网线了。灵感来自番茄花园。吼吼。

  当然这时候你最好是买个KVM,16口的KVM,一次准备16张光盘就可以用一套键盘鼠标操作16台机器。当然啦,KVM是可以级联的,我最牛一次一次一套键盘安装166台机器。郁闷的是,塞光盘塞死,插KVM线插死,配置IP配死,有时候还会弄错??

  办法2,你可以用NETKVM去远程安装,但是你插那些NETKVM的线路,2000个插下来,爽不?然后你继续扎KVM和网线的时候,看着和瀑布一样的网线和KVM线交错在一起。估计直接崩溃。远程KVM有的牛x的是可以分发ISO的,就是传说中的远程分发安装。可以自己买一个研究研究了,我们公司以人为本,从来不买这类高科技。

  办法3,我犯贱时候发明的:我们的机器全部是RAID1,于是我安装一台raid1的机器,系统全部安装好,然后拔掉一个硬盘,插上一个新硬盘自动恢复镜像,基本10来分钟恢复好一个硬盘,插到机器上去。这样,还是比装系统来的快。当然啦,型号是一模一样的??

  办法4,HP的ILO2功能,实现远程分发。前提你得一台一台配置好BIOS里的ILO2。也是蛮痛苦的。IBM和DELL现在也都有这个功能,但是你在分发以前,还是得一台一台机器插上网线,配置好BIOS的IP,痛苦。然后把操作系统和机器的驱动程序和后续的软件全部做到一张DVD里,让他自动运行。然后所有的服务器远程运营这一个ISO,最好多弄几台,否则一台机器弄的慢死。

  办法5,绝对最简单的办法!!就是买机器前,让厂家给你在硬盘里灌好系统,和你买笔记本一样,打开是个安装完成需要你输入序列号的系统。但是弱点是后续的软件需要自己装。因为服务器厂商是不会帮你安装别的软件的。还有更多的办法,只是暂时没想到,大家也可以谈论自己的办法。互相交流嘛。(51CTO编辑注:其实现在已经有很多无人值守安装系统的管理软件,比如KickStart和现在流行的Cobbler,都是不错的批量安装工具,而且都是开源的。现在都追求自动化,希望越来越多的运维们将不必面对一台一台装机的困扰)

  所以我喜欢linux,可以用N种办法安装系统。

  windows就是个让IT人当装机男,挨踢人当民工。

  好了系统装好了,电源线和网线连接完,和瀑布一样的。这时候还是尽量把他扎一下吧。

  否则机器通风不畅,会导致热死。

  简单办法就是电源线扎一边,网线扎一边。有钱的公司可以买个网线序号标,没钱就自己拿胶布标。

  你可以随便扎,或者和给你老婆梳头一样,好好扎。哈哈

  插交换机的时候,从上往下,从1-24往后,这样网络异常,数一下就知道了。

  想来想去这里也没啥值得关注的地方。所以就几行带过。

  五,资产统计

  假如你的机器只有2000台反而好容易管理了,但是现在我要管理的全国IDC有31个,平均每个机房有不同品牌服务器1500台。

  一共大约有台的样子(我的资产管理系统里的数字,不包含交换机,防火墙等)

  这时候怎么办?

  每季度和财务小MM一起出去旅游盘点IDC资产,幸福啊??(我们财务小mm很PL的哦)到了机房就是我一个人干活点资产,小mm带着大口罩,披着双层的放辐射服??

  可怜我们这些干活的,短裤背心,IDC里一呆就是好几个月(IDC办公室就在机房边上??),不知道精子被辐射杀死多少??

  1,必须有资产管理系统,虽然这个其实是个很简单的数据库,但是你可以把每一台机器的品牌,硬件信息,操作系统信息,购买年限,质保年限等,你非常关注的东西做一个详细记录,并配发同一的资产编号。比如我们的资产号,FWQ- 服务器-,这是一个总的资产号,这个服务器哪怕搬到美国,也是这1个资产,直到丢失,或者抛弃,都是这一个资产,永远不会变。

  比如我现在的板凳就是一个资产号是:服务器-000010的一个4U服务器,配置是P2 300*2 256M内存 16G硬盘×4 购买时间是1999年10月,从中维修过1次,升级过1次,在哈尔滨机房-广州机房-河南机房-北京网通机房-上海公司内部测试机房-上海库房服役过。

  有历史吧??.2,送到机房

  看过我这个服务器去过的地方,羡慕不?见证我们公司的发展史。9年过去了,终于成了我的板凳??

  服务器在购买合同确定以后,就应该按照配置记录资产,并且在财务备案,资产编号一定和财务记录相同。这样这个服务器走到哪里,都有备案和记录。现在要把这个服务器送到某个机房去,搬着走吧??汗

  送到机房,我们要给服务器按照财务给的表格粘贴资产编号,选个顺眼的地方,不会磨损的地方。

  一般是机器正面某个地方,然后是机器屁股后面某个地方,然后机器侧面把手的地方,粘贴3个,以防掉了就烦了。

  然后在粘贴这个机器的应用资产号和IP标签:

  应用资产号举例:FWQ-SH-XX-B31-WEBSERVER 意思是:服务器-上海-xx机房-B列31号机柜-web服务器

  IP标签举例:外内。这2个标签你可以分开也可以在一张标签上写清楚。

  并且在安装服务器的时候。把FWQ-SH-XX-B31-WEBSERVER-123-234 把这个作为你的HOSTS信息,windows里叫做计算机名

  这样远程上来都非常清晰自己在哪个服务器上,出问题时候也非常容易找到这个机器,不要闲麻烦,一切的麻烦都是为了以后快速的解决down机问题而做的。当然啦,甚至在密码管理上你也可以用这个规则来设置密码,但是最好规则别让别人知道了??

  3,把这些信息全部录入你的资产管理系统

  系统无非服务器名,IP信息,用途,机架位置,或者是否在使用一类的,我就不多讲了

  4,资产系统软件交互,也可以说是监控系统。

  企业可以开发一个软件,在装机的时候安装到服务器上。然后资产管理系统定时去取服务器上的信息,比如网络流量,CPU内存硬盘负载一类的东西,这样你的资产管理系统又变成了一个监控系统;

  当然啦,你也可以在资产系统里集成一个远程桌面管理系统,自动载入用户名和密码,还有随机码,就可以登录系统。省的还得管理服务器密码。

  然后用户的访问权限不同,看到的节面权限就不同。

  比如说,监控人员没有登录权限,或者IDC人员没有登录权限一类。权限分配你自己研究好了。

  5,还是IDC的工作。

  话题继续回到我和财务小mm去盘点(你公司比较大的话,你可以多派几个人分开去各个地方??)

  小mm一看我们机房服务器黑压压的一片,铺天盖地的,直接无语。为啥,因为要拿着资产表一个一个核对,面对几千个机器,直接晕倒。

  虽然按照资产管理系统里导出的信息,机柜号,IP号,机器从上到下的顺序都非常精确,但是你一个一个核对,还是慢。

  怎么办?

  库房管理的工作用上了,哈哈。你买服务器或者买笔记本电脑的时候有没有注意到箱子上的条码?

  那个条码非常清楚的记录了这个机器的详细信息。所以黑莓手机或者NOKIA手机(别的我没用过)都有扫描条码的功能??好像与主题无关??

  那么剩下的就简单了。

  去买个这种条码标签的打印机,编辑成自己需要的条码,一个一个贴好,上面有你所有需要盘点的信息?? 比如我们是从资产到机柜号到服务器名字到内外网IP都要盘点??小崩溃

  打印出来贴上去。然后买个扫描枪,和超市那种一样,不过你要买有存储功能的,否则你要端着笔记本去扫描,SB了。

  然后我和财务mm本来需要一个人念号码一个人核对(你要直到在机房里大喊资产号,喊一天的结果是啥,自己想),现在一个人拿一个扫描枪,按照规则一个一个扫描。完成后把数据导出后重新整理分析。直接和数据库核对(当然这个也需要你自己开发),核对完成生成一张表。

  表上写的非常清楚你哪个机架没有哪个机器,哪个机器不在特定的位置上,哪个机器缺少??等等

  这样比如说,机器位置不对扣5块钱工资,机器IP不对扣2块钱工资,或者??反正扣到最后??这月不给发工资了,还得倒贴点??哈哈哈

  六,监控架构

  监控架构其实每个地方都有自己的做法,我也知道我的办法不是很先进,但是仍然拿出来和大家一起讨论

  首先谈谈监控软件,一说起这个常用的东西MRTG,cacti一类的就都可以用了。只要稍微归类一下,流量展示看的还是很清楚的。

  要是要监控服务一类的,那就只好启用大名鼎鼎的nagios,和一些牛x人基于这个做的一些别的商业软件。

  或者就是自己做个脚本去定时探一下,不通了给你发邮件了啥的,你vim一下nagios的chack_xxx,学习一下里头人家探测的办法,自己也能搞出来个啥东西,都还是很不错的了。

  作为IDC工程师,我们所要关注的东西就是个流量了,我们要很清楚某台65下的某台35上每个口的应用,当遭受攻击或者流量异常的时候,一眼就能知道是怎么回事。我不相信你天天看着10M的流量,某天突然一下给你来个80M,你说这是正常事件吧。哪怕正常,你也找相关的人确认一下吧,一个100m口跑 80M,估计电信的人都来找你了。

  每天看着这些流量图是很枯燥的事情,那么我们没事只能想办法让他自动报警给我们了,于是EMAIL报警,然后把他发送到一个有手机提示新邮件的邮箱,你手机就有了。MSN报警,还是不错的吧,手机报警一类的办法都是不错的。这样你你可以和我一样放心的去打网游了。这里只谈经验,不谈详细的技术,因为我一说我的系统架构地球人都知道我是哪个公司的了,虽然已经离职,但是咱也有个职业道德,谢谢。

  当然了,有些公司是有网络监控部门的。但是我就一直在想这个问题,所有的数值都可以用短信报警,你随时都可以收到信息。用这个部门干啥,让一群可怜的家伙 8小时一动不动盯着屏幕,公司又在他们电脑上安装了抓屏软件,上班事件聊天上网就扣钱??我估计他们每天最期望的事情也莫过于服务器挂了,可以给我们打个电话重启个服务器或者连到服务器上检查一下啥问题,重启个服务了啥的。当然了,这些兄弟最后的职业方向也只能是进入运维部门了,至少公司服务器宕机维护的流程性东西掌握的非常熟练了。但是这是用好几年时间换来的经验,太??所以我是奉劝兄弟们有发现监控部门招聘人,就别去了吧。面前8台显示器,猛一看还以为是黑客帝国呐,结果仔细一看全tmd是流量图。常年对着8个显示器,那个辐射??

  我就不清楚设置个节点,出现问题告诉人,人去操作会死啊,非要让人和机器一样一动不动的盯着显示器,TMD,官僚。虽然我没经历过,但是想也能想到。做SA,最大的要点是懒,把一些需要人做的事情都自动化??但是话说回来,我公司以人为本,人海战术嘛,可以理解。

  上面的帖子位子已经满了,下来的帖子在这里写。

  企业实际面对的一些问题

  我大概通读了veyron 大侠的文章,认为系统架构方面的我绝对不如他。我就不在这里卖艺了,那么我卖企业都会实际面对的一些问题。

  1,自动化,流程化你的信息管理

  为什么要自动化,这年头流行办公自动化,你丫没事还拿着工单四处签字,老土了吧。

  为什么要流程化,这念头流行流程管理,假如你公司没有一个固定的流程管理,出了事情,大家都不知道怎么做,各个部门的电话乱打,大家都一锅粥没有效率。所以,未雨绸缪,在没有出问题的时候,模拟出问题,多多准备,建立规范的流程,公司的每个人都要遵守,这样,流程化的管理+办公自动化,大家只用在电脑上翘翘键盘,点击确定,流程就发出去,一路审批,OK,流程发送到做事的人地方,也许这个做事的人在美国,也一样方便。

  上面说的是一个原理和意思,用这样的理念去管理你的服务器应该如何去做?当然了,你假如只有10来台服务器,就不用考虑这个了??.首先服务器采购录入资产管理系统(详细见上面有写),服务器的去向和调度都在管理系统里有提现。

  这里说的是:如何去上架,维修,下架等流程控制

  先说上架下架:服务器到机房以后,别人要用服务器怎么办?先可以到你的资产管理系统里,看你机房还有什么配置的机器多少台,然后让他们选择自己项目服务器的配置,数量。在流程管理系统中,把这些机器选中,生成一个表单,表单名字为xx项目上架需求,写清楚谁用,做什么,数量,哪个机房等。然后提交给他们部门领导,他们部门领导同意后,转给需要审批的领导,一层层下来,流转到我们部门领导,我们部门领导流转给部门机房员工,员工收到流程,检查上架下架服务器;如要上架,安装完系统后填写IP,机器名,机架等相关信息。如要下架,删除相关信息,提交给流程控制的人员,流程控制人员确认后,这个流程完成。届时,所有的人审批过的数据,经手人,数据库里都有,出现什么问题找相关责任人,一下就找到了,省的和某些XX部门JJYY。

  维修也一样了,机器坏了,或者需要重装系统,按照上面的流程,一步步走一遍,就可以了。年底统计机房一天要干多少活,省的某些领导认为机房人TMD都在闲着。机房的人呢?没有流程不干活,否则白干。

  在流程系统里重启服务器,重启服务器要是要流程,就太慢了,那么你可以做一个绿色通道,写清楚原因,重启哪个机器,直接提交给相关机房人员,在你的流程系统里绑定一个短信网关,机房人员可以收到需要重启服务器的短信。准确无误。

  这样代替了无纸化办公,既有自己做的事情的每一个记录,又有相关人员管理,可以量化自己的工作,免得年终奖的时候xx人有说你干的少,发的少。你把记录拉出来对比对比就知道谁多谁少了。

  2,如何升级你的服务器

  服务器老了,或者需要加内存加硬盘,怎么升级。

  虽然说是很简单换个CPU,加个内存,加个硬盘很简单。

  但是,如何控制你的配件不丢失,确定的安装到机器上利用了呢?

  简单,在服务器上做一个探测服务器配置的客户端,每天探测一次硬件配置发送到资产管理服务器上。

  与资产管理系统的硬件配置做对比,出了问题就报错发一封邮件到机房工作人员,抄送流程控制人员一封就可以了。

  至于的加内存的时候注意型号啥的问题就不说了,大家应该都没问题了 要说的是,假如你一个机柜上放的机器比较多,比如4个6个机器一摞,恰巧坏了,恰巧一个人在机房,非得解决,怎么办?

  简单,一个办法,但是还是需要你有力气,虽然有力学原理

  比如有4台服务器,最下面的坏了,你可以拽住最下面的把4台一起往出拉,拉出来一点,把上面3台往后推,这样一点一点的拉出来,下面最关键:

  拉到最后,前面要留出来一点,轻轻的把上面3台的尾巴着地,然后一只手抬住上面3台机器,一只手拉出下面一台机器。

  上面3台一定要留出来一点,否则放下的时候,机器和机柜托板会压住你的手,你一松手,机器震一下,硬盘就挂了??

  所以在推进去的最后仍旧要留一点在外面,最后放下来了再推进去这最后一点。

  然后就可以换或者加内存了。相对比较省劲,不危险,不会压倒自己,不会砸坏服务器的办法就是这样了。

运维工程师工作计划5篇(运维工程师工作总结范文)相关文章:

工程师个人工作计划12篇 工程师个人工作总结范文大全

工程师个人工作计划3篇(工程师工作计划和目标)

工程师个人工作计划3篇 工程师工作计划范文

建筑工程师工作计划8篇 建筑工程师工作内容怎么写

ie工程师工作计划9篇 IE工程师工作内容

建筑工程师个人工作计划精选5篇 土建工程师年度工作计划

工程师岗位工作计划3篇 计划工程师工作内容

工程师个人工作计划最新报告3篇 工程师的工作计划

电气工程师工作计划3篇(电气工程师工作计划范文)

英语教师青蓝工程师傅工作计划3篇 小学英语青蓝工程师傅工作计划