1 负责日常系统维护,及监控,提供IT软硬件方面的服务和支持,保证系统的稳定。
2 参与设计、审核、优化公司IT系统以及各应用系统的体系架构;
3 全面负责公司运维项目的系统升级、扩容需求与资源落实,配合开发需求,测试、调整运维平台;
4 负责网络以及服务器的网络设置、维护和优化、网络的安全监控、系统性能管理和优化、网络性能管理和优化;
5 建立面向开发部门,业务部门的服务流程和服务标准;
6 负责IT运维相关流程的规划、设计、推行、实施和持续改进;
7 负责内部分派下发,对实施结果负责。
8 负责日常网络及各子系统管理维护。
9 负责设计并部署相关应用平台,并提出平台的实施、运行报告。
10 负责配合开发搭建测试平台,协助开发设计、推行、实施和持续改进。
11 负责相关故障、疑难问题排查处理,编制汇总故障、问题,定期提交汇总报告。
12 负责网络监控和应急反应,以确保网络系统有7*24小时的持续运作能力。
运维的技术方向
服务监控技术:包括监控平台的研发、应用,服务监控准确性、实时性、全面性的保障
服务故障管理:包括服务的故障预案设计,预案的自动化执行,故障的总结并反馈到产品/系统的设计层面进行优化以提高产品的稳定性
服务容量管理:测量服务的容量,规划服务的机房建设,扩容、迁移等工作
服务性能优化:从各个方向,包括网络优化、操作系统优化、应用优化、客户端优化等,提高服务的性能和响应速度,改善用户体验
服务全局流量调度:接入服务的流量,根据容量和服务状态在各个机房间分配流量
服务任务调度:服务的各种定时/非定时任务的调度触发及状态监控
服务安全保障:包括服务的访问安全、防攻击、权限控制等
数据传输技术:包括p2p等各类传输技术的研发应用,也远距离大数据传输等问题的解决
服务自动发布部署:部署平台/工具的研发,及平台/工具的使用,做到安全、高效的发布服务
服务集群管理:包括服务的服务器管理、大规模集群管理等
服务成本优化:尽可能降低服务运行使用的资源,降低服务运行成本
数据库管理(DBA):通过设计、开发和管理高性能数据库集群,使数据库服务更稳定、更高效、更易于管理。
平台化的开发:类docker和google borg平台的开发管理,及服务接入技术
分布式存储平台的开发优化:类google gfs等分布式存储平台的研发及服务接入
温馨提示:内容为网友见解,仅供参考