诸多平台落地,管理近上万台设备、几百个业务系统,提供监控告警、自动化运维、配置管理、调度管理、决策管理等能力,充分体现了插上AI翅膀后运维平台焕发出的崭新生命力,在趋势分析、智能诊断、故障自愈、决策分析等方面均得到有效发挥。

头条推荐

插上AI翅膀 运维平台焕发出崭新生命力

AI虽然已经在很多行业得到应用,但仍属于比较前沿的科技,需要巨大的投入。对于AIOPS来说,算法、数据和专业三者缺一不可,与大众领域相比,运维行业对AI人工智能的人才吸引力较弱,因此在这方面的专家相对薄弱,需要尽快构建起自已的AI人才体系。……>>详细

从人肉运维到智能运维,京东金融服务监控

【51CTO.com原创稿件】人肉阶段的运维,理想与现实有天壤之别,同时还有背不完的锅,填不完的坑。人工、自动、智能运维相互交叠是当前运维领域的现状,智能运维是大势所趋,但真正的落地实践并不多。

在由 51CTO 主办的第十四期“Tech Neo”技术沙龙活动中,资深架构师沈建林分享了京东金融的服务监控、服务治理等方面的应用与技术实现。

为什么要做服务监控?

业务规模不断扩大、微服务化、频繁变更这三方面现实需求,是做服务治理和监控的重要原因。为保证这三方面的正常进行,需要做很多事,重点包括如下几点:

  • 如何快速发现问题?采用哪些技术?
  • 如何梳理服务依赖?面对京东过万的服务,如何进行梳理,具体实现过程是怎么样的?
  • 如何判断依赖合理性?微服务之间相互依赖,采用什么样方式判断依赖是否合理?
  • 如何实现实时容量规划?传统的方式是在618前两月进行封网,不允许上线,利用这段时间进行线上压测,得到应用的容量,随后根据现实情况进行扩容。这样的方式耗时耗力,所有研发不让上线,成本很难评估。现在的做法是基于历史数据,机器学习,自动运算,那具体是如何实现的?
  • 如何判断故障影响范围?也就是故障定位问题,如何能知道哪个节点发生故障,响应了哪些业务?
  • 如何实现业务级监控?京东金融会和很多第三方支付机构打交道,如何去监控和合作伙伴之间交易的服务质量?

综上都是服务监控要完成的使命,下面我们先从服务监控设计原则、自主监控的基本要素、服务依赖关系梳理、调用链分析、容量规划、根源分析等方面来看看服务监控的应用

阅读全文

运维逼格提升心法:从报警到预警,如何有

【51CTO.com原创稿件】当下,IT 运维成为企业的核心竞争力,从过去人肉保障的阶段,一直到现在引入 AI 和各种计算的方式来实现稳定性。在进阶的过程中,如何评价运维的质量,是摆在运维人员和服务对象/业务方之间的难题。

在由 51CTO 主办的第十四期“Tech Neo”技术沙龙活动中,搜狗 SRE 负责人黄昕老师以此难题为开端,逐步深入展开,讲解具体实现细节。分享主线以时间为序:从建立、实现 SLO,到预警的提出和成熟、预警系统的布设,再到运维准入门槛的提出、故障的自动恢复。

如何建立 SLO

SLO 即服务水平目标,通过建立运维 SLO,如稳定性目标、服务时长等,实现用数据的方式合理评价运维工作效率。

十年前,没有各种监控系统,要以纯人肉的方式,来实现稳定性,整个运维行业是人跟着报警走的状态。

阅读全文

张真:AIOps六大技术难点与宜信运维的重

【51CTO.com原创稿件】运维发展历程与工业革命异曲同工,工业的三次革命分别是机械化、电气化与信息化,运维则是原始手工、脚本与自动化工具。那么工业4.0悄然来临的今天,智能化又将会给运维带来哪些影响?AIOps早期是由Gartner提出,原义是基于算法的IT运维,随实践、反思和讨论的不断积累,对它的认知发生了一些变化。

随着人工智能技术的发展,基于人工智能的IT运维越来越被普遍认可,所以AIOps如今被解读为Artificial Intelligence for Operations。近日,宜信研发总监,接受了51CTO的采访,核心围绕AIOps技术难点,金融行业AIOps应用现状与宜信运维的重大变革展开。

张真·宜信研发总监

阅读全文

相关热文

[WOTD]腾讯杨文兵:基于PaaS
身处云计算时代的海量运维,传统运维已经过时,企业需要有一套属于自己的自…
IT运维如何防止陷入“中年油
在扩大运维团队的同时,他们通过整合资源、逐步转变并提升了 Ops 的相关观…
顺丰科技陈天宇:“双11”、
近年各大电商的崛起,正以强劲之势改变着中国,同时也影响着我们的生活。它…
未雨绸缪,迎接运维新时代—
今天, 由51CTO 主办的第十六期以“Tech Neo”为主题的技术沙龙活动如期举…
饿了么程炎岭:分享全站多活
自动化运维,智能化运维必然是潮流,只是运维在不同阶段面临不同的问题。不…
智能化运维的探索与实践——
今天, 由51CTO 主办的第十八期以“Tech Neo”为主题的技术沙龙活动如期举…
Bespin Global:借力AI技术
对于多体系的中国云市场,相比较来说,MSP更加被需要,但只有技术能力过硬…
运维绝不是背锅、填坑和救火
魅族运维团队通过构建持续集成云端交付平台提高应对变化的能力,实现主动应…
游戏运维的最佳实践:搜狐畅
搜狐黎志刚见证了畅游游戏自动化运维平台的从无到有,通过在其中踩过的坑、…

投    票

专题推荐

4.29首都网络安全日系列活动之北京国际互联网博览会暨世界网络安全大会将于2018年4月26-28日在北京展览馆盛
2018第五届首都网络安全日专
4.29首都网络安全日系列活动之北京国际互联网博览会暨世界网络安全大会将于2018...
一年一度的安全行业盛会RSA 2018即将拉开帷幕,本届大会的主题是Now Matters(现在很重要)。今年的RSA大会
2018美国RSA信息安全大会专
一年一度的安全行业盛会RSA 2018即将拉开帷幕,本届大会的主题是Now Matters(...

随着物联网应用逐渐丰富,生物识别技术迎来了大显身手的机会——这很容易理解,在万物互联的时代,数据安
探测未来:人脸、指纹等生物
随着物联网应用逐渐丰富,生物识别技术迎来了大显身手的机会——这很容易理解...
近几年来,德国的“工业4.0”、美国的“工业互联网”概念先后问世,我国国务院也先后印发了《关于促进云计
迎接智能制造 以工业云为抓
近几年来,德国的“工业4.0”、美国的“工业互联网”概念先后问世,我国国务院...

一周排行

留言评论