自动监控和响应ECS系统事件实现故障处理、动态调度等自动化运维
阿里云提供了ECS系统事件用于记录和通知云资源信息,例如ECS实例的启停、是否到期、任务执行情况等。在大规模集群、实时资源调度等场景,如果您需要主动监控和响应阿里云提供的ECS系统事件,来实现故障处理、动态调度等自动化运维,可通过云助手插件ecs-tool-event实现。
系统运维工具集SysAK使用说明
SysAK(System Analyse Kit)是阿里云操作系统提供的一个全方位的系统运维工具集,可以覆盖系统的日常监控、线上问题诊断和系统故障修复等常见运维场景。本文为您介绍SysAK的安装部署和使用方法。
系统运维 SysOM profiling 在云上环境的应用观测实践 | 龙蜥技术
文/系统运维 SIG背景云上环境,ECS客户一般都会布置一些常规监控观察系统指标或者业务指标,虽然通过这些指标能监控到系统或者应用的异常,但是却不能完全了解系统/应用正在做什么导致的指标异常。常见的如:看到系统CPU偶尔飙高却不知道是哪个应用引起、抓包发现报文已经到达了本机却不知道应用为何迟迟不收包等等,束手无策之余只能认为“系统有问题” ,而在排查系统问题之后发现往往是应用对系统资源在做一些野....
![系统运维 SysOM profiling 在云上环境的应用观测实践 | 龙蜥技术](https://ucc.alicdn.com/pic/developer-ecology/6nbwtd7hf57co_59b1f478441246ffb44eacc7eceb0ca5.png)
系统运维利器,百万服务器运维实战总结!一文了解最新版SysAK|龙蜥技术
在刚刚结束的龙蜥峰会 eBPF & Linux 稳定性专场上,龙蜥系统运维 SIG Maintainer 张毅做了《SysAK 系统运维工具集》的主题演讲,以下为演讲实录。大家好,在去年的云栖大会,我们在龙蜥社区开源了系统运维工具集 SysAK,并提供了多种诊断功能。作为系统运维 SIG(Special Interest Group) 主力项目之一。这一年来,SysAK 为适应更多场景,....
![系统运维利器,百万服务器运维实战总结!一文了解最新版SysAK|龙蜥技术](https://ucc.alicdn.com/pic/developer-ecology/b6446b6dea624ba099f1995049f4bfcd.png)
sysAK(青囊)系统运维工具集:如何实现高效自动化运维?| 龙蜥技术
编者按:本文整理自「云栖大会龙蜥专场论坛」的技术分享。作者张毅,系统运维SIG 核心人员。另龙蜥专场视频已经上线至龙蜥社区官网,欢迎观看:云栖大会龙蜥专场论坛。系统运维 SIG 已在龙蜥社区建立 SIG 组。目前 sysAK 工具集已经在龙蜥社区开源,并且在系统运维 SIG、跟踪诊断 SIG 一起共建,希望大家后期加入 SIG 一起讨论共建。本文将从技术角度分享 sysAK 系统。一、 What....
![sysAK(青囊)系统运维工具集:如何实现高效自动化运维?| 龙蜥技术](https://ucc.alicdn.com/pic/developer-ecology/1cfda816085d4df391c629ba0feb59ed.jpg)
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。