skywalking:掌控我们的系统,从这里开始,从此游刃有余
掌控我们的系统,从这里开始,从此游刃有余
- 纵观平台全局:让平台服务健壮性透明,让服务优化立竿见影
各时间点的热力图,说明接口耗时的分布及其数量
p50,p75,p90,p95,p99接口的耗时
系统吞吐量排序数据
慢服务排序数据:发现慢服务,让性能优化有的放矢
系统拓扑图:展现平台系统关系复杂度,为平台稳定性和灵活性提供方向
- 掌控各个系统:
接口整体服务情况:耗时,吞吐率
该系统慢服务发现:找到瓶颈接口
一览实例列表:为游刃有余奠定基础
系统依赖关系:知道我影响谁,谁依赖我;发现和优化系统的重要性!
- 剖析每一接口:
可视接口依赖:知道接口的前序后情
接口耗时情况(平均,折线图):分析接口的健康状态
- 透明实例:
实例接口服务情况(平均,折线图):发现改善决服务瓶颈
实例JVM服务情况(GC,内存动态):发现并掌控健康服务
- 链路跟踪,接口链路分析:
清晰接口路径,透明耗时分布,让性能优化有的放矢
清晰接口路径,各节点服务状态一目了然,让问题发现与解决游刃有余
监控告警,防患于未然:该功能是根据业务情况,和团队需求来自由定制,可包括但不限于:
- 接口
接口可用性监控告警;
接口慢服务监控告警
接口高频调用监控告警
接口吞吐量监控告警
- 服务
服务可用性监控告警
服务高压监控告警
服务吞吐量监控告警
- JVM
gc情况监控
jvm情况监控
ELK及业务日志的强有力的后盾:只需要一个配置即可让ELK如虎添翼:统一的traceId通过logback打印到所有日志中,让分布式集群的日志查看及问题排查成为现实。
仪表盘-全局
仪表盘-服务
追踪:
- 迅速定位到报错接口错误的位置
- 查看接口服务的调用其他服务和访问缓存,数据库等的情况
告警
该功能是根据业务情况,和团队需求来自由定制,可包括但不限于:
接口
- 接口可用性监控告警;
- 接口慢服务监控告警
- 接口高频调用监控告警
- 接口吞吐量监控告警
服务
- 服务可用性监控告警
- 服务高压监控告警