SW应用中对Trace的跟踪一直占有重要的地位,即可以用户指定的tag值,可以筛选出感兴趣的trace(跟踪链),用户可以通过跟踪链追踪各个Span的详细情况。 但是在使用SW OAP原生页面中会存在两个问题:
1) Trace数量太多了,需要反复搜索才能找到
2) 找到的Trace,往往代表一类业务,但原生的OAP无法提供Trace聚合图表,比如此类业务耗时的平均延时图
我们尝试用grafana+Graphql+SW解决,前文可参考 grafana结合Skywalking生成组合图表

首先我们用SW OAL提供的queryBasicTraces查询trace列表

query {totaltraces:
 queryBasicTraces(
    condition: {
        serviceId: "$serviceId"
        serviceInstanceId: ""
        endpointId: "$endpointId"
        traceState: ALL
        traceId: ""
        queryDuration: {start: "${__from:date:YYYY-MM-DD HHmm}",end: "${__to:date:YYYY-MM-DD HHmm}", step: MINUTE}
        tags: $tags
        queryOrder: BY_START_TIME
        paging: {
            needTotal: false
            pageNum:1
            pageSize: 100
        }
    }
){
    traces{
        traceIds
        duration
        endpointNames
        start
        
    }
}
}

serviceId对应服务Id变量。endpointId对应端点的变量,这里重点说一下tags,支持按tag查询,如果是空对应,tags=[] ,如果非空则是tags={key:“xxnamexx”,value:“xxvaluexx”} , xxnamexx和xxvaluexx定义的tag(参考SW,这里不赘述)
所以最后的设计就是 tags变量,如果空则填[] ,如果非空则填{key:“xxnamexx”,value:“xxvaluexx”} ,当然这有点反人类,未来希望通过插件改造实现,若有更简单的办法,恳请赐教

查询结果,先选择table
grafana结合Skywalking追踪Trace(一)-LMLPHP
那么后续就是需要解决时间序列的问题,主要是通过gafana提供的transform和域名的Overrides工具,对start(时间)进行改造,实现适配TimeSeries,主要目标就是把start列从UNIX标准时间转换成ISO的标准时间,并指定为时间轴 ,步骤如下:
1 transform: add field from calculation 选Binary operation(列计算) start1 (我不知道为啥,但不加这条,没法转) alias 选starttime (否则就是很中二的 start1… )
2 table选择Overrides 选 starttime, 选Unit 然后转成 Datetime ISO
3 transform: filter by name 去掉start列
4 Convert fieldtype 选starttime 转成时间

grafana结合Skywalking追踪Trace(一)-LMLPHP
然后把table换成 timeseries OK(注意: GraphStyle选bar比较好)
grafana结合Skywalking追踪Trace(一)-LMLPHP
然后把Table变成TimeSeries就好了

我为了保留表格,采用了新建Panel然后 DataSource选 dashboard 引入刚才的表格数据,然后再使用transform和override 变成timeseries

09-19 07:09