帮助文档 Logo
平台使用
阿里云
百度云
移动云
智算服务
教育生态
登录 →
帮助文档 Logo
平台使用 阿里云 百度云 移动云 智算服务 教育生态
登录
  1. 首页
  2. 阿里云
  3. 日志服务
  4. 操作指南
  5. 机器学习语法
  6. 相关性分析函数

相关性分析函数

  • 机器学习语法
  • 发布于 2025-04-22
  • 0 次阅读
文档编辑
文档编辑

针对系统中的多个观测指标,可以快速找出与某个指标项相关或者时序序列相关的指标名称。

函数列表

函数

说明

ts_association_analysis

针对系统中的多个观测指标,快速找出和某个指标项相关的指标名称。

ts_similar

针对系统中的多个观测指标,快速找出和用户输入的时序序列相关的指标名称。

ts_association_analysis

函数格式:

select ts_association_analysis(stamp, params, names, indexName, threshold)

参数说明如下:

参数

说明

取值

stamp

long 类型,表示UnixTime时间戳。

-

params

array(double)类型,表示待分析的指标维度。

例如:Latency,QPS,NetFlow等。

names

array(varchar )类型,表示待分析的指标名称。

例如:Latency,QPS,NetFlow等。

indexName

varchar 类型,表示分析目标指标的名称。

例如:Latency。

threshold

double 类型,表示其它分析指标与目标指标间的相关性阈值。

取值范围在:[0,1]。

结果输出:

  • name:指标的名称。

  • score:该指标与目标指标之间的相关性值,范围在[0,1]之间。

代码示例

* | select ts_association_analysis(
              time, 
              array[inflow, outflow, latency, status], 
              array['inflow', 'outflow', 'latency', 'status'], 
              'latency', 
              0.1) from log;

结果示例:

| results               |
| --------------------- |
| ['latency', '1.0']    |
| ['outflow', '0.6265'] |
| ['status', '0.2270']  |

ts_similar

函数格式一:

select ts_similar(stamp, value, ts, ds)
select ts_similar(stamp, value, ts, ds, metricType)

参数说明一:

参数

说明

取值

stamp

long 类型,表示UnixTime时间戳。

-

value

double 类型,表示某指标对应的值。

-

ts

array(double)类型,表示指定曲线的时间序列信息。

-

ds

array(double)类型,表示指定曲线的数值序列信息。

-

metricType

varchar 类型,表示度量曲线间相关性的类型。

类型如下:

SHAPE,RMSE,PEARSON,SPEARMAN,R2,KENDALL

函数格式二:

select ts_similar(stamp, value, startStamp, endStamp, step, ds)
select ts_similar(stamp, value, startStamp, endStamp, step, ds, metricType )

参数说明二:

参数

说明

取值

stamp

long 类型,表示UnixTime时间戳。

-

value

double 类型,表示某指标对应的值。

-

startStamp

long 类型,表示指定曲线的开始时间戳。

-

endStamp

long 类型,表示指定曲线的结束时间戳。

-

step

long类型,表示时序中相邻两个点之间的时间间隔。

-

ds

array(double)类型,表示指定曲线的数值序列信息。

-

metricType

varchar 类型,表示度量曲线间相关性的类型。

类型如下:

SHAPE,RMSE,PEARSON,SPEARMAN,R2,KENDALL

输出结果:

  • score:该指标与目标指标之间的相关性值,范围在[-1, 1]之间。

代码示例:

* | select vhost, metric, ts_similar(time, value, 1560911040, 1560911065, 5, array[5.1,4.0,3.3,5.6,4.0,7.2], 'PEARSON') from log  group by vhost, metric;

结果示例:

| vhost  | metric          | score                |
| ------ | --------------- | -------------------- |
| vhost1 | redolog         | -0.3519082537204182  |
| vhost1 | kv_qps          | -0.15922168009772697 |
| vhost1 | file_meta_write | NaN                  |
相关文章

时序SPL 2025-04-22 10:42

在Logstore中存在很多时序数据,日志服务支持通过时序SPL指令和SPL函数处理Logstore中的时序数据。 什么是Series Series是由时间维度序列和指标维度序列组成的二维数据结构,适用于表达随时间变化的观测值集合。和Series相对应的是Table数据。

SPL指令 2025-04-22 10:42

本文主要介绍时序SPL指令的详细信息。 SPL指令列表

SPL函数 2025-04-22 10:42

Logstore中的时序数据通过SPL指令处理后,可以调用时序SPL函数进行结果可视化。 函数列表

平滑函数 2025-04-22 10:42

平滑函数是针对输入的时序曲线进行平滑和简单的滤波操作,滤波操作通常是发现时序曲线形态的第一步。 函数列表

多周期估计函数 2025-04-22 10:42

多周期估计函数支持对不同时间段内的时序进行周期估计,通过傅立叶变换等一系列操作进行周期的提取。 函数列表

变点检测函数 2025-04-22 10:42

变点检测函数一般用于对时序数据中的变点进行检测。 变点检测函数支持对如下两种变点形态进行检测: 指定时间段内的某些统计特性发生了变化。

目录
Copyright © 2025 your company All Rights Reserved. Powered by 博智数字服务平台.
闽ICP备08105208号-1