帮助文档 Logo
平台使用
阿里云
百度云
移动云
智算服务
教育生态
登录 →
帮助文档 Logo
平台使用 阿里云 百度云 移动云 智算服务 教育生态
登录
  1. 首页
  2. 阿里云
  3. 日志服务
  4. 操作指南
  5. 机器学习语法
  6. 频繁模式统计函数

频繁模式统计函数

  • 机器学习语法
  • 发布于 2025-04-22
  • 0 次阅读
文档编辑
文档编辑

频繁模式统计函数可以在给定的多属性字段样本中,挖掘出具有一定代表性的属性组合,用来归纳当前日志。

pattern_stat

函数格式:

select pattern_stat(array[col1, col2, col3], array['col1_name', 'col2_name', 'col3_name'], array[col5, col6], array['col5_name', 'col6_name'], support_score, sample_ratio) 

参数说明如下:

参数

说明

取值

array[col1, col2, col3]

字符型数据的输入列。

数组形式,例如:array[clientIP, sourceIP, path, logstore]。

array['col1_name', 'col2_name', 'col3_name']

字符型数据的输入列的对应名称。

数组形式,例如:array['clientIP', 'sourceIP', 'path', 'logstore']。

array[col5, col6]

数值型数据的输入列。

数组形式,例如:array[Inflow, OutFlow]。

array['col5_name', 'col6_name']

数值型数据的输入列的对应名称。

数组形式,例如array['Inflow', 'OutFlow']。

support_score

样本在进行模式挖掘时的支持度。

double类型,取值为(0,1]。

sample_ratio

采样比率,默认为0.1,表示只拿10%全量集合。

double类型,取值为(0,1]。

示例:

  • 查询分析:

    * | select pattern_stat(array[ Category, ClientIP, ProjectName, LogStore, Method, Source, UserAgent ], array[ 'Category', 'ClientIP', 'ProjectName', 'LogStore', 'Method', 'Source', 'UserAgent' ], array[ InFlow, OutFlow ], array[ 'InFlow', 'OutFlow' ], 0.45, 0.3) limit 1000
  • 输出结果:

显示项如下:

显示项

说明

count

当前模式所含样本的数量。

support_score

当前模式的支持度。

pattern

模式的具体内容,按照条件查询的形式组织。

相关文章

时序SPL 2025-04-22 10:42

在Logstore中存在很多时序数据,日志服务支持通过时序SPL指令和SPL函数处理Logstore中的时序数据。 什么是Series Series是由时间维度序列和指标维度序列组成的二维数据结构,适用于表达随时间变化的观测值集合。和Series相对应的是Table数据。

SPL指令 2025-04-22 10:42

本文主要介绍时序SPL指令的详细信息。 SPL指令列表

SPL函数 2025-04-22 10:42

Logstore中的时序数据通过SPL指令处理后,可以调用时序SPL函数进行结果可视化。 函数列表

平滑函数 2025-04-22 10:42

平滑函数是针对输入的时序曲线进行平滑和简单的滤波操作,滤波操作通常是发现时序曲线形态的第一步。 函数列表

多周期估计函数 2025-04-22 10:42

多周期估计函数支持对不同时间段内的时序进行周期估计,通过傅立叶变换等一系列操作进行周期的提取。 函数列表

变点检测函数 2025-04-22 10:42

变点检测函数一般用于对时序数据中的变点进行检测。 变点检测函数支持对如下两种变点形态进行检测: 指定时间段内的某些统计特性发生了变化。

目录
Copyright © 2025 your company All Rights Reserved. Powered by 博智数字服务平台.
闽ICP备08105208号-1