在以往的文献中,shapelets 在分类任务中提供了可解释 性。

shapelet是什么

shapelet其实就是一段时间序列数据中的某个子序列,这个子序列是这段时间序列数据的最显著的特点(显然,shapelet和趋势,周期分量一样,也是时序数据本身的一种特别的分量)

参考:Time Series Shapelets: A New Primitive for Data Mining

问题:大多数现有作品忽略了不同时间片的不同代表能力,以及(更重要的是)shapelets 的演变模式。

本文:通过设计两级时序因子来提取时间感知 shapelets。

定义并构建了 shapelet 演化图,将 shapelet 和时间序列的表示学习问题转化为图嵌入;它捕捉了 shapelet 如何随时间演化,并且可以通过图嵌入算法纳入时间序列嵌入中。

为了捕捉 shapelet 之间的共现和对等影响,我们提出了将时间序列视为图形的想法,其中节点指的是 shapelet,加权边表示 shapelet 之间具有不同概率的转换。

1 intro

shapelet是动态的:

  • 出现在不同时间片上的同一个 shapelet 可能会产生一系列不同的影响。跟同期的其他时间序列比
  • 确定 shapelets 演化的方式对于全面理解时间序列至关重要。跟历史时期的自己比

问题:静态shapelet可以通过计算候选的信息增益选出,动态的应该如何定义?

动态shapelet的演变如何捕捉?

将 shapelets 的进化模式嵌入到潜在特征空间 Σ 中可能是有效的。

解决:通过提取时间感知 shapelet 并构建 shapelet 演化图来学习时间序列的表示。

首先定义了一个两级时序因子来量化 shapelets 在不同时间的判别能力,然后构建一个图来表示 shapelets 的进化模式。

fig1:图 1a 展示了一个用户在 1 月至 5 月期间偷电而其余月份正常使用电力的一年用电量。我们每个月分配当时最具代表性的 shapelet,并在图 1b 中显示 shapelet #72 和 #67,以及它们的时间因素,其中深色区域表示相应的 shapelet 相对于浅色区域更具辨别力。 shapelet 演化图如图 1c 所示,说明了 shapelet 在正常情况下如何从一个转移到另一个:对于正常的用电量记录,它的 shapelet 过渡有一条清晰的路径(#90 → #67 → # 85) 在图中。而对于异常数据,路径(#85→#72→#7)不存在,说明shapelet过渡路径的连通性为检测异常时间序列提供了证据依据。最后,我们将 shapelets 和时间序列的学习表示问题转化为图嵌入问题

2 pre

介绍了两个概念:

Alignment.和shapelet

3 time2grph 的框架

我们从大量候选对象中提取时间感知 shapelet(第 3.1 节),

构建 Shapelet 演化图以捕获 shapelet 之间的相关性(第 3.2 节),

最后通过连接段来学习时间序列表示向量(第 3.3 节)嵌入由从 Shapelet Evolution Graph 获得的 shapelet 嵌入组成。

3.1 时间感知shapelet的提取

时间感知的意思是考虑不同时间子序列的的代表性不同。

本文中考虑时间感知 shapelets。

两个因素定量测量不同级别 shapelets 的时间效应。

(1)局部因子 wn 来表示特定 shapelet 的第 n 个元素的内部重要性,

定义shapelet v和 segment s之间的距离

(l2距离按权重求和开根号)

权重按DTW 的最佳对齐方式区分

DTW动态时间规整:可以把序列某个时刻的点跟另一时刻多个连续时刻的点相对应”的做法称为时间规整Time Warping

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jYVOh0hW-1651802694018)(C:\Users\Dell\AppData\Roaming\Typora\typora-user-images\image-20220307215414698.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CgVAYQtb-1651802694022)(C:\Users\Dell\AppData\Roaming\Typora\typora-user-images\image-20220307215434061.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-MILHAC1u-1651802694025)(C:\Users\Dell\AppData\Roaming\Typora\typora-user-images\image-20220307215502578.png)]

DTW算法的步骤为:

  1. 计算两个序列各个点之间的距离矩阵。
  2. 寻找一条从矩阵左上角到右下角的路径,使得路径上的元素和最小。

可以直观地解释为权重 w 投影到 DTW 对齐路径上。

(2)在全局范围内,我们的目标是衡量跨段的时间效应对 shapelets 的区分能力的影响。shapelets 在不同时间步可能代表完全不同的含义的直觉,并且通过添加段级权重可以直接测量这种偏差。

设计全局因子umshapelet v 和时间序列 t 之间的距离

3.2 Shapelet演化图

捕捉刷屏shapelet之间的相关性,包括共现性,出现的顺序。

定义3 Shapelet演化图

有向加权图,节点是shapelet,边是shapelet之间的转移关系,边权是发生这种转移的概率

图构建

根据时间感知的差异将每个时间序列的每个段 si 分配给几个与 si 距离最近的 shapelet。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AdSfAUly-1651802694027)(C:\Users\Dell\AppData\Roaming\Typora\typora-user-images\image-20220306165351451.png)]

shapelets 集 vi,∗ 以概率 pi,∗ 分配给片段 si,并且 vi+1,∗ 分别以概率 pi+1,∗ 分配给 si+1。

3.3 表示学习

使用DeepWalk对shapelet演化图进行embedding

vij→μij,

检索每个 shapelet vi,j 的表示向量 µ(vi,j) 乘以分配概率 pi,j,并将它们在每个段上求和,得到了段表示

将所有这 m 个段嵌入向量连接起来,得到时间序列 t 的表示向量 Φ

将嵌入特征馈送到外部分类器的方式,将时间序列的表示向量用作各种时间序列分类任务的特征。

参考

https://blog.csdn.net/pixian3729/article/details/109385311

https://zhuanlan.zhihu.com/p/422967593

https://zhuanlan.zhihu.com/p/270927880

DTWhttps://zhuanlan.zhihu.com/p/43247215

https://www.bilibili.com/video/BV12r4y1A7mT?spm_id_from=333.337.search-card.all.click

shapelethttps://www.bilibili.com/video/BV1cL4y1h7yL?spm_id_from=333.337.search-card.all.click
3.337.search-card.all.click

shapelethttps://www.bilibili.com/video/BV1cL4y1h7yL?spm_id_from=333.337.search-card.all.click

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐