动机
这一篇是 斯坦福大学的EE人写的,看一下人家咋玩儿的哈
我发现这东西的确有一些我没有听说过的玩儿法,权当是知识积累吧
时间序列的聚类算法
在LITERATURE REVIEW中,作者提到,用于specify时间序列相似度的similarity measures有很多,比较有名的是:Euclidean distance, Hausdorff distance, HMM-based distance, Dynamic time warping (DTW) and Longest Common Sub-Sequence
(LCSS)。
本文采用的Dynamic Time Warping (DTW) distance是这么一回事:它finds the
optimal alignment between two time series by stretching or compressing the segments of the series.
说的怪长,实际上就是基于一个intuition:我们俩都是时间序列,那么,我们相似的地方很可能在时刻上有一定的错位,如在本文的应用lectrical devices usage中,用户的习惯可能有一个小时左右的variation,因此在比较俩时间序列的时候,需要在前后俩小时的范围内进行计算。这时候就可以利用dTW的warping path 概念了。
这样就能保证具有相似shape的两个时间序列仍然是相似的,即使它俩具有stretching and contracting of the time axes.
Time wrappign不过如此嘛。
cluster的应用:day ahead load curve predictions
这些cluster除了用于构建FIS之外,还可以用于构建Markov process。
两步走:
- we select the best next day load shape
from the cluster prototypes, conditioned on the current
day’s load curve. - we scale the selected prototype
to obtain the prediction.
其实就是搜索了,具体我还没看懂,哈哈。
总结
这个其实就是纯应用了,应用的一个衡量标准就是能work就行了。
更多的东西也没法参考,就这样了。