摘要:
为解决无限数据流在有限内存空间中的聚类分析问题,本文提出了一种加权聚类及演化分析框架。为简要地描述此框架,给出了聚类、聚类簇的概念及其数据结构定义,接着对聚类、聚类簇的加法运算和差运算给出了清晰的描述和相应的实现算法。本框架与CluStream框架有较大的差别,这里采用聚类簇的加法运算来实现更大时间跨度内的聚类簇融合,采用聚类簇的差运算来进行聚类簇的演化分析。最后通过第一个例子来说明本框架是如何对数据流进行加权聚类及演化分析的,采用第二个例子来验证为实现本框架所需的十五个算法的正确性及有效性。
中图分类号: