0
与k均值算法类似,“学习向量量化”(简称LVQ)也是视图找到一组原型向量来刻画聚类结构,但与一般聚类算法不同的是,LVQ假设数据样本带有类别标记,学习过程利用样本的这些监督信息来辅助聚类。 给定样本集D={(x1,y1),(x2,y2),…,(xm,ym)},每个样本xj是由n个属性描述的特征向量(xj1;xj2;…;xjn),yj属于У是样本xj的类别标记。LVQ的目标是学得一组n维原型向量{p1,p2,…pq},每个原型向量代表一个聚类簇,簇标记ti属于У。 LVQ算法描述如下图所示,算法第一行先对原型向量进行初始化,例如对第q个簇可从类别标记为tq的样本中随机算去一个作为原型向量。算法第2-12行对原型向量进行迭代优化。在每一轮迭代中,算法随机选取一个有标记训练样本,找出与其距离最近的原型向量,并根据两者的类别标记是否一致来对原型向量进行相应的更新。在第十二行中,若算法的停止条件已满足(例如达到最大迭代轮数,活原型向量更新很小甚至不在更新),则将当前原型向量作为最终结果返回。
收藏