Mapreduce框架下的聚类算法如何实现?
0 470
0
该提问暂无详细描述
收藏
2021-01-15 17:50 更新 空心人 •  3356
共 1 个回答
高赞 时间
0

1)给定初始的聚类中心,数据点值,计算距离每个数据点最近的中心索引,将索引作为键,数据点的值作为返回键值对。 (2)应用结合函数,将步骤(1)返回的键值对中在同一台机器上相同键的值进行组合,累加属于同一个簇的元素,并记录个数,仍将索引作为键,簇内元素和个数作为值返回。 (3)将相同键对应的进行累加,计算出新的簇中心,将簇索引作为键,将新的中心作为值返回。 Mapreduce分布式计算框架: MapTask Reduce Task

收藏
2021-01-15 17:52 更新 小眼的铁板烧 •  3516