基于物品的协同过滤(ItemCF)是怎么做的？ - 问答

基于物品的协同过滤算法的核心思想：给用户推荐那些和他们之前喜欢的物品相似的物品。

基于物品的协同过滤算法首先计算物品之间的相似度，计算相似度的方法有以下几种：

基于共同喜欢物品的用户列表计算

在此，分母中 N(i) 是购买物品 i 的用户数，N(j) 是购买物品 j 的用户数，而分子是同时购买物品i 和物品 j 的用户数。可见上述的公式的核心是计算同时购买这件商品的人数比例。当同时购买这两个物品人数越多，他们的相似度也就越高。另外值得注意的是，在分母中我们用了物品总购买人数做惩罚，也就是说某个物品可能很热门，导致它经常会被和其他物品一起购买，所以除以它的总购买人数，来降低它和其他物品的相似分数。
基于余弦的相似度计算

上面的方法计算物品相似度是直接使同时购买这两个物品的人数。但是也有可能存在用户购买了但不喜欢的情况所以如果数据集包含了具体的评分数据我们可以进一步把用户评分引入到相似度计算中。