基于机器学习方法的电影推荐系统 - 资源下载

0 有用

43 下载

基于机器学习方法的电影推荐系统

文件列表（压缩包大小 150.25K)

免费

概述

整体介绍

recsys_ui: 前端技术(html5+JavaScript+jquery+ajax)
recsys_web: 后端技术(Java+SpringBoot+mysql)
recsys_spider: 网络爬虫(python+BeautifulSoup)
recsys_sql: 使用SQL数据处理
recsys_model: pandas, libFM, sklearn. pandas数据分析和数据清洗，使用libFM,sklearn对模型初步搭建
recsys_core: 使用pandas, libFM, sklearn完整的数据处理和模型构建、训练、预测、更新的程序
recsys_etl：ETL 处理爬虫增量数据时使用kettle ETL便捷处理数据

设计思路

用简单地方式表述一下设计思路，

后端服务recsys_web依赖于系统数据库的推荐表‘recmovie’展示给用户推荐内容
用户对电影打分后（暂时没有对点击动作进行响应），后台应用会向mqlog表插入一条数据（消息）。
新用户注册，系统会插入mqlog中一条新用户注册消息
新电影添加，系统会插入mqlog中一条新电影添加消息

推荐模块recsys_core会拉取用户的打分消息，并且并行的做以下操作：

a.增量的更新训练样本
b.快速（因服务器比较卡，目前设定了延时）对用户行为进行基于内容推荐的召回
c.训练样本更新模型
d.使用FM，LR模型对Item based所召回的数据进行精排
e.处理新用户注册消息，监听到用户注册消息后，对该用户的属性初始化(统计值)。
f.处理新电影添加消息，更新基于内容相似度而生成的相似度矩阵

注：

由于线上资源匮乏，也不想使系统增加复杂度，所以没有直接使用MQ组件，而是以数据库表作为代替。
recsys_model属于用notebook进行数据分析和数据处理以及建模的草稿，地址为：https://github.com/GavinHacker/recsys_model
其余的所有项目的地址索引为：https://github.com/GavinHacker/technologyx