个人作品展示---基于Spark的电影推荐系统

该项目是本人参加山东省软件设计大赛过程中参照网上相关开源算法完成的作品

一、项目背景
随着互联网技术的快速发展与普及,在线电影数量飞速增长,要想从众多的电影中选择一部自己想看的电影变得越来越困难。为了得到更好的观影体验,推荐系统应运而生。
推荐系统是解决在海量信息中获取用户想得到数据的利器,给用户带来良好的体验。
二、项目简介
该作品是以MovieLens数据集和TMDB网站数据作为依托,基于Spark大数据平台搭建的电影推荐系统。包含了离线推荐与实时推荐体系。提供了从前端应用、后台服务、算法设计实现、平台部署等多方位的闭环的业务实现。
三、架构设计及数据流图
个人作品展示---基于Spark的电影推荐系统
个人作品展示---基于Spark的电影推荐系统
四、数据源介绍及处理过程
个人作品展示---基于Spark的电影推荐系统
个人作品展示---基于Spark的电影推荐系统
五、模块设计

1.离线推荐模块
个人作品展示---基于Spark的电影推荐系统
离线推荐模块核心算法实现流程
个人作品展示---基于Spark的电影推荐系统
个人作品展示---基于Spark的电影推荐系统
个人作品展示---基于Spark的电影推荐系统
个人作品展示---基于Spark的电影推荐系统
2.实时推荐模块
个人作品展示---基于Spark的电影推荐系统
实时推荐模块核心算法:推荐优先级的计算
个人作品展示---基于Spark的电影推荐系统
个人作品展示---基于Spark的电影推荐系统
3.相似推荐模块
个人作品展示---基于Spark的电影推荐系统
个人作品展示---基于Spark的电影推荐系统
4.统计推荐模块
个人作品展示---基于Spark的电影推荐系统
个人作品展示---基于Spark的电影推荐系统
六、冷启动问题的处理
个人作品展示---基于Spark的电影推荐系统