0%

构建简单社交推荐系统——绪论

自动摘要: date:2018041714:23:59 1.兴趣来源 推荐系统的研究和应用从90年代开始兴起,到现在己经有近30年的历史。GroupLens最初研究推荐Usenet上的新闻 ……..

date: 2018-04-17 14:23:59

1.兴趣来源

推荐系统的研究和应用从90年代开始兴起,到现在己经有近30年的历史。GroupLens最初研究推荐Usenet上的新闻给可能感兴趣的用户。用户只需要提供对一些新闻的评分或者网站上行为数据,系统就会结合其他用户的评分和行为给出个性化推荐。在这个系统中用户可以在对其他用户或者新闻一无所知的情况下获得推荐。随后推荐系统在机器学习信息检索等领域迅速掀起热潮,众多领域开始引入推荐系统。 最有影响力的推荐应用当属亚马逊购物推荐系统,系统根据用户购买,浏览和评价历史和当前的查看的产品,推荐用户可能购买的其他产品。 在当今网络社交高涨的年代,人人都不易出门交友,导致大部分人朋友圈狭隘。假设有个好友推荐系统,能让用户匹配到性格相似,话语投机的网友,或许可以让冷漠的网络成为一方心灵疏导的乐土。

2.面临难题。

1.数据收集

社会加速发展,人的观念也在加速变化,无法花费大量成本收集到最新数据。

2.数据稀疏

用户之间评分,评价非常少。

3.冷启动问题

新用户无历史数据无法推荐。

4.如何制定评分标准

一个好的评分标准直接关系到推荐系统的性能。

5.如何计算推荐效果

一个好的推荐系统应该具有健壮性,让大多数人信赖。

3.协同过滤推荐算法

协同过滤是从当前过去的行为和其他用户对当前用户评分来构建模型。

因为写过简单的电影推荐,所以继续采用K-最近邻(KNN)算法构建推荐系统。

KNN是用k个最近邻的训练数据集来寻找位置对象分类的算法(多数表决法)。

一般分为三个步骤:

  1. 定义相似度,
  2. 选择近邻,
  3. 预测。

4.用户关系网络图

用户-标签, 用户-评分等等之间联系组成一个网络图, 每个用户都是一张图, 用户-用户间又是一张图, 为了简化复杂的网络图,
将一个评价赋予权重, 然后将每个用户的评价构成向量C=(V,D), 评价与评价间做余弦定理,计算余弦值,大于阈值,则说明评价对用户无关, 小于阈值,则说明有关。如此迭代,最后将整个网络看成整体,
将用户看成一个向量,计算用户与用户间相似性。

待续。。。。。

欢迎关注我的其它发布渠道