斯坦福机器学习公开课笔记 十三 推荐系统
分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.****.net/jiangjunshow
也欢迎大家转载本篇文章。分享知识,造福人民,实现我们中华民族伟大复兴!
公开课地址:https://class.coursera.org/ml-003/class/index
授课老师:Andrew Ng
1、problem formulation(问题产生)
在平时购物的时候我们都会看到网站把向我们推荐的商品放在醒目位置,其实这就是推荐系统。现在考虑一个电影推荐系统的例子,我们拥有一些用户对于一些电影的评分,如下:
从上面可以看到,用户对电影的评分分为从0到5这六个等级,有些用户没有看过某部电影,故对该电影的评价未知。分析之下能发现电影列表中的电影可以分为两个类别,上面三部都是爱情片,下面两部为动作片。现在的问题是,如何根据用户对电影的评分给用户推荐电影?
2、content-based recommendations(基于内容的推荐)
现在我们拥有用户对电影的评分,同时我们也需要知道电影的特征,基于内容的推荐的前提就是获取待推荐物品的特征信息。针对上面的例子,可以认为这些电影中只含有两类特征,一种是romance,一种是action,特征评分越高,证明该电影越倾向于这一特征,提取特征后得到的列表如下:
其中x1代表每部电影的romance等级,x2代表action等级,x(1)代表《love at last》这部电影的特征信息,其余类似,这样我们就把电影转换成了向量形式。和机器学习中的其他方法类似,我们对向量增加一维常量1,最后把每部电影转换为一个3*1的向量。现在,光有电影的特征是不够的,如果要预测用户对电影的评分,显然还需要知道用户的喜好,这里用theta表示:
可以看到,theta也是一个3*1的向量,第一维依然是常量,后两维是对两类电影的喜好,theta(1)代表第一个用户自己的喜好。有了这些信息后,就可以用theta*x来预测某个用户对于某部电影的评分情况了。不过通常情况下theta值不可能一下子看出来,是需要通过学习得到的,问题转换为求出theta,写成更规范的形式如下:
和回归类似,写出代价函数,然后用梯度下降求解:
通过这样,我们就能求出theta。
3、collaborative filtering(协同过滤)
上面求出了theta,不过细细分析后会发现关于x也是我们人为指定的,如果不指定电影的特征信息应该如下:
为了求出x,我们需要指定出theta,接下来还是那一套老路:
这下我们犯难了,theta和x都没给,那怎么求?这是一个鸡生蛋蛋生鸡的问题!这就是协同过滤要解决的难题。
4、collaborative filtering algorithm(协同过滤算法)
先对之前提出的问题进行一下总结:
可以发现,合并之后参数变成了x和theta两类,针对这个代价函数梯度下降时只能交替处理x和theta:
这样就能够在不知道x和theta的情况下进行求解了。
5、vectorization:low rank matrix factorization(矢量化-小秩矩阵分解)
其实在获取上面用户对电影的评分之后,可以用矩阵的形式进行表述:
其实Y矩阵中的元素都是通过theta和x计算得来,展开如下:
上面的矩阵可以分解为X和theta两个向量,这就是小秩矩阵分解。如果要寻找哪两种电影最相近,可以通过计算X向量中两个值的差值来判断,差值越小,则越相近:
6、implementational detail:Mean normalization(标准化)
现在我们在原来的数据上增加一列:
在这里Eve还没有对任何电影评过分,我们只能假设他对所有电影的评分都为0。此时,我们对其评分进行预测,得到的结果都为0。针对这种情况,我们先对Y进行标准化处理:
在求出均值后,对Y进行变换,用标准化后的Y来进行计算,得到的结果要加上均值,这样就能确保Eve的评分不会一直为0,这样还是比较有道理的。
------------------------------------------------------弱弱的分割线----------------------------------------------------
这一讲主要介绍了推荐系统是怎么回事,关键是要学习两个向量,物品特征向量和用户偏好向量。协同过滤的思想就是在不知道这两个向量时用梯度下降的方法对其进行求解。在把数据矩阵化之后,可以用矩阵分解的方法求解,关于具体做法很遗憾这里没有讲,最常见的恐怕是SVD方法,关于SVD的具体内容可以看这里:
http://en.wikipedia.org/wiki/Singular_value_decomposition
另外给出一个具体的例子-电影推荐系统:
http://blog.****.net/jj12345jj198999/article/details/8821419
给我老师的人工智能教程打call!http://blog.****.net/jiangjunshow
新的改变
我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:
- 全新的界面设计 ,将会带来全新的写作体验;
- 在创作中心设置你喜爱的代码高亮样式,Markdown 将代码片显示选择的高亮样式 进行展示;
- 增加了 图片拖拽 功能,你可以将本地的图片直接拖拽到编辑区域直接展示;
- 全新的 KaTeX数学公式 语法;
- 增加了支持甘特图的mermaid语法1 功能;
- 增加了 多屏幕编辑 Markdown文章功能;
- 增加了 焦点写作模式、预览模式、简洁写作模式、左右区域同步滚轮设置 等功能,功能按钮位于编辑区域与预览区域中间;
- 增加了 检查列表 功能。
功能快捷键
撤销:Ctrl/Command + Z
重做:Ctrl/Command + Y
加粗:Ctrl/Command + B
斜体:Ctrl/Command + I
标题:Ctrl/Command + Shift + H
无序列表:Ctrl/Command + Shift + U
有序列表:Ctrl/Command + Shift + O
检查列表:Ctrl/Command + Shift + C
插入代码:Ctrl/Command + Shift + K
插入链接:Ctrl/Command + Shift + L
插入图片:Ctrl/Command + Shift + G
合理的创建标题,有助于目录的生成
直接输入1次#,并按下space后,将生成1级标题。
输入2次#,并按下space后,将生成2级标题。
以此类推,我们支持6级标题。有助于使用TOC
语法后生成一个完美的目录。
如何改变文本的样式
强调文本 强调文本
加粗文本 加粗文本
标记文本
删除文本
引用文本
H2O is是液体。
210 运算结果是 1024.
插入链接与图片
链接: link.
图片:
带尺寸的图片:
当然,我们为了让用户更加便捷,我们增加了图片拖拽功能。
如何插入一段漂亮的代码片
去博客设置页面,选择一款你喜欢的代码片高亮样式,下面展示同样高亮的 代码片
.
// An highlighted block var foo = 'bar';
生成一个适合你的列表
- 项目
- 项目
- 项目
- 项目
- 项目1
- 项目2
- 项目3
- 计划任务
- 完成任务
创建一个表格
一个简单的表格是这么创建的:
项目 | Value |
---|---|
电脑 | $1600 |
手机 | $12 |
导管 | $1 |
设定内容居中、居左、居右
使用:---------:
居中
使用:----------
居左
使用----------:
居右
第一列 | 第二列 | 第三列 |
---|---|---|
第一列文本居中 | 第二列文本居右 | 第三列文本居左 |
SmartyPants
SmartyPants将ASCII标点字符转换为“智能”印刷标点HTML实体。例如:
TYPE | ASCII | HTML |
---|---|---|
Single backticks | 'Isn't this fun?' |
‘Isn’t this fun?’ |
Quotes | "Isn't this fun?" |
“Isn’t this fun?” |
Dashes | -- is en-dash, --- is em-dash |
– is en-dash, — is em-dash |
创建一个自定义列表
- Markdown
- Text-to-HTML conversion tool
- Authors
- John
- Luke
如何创建一个注脚
一个具有注脚的文本。2
注释也是必不可少的
Markdown将文本转换为 HTML。
KaTeX数学公式
您可以使用渲染LaTeX数学表达式 KaTeX:
Gamma公式展示 是通过欧拉积分
你可以找到更多关于的信息 LaTeX 数学表达式here.
新的甘特图功能,丰富你的文章
gantt
dateFormat YYYY-MM-DD
title Adding GANTT diagram functionality to mermaid
section 现有任务
已完成 :done, des1, 2014-01-06,2014-01-08
进行中 :active, des2, 2014-01-09, 3d
计划一 : des3, after des2, 5d
计划二 : des4, after des3, 5d
- 关于 甘特图 语法,参考 这儿,
UML 图表
可以使用UML图表进行渲染。 Mermaid. 例如下面产生的一个序列图::
这将产生一个流程图。:
- 关于 Mermaid 语法,参考 这儿,
FLowchart流程图
我们依旧会支持flowchart的流程图:
- 关于 Flowchart流程图 语法,参考 这儿.
导出与导入
导出
如果你想尝试使用此编辑器, 你可以在此篇文章任意编辑。当你完成了一篇文章的写作, 在上方工具栏找到 文章导出 ,生成一个.md文件或者.html文件进行本地保存。
导入
如果你想加载一篇你写过的.md文件或者.html文件,在上方工具栏可以选择导入功能进行对应扩展名的文件导入,
继续你的创作。
-
注脚的解释 ↩︎