贪心科技SkipGram 2020.4.3笔记

Skip-Gram模型理解
老铁整理的视频
明天补吧,搞不定了
独热编码不能表达两个单词相似度
不等同于词向量
独热用01稀疏向量,分布式用稠密向量
可以说分布式表示有一种含义
希望machine与apple相似度大于apple的相似度
区别:独热----》向量大小是词库大小
分布式----》长度可以设定,也就是超参数的作用

得到不同单词的词向量,句子用平均
贪心科技SkipGram 2020.4.3笔记
第三个区别:容量
100维独热最多100不同单词
分布式100维可以表示无穷多单词,每一位有无穷可能贪心科技SkipGram 2020.4.3笔记
如何学习词向量:
需要模型,也就是词向量的模型,有很多
MF:矩阵分解
SkipGram很合适初学
希望学出每一个单词的词向量,找出单词关系
离越近,相似度 (可能)越大(不是所有情况)(反正相关性要大)
1.去掉knowleg之后,希望利用周围信息预测
2.用know预测周围单词