图像随记

典型关联分析CCA:关联关系算法,降维比较相关性。

降维原则:
PCA:无监督学习,投影方差最大
LDA:监督学习,同类投影方差小,异类间投影方差大。LDA关心的是能够最大化类间区分度的坐标轴成分
图像随记
图像随记
PCA:
1.线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。
2.减少数据集的维数,保持数据集的对方差贡献最大的特征。
3.这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。但是,这也不是一定的,要视具体应用而定。
4.数据主成分(特征向量),权值(特征值)

相关参数:
反映变量间密切程度的统计指标,相关系数

Pearson相关系数:衡量两个数据集合是否在一条线上面,定距变量间的线性关系。

图像随记

TF-IDF:信息检索,加权技术。词频-逆文本频率指数
TF表示词条在文档d中出现的频率
IDF:包含词条t的文档越少,即n越小,IDF越大,则说明词条t具有很好的类别区分能力