数据挖掘导论课后习题答案 第二章(二)
19.余弦计算公式:
相关计算公式:
欧几里得公式:
Jaccard 系数:
(a)
cov=0
(b)
cov=-1
d(x,y)=2
(c)
\
cov=0
d(x,y)=2
(d)
cov=0.25
J=0.6
(e)
cov=0
20.
(a)[-1,1].很多时候数据正值比较多,因此只有[0,1]
(b) 两个对象相似,但是对象的值不一定相等,比如向量x=(1,1,1,1),y=(2,2,2,2)
(c)如果两个向量有平均值0,cov(x,y)=cos(x,y)
(d)因为所有的100,000个点能够落入曲线上,所以欧几里得距离和余弦度量存在函数关系。具体来说,欧几里得距离和余弦度量存在相反关系。举例说明,如果两个点是一样的,他们的余弦度量是相似的,他们的欧几里得距离是0,但是如果两个数据有很高的欧几里得距离,它们的余弦度量就接近于0,请注意,所有示例数据点 来自正象限,即只有正值。这个意味着所有的余弦值都是正的。
(e)因为所有的100,000个点能够落入曲线上,所以欧几里得距离和相关性存在函数关系。具体来说,欧几里得距离和相关性存在相反关系。举例说明,如果两个点是一样的,他们的相关性是相似的,他们的欧几里得距离是0,但是如果两个数据有很高的欧几里得距离,它们的相关就接近于0,请注意,所有示例数据点 来自正象限,即只有正值。这个意味着所有的相关值都是正的。
(f)
(g)
21题以后的题目偏定理证明题目,对于初学者来说先熟悉概念和应用比较重要。所以有空再翻译啦