Kaggle学习(一)产品和搜索词语相关性自动评价

Kaggle学习(一)产品和搜索词语相关性自动评价
Kaggle学习(一)产品和搜索词语相关性自动评价
Kaggle学习(一)产品和搜索词语相关性自动评价

测试集输入到模型中输出评价和实际评价相比较
Kaggle学习(一)产品和搜索词语相关性自动评价
评分标准:
Kaggle学习(一)产品和搜索词语相关性自动评价
Kaggle学习(一)产品和搜索词语相关性自动评价
Kaggle学习(一)产品和搜索词语相关性自动评价
原先是2被评价成1的有100个,被评价成2的有200个
为什么这么设置:
Kaggle学习(一)产品和搜索词语相关性自动评价
提交几百万次————
限制提交次数
最好的情况
Kaggle学习(一)产品和搜索词语相关性自动评价
冠军思路
Kaggle学习(一)产品和搜索词语相关性自动评价
去掉html标签,拼写错误的单词/同义词替换掉,Stemming(统计词的原型,比如动词和形容词统一成名词,复数统一成单数)

**组合提升:**弱分类器——强分类器
Kaggle学习(一)产品和搜索词语相关性自动评价
无免费午餐定理Kaggle学习(一)产品和搜索词语相关性自动评价
Kaggle学习(一)产品和搜索词语相关性自动评价
Kaggle学习(一)产品和搜索词语相关性自动评价
模型是已经做好了的
http://www.cnblogs.com/zongfa/p/9304353.html
X0和X1的区别:X0分错的会在X1里面重点关照
Kaggle学习(一)产品和搜索词语相关性自动评价
Kaggle学习(一)产品和搜索词语相关性自动评价
Kaggle学习(一)产品和搜索词语相关性自动评价