多标签分类算法技术细节笔记
一:多标签分类算法阈值函数(Threshold Calibration)
这里的阈值函数是指:对于每一个标签的预测值,当它达到多少时被判定为此标签存在,小于多少时被判定为词标签不存在。
主要有两种阈值函数:常数阈值函数和基于训练集的阈值函数。
1. 常数阈值函数
常见的选择为0或者0.5。比如取0.5,当给定标签预测值大于它时,被判定为存在,反之不存在。
2. 基于训练集的阈值函数
二:多标签分类评价指标
三:tanh**函数的优化
它的原始公式为:(Math.exp(x) - Math.exp(-x)) / (Math.exp(x) + Math.exp(-x))
为了提高运行效率:转化为2.0 / (1.0 + Math.exp(-2.0 * inputValue)) - 1.0
它们作了等价变换。
。。。未完结
参考文献
[1] Zhang M L, Zhou Z H. A Review on Multi-Label Learning Algorithms[J]. IEEE Transactions on Knowledge & Data Engineering, 2014, 26(8):1819-1837.