Improving EEG-Based Emotion Classification Using Conditional Transfer Learning论文解读
文章问题提出:情感分类需要每个人提供大量的校准数据但那是费时费力的,怎么才能不通过增加样本数据下提高检测的准确度?
文章方案:通过条件迁移学习来解决那些样本分类不好的个体,即从源域中选取与目标域相似的样本,组成新的源域从而提高检测的准曲率。
dataset: Oscar soundtrack EEG dataset.26个个体每个人有16段的30-s 30-channel
脑电实验和自我评价labels.
情感两分类:(积极、高兴VS消极、悲伤)
特征选择:ReliefF算法
每一类的预测分类:Gaussian Naïve Bayes (GNB)
源域:Ds 学习任务:Ts TS:目标域个体 SSs:源域中存在的用作迁移和学习的个体
目标域:Dt 学习任务:Tt TSs:目标域库
the condition T S 6= T T means either Y S 6= Y T or P(Y S |X S ) 6= P(Y T |X T ):源域和目标域数据和标签皆不同。
何时迁移:当模型的准确度小于等于chance level
如何迁移:从源域库中选取最为相似的样本。个体特征相似性度量:ReliefF-sorted ,TL框架包括一组最相似的SS作为训练数据,以开发给定TS的新情绪分类模型。
迁移什么:对TS和SSs和特征进行迁移,将所选择的源域和目标域数据连在一起,形成通用信息丰富的特征空间。然后使用增强的训练数据和改进的特征空间来重建TS的情绪分类模型。
The TL steps in each LTO repetition are described as follows:
1、计算TS和SSs空间相似性.
用15次实验去形成目标域样本特征空间,计算目标域样本特征空间与SSn(25)中每个个体的相似性(皮尔逊相关系数)。
2、迁移与目标域数据最相似的个体
将TS的15个训练试验与O个最相似的SS(s)的数据试验合并,其中O是被选择的受试者的数量,然后使用增强的数据集(15 + O×16试验)重新形成 TS的特征空间使用ReliefF。
3、优化特征空间TS
为了在分类器建模期间丢弃类不平衡问题的影响,该步骤在增强训练试验中随机选择类平衡样本,重复500次,以试图产生最佳但公平的训练模型。 每次重复应用5倍交叉验证并添加一个特征,即,一次添加具有高ReliefF分数的一个特征,利用具有最大训练准确度的最佳特征子空间的方法。
4、用TS训练和测试迁移moudle
GNB模型通过增强和特征空间优化的数据试验进行了重新训练,并针对TS的脱节左侧试验进行了测试。
分类器采用 Gaussian Naïve Bayes (GNB)
迁移方案: