天池NLP中文预训练模型赛来了!
↑↑↑关注后"星标"Datawhale
每日干货 & 每月组队学习,不错过
Datawhale赛事
主办单位:阿里云,CLUE,乐言科技
自从2017年具有划时代意义的Transformer模型问世以来,短短两年多的时间内,如雨后春笋般的出现了大量的预训练模型,比如:Bert,Albert,ELECTRA,RoBERta,T5,GPT3等等。然而之前的基准评测体系存在两个缺陷:评测强度不够,模型不通用。评测强度不够指的是选手只提交结果,不提交inference的代码。模型不通用指的是预训练模型不能保证在相同超参数情况下在所有任务上都获得比较好的性能。以上两点极大限制了预训练技术的应用和发展。如果我们能通过算法实现泛化能力强的中文预训练模型,这将提高下游业务的准确性,从而提升企业的核心竞争力,并为企业创造更多的价值。
为此阿里云计算平台PAI团队联合CLUE中文语言理解评测组织和上海乐言信息科技有限公司,共同推出中文预训练模型泛化能力挑战赛,邀请业内算法高手、爱好者一起促进自然语言处理预训练技术的发展。
1本赛题精选了以下3个具有代表性的任务,要求选手提交的模型能够同时预测每个任务对应的标签:
-
任务1:OCNLI–中文原版自然语言推理
-
任务2:OCEMOTION–中文情感分类
任务3:TNEWS–今日头条新闻标题分类
-
2 专属组队交流群,阅读原文报名
竞赛组队交流群
鱼佬,武汉大学硕士,2020腾讯广告算法大赛冠军
阿水,北航计算机硕士,CV领域Top选手
杰少:南京大学硕士,DCIC冠军选手
报名地址(如果群满后台回复 天池 进新群):
https://tianchi.aliyun.com/s/47420d202909774a1960635ac9d29aea
点击【阅读原文】直接报名↓