IBM PowerAI人工智能编程马拉松——探秘金融语音大数据的商业价值

IBM PowerAI人工智能编程马拉松——探秘金融语音大数据的商业价值
大赛介绍
本次大赛是面向全球金融行业AI技术精英的编程竞赛。通过开放真实的数据,结合金融行业热点课题,向算法天才征集更聪明的解决方案;并有机会直接将其应用于金融行业,建立新的商业模式。大赛由IBM和CSDN共同主办,主题为“PowerAI 人工智能马拉松编程大赛——探秘金融语音大数据的商业价值!”大赛将聚焦金融行业语音大数据,基于人工智能相关技术,计算有关金融场景的信息聚类,将电话银行海量通话内容结构化,并打上各类标签。通过挖掘分析有价值信息,为服务与营销提供数据与决策支持,发现最新的市场机遇和客户关注热点。

所有参赛团队,将现场免费体验IBM专门为人工智能所建的高性能计算服务器PowerAI。PoweAI人工智能平台基于Power8体系结构,支持开源机器学习和深度学习架构,包括CAFFE, Chainer, TensorFlow, Theano, Torch, cuDNN, NVIDIA DIGITS以及其它若干个机器学习与深度学习架构和库。参赛者将轻松便捷地使用这些人工智能方法,创建新的计算机模式以高效的对数据进行分析。

题目说明
1.大赛会提供训练样本数据。数据文件分为两部分,训练和测试部分。训练部分包括:

a) 话内容文件(文件格式可能存在转码需求,选手需要考虑)
对话内容分为11类

b) 对话内容标签文件,包括理财产品分类和意愿分类(肯定,否定,疑问)

c) 语料文件-文件格式为txt格式。内容包括中文和标点符号。文章内容是金融相关的文章。文件总量在50M左右。参赛团队可以利用这些文件来建立自己的语言模型,分词模型等

d) 训练数据:每个分类的样本个数不少于150条。数据样本间有一定区分度

2.参赛者需要根据训练文件进行购买产品分类和意愿分类。

3.大赛鼓励参赛选手自己构建分词和语言模型,如果选手选择使用第三方分词或者语言模型需要自己解决平台依赖。

评审规则
1.实现对话内容分类(金融产品和意愿)功能25分
2.正确率评分标准(Precision) 40分
金融产品分类对测试Top1正确率:分为5档,档位为95%以上正确率20分,85%以上15分,80%以上10,70%以上5,其他0分。
客户意愿分类测试Top1正确率:分为5档,档位为95%以上正确率20分,85%以上15分,80%以上10,70%以上5,其他0分。
3.性能评分标准(25分)
取前5名,档位为第一名 25分, 第二名 20分, 第三名 15分,第四名 10分, 第五名 5分, 其他0分。
4.附加分:10分
a) 选手根据大赛提供语料库训练分词系统并应用于后面的文本分类5分
b) 选手使用深度学习框架生成词向量病应用于后面的文本分类5分

奖品设置
最佳分析师1名 10000元
数据科学家2名 8000元
挖掘精英3名 5000元
参与奖 50京东卡 到场参赛即可获得
鼓励奖100元京东卡 到场参赛并提交作品即可获得

立即报名
更多详情请参看大赛官网http://powerai.csdn.net/finance