IBM PowerAI人工智能编程马拉松——探秘金融语音大数据的商业价值

IBM PowerAI人工智能编程马拉松——探秘金融语音大数据的商业价值
大赛介绍
本次大赛是面向全球金融行业AI技术精英的编程竞赛。通过开放真实的数据，结合金融行业热点课题，向算法天才征集更聪明的解决方案；并有机会直接将其应用于金融行业，建立新的商业模式。大赛由IBM和CSDN共同主办，主题为“PowerAI 人工智能马拉松编程大赛——探秘金融语音大数据的商业价值！”大赛将聚焦金融行业语音大数据，基于人工智能相关技术，计算有关金融场景的信息聚类，将电话银行海量通话内容结构化，并打上各类标签。通过挖掘分析有价值信息，为服务与营销提供数据与决策支持，发现最新的市场机遇和客户关注热点。

所有参赛团队，将现场免费体验IBM专门为人工智能所建的高性能计算服务器PowerAI。PoweAI人工智能平台基于Power8体系结构，支持开源机器学习和深度学习架构，包括CAFFE, Chainer, TensorFlow, Theano, Torch, cuDNN, NVIDIA DIGITS以及其它若干个机器学习与深度学习架构和库。参赛者将轻松便捷地使用这些人工智能方法，创建新的计算机模式以高效的对数据进行分析。

题目说明
1.大赛会提供训练样本数据。数据文件分为两部分，训练和测试部分。训练部分包括：

a) 话内容文件（文件格式可能存在转码需求，选手需要考虑）
对话内容分为11类

b) 对话内容标签文件，包括理财产品分类和意愿分类（肯定，否定，疑问）

c) 语料文件-文件格式为txt格式。内容包括中文和标点符号。文章内容是金融相关的文章。文件总量在50M左右。参赛团队可以利用这些文件来建立自己的语言模型，分词模型等

d) 训练数据：每个分类的样本个数不少于150条。数据样本间有一定区分度

2.参赛者需要根据训练文件进行购买产品分类和意愿分类。

3.大赛鼓励参赛选手自己构建分词和语言模型，如果选手选择使用第三方分词或者语言模型需要自己解决平台依赖。

评审规则
1.实现对话内容分类（金融产品和意愿）功能25分
2.正确率评分标准（Precision） 40分
金融产品分类对测试Top1正确率：分为5档，档位为95%以上正确率20分，85%以上15分，80%以上10，70%以上5，其他0分。
客户意愿分类测试Top1正确率：分为5档，档位为95%以上正确率20分，85%以上15分，80%以上10，70%以上5，其他0分。
3.性能评分标准(25分)
取前5名，档位为第一名 25分，第二名 20分，第三名 15分，第四名 10分，第五名 5分，其他0分。
4.附加分：10分
a) 选手根据大赛提供语料库训练分词系统并应用于后面的文本分类5分
b) 选手使用深度学习框架生成词向量病应用于后面的文本分类5分

奖品设置
最佳分析师1名 10000元
数据科学家2名 8000元
挖掘精英3名 5000元
参与奖 50京东卡到场参赛即可获得
鼓励奖100元京东卡到场参赛并提交作品即可获得

立即报名
更多详情请参看大赛官网：http://powerai.csdn.net/finance

IBM PowerAI人工智能编程马拉松——探秘金融语音大数据的商业价值

相关推荐