国际数据挖掘顶会 KDD 2019 应用方向冠亚军论文《Actions Speak Louder than Goals: Valuing Player Actions in Soccer》解读

KDD解读

第 25 届 ACM SIGKDD 知识发现和数据挖掘会议(KDD)已于今年 8 月 4 日在美国阿拉斯加州安克雷奇开幕。今年的大会奖项分为研究方向和应用数据科学方向。在今天公布的最佳论文中,康奈尔大学的《Network Density of States》获得了研究类最佳论文奖;而应用数据科学方向的最佳论文为《Actions Speak Louder than Goals: Valuing Player Actions in Soccer》,这是一篇有关足球技术分析方面的研究,来自比利时天主教鲁汶大学以及体育分析公司 SciSports。

为了提升论文接收的质量,KDD 2019 首次采用了双盲*,本次大会也对研究的可复现性提出了新的要求,强调其为「论文审核过程中的一个重要因素」,只有包含两页可复现性内容附录的文章才有可能被评为 KDD 最佳论文。

KDD 对论文接收非常严格,每年的接收率均未超过 20%。本届大会在应用数据科学方向共收到大约 700 篇论文,其中 45 篇 oral 论文,约 100 篇被接收为 poster 论文;研究方向共收到约 1200 篇投稿,其中约 110 篇 oral 论文,60 篇 poster 论文,接收率仅为 14%。

国际数据挖掘顶会 KDD 2019 应用方向冠亚军论文《Actions Speak Louder than Goals: Valuing Player Actions in Soccer》解读

获得 KDD 2019 应用数据挖掘方向最佳论文的研究来自于比利时天主教鲁汶大学和体育分析公司 SciSports,研究有关使用新方法评价足球运动员的能力:球员在场上的动作比进球更有价值,这是一项颇具《Money Ball》风格的工作。

最佳论文

  • 标题:Actions Speak Louder than Goals: Valuing Player Actions in Soccer

  • 作者:Tom Decroos、Lotte Bransen、Jan Van Haaren、Jesse Davi

  • 链接:https://arxiv.org/pdf/1802.07127.pdf

评估足球运动员比赛中个人行动所造成的影响是评估他们的重要指标。然而,大多数传统指标在解决此类任务时效果都不尽如人意,因为它们只关注整场比赛中仅有的几次特殊动作,比如射门和进球——而忽视了行动的背景。

研究人员提出的方法包括:

  • 一种用于描述球场上各个球员动作的新语言;

  • 基于它对比赛结果的影响来评估任何类型球员动作的框架,同时考虑了动作发生的背景。

国际数据挖掘顶会 KDD 2019 应用方向冠亚军论文《Actions Speak Louder than Goals: Valuing Player Actions in Soccer》解读

国际数据挖掘顶会 KDD 2019 应用方向冠亚军论文《Actions Speak Louder than Goals: Valuing Player Actions in Soccer》解读

国际数据挖掘顶会 KDD 2019 应用方向冠亚军论文《Actions Speak Louder than Goals: Valuing Player Actions in Soccer》解读

2017/18 赛季英超联赛进攻球员的排名与身价对比(出场时间至少为 900 分钟)。上表为进球+助攻数的排名,下表为使用新方法 VAEP 的排名。球员身价为 2019 年 2 月德国转会市场的估价。

通过评估足球运动员的动作「价值」,我们就可以量化他们对球队的总体进攻和防守贡献。研究人员展示了使用新方法如何找到传统球员评估方法忽略的信息,有关用例已在 2016/17 和 2017/18 赛季欧洲*联赛球探考察球员以及比赛风格描述工作中使用。

应用方向亚军论文

  • 论文:Developing Measures of Cognitive Impairment in the Real World from Consumer-Grade Multimodal Sensor Streams

  • 作者:Richard Chen、Filip Jankovic、Nikki Marinsek(苹果、Evidation Health、礼来公司、)

  • 链接:http://alessiosignorini.com/articles/developing-measures-cognitive-impairment-multimodal-sensor-streams/paper.pdf

据估计,全球约有 4680 万人患有痴呆症。痴呆症的早期诊断是一项临床挑战,而且非常耗时。早期症状通常并不明显,而且长期潜伏,很容易被忽视为「正常老化」。

可穿戴消费设备、移动计算平台(智能手机、智能手表、平板电脑)和多种传感器模式的普及和进步,使得痴呆症高危人群或患者日常活动的持续监测成为可能。这些丰富的纵深信息可以用来挖掘认知障碍的生理和行为特征,从而为及时、经济、有效地检测轻度认知功能障碍(介于正常衰老和痴呆之间的一种中间状态)提供了新的途径。

在本文中,研究者提出了一个平台,可以利用消费级智能设备来远程监控认知障碍相关症状,并且不对用户生活造成明显影响。通过礼来公司一项为期 12 周的探索性数字评估研究,研究者监测了 31 名认知障碍患者和 82 名无认知障碍患者在*生活条件下的情况,并利用该平台收集了 16TB 的数据。

研究者描述了如何谨慎地使用数据统一(data unification)、时间对齐(time alignment)和缺失值处理技术(imputation technique)来处理真实环境中固有的数据缺失率,并展示了这些数据的实用价值。