中国首个开源基金会成立;京东 AI 研究院获 QuAC 机器阅读理解竞赛冠军
开发者社区技术周刊又和大家见面了,快来看看这周有哪些值得我们开发者关注的重要新闻吧。
京东AI研究院获QuAC机器阅读理解竞赛冠军
中国首个开源基金会成立,已有七个项目加入孵化
COVID-19大流行期间的云计算市场发展趋势
TIOBE 9 月榜单:C++ 重振旗鼓
星链网络延迟低于 20 毫秒,SpaceX 计划在美国多州公测
16 岁少年为逃课策划 8 次 DDoS 攻击,地区网络也崩溃了
CnGAN:面向跨网用户偏好推荐的生成对抗网络
ECCV 2020 Spotlight丨图像定位上的细粒化区域相似性自监督
SemanticPOSS-具有大量动态实例的点云数据集
技 术 要 闻
Industry News
▲▲▲
近日,在斯坦福大学、华盛顿大学、Allen AI 和 UMass 联合发起的机器阅读理解(QuAC[1] (Choi et al., 2018))比赛上,京东 AI 研究院语音语言实验室提出的 EL-QA 模型(Single Model)登顶 QuAC Leaderboard,全部三项指标均获得第一名。其中,在 F1-Measure(又称为 F1-Score) 指标上达到 74.6,大幅拉近了机器与人类在该任务上的差距水平。这也意味着以零售、物流、金融、客服等优质场景为依托的京东 AI 研究院,在机器阅读理解能力上取得了突飞猛进的成果。
9 月 9 日,中国首个开源软件基金会「开放原子开源基金会(OpenAtom Foundation)」官方正式对外发声。开放原子开源基金会作为中国首个在民政部注册的致力于开源产业公益事业的非营利性独立法人机构,也是目前唯一一个以开源为主题的基金会。 其服务范围包括开源软件、开源硬件、开源芯片及开源内容等,开放原子基金会成立的初衷是致力于为各类开源项目提供中立的知识产权托管,保证项目的持续发展不受第三方影响的同时,通过开放治理寻求更丰富的社区资源的支持与帮助,包括募集并管理资金,法律、财务等专业支持。根据网站提供的信息,目前该基金会拥有七个孵化项目。
IDC 报告称,随着全球冠状病毒大流行,到 2020 年第一季度在云基础设施上的支出增长了 2.2%。这个数字看似微不足道,但与同期非云相关 IT 投资的支出下降 16.3% 相比,这一数字意义重大。显然,随着企业在大流行造成的经济灾难中收紧 IT 预算,他们正在为云计算设置例外。同样, MariaDB 的一项调查发现,由于大流行,有 40% 的公司报告加速了向云的迁移。
2003 年是 C++ 的巅峰时期,当年 8 月,它的 TIOBE 排名峰值为 17.53%,接近第二名,并拿下了当年的年度编程语言奖。但 2005 年之后,C++ 的榜单排名再也没有超过 10%,甚至在 2017 年达到历史最低值 4.55%。但是,与去年相比,C++ 现在是榜单中增长最快(+1.48%)的语言。TIOBE CEO Paul Jansen 认为,新的 C++ 20 标准带来了极大的正面影响。C++ 的积极趋势赶超了其他语言,例如 R(+1.33%)和 C#(+1.18%),以及与去年相比损失了 3.18% 排名率的 Java。
在最近提交给美国联邦通信委员会(FCC)的一份演示文稿中,美国太空探索技术公司 SpaceX 披露了其星链互联网的两项重要测试结果。演示文稿显示,SpaceX 使用美国互联网流量监测机构 Ookla 的 Speedtest.net 服务进行了两项基准测试,星链互联网的下载速率为 102 至 103Mbps,上传速率为 40 至 42Mbps,延迟为 18 至 19 毫秒。这意味着,该网络可以支持多个用户同时玩多人视频游戏和观看超高清视频,且已实现 20 毫秒以下的延迟,与地面宽带大致相当。
近日,一位来自佛罗里达州的 16 岁高中生策划了 8 次 DDoS 攻击,不仅让全校线上课程不得不终止了一段时间,还间接导致了地区级网络崩溃。在学校的官方声明中写到:“这位学生承认策划了八次旨在使地区网络崩溃的 DDoS 攻击。”这名学生表示自己是使用开源工具 LOIC 破坏了网络,而大多数基本的防火墙软件都能捕捉到这个工具。
学 术 前 沿
Academic News
▲▲▲
对于推荐系统大家早已见怪不怪了,购物平台上有淘宝,京东,拼多多,音乐平台上有 QQ 音乐和网易音乐,视频平台上有优酷和爱奇艺,它们共同的特点就是根据自己的喜好和浏览记录进行个性化的推荐。但还有一种推荐方式是跨平台跨网络的推荐方式,它的一个主要缺点是只能应用于重叠的用户。因此,构成大多数用户的非重叠用户容易被忽略。本文针对这个问题提出了一种新的基于多任务学习的编码器 GAN 推荐体系结构——CnGAN。
论文链接:https://arxiv.org/abs/2008.10845
图像定位(Image-based Localization)技术旨在不借助 GPS 等额外信息的情况下估计出图像所在的地理位置,该技术被广泛应用于 SLAM、AR/VR、手机拍照定位等场景。香港中文大学博士团队针对大规模图像定位中的弱监督问题提出有效的解决方法,旨在通过自监督学习的方法充分挖掘表征学习中的难样本,并进一步将图像级监督细粒化为区域级监督,以更好地建模图像与区域间的复杂关系。
利用该算法训练的模型具有较强的鲁棒性和泛化性,在多个图像定位数据集上进行了验证,准确度大幅超越最先进技术高达 5.7%,代码和模型均已公开。
论文链接:https://arxiv.org/abs/2006.03926
近年来,针对三维语义分割任务的深度学习模型得到了广泛的研究,但它们通常需要大量的训练数据。然而,目前用于三维语义分割的数据集存在point-wise标注少、场景多样少、对象动态的少的缺点。本文提出了SemanticPOSS数据集,其中包含2988个具有大量动态实例的各种复杂的LiDAR扫描。这些数据是在北京大学收集的,使用与SemantiKITTI相同的数据格式。此外,作者在SemanticPOSS数据集上对几种典型的3D语义分割模型进行了评估。实验结果表明,SemanticPOSS能够在一定程度上提高人、车等动态对象的预测精度。
论文链接:https://arxiv.org/pdf/2002.09147.pdf
*以上信息来源于网络,由“京东智联云开发者”公众号编辑整理,不代表京东智联云立场*