原文链接
本文是人工智能著名学者Yann Lecun的作品
代码链接
摘要
传统解决NLP任务的网络结构为RNN和CNN,但是比起在图像领域的效果,CNN在NLP领域的效果实在是差强人意,本文提出了一种新型的CNN结构,它直接在字符级别上进行操作,并且只使用简单的卷积和池化操作。本文实验表明,模型的性能随着深度的增加而增加,本文最终使用了29个卷积层,在公开数据集上进行了测试,发现效果不错。
模型
本文模型如下图所示:
其中Convolutional Block的结构如图所示:
模型的深度可调,本文尝试了如下几种结构: