用于文本汇总的数据集链接?

问题描述:

任何人都有文本摘要的数据集下载链接,如DUC 2007或TREC? 请帮帮我。用于文本汇总的数据集链接?

+0

我有和你一样的问题。你有没有找到一个好的数据集?请介意与我分享任何链接或其他内容吗? – Paniz 2014-09-26 12:00:12

您可以使用http://archive.ics.uci.edu/ml/datasets/Legal+Case+Reports进行基于抽取的文本摘要方法。它包含catchPhrase,它可以充当选定的句子进行训练。但标语可能不太合适。

可以完成一些组织后访问DUC数据集和个人协议..kindly参考http://www-nlpir.nist.gov/projects/duc/data.html了解更多信息

你可以写在一个scrapy地图爬行器用于

这可能会给你145万左右的抽象和文章。

你也可以检查这个harvardnlp sent summary数据集和CNN Dailymail数据集,它可以给一些文章的故事。

警告:由于所有这些都是不同的来源,他们的写作方式可能会有所不同。