用于文本汇总的数据集链接?
答
您可以使用http://archive.ics.uci.edu/ml/datasets/Legal+Case+Reports进行基于抽取的文本摘要方法。它包含catchPhrase,它可以充当选定的句子进行训练。但标语可能不太合适。
答
你可以写在一个scrapy地图爬行器用于
这可能会给你145万左右的抽象和文章。
你也可以检查这个harvardnlp sent summary数据集和CNN Dailymail数据集,它可以给一些文章的故事。
警告:由于所有这些都是不同的来源,他们的写作方式可能会有所不同。
我有和你一样的问题。你有没有找到一个好的数据集?请介意与我分享任何链接或其他内容吗? – Paniz 2014-09-26 12:00:12