【资源聚合平台】5/30日工作日志

梁惠欣

成功使用wiki的语料库训练了word2vec方法。但是,由于语料库所含文本与我们的技术专栏,提取摘要效果很差。
不太适用于我们的情况。
正在爬取技术博客文章作为语料库训练集。
改ui,明天继续改
【资源聚合平台】5/30日工作日志


邵长旭

现在能发图片了,实际是现在的内容存的html代码,所以能解析img图片,但是这样在生成摘要时直接截取前几个就不行了,做摘要提取的时候要先把各种html标签去掉,再生成摘要:
【资源聚合平台】5/30日工作日志
现在详情页面长这样,而且我看代码这应该有个关注按钮的,不知道为何不显示:
【资源聚合平台】5/30日工作日志


王子悦

继续研究AprioriAll算法的实现