语言模型

关联规则多用于推荐系统,但是目前大部分的推荐都是推荐关联度高的信息。
但是可以反向使用关联规则来帮助我们找出停滞词(无关词)

序列模型的采样

语言模型

gram模型的缺点:
参数系数,参数空间过大,存储和内存吃不消
没有考虑文本中出现过多的废话词,可以用tf-idf优化
没有考虑久远之前出现的词语对现在的影响,可以用bigram、trigram等词袋模型解决

你知道的越多,你不知道的越多。
有道无术,术尚可求,有术无道,止于术。
如有其它问题,欢迎大家留言,我们一起讨论,一起学习,一起进步