在PHP中从HTML中提取句子

问题描述:

我正在做一个PHP项目(使用Codeigniter)进行文本摘要,并且需要从Rich TextBox的内容中提取句子(此内容包含标签)。因此有没有一种合适的方法或Codeigniter库来从包含HTML标签的内容中提取语句在PHP中从HTML中提取句子

PHP函数strip_tags()应该帮助你。它返回没有PHP和HTML标签的字符串。如果您只需要计算句子,则可以执行计数(爆炸(“。”,$ text))分隔符是句子的典型结尾。

简单而有限,但不需要任何库。

+0

谢谢.. explode(“。”,$ text)可以使用。此外它需要一点修改来检查是否“。”表示行结束或其他任何内容,例如“。”分数。 – Hydrogirl

这种技术被称为网络刮

看一看this