您的位置: 首页 > 技术问答 > 通用标记语言解析器 通用标记语言解析器 分类: 技术问答 • 2022-06-30 21:29:43 问题描述: 我想解析一个html页面并从中提取标签。我需要一些好的算法在C语言中做这些建议?我试图寻找库,但多数人似乎支持Python和Ruby或Java但遗憾的是没有什么是有C.通用标记语言解析器 +0 看看libxml2,htmltidy,expat等 – 2013-03-14 07:37:01 +0 谢谢你的帮助,我确实研究过它们,看起来它们可能很有用,但是我想从头开始编写我自己的解析器,然后递归下降的方式来编写它好。?我不想一次解析文件一个字符,任何更好的方法来提高解析速度。 – user2164540 2013-03-14 08:55:50 答 尝试使用HTML整洁 更多的参考可以在这里找到: http://curl.haxx.se/libcurl/c/htmltidy.html
看看libxml2,htmltidy,expat等 – 2013-03-14 07:37:01
谢谢你的帮助,我确实研究过它们,看起来它们可能很有用,但是我想从头开始编写我自己的解析器,然后递归下降的方式来编写它好。?我不想一次解析文件一个字符,任何更好的方法来提高解析速度。 – user2164540 2013-03-14 08:55:50