如何将HTML转换为XML(符合XML模式或DTD)

问题描述:

我试图在Ubuntu上将一些HTML文件转换为XML格式,并且它们应该符合特定的XML模式或DTD。我猜Tidy应该这样做,但我不明白它的语法。或者如果有其他工具,我很乐意尝试一下。 例如:转换file.htmfile.xml(这符合standard.DTD) 感谢如何将HTML转换为XML(符合XML模式或DTD)

整洁可以转换HTML为XHTML(元素和属性的结构相同,但满足XML良构的规则),但它不能将其转换为符合某些任意DTD的要求。

你需要在这两种数据格式之间写一个明确的映射。 XSLT是一种流行的语言。

+0

如果我有一个XSLT脚本。你能建议我可以用于转换的任何程序吗?我想Visual Studio可以做到这一点,但我已经尝试不了解它,我受到时间的限制。谢谢 – TheSolider