如何在Java中

问题描述:

非特殊字符编码为HTML实体下面的代码:如何在Java中

org.apache.commons.lang.StringEscapeUtils.unescapeHtml("Hello World"); 

给出:

Hello World 

,但我想知道如何要回解码来自“Hello World”的字符串。我已经尝试过escapeHtml方法,但这只能编码特殊字符。

但我想知道如何从“Hello World”返回解码后的字符串。我已经尝试过escapeHtml方法,但是这没有做任何有用的事情。

对于“任何有用的”都不是真的;如果您的测试字符串包含HTML特殊字符,如<,>,&,该函数会将其转换为& lt; & gt;和& amp; (并将其他较高的ISO8859-1代码更改为实体)。

如果你需要对其进行编码,回为Unicode实体格式,只需通过串码点迭代:

for (int i = 0; i < str.length(); i++) 
    System.out.print("&#" + str.codePointAt(i) + ";"); 
+0

谢谢玛达。我已经编辑了我的问题来反映答案,但留下了相同的问题,因为我知道特殊字符被编码。 – Custard