如何在javascript中解码unicode和utf-8的字符串?

问题描述:

好的请帮助 - 我在解决所有的Unicode字符串中的unicode/utf-8问题。我看了this question,但我不明白如何形成一个涵盖我需要的所有东西的正则表达式。例如,我有一个字符串可能是:“\ xe2 \ x80 \ x98my \ u002c union”,我想输出'my,union。我对如何处理这种格式非常困惑,我试着看着this resource,但我不明白如何使用或构造正则表达式。另外,如果还有另一种更简单的方法来避免这些角色,那么我们会很欢迎这样的想法,我在这方面是一个初学者。我确实尝试了unescape(JSON.parse(mystring)),但这也不起作用。请帮忙!!如何在javascript中解码unicode和utf-8的字符串?

您可以使用decodeURIComponentescape,作为读取的博文后,以及在this blogpost

decodeURIComponent(escape('\xe2\x80\x98my\u002c union')) // "‘my, union" 
+0

我忘了说我已经尝试过此选项的详细。我不确定它为什么没有逃过角色 – mbaed