如何在javascript中解码unicode和utf-8的字符串?
问题描述:
好的请帮助 - 我在解决所有的Unicode字符串中的unicode/utf-8问题。我看了this question,但我不明白如何形成一个涵盖我需要的所有东西的正则表达式。例如,我有一个字符串可能是:“\ xe2 \ x80 \ x98my \ u002c union”,我想输出'my,union。我对如何处理这种格式非常困惑,我试着看着this resource,但我不明白如何使用或构造正则表达式。另外,如果还有另一种更简单的方法来避免这些角色,那么我们会很欢迎这样的想法,我在这方面是一个初学者。我确实尝试了unescape(JSON.parse(mystring))
,但这也不起作用。请帮忙!!如何在javascript中解码unicode和utf-8的字符串?
答
您可以使用decodeURIComponent
与escape
,作为读取的博文后,以及在this blogpost
decodeURIComponent(escape('\xe2\x80\x98my\u002c union')) // "‘my, union"
我忘了说我已经尝试过此选项的详细。我不确定它为什么没有逃过角色 – mbaed