Unicode编码/解码

分类: 技术问答 • 2022-07-21 23:14:20

问题描述：

我有一个看起来像这样的字符串。Unicode编码/解码

st = '/M\xe4rzen'

我想将这个转化为unicode。我怎样才能做到这一点？我已经试过：

st.decode('utf-8') 
unicode(t, 'utf-8')

原始文件是UTF-8编码，但我似乎无法得到字符串的Unicode表示。

答

您的数据不是UTF8编码;越有可能是使用Latin-1编码：

>>> print st.decode('latin1') 
/Märzen

调用.decode()就足够了，没必要也呼叫unicode()。