Unicode编码/解码

问题描述:

我有一个看起来像这样的字符串。Unicode编码/解码

st = '/M\xe4rzen' 

我想将这个转化为unicode。我怎样才能做到这一点?我已经试过:

st.decode('utf-8') 
unicode(t, 'utf-8') 

原始文件是UTF-8编码,但我似乎无法得到字符串的Unicode表示。

您的数据不是UTF8编码;越有可能是使用Latin-1编码:

>>> print st.decode('latin1') 
/Märzen 

调用.decode()就足够了,没必要呼叫unicode()