Unicode转换为UTF8字符串
问题描述:
我需要转换什么,我认为是从硒unicode字符串转换为可读UTF8字符串(没有在字符串的开头u
)Unicode转换为UTF8字符串
但如果字符串已经是什么UTF8编码?然后多字节字符将被双重编码
td.text.encode('utf-8').strip()
答
如果unicode中的文本,您可以执行一个编码操作来转换为utf-8。如果它已经在utf-8中,它将不会被双重编码。它只会抛出一个错误,说明:
AttributeError: 'bytes' object has no attribute 'encode
您是否有具体问题? unicode字符串应该是编码不可知的,编码会给你一个字节字符串(基本上只是一个字节序列) – Felk
Python中没有“UTF-8编码字符串”这样的东西。一个字符串是一系列的Unicode字符。 UTF-8是一系列'byte'值。 – Tomalak