python怎么转换unicode编码

2025-01-03 23:32:59
推荐回答(2个)
回答1:

用decode()就行。decode()方法必须传入一个参数,这个参数就是当前待转码的编码,此函数方法的用意就是将当前编码为Unicode编码。

比如就你这提问的此页面:

用的编码是gbk,那么你解码为Unicode的方法就是:decode('gbk')。

声明:本代码只是作为测试,并无攻击用意

#使用版本是python2.
import urllib
url='https://zhidao.baidu.com/question/1499967322379602619.html?entry=qb_ihome_tag&hideOtherAnswer=true&newAnswer=1'
html=urllib.urlopen(url).read()
result=html.decode('gbk')
print result

方法是绝对可行的

此法对字符串和文档内容的解码一样有效。

回答2:

decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode('gb2312'),表示将gb2312编码的字符串转换成unicode编码。

encode的作用是将unicode编码转换成其他编码的字符串,如str2.encode('gb2312'),表示将unicode编码的字符串转换成gb2312编码。