python爬虫抓下来的网页,中间的中文乱码怎么解决

2024-12-15 19:42:59
推荐回答(2个)
回答1:

对于python的中文编码问题可以参考下面的帖子
http : //python .jobbole. com/85482/
对于网页的中文乱码,建立使用requests模块代替urllib\urllib2
requests的content方法,对中文编码,支持比较好,基本不会出现乱码。
req=requests.get(url,cookies=mecookies)
print req.content
具体用法,参见下面两个帖子,较详细:
http :// blog.csdn . net/iloveyin/article/details/21444613
http : //blog .csdn . net/alpha5/article/details/24964009

回答2:

没用的,可以删了,删了不妨碍网页,就可以啊