python爬虫抓下来的网页,中间的中文乱码怎么解决

2024-12-15 19:43:57
推荐回答(1个)
回答1:

这个有很多种原因
如果用的是windows的系统,不同的ide抓下来的结果又会不太一样
像sublime抓下来的数据有时候和直接在cmd里执行python程序抓下来的数据就不一样
这是系统编码导致的,

如果要解决楼主的问题,首先看你爬的网页的编码是什么,然后写入txt或者csv或者xlsx或者数据库的时候注意汉子的编码和解码
常用的有 encode('utf-8')

二营长SEO