是因为python实现爬虫遇到编码问题:error:UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position XX。具体解决办法:
改变标准输出,添加代码。
1、str转bytes叫encode,bytes转str叫decode。
2、常用的中文编码名称
“xxx”.decode('gbk')就可以了。你的可以是 eachline.decode('gbk')
不过word文档是有结构的二进制文件,并非文本文件,最好用com接口操纵,你这种处理方法是错误的
python3
打开文件:
openfile = open(filename,'r',encoding = 'utf-8')
.decode('gbk','ignore')