一
编码问题
python的默认编码是ascii码,可以修改为utf-8
在python\Lib\site-packages\下添加一个文件sitecustomize.py
内容是
import sys
sys.setdefaultencoding('utf-8')
好了后面的问题来了,写完这个文件放哪里呢。
1)windows
windows上存放的地方还是比较简单的,存放在你python的安装的目录Lib\site-packages(比如C:\Python25\Lib\site-packages)里。
2)linux
linux上我发现有两种情况,你可以都试试 有些系统是存放在/usr/local/lib/python.27/site-packages 里,如果你放在这里面没效果 就试试放到 /usr/lib/python2.7 里。
我ubuntu最后发现存放的目录是后者
怎么验证是否修改成功呢
- import sys
- sys.getdefaultencoding()
看看返回的是不是‘utf-8’
二
importError: cannot from lxml import cssselect
原因:cssselect被从lxml提取出来了,进入该文件下把from lxml删掉。
三
LookupError: unknown encoding unicode
原因lxml版本不兼容,关掉所有进程更新lxml到3.4.2版本
pip install lxml==3.4.2
四
MySQLdb在查询时间字段的时候有问题
是mysqldb的版本问题,下载1.2.5版本就可以了,具体下载方法在另一个文章里