学习过Python都知道python中有很多库。python本身就是万能胶水,众多强大的库/模块正是它的优势。
收集一些Python常用的函数库,方便大家选择要学习的库,也方便自己学习收集,熟悉运用好这几个库,在Python这门语言也做不少的事。
1、爬虫神器scrapy框架。配上scrapy-redis组件,轻松开发一个分布式爬虫。言语无法表达我的景仰。
2、matplotlib绘图库,绘图神器。
3. you-get下载神器。国内外主流如的60多个网站的视频都支持下载。下图勾分别为支持视频、图像、音频。
使用方法也是超简单,以下是个人下载哔哩哔哩李宏毅教授的视频。基本满速下载。
4. 顺便说说另一个下载利器wget,只要给下载地址,就能下载。
5. jieba 中文分词工具
6.pip 相信用过python的人都知道pip install。
7.Django框架,Python 界最流行的 web 框架。
8.PIL,图像处理模块。个人的《网络爬虫之简单验证码识别》就有用到此模块。
9. logging ,日志功能模块,使用超简单超方便。
10. keras,以 tensorflow 或者 theano 为后端的深度学习封装库,快速上手神经网络。
11. plotly,协同 Python 和 matplotlib 工作的 web 绘图库
上面的没兴趣也可以再看看下面的。
1、web框架:
django: django是python所有web框架中最重量级的,大而全,包揽了你需要的各种功能,还有无数的第三方插件,官方的文档非常详细。
flask: flask是一个微型的框架,微型但不代表它功能上有欠缺,它是一个可扩展性极强的框架,框架没有提供的功能可以自行造*或者搜索第三方插件
2、ORM:
sqlalchemy: python中最强大的orm框架
peewee: 一个比较简洁的orm框架,目前只能适配Mysql, postgresql和sqlite
3、日期处理:
dateutils: 日期处理实用程序,在标准库中
pendulum:第三方日期时间处理库,比Arrow库好用,因为Arrow有一些bug,
4、任务队列:
celery:python中最强大的任务队列了,配合Flower可在web界面上实时查看celery的各个任务状态和统计信息
huey:一个比较小型的任务队列,依赖于redis或sqlite。
5、定时任务:
apscheduler:定时任务库,可使用Linux的cron语法来配置任务的启动信息。
6、图片处理:
pillow:python中最出名的图片处理库了。
7、科学计算:
numpy:科学计算包
panda:数据处理包
8、日志:
logging:在标准库中,非常强大
9、机器学习:
tensorflow:google出品的机器学习库
pytorch:facebook出品的机器学习库,发展势头貌似比tensorflow更猛
10、windows相关:
pywin32: 对windows api的封装
11、自然语言处理:
NLTK:自然语言处理的库,例如分析语句中的情感词语等等
12、包管理或虚拟环境:
virtualenv:创建虚拟环境,避免第三方库全部安装到系统的python路径中
13、进程处理:
subprocess:标准库中的进程模块
sarge:第三方的进程模块,简化了很多操作,作者是标准库是logging,venv模块的实现者
14、excel相关:
xlrd:读取excel文档
xlwt:写excel文档
pyexcel:读写excel文档(只能xlsx格式)
tablib:如果觉得前三个库读写excel需要太多的模板代码,可以试试这一个库。只要几行代码就能搞定,该库不仅能将数据集保存为excel(xls和xlsx均可), 还可以保存为xml, json等,十分强大。
15、url操作:
furl: 简化对url中各部分的操作,例如查询字符串的获取或设置等。
16、web服务器:
gunicorn:非常快,耗资源少的一个web服务器
uwsgi:另一个web服务器
17、爬虫(不用多说):
scrapy
pyspider
18、主流网站视频下载(两个都是命令行工具):
you-get: 能下载国内大部分的网站视频(包括优酷,乐视,腾讯视频等等)
youtube-dl: 主要下载youtube上的视频,当然还包括其它的视频网站(需要FQ或者设置vpn代理)
本文收集自互联网,以后可能还会添加。