mysql 驱动
$ sudo pip install MySQL-python
redis 数据库
$ sudo pip install redis
django 全文搜索
$ sudo pip install django-sphinx
selenium集成测试工具,配合phantomJS可以模拟浏览器操作
$ sudo pip install selenium
SQLAlchemy 是一个Python 的SQL 工具包以及数据库对象映射框架,示例代码:
user1 = User(name='user1')
session.add(user1)
session.commit()
Flask 是一个微型的 Python 开发的 Web 框架,示例代码:
from flask import Flask
app = Flask(__name__)
@app.route("/")
def hello():
return "Hello World!"
if __name__ == "__main__":
app.run()
BeautifulSoup 库是一个非常神奇的 “粗糙的解析器”,用于解析实际 Web 页面中包含的有效 HTML。
PyQuery (with lxml)
安装方法 pip install pyquery
Python 解析 HTML 时最经常被推荐的是 Beautiful Soup ,而且它的确也表现很好。提供良好的 Python 风格的 API,而且很容易在网上找到相关的资料文档,但是当你需要在短时间内解析大量文档时便会碰到性能的问题,简单,但是真的非常慢。
fuzzywuzzy
安装方法:pip install fuzzywuzzy
fuzzywuzzy 可以让你对两个字符串进行模糊比较,当你需要处理一些人类产生的数据时,这非常有用。
sh
安装方法:pip install sh
sh 可让你调用任意程序,就好象是一个函数一般:
from sh import git, ls, wc
# checkout master branch
git(checkout="master")
# print(the contents of this directory
print(ls("-l"))
# get the longest line of this file
longest_line = wc(__file__, "-L")
pattern
安装方法:pip install pattern
Pattern 是 Python 的一个 Web 数据挖掘模块。可用于数据挖掘、自然语言处理、机器学习和网络分析。