随着需要存储数据的结构不断复杂化,使用数据库来存储数据是一个必须面临的问题。那么应该如何在python中使用数据库?下面就在本篇博客中介绍一下在python中使用mysql。
首先,本博客已经假定阅读者已经安装了python和mysql,所以不会讲解关于它们的安装(如果未安装,请查阅官方文档进行下载安装)。
在python中使用pymysql操作mysql
python的标准库中,是没有可以直接连接操作mysql的模块,首先我们应安装python的第三方模块pymysql。
使用pymysql操作mysql的步骤:
1)使用pymysql.connect连接并登录mysql
2) 使用connection.cursor建立游标
3) 使用cursor.execute()或cursor.executemany()执行sql语句
例一(使用pymysql执行简单的mysql操作):
(1) 首先在mysql中建立一张用户表
CREATE TABLE `users` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`email` varchar(255) COLLATE utf8_bin NOT NULL,
`password` varchar(255) COLLATE utf8_bin NOT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin
AUTO_INCREMENT=1 ;
(2) 使用pymysql连接数据库并操作这张表
1 import pymysql
2
3 # Connect to the database
4 # 连接mysql,host指定主机;port指定端口,如果mysql为默认端口3306可以不写;
5 # user,password分别指定登录mysql的用户名和密码;
6 # db指定数据库;charset指定字符集;
7 connection = pymysql.connect(host='localhost',
8 user='root',
9 password='',
10 db='test',
11 charset='utf8mb4',
12 cursorclass=pymysql.cursors.DictCursor)
13
14 try:
15 with connection.cursor() as cursor:
16 # Create a new record
17 # 构建sql语句
18 sql = "INSERT INTO `users` (`email`, `password`) VALUES (%s, %s)"
19 # 相当于在mysql终端执行
20 # "INSERT INTO `users` (`email`, `password`) VALUES ('webmaster@python.org', 'very-secret')"
21 cursor.execute(sql, ('webmaster@python.org', 'very-secret'))
22
23 # connection is not autocommit by default. So you must commit to save
24 # your changes.
25 # 向mysql提交更改,如果是查询语句,无需执行connection.commit()
26 # 可以通过设置connection.autocommit()来自动提交,传入True即可
27 connection.commit()
28
29 with connection.cursor() as cursor:
30 # Read a single record
31 # sql = "SELECT `id`, `password` FROM `users` WHERE `email`=%s"
32 # cursor.execute(sql, ('webmaster@python.org',))
33 sql = "SELECT * FROM `users`"
34 # 执行cursor.execute(sql),等于在mysql终端执行sql语句。
35 cursor.execute(sql)
36 # 获取sql语句执行结果并打印
37 result = cursor.fetchall()
38 print(result)
39 finally:
40 # 关闭连接
41 connection.close()
例二(向mysql中的表插入多条信息):
1 import pymysql
2
3 connection = pymysql.Connect(host="localhost",
4 user="root",
5 password="",
6 db="test",
7 charset="utf8mb4",
8 cursorclass=pymysql.cursors.DictCursor)
9
10 try:
11 # # 执行多次INSERT操作
12 # with connection.cursor() as cursor:
13 # users_info = [('xiaoming@123.com','simple'), ('xiaoqiang@123.com','simple'),
14 # ('xiaozhang@123.com','very-secret'), ('xiaoli@123.com', 'simple'),
15 # ('xiangwang@123.com','simple'), ('xiaohong@123.com','very-secret')]
16 # sql = "INSERT INTO `users` (`email`, `password`) VALUES (%s, %s)"
17 # # 执行多次相同操作使用cursor.executemany()
18 # cursor.executemany(sql, users_info)
19 # connection.commit()
20
21 # 查询所有用户信息
22 with connection.cursor() as cursor:
23 sql = "SELECT * FROM `users`"
24 cursor.execute(sql)
25 result = cursor.fetchall()
26 print("-----all users-----")
27 for user_info in result:
28 print(user_info)
29
30 with connection.cursor() as cursor:
31 sql = "SELECT * FROM `users` WHERE `password`=%s"
32 cursor.execute(sql, ('very-secret',))
33 result = cursor.fetchall()
34 print("-----password is very-secret-----")
35 for user_info in result:
36 print(user_info)
37 finally:
38 connection.close()
注:在python程序中使用pymysql,最好只执行对表的增删该查即可(使用pymysql虽然能执行原生SQL语句,但不建议使用它进行建数据库,表,修改数据库,表属性等操作(如果要进行这些操作不妨直接登录mysql,直接在mysql终端执行这些操作)。
下面将介绍一些pymysql的一些常用API(在pymysq中只有两个常用object):
(1)Connection Object:
常用属性:
host – mysql主机地址
user – 登录用户名
password – 登录用户密码
port – mysql端口,默认3306
charset – 字符集
connect_timeout – 连接最大时间,超时自动断开。(default: 10, min: 1, max: 31536000)
autocommit – 是否自动提交更改。(default: False)
db – 使用指定的数据库
cursorclass – 指定cursor类
注:以上参数应在连接数据库时指定,只是常用参数(详细请参见:http://pymysql.readthedocs.io/en/latest/modules/connections.html)。
常用方法:
begin() - 开启一个事件 与 在mysql终端执行BEGIN效果相同
close() - 关闭与mysql的连接
commit() - 提交对mysql中存储数据的更改
cursor(cursor=None) - 创建一个cursor对象,cursor类在连接时未指明,可以在此指明,使用默认cursor忽略参数即可
ping(reconnect=True) - 检测连接是否存活,如果连接超过设置的connet_timeout会自动断开,所以在进行对mysql操作前应使用此方法检测
rollback() - 使用了begin()后,对mysql的操作未提交前,可以只用此方法恢复到未操作之前
select_db(db) - 选择数据库,如果要操作的表不在连接时指定的数据库,使用此方法切换。
show_warnings() - 显示警告信息
(2)Cursor Objects:
常用方法:
execute(query, args=None) - 执行一条sql语句
Parameters:
query (str) – 要被执行的sql语句
args (tuple, list or dict) – sql语句中用到的参数
Returns:
多少行信息收到影响
Return type:
int
如果args是以tuple的形式指定,则按位置依次传入sql语句中;如果是以dict传入,则以关键字传入sql语句中。
executemany(query, args) - 多次执行这条sql语句
参数与上相同,不过要使用[]将多个args括起来。
此方法可提高多行INSERT和REPLACE的性能。 否则,它等价于使用execute() 循环args。
fetchone() - 取结果中的一行
fetchall() - 取所有的结果
fetchmany(size=None) - 取结果中的size行
close() - 关闭当前cursor
max_stmt_length = 1024000 - 指定 executemany() 执行最多max_stmt_length次sql语句
注:只写了常用方法,详细请参见:http://pymysql.readthedocs.io/en/latest/modules/cursors.html
使用sqlalchemy操作数据库(重点)
例三(使用sqlalchemy创建一张数据表并插入数据):
使用pymysql固然可以与mysql进行交互,但还是在源代码中使用了原生SQL语句,使代码的重用行和扩展性大大降低,这不符合面向对象的编程的特性。那么该如何像操作对象一样操作数据库呢?
我们使用一种叫做ORM(Object Relational Mapping,简称ORM,或O/RM,或O/R mapping)的技术,是一种程序技术,用于实现面向对象编程语言里不同类型系统的数据之间的转换。在python中我们使用一个名为SQLAlchemy(基于ORM的开发组件)来进行对数据库的操作,这样就不必在源代码中使用SQL语句,大大降低了程序员学习SQL的成本,由于不必再拼接复杂的SQL语句,大大提高开发效率,并且使程序有更高的扩展性。
1 import sqlalchemy
2 from sqlalchemy import create_engine
3 from sqlalchemy.ext.declarative import declarative_base
4 from sqlalchemy import Column, Integer, String
5 from sqlalchemy.orm import sessionmaker
6
7 # 检查sqlalchemy的版本
8 # print(sqlalchemy.__version__)
9
10 # 创建一个engine
11 # 传入一个URL作为第一个位置参数(格式为:dialect[+driver]://user:password@host/dbname[?key=value..])
12 # dialect is a database name such as mysql, oracle, postgresql, ,
13 # and driver the name of a DBAPI, such as psycopg2, pyodbc, cx_oracle, pymysql.
14 # 打印操作数据库的过程,则设置echo=True,否则默认即可
15 engine = create_engine('mysql+pymysql://root:123456@localhost/test')
16
17 Base = declarative_base()
18
19 # 将要创建的表结构
20 class User(Base):
21 # 表名
22 __tablename__ = 'users'
23
24 # 字段名,字段属性
25 id = Column(Integer, primary_key=True)
26 name = Column(String(32))
27 fullname = Column(String(64))
28 password = Column(String(64))
29
30 def __repr__(self):
31 return "<User(name='%s', fullname='%s', password='%s')>" % (
32 self.name, self.fullname, self.password)
33
34 # 可以同时创建多个表,在前面以上面的形式写好所有表结构,最后统一创建
35 Base.metadata.create_all(engine)
36
37 # 创建一个Session类
38 # Session = sessionmaker()
39 # Session.configure(bind=engine)
40 # 等同于上面两行
41 Session = sessionmaker(bind=engine)
42 # 生成一个session实例
43 session = Session()
44
45 # 构造要插入表中的数据
46 ed_user = User(name='ed', fullname='Ed Jones', password='edspassword')
47 # 将数据放入session中,如果有多条数据使用session.add_all([data1,data2,...])
48 session.add(ed_user)
49 # session.add_all([User(name='wendy', fullname='Wendy Williams', password='foobar'),
50 # User(name='mary', fullname='Mary Contrary', password='xxg527'),
51 # User(name='fred', fullname='Fred Flinstone', password='blah')])
52 # 向数据库提交
53 # session.commit()
54
55 data = session.query(User).filter(User.id>2).all()
56 print(data)
# 使用上面的代码生成的数据表结构
mysql> desc users;
+----------+-------------+------+-----+---------+----------------+
| Field | Type | Null | Key | Default | Extra |
+----------+-------------+------+-----+---------+----------------+
| id | int(11) | NO | PRI | NULL | auto_increment |
| name | varchar(32) | YES | | NULL | |
| fullname | varchar(64) | YES | | NULL | |
| password | varchar(64) | YES | | NULL | |
+----------+-------------+------+-----+---------+----------------+
4 rows in set (0.00 sec)
# 使用上面代码插入表中的数据
mysql> select * from users;
+----+------+----------+-------------+
| id | name | fullname | password |
+----+------+----------+-------------+
| 1 | ed | Ed Jones | edspassword |
+----+------+----------+-------------+
1 row in set (0.00 sec)
例四(使用sqlalchemy进行对数据的查,改,删)
1 # 查询时在filter_by(或filter)中写上条件即可,查询到的结果可能是多条,first()代表取第一条,all()代表取所有
2 our_user = session.query(User).filter_by(name='ed').first()
3 # 如果有多个查询条件,data = session.query(User).filter(User.id>2).filter(User.id<4).all(),这样使用即可
4 data = session.query(User).filter(User.id>2).all()
5 print("-------这是查询数据的结果-------")
6 print(our_user)
7 print(data)
8 print('\n')
9
10 # 直接修改查询的结果,然后提交即可
11 our_user.password = 'f8s7ccs'
12 session.commit()
13 new_user = session.query(User).filter_by(name='ed').first()
14 print("-------这是修改数据的结果-------")
15 print(new_user)
16 print('\n')
17
18 # 先查询出要删除的数据,然后使用session.delete()和session.delete()即可
19 data = session.query(User).filter(User.id==5).first()
20 # print(data)
21 session.delete(data)
22 session.commit()
例五(使用sqlalchemy实现数据表的外键关联):
作为关系型数据库,表与表之间的外键关联是比不可少的,也是至关重要的,那么改如何使用sqlalchemy在python对象中通过类的形式映射这种关系呢? 请看下面的代码。
1 import sqlalchemy
2 from sqlalchemy import create_engine
3 from sqlalchemy.ext.declarative import declarative_base
4 from sqlalchemy import Column, Integer, String, Enum, ForeignKey
5 from sqlalchemy.orm import sessionmaker, relationship
6
7 engine = create_engine('mysql+pymysql://root:123456@localhost/student')
8
9 Base = declarative_base()
10
11 class Student(Base):
12 __tablename__ = 'student_info'
13
14 # 设置id, 类型为int, 不能为空, id是这张表的主键
15 id = Column(Integer, nullable=False, primary_key=True)
16 # 设置stu_id, 类型为int, 不能为空, id在这张表中的值唯一
17 stu_id = Column(Integer, nullable=False, unique=True)
18 name = Column(String(32), nullable=False, )
19 age = Column(Integer, nullable=False, )
20 gender = Column(Enum('F', 'M'), nullable=False)
21
22 # 查询结果的显示是此函数返回的格式
23 def __repr__(self):
24 return "<Student(stu_id='%s', name='%s', age='%s', gender='%s')>" % (
25 self.stu_id, self.name, self.age, self.gender)
26
27 class Study(Base):
28 __tablename__ = 'study_level'
29
30 id = Column(Integer, nullable=False, primary_key=True)
31 # 设置stu_id为study_level表的外键,与student_info表中的stu_id关联
32 stu_id = Column(Integer, ForeignKey('student_info.stu_id'))
33 mathematics = Column(Integer)
34 physics = Column(Integer)
35 chemistry = Column(Integer)
36
37 # 定义关系,可以在本类中使用属性student_info查询表student_info中的数据(以同样的条件)
38 # 也可以在Student类中使用属性study_level查询表study_level中的数据
39 student_info = relationship('Student', backref='study_level')
40
41 def __repr__(self):
42 return "<Study(name=%s, mathematics=%s, physics=%s, chemistry=%s)>" % (
43 self.student_info.name, self.mathematics, self.physics, self.chemistry)
44
45 # Base.metadata.create_all(engine)
46
47 Session = sessionmaker(engine)
48 session = Session()
49
50 # 插入4个学生信息
51 # session.add_all([Student(stu_id=10001, name='zhangsan', age=16, gender='F'),
52 # Student(stu_id=10002, name='lisi', age=17, gender='M'),
53 # Student(stu_id=10003, name='wangwu', age=16, gender='M'),
54 # Student(stu_id=10004, name='zhouliu', age=15, gender='F')])
55 #
56 # 插入考试成绩,成绩不到60分的科目需补考,再插入补考成绩
57 # session.add_all([Study(stu_id=10001, mathematics=78, physics=70, chemistry=83),
58 # Study(stu_id=10002, mathematics=87, physics=85, chemistry=92),
59 # Study(stu_id=10003, mathematics=60, physics=54, chemistry=76),
60 # Study(stu_id=10004, mathematics=52, physics=46, chemistry=44),
61 # Study(stu_id=10003, physics=68),
62 # Study(stu_id=10004, mathematics=63, physics=61, chemistry=65)])
63 # session.commit()
64
65 # 使用这种方法查询多张表,表之间可以没有任何关系
66 data = session.query(Student, Study).filter(Student.stu_id==Study.stu_id).all()
67 print(data)
68 print('\n')
69
70
71 # 使用下面的方法通过一张表查询其他表,表之间必须有外键关联
72 # 因为每个学生的信息唯一,所以使用first()
73 student = session.query(Student).filter(Student.stu_id==10003).first()
74 print(student)
75 # print(student.study_level)相当于Student.stu_id==10003时,下面的两行代码
76 # data = session.query(Study).filter(session.query(Study).filter(Student.stu_id==Study.stu_id).all()).all()
77 # print(data)
78 print(student.study_level)
79 print('\n')
80
81 # 因为一个学生可能会有多次考试记录,所以使用all()
82 score = session.query(Study).filter(Study.stu_id==10003).all()
83 print(score)
84 # print(score[0].student_info)相当于Study.stu_id==10003时
85 # 因为在student_info表中stu_id的值唯一,所以只有一条数据
86 # data = session.query(Student).filter(Study[0].stu_id==Student.stu_id).first()
87 # print(data)
88 print(score[0].student_info)
mysql> select * from student_info;
+----+--------+----------+-----+--------+
| id | stu_id | name | age | gender |
+----+--------+----------+-----+--------+
| 1 | 10001 | zhangsan | 16 | F |
| 2 | 10002 | lisi | 17 | M |
| 3 | 10003 | wangwu | 16 | M |
| 4 | 10004 | zhouliu | 15 | F |
+----+--------+----------+-----+--------+
4 rows in set (0.00 sec)
mysql> select * from study_level;
+----+--------+-------------+---------+-----------+
| id | stu_id | mathematics | physics | chemistry |
+----+--------+-------------+---------+-----------+
| 1 | 10001 | 78 | 70 | 83 |
| 2 | 10002 | 87 | 85 | 92 |
| 3 | 10003 | 60 | 54 | 76 |
| 4 | 10004 | 52 | 46 | 44 |
| 5 | 10003 | NULL | 68 | NULL | #学号为10003的学生,只有一科成绩小于60,只补考一科
| 6 | 10004 | 63 | 61 | 65 | #学号为10004的学生,三科成绩都小于60,需补考三科
+----+--------+-------------+---------+-----------+
6 rows in set (0.00 sec)
注:对有外键关联的数据表,进行数据的增删该查,与上例中使用的方式一样,不过受外键约束,约束条件同mysql中外键的约束相同。(详细请参见:http://www.cnblogs.com/God-Li/p/8157312.html)
例六(使用sqlalchemy实现mysql中多对多的关系):
多对多的数据关系是最常见的实际生产的数据关系,比如超市的商品与顾客之间的关系(一个顾客可以买多种商品,一种商品可以被多个顾客购买),比如电影与演员的关系(一名演员可以参演多部电影,一部电影会有多个演员),这些数据是我们经常使用的,比如我们在视频网站查找电影时,会有按演员查找,对于一部电影我们也经常关注是哪些演员参演的。那么改如何使用sqlalchemy在mysql中存储这些关系呢?我们就以超市商品与顾客之间的关系来做一个示例,请看下面的代码。
为了便于理解,我们先来看一下表结构(一共三张表)
# 商品表,存储商品的名称,价格,和生产日期(为了简单只存这几样信息)
mysql> select * from products;
+----+-------------+-------+------------+
| id | name | price | pro_date |
+----+-------------+-------+------------+
| 1 | iPhone8 | 6988 | 2017-09-18 |
| 2 | Apple Watch | 2588 | 2017-06-20 |
| 3 | Airpods | 1288 | 2017-01-11 |
| 4 | MacBook | 10288 | 2017-05-13 |
+----+-------------+-------+------------+
4 rows in set (0.00 sec)
# 顾客表,存储顾客的姓名(这里为了简单只存了姓名,其实还应该用性别、年龄等具体信息)
mysql> select * from customers;
+----+-----------+
| id | name |
+----+-----------+
| 1 | ZhangSang |
| 2 | WangWu |
| 3 | XiaoMing |
| 4 | LiSi |
| 5 | ZhaoLiu |
+----+-----------+
5 rows in set (0.00 sec)
# 商品顾客关系表,存储商品与用户的关系,可通过用户查购买了哪些商品,也可通过商品查有哪些用户购买
mysql> select * from product_to_customer;
+------------+-------------+
| product_id | customer_id |
+------------+-------------+
| 4 | 4 |
| 4 | 3 |
| 3 | 2 |
| 2 | 1 |
| 2 | 4 |
| 2 | 2 |
| 2 | 5 |
| 2 | 3 |
| 1 | 1 |
| 1 | 4 |
| 1 | 5 |
+------------+-------------+
11 rows in set (0.00 sec)
接着我们来看一下如何使用python来创建这些表,插入并查询这些信息。
1 import sqlalchemy
2 from sqlalchemy import Table, Column, Integer, String, DATE, ForeignKey
3 from sqlalchemy.orm import relationship
4 from sqlalchemy.ext.declarative import declarative_base
5 from sqlalchemy import create_engine
6
7 Base = declarative_base()
8
9 # 商品与顾客关系表结构
10 product_to_customer = Table('product_to_customer', Base.metadata,
11 Column('product_id', Integer, ForeignKey('products.id')),
12 Column('customer_id', Integer, ForeignKey('customers.id')))
13
14 # 用户表结构
15 class Customer(Base):
16 __tablename__ = 'customers'
17
18 id = Column(Integer, primary_key=True)
19 name = Column(String(32))
20
21 def __repr__(self):
22 return self.name
23
24 # 商品表结构
25 class Product(Base):
26 __tablename__ = 'products'
27
28 id = Column(Integer, primary_key=True)
29 name = Column(String(32))
30 price = Column(Integer)
31 pro_date = Column(DATE)
32 customers = relationship(Customer, backref='products', secondary='product_to_customer')
33
34 def __repr__(self):
35 return self.name
36
37
38 engine = create_engine('mysql+pymysql://root:123456@localhost/supermarket')
39 Base.metadata.create_all(engine)
1 import table_struct
2 from sqlalchemy.orm import sessionmaker
3
4 Session = sessionmaker(table_struct.engine)
5 session = Session()
6
7 # 构建商品信息
8 # p1 = table_struct.Product(name='iPhone8', price='6988', pro_date='2017-9-18')
9 # p2 = table_struct.Product(name='MacBook', price='10288', pro_date='2017-5-13')
10 # p3 = table_struct.Product(name='Airpods', price='1288', pro_date='2017-1-11')
11 # p4 = table_struct.Product(name='Apple Watch', price='2588', pro_date='2017-6-20')
12 #
13 # 构建顾客信息
14 # c1 = table_struct.Customer(name="ZhangSang")
15 # c2 = table_struct.Customer(name="LiSi")
16 # c3 = table_struct.Customer(name="WangWu")
17 # c4 = table_struct.Customer(name="ZhaoLiu")
18 # c5 = table_struct.Customer(name="XiaoMing")
19 #
20 # 构建商品与顾客的关系
21 # p1.customers = [c1, c2, c4]
22 # p2.customers = [c2, c5]
23 # p3.customers = [c3]
24 # p4.customers = [c1, c2, c3, c4, c5]
25 #
26 # session.add_all([p1, p2, p3, p4, c1, c2, c3, c4, c5])
27 # session.commit()
28
29 # 通过顾客查询他购买了哪些商品
30 customer_obj = session.query(table_struct.Customer).filter(table_struct.Customer.name=='XiaoMing').first()
31 print(customer_obj.products)
32
33 # 通过商品查询有哪些顾客购买
34 product_obj = session.query(table_struct.Product).filter(table_struct.Product.name=="iPhone8").first()
35 print(product_obj.customers)