百万年薪python之路 -- 数据库初始

一. 数据库初始

1. 为什么要有数据库?

先来一个场景:

​ 假设现在你已经是某大型互联网公司的高级程序员,让你写一个火车票购票系统,来hold住十一期间全国的购票需求,你怎么写?

  由于在同一时段抢票的人数太多,所以你的程序不可能写在一台机器上,应该是多台机器一起分担用户的购票请求。

  那么问题就来了,票务信息的数据存在哪里?存在文件里么?

  如果存储在文件里,那么存储在哪一台机器上呢?是每台机器上都存储一份么?

  首先,如果其中一台机器上卖出的票另外两台机器是感知不到的,

  其次,是如果我们将数据和程序放在同一个机器上,如果程序和数据有一个出了问题都会导致整个服务不可用

  最后,是操作文件,修改文件对python代码来说是一件很麻烦的事

  基于上面这些问题,单纯的将数据存储在和程序同一台机器上的文件中是非常不明智的。

  百万年薪python之路  --  数据库初始

通过上面的场景,可以了解到:

  1. 将文件和程序存储在一台计算机上时不合理的.
  2. 操作文件是一件开销很大的,非常麻烦的一件事.

所以引出了一个新的概念 -- 数据库

2. 什么是数据库?

首先来一波最官方的定义:

# 来自百度百科
数据库是存放数据的仓库。它的存储空间很大,可以存放百万条、千万条、上亿条数据。但是数据库并不是随意地将数据进行存放,是有一定的规则的,否则查询的效率会很低。
数据库是以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合,可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据进行新增、查询、更新、删除等操作.

通俗易懂的理解:

存放在一台机器上独立工作的,按照一定格式编成的相互关联的各种数据的集合,供用户高效、便捷有效地进行数据处理。

如此就帮助我们解决了上面出现的问题,如果将所有的数据都存储在一个独立的机器上,而对用户提供服务的机器只是存放你写的代码。

百万年薪python之路  --  数据库初始

3. 数据库的优点是什么?

1. 程序稳定性: 如果任意一台服务器崩溃了,都不会影响到数据和服务.
2. 数据一致性: 所有的数据都存储在一起,所有对数据的操作都是统一的,就不会出现对数据的不一致性.
3. 并发: 数据库可以良好的支持并发,所有的程序操作数据库都是通过网络,而数据库本身支持并发的网络操作,不需要我们自己写socket.
4. 效率: 使用数据库对数据的增删改查的效率会远远高出我们对文件的操作的效率.

4. 数据库的概述

  1. 什么是数据(data)

    又是一波官方的定义:

    数据(data)是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的的原始素材。
    数据可以是连续的值,比如声音、图像,称为模拟数据。也可以是离散的,如符号、文字,称为数字数据。
    在计算机系统中,数据以二进制信息单元0,1的形式表示。

    数据由多种表现形式,它们都可以经过数字化后存入计算机

    在计算机中描述一个事物,就需要抽取这个事物的典型特征,组成一条记录:

    zcy,男,18,1999,江西,NCLG

    单纯的一条记录是没有任何意义,如果我们按逗号作为分隔,依次定义各个字段的意思,相当于定义表的标题

    name,sex,age,born_year,addr,school # 字段/列名
    zcy,男,18,1999,江西,NCLG   # 数据

    这样我们就可以了解这条记录是什么意思.

  2. 什么是数据库(DataBase,简称DB)

    数据库即存放数据的仓库,只不过这个仓库是在计算机存储设备上,而且数据是按一定的格式存放的

    过去人们将数据存放在文件柜里,现在数据量庞大,已经不再适用

    数据库是长期存放在计算机内、有组织、可共享的数据集合。

    数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种 用户共享

    3 什么是数据库管理系统(DataBase Management System 简称DBMS)

    在了解了Data与DB的概念后,如何科学地组织和存储数据,如何高效获取和维护数据成了关键

    这就用到了一个系统软件---数据库管理系统

    如MySQL、Oracle、SQLite、Access、MS SQL Server

    mysql主要用于大型门户,例如搜狗、新浪等,它主要的优势就是开放源代码,因为开放源代码这个数据库是免费的,他现在是甲骨文公司的产品。
    oracle主要用于银行、铁路、飞机场等。该数据库功能强大,软件费用高。也是甲骨文公司的产品。
    sql server是微软公司的产品,主要应用于大中型企业,如联想、方正等。

    数据库管理员 DBA(Database Administrator)

    4 数据库服务器、数据管理系统、数据库、表与记录的关系(重点)

    记录:1 周道镕 170103040320(多个字段的信息组成一条记录,即文件中的一行内容)

    表:userinfo,studentinfo,courseinfo(即文件)

    数据库:db(即文件夹)

    数据库管理系统:如mysql(是一个软件)

    数据库服务器:一台计算机(对内存要求比较高)

    总结:

    数据库服务器-:运行数据库管理软件

    数据库管理软件:管理-数据库

    数据库:即文件夹,用来组织文件/表

    表:即文件,用来存放多行内容/多条记录

    ### 5 数据库管理技术的发展历程(了解)

    一 人工管理阶段

    20世纪50年代中期以前,计算机主要用于科学计算。

    当时的硬件水平:外存只有纸带、卡片、磁带,没有磁盘等直接存取的存储设备

    当时的软件状况:没有操作系统,没有管理数据的软件,数据的处理方式是批处理。

    人工管理数据具有以下特点:

    1 数据不保存:计算机主要用于科学计算,数据临时用,临时输入,不保存

    2 应用程序管理数据:数据要有应用程序自己管理,应用程序需要处理数据的逻辑+物理结构,开发负担很重

    3 数据不共享:一组数据只对应一个程序,多个程序之间涉及相同数据时,必须各自定义,造成数据大量冗余

    4 数据不具有独立性:数据的逻辑结构或物理结构发生变化后,必须对应用程序做出相应的修改,开发负担进一步加大

    百万年薪python之路  --  数据库初始

    二 文件系统阶段

    20世纪50年代后期到60年代中期

    硬件水平:有了磁盘、磁鼓等可直接存取的存储设备

    软件水平:有了操作系统,并且操作系统中已经有了专门的数据管理软件,即文件系统;处理方式上不仅有了批处理,而且能够联机实时处理

    文件系统管理数据具有以下优点:

    1 数据可以长期保存:计算机大量用于数据处理,因而数据需要长期保存,进行增删改查操作

    2 由文件系统管理数据:文件系统这个软件,把数据组织成相对独立的数据文件,利用按文件名,按记录进行存取。实现了记录内的结构性,但整体无结构。并且程序与数据之间由文件系统提供存取方法进行转换,是应用程序与数据之间有了一定的独立性,程序员可以不必过多考虑物理细节。

    文件系统管理数据具有以下缺点:

    1 数据共享性差,冗余度大:一个文件对应一个应用程序,不同应用有相同数据时,也必须建立各自的文件,不能共享相同的数据,造成数据冗余,浪费空间,且相同的数据重复存储,各自管理,容易造成数据不一致性

    2 数据独立性差:一旦数据的逻辑结构改变,必须修改应用程序,修改文件结构的定义。应用程序的改变,也将引起文件的数据结构的改变。因此数据与程序之间缺乏独立性。可见,文件系统仍然是一个不具有弹性的无结构的数据集合,即文件之间是孤立的,不能反映现实世界事物之间的内存联系。

    百万年薪python之路  --  数据库初始

    三 数据系统阶段

    20世纪60年代后期以来,计算机用于管理的规模越来越大,应用越来越广泛,数据量急剧增长,同时多种应用,多种语言互相覆盖地共享数据结合要求越来越强烈

    硬件水平:有了大容量磁盘,硬件架构下降

    软件水平:软件价格上升(开发效率必须提升,必须将程序员从数据管理中解放出来),分布式的概念盛行。

    数据库系统的特点:

    1 数据结构化(如第一幅图)

    2 数据共享,冗余度低,易扩充

    3 数据独立性高

    4 数据由DBMS统一管理和控制

      a:数据的安全性保护

      b:数据的完整性检查

      c:并发控制

      d:数据库恢复

  3. 数据库管理系统软件的分类

    管理数据的工具有很多种,关于分类其实可以从各个角度来进行划分,但是我们最常使用的分类还是根据他们存取数据的特点来划分的,主要分为关系型和非关系型。

      可以简单的理解为,关系型数据库需要有表结构非关系型数据库是key-value存储的,没有表结构

    关系型:如sqllite,db2,oracle,access,sql server,MySQL,注意:sql语句通用
    非关系型:mongodb,redis,memcache

二. mysql初始

  1. MySQL是什么?

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,目前属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS (Relational Database Management System,关系数据库管理系统) 应用软件。

  MySQL是一种关系数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。

  MySQL所使用的 SQL 语言是用于访问数据库的最常用标准化语言。MySQL 软件采用了双授权政策,分为社区版和商业版,由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,一般中小型网站的开发都选择 MySQL 作为网站数据库。

  1. 下载和安装

    mysql为我们提供开源的安装在各个操作系统上的安装包,包括ios,linux,windows。

      mysql的安装、启动和基础配置 —— linux版本 (https://www.cnblogs.com/Eva-J/articles/9664401.html)

      mysql的安装、启动和基础配置 —— mac版本 (https://www.cnblogs.com/Eva-J/articles/9664401.html)

      mysql的安装、启动和基础配置 —— windows版本 (https://www.cnblogs.com/Eva-J/articles/9669675.html)

  2. 初始SQL语句

    # 进入mysql客户端
    win + R输入cmd回车进入DOS系统
    终端输入:mysql
        mysql>select user(); # 查看当前用户
        mysql>exit  # 也可以\q或quit退出
    
    # 默认用户登录之后没有实际操作的权限
    # 需要使用管理员root用户登录
    终端输入:mysql -uroot -p # mysql 5.6默认是没有密码的
        # 遇到password直接按回车键
        mysql>set password = password('root'); # 给当前数据库设置密码
    
    # 创建账号
    mysql>create user 'zcy'@'192.168.16.%'  identified by '123';    # 指示网段可以使用
    mysql>create user 'zcy'%'192.168.16.20';    # 指定某一机器(IP)可以连接
    mysql>create user 'zcy'@'%';        # 指示使用机器都可以连接
    mysql>show grants for 'zcy'@'192.168.16.20';    #查看某个用户(IP)的权限
    
    # 远程登陆
    终端输入:mysql -uroot -p123 -h 192.168.16.20
    
    # 给账号授权(https://www.cnblogs.com/zhangchaoyin/p/11426458.html)
    mysql>grant 权限名 on 数据库名.表名 to '用户名'@'%' 授权"用户名"用户可以在 任何ip下 对 数据库名 的 表名 进行设置的权限操作,可指定IP地址(把%设成IP地址)
    mysql>grant all on *.* to 'zcy'@'%';
    mysql>grant select,updata on db1.* to 'zcy'
    mysql>flush privileges;     # 刷新使授权立即生效
    
    # 创建账号并授权
    MySQL>grant all on *.*  to 'zcy'@'%' identified by '123';
    
    # 收回权限
    mysql>revoke 权限名 on 数据库名.表名 from '用户名'
    --回收建表、改表、删表权限
    mysql>revoke create on 数据库名.* FROM 'zcy';
    mysql>REVOKE DROP ON 数据库名.* FROM 'zcy';
    mysql>REVOKE ALTER ON 数据库名.* FROM 'zcy';
    
    --回收表记录的增删改权限
    mysql>REVOKE INSERT ON 数据库名.* FROM 'zcy';
    mysql>REVOKE UPDATE ON 数据库名.* FROM 'zcy';
    mysql>REVOKE DELETE ON 数据库名.* FROM 'zcy';

    ​ 设想一下,当我们想要从文件中存取数据的时候,是一个非常繁琐的过程,主要是因为文件中所有的内容对我们来说是连续的,没有规则的。如果我们将数据按照规则存在一个文件中,在设计一种规则可以拼凑组合成我们需要的操作,并通过这些指示在文件中存取数据,那么操作数据是不是能够变得更加简单快速呢?这串规则就被我们成为SQL。

      SQL : 结构化查询语言(Structured Query Language)简称SQL(发音:/ˈes kjuː ˈel/ "S-Q-L"),是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统

      SQL语言主要用于存取数据、查询数据、更新数据和管理关系数据库系统,SQL语言由IBM开发。SQL语言分为3种类型:

      1、DDL语句 数据库定义语言: 数据库、表、视图、索引、存储过程,例如CREATE DROP ALTER

      2、DML语句 数据库操纵语言: 插入数据INSERT、删除数据DELETE、更新数据UPDATE、查询数据SELECT

      3、DCL语句 数据库控制语言: 例如控制用户的访问权限GRANT、REVOKE

    1. 操作文件夹(库database)
        增: create database db1 charset utf8;
        删: drop database db1;
        改: alter database db1 charset latin1;
        查: show databases;
            show create database db1;
    
    2. 操作文件(表table)
        先切换到文件夹下: use db1;
        增: create table t1(id int, name char(16));
        删: drop table t1;
        改: alter table t1 modify name char(4);
            alter table t1 change name name1 char(3);
        查: show tables;
            show create table t1;
            desc t1; # 查看一张表的基本信息
    
    3. 操作文件中的内容(记录)
        增: insert into t1 values(1,'zcy'),(2,'zdr'),(3,"zfy");
        删: delete from t1 where id = 1;
            delete from t1; # #如果有自增id,新增的数据,仍然是以删除前的最后一样作为起始。
            truncate table t1;  # 数据量大,删除速度比上一条快,且直接从零开始.
        改: update t1 set name = 'hehe' where id = 2;
        查: select * from t1;
            select name from t1 where id = 1;
    
    *auto_increment # 表示: 自增
    *primary key # 表示:约束(不能重复且不能为空);加速查找
上一篇:Python常用模块-随机数模块(random)


下一篇:python 常用模块 time random os模块 sys模块 json & pickle shelve模块 xml模块 configparser hashlib subprocess logging re正则