随着互联网web2.0网站的兴起，传统的关系数据库在应付web2.0网站，特别是超大规模和高并发的SNS(社交网络)类型的web2.0纯动态网站已经显得力不从心，暴露了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展，NoSQL数据库的生产就是为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题。

一、关系数据库与非关系型数据库

1、关系型数据库

关系型数据库是一个结构化的数据库，创建在关系模型 (二维表格模型) 基础上，一般面向于记录。

SQL语句 (标准数据查询语言) 就是一种基于关系型数据库的语言，用于执行对关系型数据库中数据的检索和操作。

主流的关系型数据库包括Oracle、MySQL(mariadb)、SQL Server、Microsoft Access、DB2等。

2、非关系型数据库

NoSQL (NoSQL=NotOnlySQL)，意思是“不仅仅是SQL”，是非关系型数据库的总称。
除了主流的关系型数据库外的数据库，都认为是非关系型。

主流的 NoSQL 数据库有Redis、 MongoDB、 Hbase、 Memcached、Postgresql等。
redis 、memecached 、mangodb postgresql ————》需要学习和理解这些非关数据库是作用在哪里的（放在哪），能做什么（场景）

3、关系型数据库和非关系型数据库区别

3-1、数据存储方式不同

关系型和非关系型数据库的主要差异是数据存储的方式。关系型数据天然就是表格式的，因此存储在数据表的行和列中。数据表可以彼此关联协作存储，也很容易提取数据。
与其相反，非关系型数据不适合存储在数据表的行和列中，而是大块组合在一起。非关系型数据通常存储在数据集中，就像文档、键值对或者图结构。你的数据及其特性是选择数据存储和提取方式的首要影响因素。
① 关系型：依赖于关系模型E-R图，同时以二维表格式的方式存储数据
② 非关系型：除了以表格形式存储之外，通常会以大块的形式组合在一起进行存储数据

3-2、扩展方式不同

SQL和NoSQL数据库最大的差别可能是在扩展方式上，要支持日益增长的需求当然要扩展。要支持更多并发量，SQL数据库是纵向扩展，也就是说提高处理能力，使用速度更快速的计算机，这样处理相同的数据集就更快了。因为数据存储在关系表中，操作的性能瓶颈可能涉及很多个表，这都需要通过提高计算机性能来克服。虽然SQL数据库有很大扩展空间，但最终肯定会达到纵向扩展的上限。
而NoSQL数据库是横向扩展的。因为非关系型数据存储天然就是分布式的，NoSQL数据库的扩展可以通过给资源池添加更多普通的数据库服务器 (节点) 来分担负载。
① 关系：纵向（天然表格式）
② 非关：横向（天然分布式）

3-3、对事务性的支持不同

如果数据操作需要高事务性或者复杂数据查询需要控制执行计划，那么传统的SQL数据库从性能和稳定性方面考虑是最佳选择。SQL数据库支持对事务(ACID)原子性细粒度控制，并且易于回滚事务。
虽然NoSQL数据库也可以使用事务操作，但稳定性方面没法和关系型数据库比较，所以它们真正闪亮的价值是在操作的扩展性和大数据量处理方面。
① 关系型：特别适合高事务性要求和需要控制执行计划的任务
② 非关系：此处会稍显弱势，其价值点在于高扩展性和大数据量处理方面

3-4、非关系型数据库产生背景

可用于应对Web2.0纯动态网站类型的三高问题。
(1) High performance-------对数据库高并发读写需求
(2) HugeStorage--------------对海量数据高效存储与访问需求
(3) High Scalability && High Availability------- 对数据库高可扩展性与高可用性需求

关系型数据库和非关系型数据库都有各自的特点与应用场景，两者的紧密结合将会给Web2.0的数据库发展带来新的思路。让关系数据库关注在关系上，非关系型数据库关注在存储上。例如，在读写分离的MySQL数据库环境中，可以把经常访问的数据存储在非关系型数据库中，提升访问速度。
Mysql 高热数据——》redis
web ——》redis ——》mysql
CPU——》内存/缓存 ——》磁盘

总结：
关系型数据库：实例–>数据库–>表(table)–>记录行(row)、数据字段(column)——》存储数据

非关系型数据库：实例–>数据库–>集合(collection) -->键值对(key-value)
workdir=/usr/local/mysql

非关系型数据库不需要手动建数据库和集合(表)。

二、Redis简介

1、概念

Redis是一个开源的、使用C语言编写的NoSQL 数据库。

Redis基于内存运行并支持持久化(支持存储在磁盘)，采用key-value (键值对)的存储形式，是目前分布式架构中不可或缺的一环。

2、模型

Redis服务器程序是单进程模型
Redis服务在一台服务器上可以同时启动多个Redis进程，Redis的实际处理速度则是完全依靠于主进程的执行效率。若在服务器上只运行一个Redis进程，当多个客户端同时访问时，服务器的处理能力是会有一定程度的下降；若在同一台服务器上开启多个Redis进程，Redis在提高并发处理能力的同时会给服务器的CPU造成很大压力。即：在实际生产环境中，需要根据实际的需求来决定开启多少个Redis进程。
建议可以开2个进程
原因：
1、备份
2、抗高并发的同时尽量不给CPU造成太大的压力
若对高并发要求更高一些，可能会考虑在同一台服务器上开启多个进程。若CPU资源比较紧张，采用单进程即可。

3、单进程快速的原因：

PS ：补充加深一点
使用 epoll（默认） + I/O多路复用机制
首先，Redis 是跑在单进程中的，所有的操作都是按照顺序线性执行的，但是由于读写操作等待用户输入或输出都是阻塞的，所以 I/O 操作在一般情况下往往不能直接返回，这会导致某一文件的 I/O 阻塞导致整个进程无法对其它客户提供服务，而 I/O 多路复用就是为了解决这个问题而出现的。
epoll 机制优势：
1. epoll 没有最大并发连接的限制，上限是最大可以打开文件的数目，这个数字一般远大于 2048, 一般来说这个数目和系统内存关系很大，具体数目可以 cat /proc/sys/fs/file-max 察看。
2. 效率提升， Epoll 最大的优点就在于它只管你“活跃”的连接，而跟连接总数无关，因此在实际的网络环境中， Epoll 的效率就会远远高于 select 和 poll 。
3. 内存拷贝， Epoll 在这点上使用了“共享内存 ”，这个内存拷贝也省略了
I/O多路复用就通过一种机制，可以监视多个描述符，一旦某个描述符就绪，能够通知程序进行相应的操作。

4、epoll模型所实现的I/O多路复用可以定义为如下：

socket 1 --->
socket 2 ---> I/O多路复用程序 --》文件事件分派器（从队列中获取，再分发给对应处理器）--》命令处理、请求、连接应答等处理器
socket 3 --->

多个socket 会定义为一个fd文件描述符（每有一个新建、打开、修改等“事件”内核就会返回一个fd（可理解为索引）），在每个fd激活时，会进行内核中的回调函数

I/O多路复用程序会监听socket 活跃的链接，然后调用该socket （而此socket 文件句柄主要实现的是网络上的“ip+port+协议所标识的网络中的‘进程’”）可以简单理解为虚拟接口（抽象层）
本质而言就是使用一个线程来追踪多个socket（I/O流）的状态，来管理多个I/O

I/O复用：一个线程同时追踪、管理多个连接（原本默认情况下是一个线程对应一个连接）
回调：预先定义具体的执行过程（定义一个方法），等待调用，在一个线程给执行时，可以根据“触发器”“钩子” 完成回调，回调的目的是提高处理性能和节省资源

5、Redis 具有以下几个优点（redis 特性（与其他nosql对比））

5-1、具有极高的数据读写速度：数据读取的速度最高可达到 110000 次/s，数据写入速度最高可达到 81000 次/s。

5-2、支持丰富的数据类型：支持key-value、 Strings、Lists、 Hashes（散列值）、 Sets 及Ordered Sets 等数据类型操作。
ps:
string 字符串（可以为整形、浮点和字符型，统称为元素）
list 列表：（实现队列，元素不唯一，先入先出原则）
set 集合：（各不相同的元素）
hash hash散列值：（hash的key必须是唯一的）
set /ordered sets 集合/有序集合

5-3、支持数据的持久化：可以将内存中的数据保存在磁盘中，重启的时候可以再次加载进行使用。

5-4、原子性：Redis所有操作都是原子性的。

5-5、支持数据备份：即master-salve 模式的数据备份。

丰富的特性 – Redis还支持 publish（消息发布）/subscribe（订阅）, 通知, 设置key有效期等等特性。

Redis作为基于内存运行的数据库，缓存是其最常应用的场景之一。除此之外，Redis常见应用场景还包括获取最新N个数据的操作、排行榜类应用、计数器应用、存储关系、实时分析系统、日志记录。支持key-value、 Strings、Lists、 Hashes（散列值）、 Sets 及Ordered Sets 等数据类型操作。

三、部署步骤

1、Redis安装部署

[root@localhost ~]# systemctl stop firewalld
[root@localhost ~]# setenforce 0
[root@localhost ~]# hostnamectl set-hostname redis
[root@localhost ~]# su
[root@redis ~]# yum install -y gcc gcc-c++ make
yum repolist
重新yum
yum install -y gcc*

#将redis-5.0.7.tar.gz 压缩包上传到/opt 目录中
[root@redis ~]# cd /opt
[root@redis opt]# rz -E
rz waiting to receive.
[root@redis opt]# tar zxvf redis-5.0.7.tar.gz -C /opt/

[root@redis opt]# cd /opt/redis-5.0.7/
[root@redis redis-5.0.7]# make
[root@redis redis-5.0.7]# make PREFIX=/usr/local/redis install
#由于Redis源码包中直接提供了Makefile 文件，所以在解压完软件包后，不用先执行./configure 进行配置，可直接执行make与make install命令进行安装

#执行软件包提供的 install_server.sh 脚本文件设置Redis服务所需要的相关配置文件
[root@redis redis-5.0.7]# cd /opt/redis-5.0.7/utils
[root@redis utils]# ./install_server.sh
.......          #一直回车.
Please select the redis executable path [] /usr/local/redis/bin/redis-server
#需要手动修改为 /usr/local/redis/bin/redis-server    注意要一次性正确输入
-------------------------------------------------------------------------------------
Selected config:
Port               : 6379                               #默认侦听端口为6379
Config file        : /etc/redis/6379.conf               #配置文件路径
Log file           : /var/log/redis_6379.log            #日志文件路径
Data dir           : /var/lib/ redis/6379               #数据文件路径
Executable         : /usr/local/redis/bin/redis-server  #可执行文件路径
Cli Executable     : /usr/local/redis/bin/redis-cli     #客户端命令工具
-------------------------------------------------------------------------------------

#把redis的可执行程序文件放入路径环境变量的目录中便于系统识别
[root@redis utils]# ln -s /usr/local/redis/bin/* /usr/local/bin/

#当install_server.sh 脚本运行完毕，Redis 服务就已经启动，默认侦听端口为6379
[root@redis utils]# netstat -natp | grep redis

#Redis服务控制
/etc/init.d/redis_6379 stop       #停止
/etc/init.d/redis_6379 start      #启动
/etc/init.d/redis_6379 restart    #重启
/etc/init.d/redis_6379 status     #状态

#修改配置 /etc/redis/6379.conf 参数
[root@redis utils]# vim /etc/redis/6379.conf
bind 127.0.0.1 192.168.226.20      #70行，添加监听的主机地址
port 6379                          #93行，Redis默认的监听端口
daemonize yes                      #137行，启用守护进程
pidfile /var/run/redis_6379.pid    #159行，指定PID文件
loglevel notice                    #167行，日志级别
logfile /var/log/redis_6379.log    #172行，指定日志文件


[root@redis utils]# /etc/init.d/redis_6379 restart

2、Redis命令工具

redis-server: 用于启动Redis 的工具
redis-benchmark: 用于检测Redis在本机的运行效率
redis-check-aof: 修复AOF持久化文件
redis-check-rdb: 修复RDB持久化文件
redis-cli: Redis 命令行工具.

rdb 和aof 是redis服务中持久化功能的两种形式RDB AOF 
redis-cli 常用于登陆至redis 数据库

3、redis-cli 命令行工具（远程登陆）

语法: redis-cli -h host -p port -a password
-h :指定远程主机
-p :指定Redis 服务的端口号
-a :指定密码，未设置数据库密码可以省略-a选项
若不添加任何选项表示，则使用127.0.0.1:6379 连接本机上的 Redis 数据库，

redis-cli -h 192.168.159.20 -p 6379

4、redis-benchmark 测试工具

redis-benchmark 是官方自带的 Redis 性能测试工具，可以有效的测试 Redis 服务的性能。

基本的测试语法: redis-benchmark [选项] [选项值]
-h :指定服务器主机名。
-p :指定服务器端口。
-s :指定服务器socket（套接字）
-c :指定并发连接数。
-n :指定请求数。
-d :以字节的形式指定 SET/GET 值的数据大小。
-k : 1=keep alive  0=reconnect
-r : SET/GET/INCR 使用随机key, SADD使用随机值。
-P :通过管道传输<numreq>请求。
-q :强制退出redis。 仅显示query/sec 值。
--csv :以CSV格式输出。
-l :生成循环，永久执行测试。
-t :仅运行以逗号分隔的测试命令列表。
-I : Idle模式。仅打开 N 个idle连接并等待。

#向IP地址为192.168.159.20、端口为6379 的Redis 服务器发送100个并发连接与100000 个请求测试性能
redis-benchmark -h 192.168.159.20 -p 6379 -c 100 -n 100000

#测试存取大小为100字节的数据包的性能
redis-benchmark -h 192.168.159.20 -p 6379 -q -d 100

#测试本机上Redis 服务在进行set与lpush操作时的性能
redis-benchmark -t set,lpush -n 100000 -q

5、Redis数据库常用命令

5-1、SET 与 GET 命令

set: 存放数据，命令格式为set key value
get: 获取数据，命令格式为get key

redis-cli 
127.0.0.1:6379> set teacher zhangsan
OK
127.0.0.1:6379> get teacher
"zhangsan"

当多个客户端访问redis同一个关键数据时，客户端的请求修改数据时均会使用setnx，当第一个客户端的请求任务在执行修改过程中，redis 会对此数据进行加锁（可以通过固定过期时间/watch dog 的形式续期+通知lock.unlock{[释放锁)的机制释放）在锁定期间，第二个客户端的请求任务不会修改数据,而是会等待
目的:缓解高并发的压力(因为本身redis使用的是单线程epo11-I/o复用的机制)所以第二个任务请求(socket所被分配的文件描述符，不是就续状态，所以不会消耗太多资源）不会占用太多资源

5-2、keys命令

#keys命令可以取符合规则的键值列表，通常情况可以结合*、?等选项来使用。
127.0.0.1:6379> set k1 1 
127.0.0.1:6379> set k2 2 
127.0.0.1:6379> set k3 3
127.0.0.1:6379> set v1 4
127.0.0.1:6379> set v5 5
127.0.0.1:6379> set v22 5

127.0.0.1:6379> KEYS *        #查看当前数据库中所有键
 1) "v5"
 2) "myset:__rand_int__"
 3) "v1"
 4) "counter:__rand_int__"
 5) "v22"
 6) "teacher"
 7) "k2"
 8) "mylist"
 9) "k3"
10) "key:__rand_int__"
11) "k1"

127.0.0.1:6379> KEYS v*       #查看当前数据库中以v开头的数据
1) "v5"
2) "v1"
3) "v22"

127.0.0.1:6379> KEYS v?       #查看当前数据库中以v开头后面包含任意一位的数据
1) "v5"
2) "v1"

127.0.0.1:6379> KEYS v??      #查看当前数据库中以v开头v开头后面包含任意两位的数据
1) "v22"

5-3、exists 命令

#exists 命令可以判断键值是否存在。
127.0.0.1:6379> exists teacher    #判断teacher 键是否存在
(integer) 1                       # 1表示teacher 键是存在
127.0.0.1:6379> exists tea
(integer) 0                       #0表示tea键不存在

5-4、del命令

#del命令可以删除当前数据库的指定key。
127.0.0.1:6379> keys *
127.0.0.1:6379> del v5 
(integer) 1
127.0.0.1:6379> get v5
(nil)

5-5、type 命令

# type 命令可以获取key对应的 value 值类型。
127.0.0.1:6379> type k1
string

5-6、 rename 命令

# rename 命令是对已有key进行重命名。 (覆盖)
命令格式: rename 源key  目标key
使用rename命令进行重命名时，无论目标key是否存在都进行重命名，且源key的值会覆盖目标key的值。在实际使用过程中，建议先用 exists命令查看目标key是否存在，然后再决定是否执行rename命令，以避免覆盖重要数据。

127.0.0.1:6379> keys v*
1) "v1"
2) "v22"
127.0.0.1:6379> rename v22 v2
OK
127.0.0.1:6379> keys v*
1) "v1"
2) "v2"
127.0.0.1:6379> get v1
"4"
127.0.0.1:6379> get v2
"5"
127.0.0.1:6379> rename v1 v2
127.0.0.1:6379> get v1
(nil)
127.0.0.1:6379> get v2
"4"

5-7、renamenx命令

# renamenx
rename n 不进行修改 x进行修改
nx 组合： 先判断 命令的作用是对已有key进行重命名，并检测新名是否存在，如果目标key存在则不进行重命名。 (不覆盖)
命令格式: renamenx 源key  目标key
127.0.0.1 :6379> keys *
127.0.0.1:6379> get teacher
"zhangsan"
127.0.0.1:6379> get v2
"4"
127.0.0.1:6379> renamenx v2 teacher
(integer) 0
127.0.0.1:6379> keys *
127.0.0.1 :6379> get teacher
"zhangsan"
127.0.0.1:6379> get v2
"4"

5-8、dbsize命令

#dbsize命令的作用是查看当前数据库中key的数目。
127.0.0.1:6379> dbsize
(integer) 9

5-9、设置密码

#使用config set requirepass your password 命令设置密码
127.0.0.1:6379> config set requirepass 123456

5-10、查看密码

#使用config get requirepass 命令查看密码(一旦设置密码，必须先验证通过密码，否则所有操作不可用)
127.0.0.1:6379> auth 123456
127.0.0.1:6379> config get requirepass

5-11、删除密码

#删除密码
127.0.0.1:6379> auth 123123
127.0.0.1:6379> config set requirepass ''
#以上不设置，无法重启redis

6、Redis 多数据库常用命令（16个库 0-15）

Redis支持多数据库，Redis 默认情况下包含16个数据库，数据库名称是用数字0-15 来依次命名的。多数据库相互独立，互不干扰。

6-1、多数据库间切换

#多数据库间切换
命令格式: select 序号
使用 redis-cli 连接Redis数据库后，默认使用的是序号为 0 的数据库。
127.0.0.1:6379> select 10        #切换至序号为10的数据库

127.0.0.1:6379[10]> select 15    #切换至序号为15的数据库

127.0.0.1:6379[15]> select 0     #切换至序号为0的数据库

6-2、多数据库间移动数据

#多数据库间移动数据
格式: move  键值  序号

127.0.0.1:6379> set k1 100
OK
127.0.0.1:6379> get k1
"100"
127.0.0.1:6379> select 1
OK
127.0.0.1:6379[1]> get k1
(nil)
127.0.0.1:6379[1]> select 0    #切换至目标数据库0
OK
127.0.0.1:6379> get k1         #查看目标数据是否存在
"100"
127.0.0.1:6379> move k1 1      #将数据库0中k1移动到数据库1中
(integer) 1
127.0.0.1:6379> select 1       #切换至目标数据库1
OK
127.0.0.1:6379[1]> get k1      #查看被移动数据
"100"
127.0.0.1:6379[1]> select 0 
OK
127.0.0.1:6379> get k1         #在数据库0中无法查看到k1的值
(nil)

6-3、清除数据库内数据(rm -rf )

#清除数据库内数据(rm -rf )
FLUSHDB  :清空当前数据库数据
FLUSHALL :清空所有数据库的数据，慎用!

6-4、redis 远程数据备份（全量、增量）

是以Shell 脚本的形式
redis_backup.sh
#!/bin/bash 
TIME=$
BCDIR=
redis_server=
post
psword

6-5、Redis出现的问题

redis 缓存穿透 击穿 雪崩
redis 分布式锁（）

总结

redis数据库在大并发，高负载的网站中必须考虑，redis数据库中的所有数据都存储在内存中。由于内存的读写速度远快于硬盘，因此Redis在性能上对比其他基于硬盘存储的数据库有非常明显的优势。
项目中使用Redis，主要是从两个角度去考虑：性能、并发。当然，Redis的的的还具备可以做分布式锁等其他功能，但是如果只是为了分布式锁这些其他功能，完全还有其他中间件代替，并不是非要使用Redis的的的。因此，这个问题主要从性能和并发两个角度去答。
性能：我们在碰到需要执行耗时特别久，且结果不频繁变动的SQL，就特别适合将运行结果放入缓存，这样，后面的请求就去缓存中读取，请求使得能够迅速响应。

并发：在大并发的情况下，所有的请求直接访问数据库，数据库会出现连接异常。这个时候，就需要使用的的Redis的做一个缓冲操作，让请求先访问到的Redis的的，而不是直接访问数据库。

redis优势：

1、运行在内存，速度快官方号称支持并发11瓦特读操作，并发8瓦特写操作，可以说是相当彪悍了。
2、数据虽在内存，但是提供了持久化的支持，即可以将内存中的数据异步写入到硬盘中，同时不影响继续提供服务
3、支持数据结构丰富（string（字符串），list（链表），set（集合），zset（sorted set - 有序集合））和Hash（哈希类型，md5加密出来的那个串）。

码农公寓

前言