PostgreSQL简介
简介
PostgreSQL在业内通常也简称PG,是一个关系型数据库管理系统,适用于各种Linux操作系统、Windows、Solaris、BSD和Mac OS X。PostgreSQL遵循BSD许可,是一个开源软件,PostgreSQL作为全球第四大关系型数据库服务,正在以飞快的速度发展,目前已经广泛用在各个行业,PostgreSQL本身具有哪些功能特点,请往下看
# 1. PostgreSQL数据库是目前功能最强大的开源数据库,是架构上和Oracle最接近的开源数据库.它基本上包含其他所有商业或开源数据库中你能找到的功能。
# 2. 最接近工业标准SQL92,新功能兼容最新的SQL标准:SQL2003,支持SQL2011的主要特性见:http://www.postgresql.org/docs/9.4/interactive/features.html
# 3. 支持复杂的多表JOIN查询SQL:JOIN算法支持 hash join、merge join。
# 4 .支持窗口函数 ,可以改成复杂分析函数,因为分析函数包括了窗口函数。
# 5. 多进程的架构,更加稳定,单机可以支持更高访问量的数据库。
# 6. 有功能强大,性能优秀的GIS插件Postgis。
为什么要使用PostgreSQL?
PostgreSql提供了许多功能,旨在帮助开发人员构建应用程序,管理员保护数据完整性并且构建容错环境,并帮助你管理数据,无论数据集的大小。除了免费和开源之外,Postgre SQL还具有高度的可扩展性。例如,你可以定义自己的数据类型,构建自定义SQL函数,甚至可以编写来自不同编程语言的代码,而不需要重新编译数据库。
PostgreSql试图符合SQL标准,在这种标准中,这种一致性不会与传统特性相矛盾,或者可能导致糟糕的架构决策。支持SQL标准所需的许多功能,但是有时候语法或者功能略有不同。随着时间的推移,可以预期进一步向一致性迈进。从2018年10月发布的11版本开始,PostgreSQL符合SQL:2011核心一致性的179个强制性功能中的至少160个,在此之前,没有任何关系型数据库符合此标准的完全符合。
对比Mysql
- PostgreSQL的稳定性极强,Innodb等引擎在崩溃、断电之类的灾难场景下抗打击能力有了长足的进步,然而很多Mysql用户都遇到过Server级的数据库丢失的场景---Mysql系统库是MyISAM的,相较而言,PG数据库在这方面要好一些。
- 任何系统都有他的性能极限,在高并发读写,负载逼近极限下,PG的性能指标仍然可以维持双曲线甚至对数曲线,到顶峰之后不再下降,而MySQL明细出现一个波峰后下滑。
- PG多年在GIS领域处于优势地位,因为它有丰富的几何类型,实际上不止几何类型,PG中有大量的字典、数组、bitmap等数据类型,相比之下MaySQL就差很多,insagram就是因为PG的空间数据库扩展POSTGIS远远强于MySQL的my spatial而采用PGSQL的。
- PG的“无锁定”特性非常突出,甚至包括vacuum这样的整理数据空间的操作,这个和PGSSQL的MVCC实现有关系。
- PG的可以使用函数和条件索引,这使得PG数据库的调优非常灵活,mysql就没有这个功能,条件索引在web应用中很重要。
- PG有极其强悍的SQL编程能力,有丰富的统计函数和统计语法支持,比如分析函数(Oracle的叫法,PG里面叫Window函数),还可以用多种语言来写存储过程,对于R的支持也很好。这一点上MySQL就差的很远,很多分析功能那个都没有,腾讯内部数据存储主要是Mysql,但是主要的数据分析就是Hadoop+PGsql。
- PG的有很多中集群架构可以选择,plproxy可以支持语句级的镜像或者分片,slony可以进行字段级的同步设置,standby可以构建WAL文件级或者流式的读写分离集群,同步频率和集群策略调整方便,操作非常简单。
- 一般关系型数据库的字符串有限定长度8k左右,无限长Text类型的功能受限,只能作为外部大数据访问。而PG的TEXT类型可以直接方法,SQL语法内置正则表达式,可以索引,还可以全文检索,或使用xml xpath。用PG的话,文档数据库就可以省略了
- 对于web应用来说,复制的特性很重要,Mysql到现在也是异步复制,pgsql可以做到同步,异步,半同步复制。还有mysql的同步是基于binlog复制,类似oracle golden gate, 是基于stream的复制,做到同步很困难,这种方式更加适合异地复制,pgsql的复制基于wal,可以做到同步复制。同时pgsql还提供stream复制。
- Pgsql对于numa架构的支持要比mysql强一些,比mysql对于读的性能要好些,pgsql提交可以完全异步,而mysql的内存表不够实用(表锁原因)
部署PostgreSQL
安装rpm源
yum -y install https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.noarch.rpm
安装服务包
# 安装客户端
yum install postgresql10
# 安装服务端
yum install postgresql10-server
初始化
# 初始化
/usr/pgsql-10/bin/postgresql-10-setup initdb
# 设置自动启动并且启动postgresql服务
systemctl enable postgresql-10
systemctl start postgresql-10
准备用户和数据库
# 创建用户和数据库
# 使用postgres用户登录(PostgresSQL安装后会自动创建postgres用户,无密码)
su - postgres
Last failed login: Mon Jun 15 08:35:20 CST 2020 from 205.185.115.40 on ssh:notty
There were 2 failed login attempts since the last successful login.
-bash-4.2$ psql
# 登录postgresql数据库
psql (10.13)
Type "help" for help.
# 创建用户和数据库并授权
create user sonar with password ‘123456‘; # 创建用户
create database sonar owner sonar; # 创建数据库
grant all privileges on database sonar to sonar; # 授权
# \q退出
在CentOS上,默认的PostgreSQL数据目录是/var/lib/pgsql/版本号/data
PostgreSQL的配置文件就在这个目录下/var/lib/pgsql/版本号/data/postgresql.conf,还有一个配置文件也需要稍加关注,那就是访问控制配置文件/var/lib/pgsql/版本号/data/pg_hba.conf
开启远程访问
# 开启远程访问
-bash-4.2$ vi /var/lib/pgsql/10/data/postgresql.conf
listen_addresses = ‘*‘
port = 5432
password_encryption = on 前面的 # 号去掉
# exit退出
# 再对pg_hba.conf内容进行配置,将上面红框内的ident改为md5,然后再在最下面加入 host all all 0.0.0.0/0 md5
重启服务
# 重启服务
systemctl restart postgresql-10.service
ss -antlp |grep 5432
LISTEN 0 128 *:5432 *:* users:(("postmaster",pid=10853,fd=3))
LISTEN 0 128 :::5432 :::* users:(("postmaster",pid=10853,fd=4))
修改postgres用户密码(非必要)
# 修改默认生成的 postgres 用户密码(此postgres非上面的postgres用户,此为数据库的用户,上面的为操作系统的用户)(非必要)
su - postgres
psql -U postgres
alter user postgres with encrypted password ‘1‘;