Postgres数据库源码编译及部署


一、源码编译及安装

git clone https://github.com/postgres/postgres.git

1. 指定安装路径

--prefix=/opt/pgsql/postgresql指定安装路径,最终make install的时候,程序会被安装到这个目录下,而不是默认的/usr/lcoal

./configure

2. 编译安装

make
make install

3. 安装后 PostgreSQL 的目录结构

/usr/local/pgsql/bin/        # 可执行文件
/usr/local/pgsql/lib/        # 库文件
/usr/local/pgsql/share/      # 共享资源,如配置模板、文档

4. 设置环境变量

vi ~/.bashrc
export PATH=/usr/local/pgsql/bin:$PATH
source ~/.bashrc

二、PG数据库初始化

1. 初始化数据库目录

该操作只有在部署完后的首次需要执行,指定数据库文件存放地址-D $HOME/pgdata,指定超级用户名-U postgres

/usr/local/pgsql/bin/initdb -D /opt/postgres-custom/mydb -U postgres -E UTF8 --locale=en_US.UTF-8

2. 启动数据库

/usr/local/pgsql/bin/pg_ctl -D /opt/postgres-custom/mydb -l logfile start

其中:-D 指定数据库目录,-l logfile 指定日志文件

3. 连接数据库

/usr/local/pgsql/bin/psql -U postgres

输出

(base) hhhh@ubuntu-Super-Server:~$ psql -U postgres
psql (13.18)
Type "help" for help.

postgres=# 

4. 数据库启动失败,端口被占用

检查端口是否被占用,执行sudo ss -tuln | grep 5432 检查是否被占用

(base) hhhhh@ubuntu-Super-Server:~$ sudo ss -tuln | grep 5432
tcp   LISTEN 0      200                                      127.0.0.1:5432       0.0.0.0:*   

或者通过ps aux | grep postgres检查

(base) hhhh@ubuntu-Super-Server:~$ ps aux | grep postgres
hhhhh 1273591  0.0  0.0 214064 22400 ?        Ss   2月12   5:40 /opt/pgsql/postgresql/bin/postgres -D /opt/postgres-custom/mydb
hhhhh 1273592  0.0  0.0 214440 24972 ?        Ss   2月12   0:20 postgres: checkpointer 

上述内容表明:数据目录是 /opt/postgres-custom/mydb,而且正是它占用了 5432 端口,通过下面的命令关闭当前进程

/opt/pgsql/postgresql/bin/pg_ctl -D /opt/postgres-custom/mydb stop

三、GIST索引使用

GIST作为一个通用索引,支持实现各种树索引如Btree、Rtree等,在这里我们以GIST中的btree实现作为例子

1. 下载数据文件

cd $HOME/gist/test_dataset
wget https://data.police.uk/data/archive/2017-04.zip

查看一共多少条数据xsv cat rows **/*-street.csv | xsv count,并查看都有哪些列

(base) hhhhh@ubuntu-Super-Server:~/gist/test_dataset$ xsv cat rows **/*-street.csv | xsv count
38595130
(base) hhhhh@ubuntu-Super-Server:~/gist/test_dataset$ xsv headers 2010-12/2010-12-avon-and-somerset-street.csv
1   Crime ID
2   Month
3   Reported by
4   Falls within
5   Longitude
6   Latitude
7   Location
8   LSOA code
9   LSOA name
10  Crime type
11  Last outcome category
12  Context
(base) hanbaofu@ubuntu-Super-Server:~/gist/test_dataset$ 

统计多个 *-street.csv 文件中,不同类型犯罪(Crime type)出现的频率,并以表格形式展示。

(base) hanbaofu@ubuntu-Super-Server:~/gist/test_dataset$ xsv cat rows **/*-street.csv \
> | pv -l -s 38595130 \
> | xsv frequency --select 'Crime type' --limit 0 \
> | xsv table

38.6M 0:00:38 [1.01M/s] [===============================================================================================>] 100%            
field       value                         count
Crime type  Anti-social behaviour         13869607
Crime type  Violence and sexual offences  4047849
Crime type  Other theft                   3258648
Crime type  Criminal damage and arson     3129836
Crime type  Burglary                      2866490
Crime type  Vehicle crime                 2477833
Crime type  Other crime                   2147319
Crime type  Shoplifting                   1890071
Crime type  Violent crime                 1673219
Crime type  Drugs                         987402
Crime type  Public order                  792808
Crime type  Robbery                       391709
Crime type  Bicycle theft                 369895
Crime type  Theft from the person         346421
Crime type  Public disorder and weapons   242145
Crime type  Possession of weapons         103878
(base) hanbaofu@ubuntu-Super-Server:~/gist/test_dataset$ 

2. 将数据集加载到 Postgres 中

2.1 连接数据库

(base) hanbaofu@ubuntu-Super-Server:~/gist$ /usr/local/pgsql/postgresql/bin/psql -U postgres
psql (18devel)
Type "help" for help.

postgres=# 

执行create database crimes_db;生成数据库,并切换到当前数据库\c crimes_db

postgres=# create database crimes_db;
CREATE DATABASE
postgres=# \c crimes_db
You are now connected to database "crimes_db" as user "postgres".
crimes_db=# 

2.2 定义一个枚举类型

CREATE TYPE crime_type AS ENUM (
  'Anti-social behaviour',
  'Violence and sexual offences',
  'Other theft',
  'Criminal damage and arson',
  'Burglary',
  'Vehicle crime',
  'Other crime',
  'Shoplifting',
  'Violent crime',
  'Drugs',
  'Public order',
  'Robbery',
  'Bicycle theft',
  'Theft from the person',
  'Public disorder and weapons',
  'Possession of weapons'
);

2.3 创建一张数据表

CREATE TABLE crimes (
  month DATE,
  longitude REAL,
  latitude REAL,
  crime crime_type
);

2.4 加载到数据表

执行下面的命令,把多个 CSV 文件中的数据导入到 PostgreSQL 中的 crimes 表里

(base) hhhhh@ubuntu-Super-Server:~/gist/test_dataset$ xsv cat rows **/*-street.csv \
> | pv -l -s 38595130 \
> | xsv select Month,Longitude,Latitude,'Crime type' \
> | sed -E 's/^([0-9]+-[0-9]+)/\1-01/g' \
> | psql -U postgres -d crimes_db -c 'copy crimes from stdin csv header'


38.6M 0:01:25 [ 452k/s] [===============================================================================================>] 100%            
COPY 38595130
(base) hhhhh@ubuntu-Super-Server:~/gist/test_dataset$ 

通过快速 交叉表快速检查数据是否已加载完毕,在此之前,先安装如下扩展

crimes_db=# create extension tablefunc;
ERROR:  extension "tablefunc" is not available
DETAIL:  Could not open extension control file "/usr/local/pgsql/postgresql/share/extension/tablefunc.control": No such file or directory.
HINT:  The extension must first be installed on the system where PostgreSQL is running.

我们发现安装扩展失败,这是因为在从进行源码编译 PostgreSQL时,默认只编译了核心部分,而 PostgreSQL 自带的很多扩展(比如 tablefunc、uuid-ossp 等)其实都在一postgresql/contrib

执行下面的命令安装 contrib 扩展,这会把所有 .control、.sql 文件安装到 PostgreSQL 的安装目录下

cd ~/gist/postgres/contrib
make
sudo make install

接下来重新回到 psql,执行刚才的创建扩展命令即可。

crimes_db=# CREATE EXTENSION tablefunc;
CREATE EXTENSION
crimes_db=# 

通过快速交叉表看看多年来数据的分布情况:

select * from crosstab(
  $$ select crime, to_char(month, 'YYYY') as year, count(*) from crimes group by crime, year order by crime asc, year asc $$,
  $$ select gs from generate_series(2010, 2017) gs $$
) as ("Crime" text, "2010" int, "2011" int, "2012" int, "2013" int, "2014" int, "2015" int, "2016" int, "2017" int);

得到如下输出:注意在psql中,只要你不输入分号,就会默认这个命令没结束

crimes_db=# select * from crosstab(
crimes_db(# $$ select crime, to_char(month, 'YYYY') as year, count(*) from crimes group by crime, year order by crime asc, year asc $$,
crimes_db(# $$ select gs from generate_series(2010, 2017) gs $$
crimes_db(# ) as ("Crime" text, "2010" int, "2011" int, "2012" int, "2013" int, "2014" int, "2015" int, "2016" int, "2017" int);
            Crime             |  2010  |  2011   |  2012   |  2013   |  2014   |  2015   |  2016   |  2017  
------------------------------+--------+---------+---------+---------+---------+---------+---------+--------
 Anti-social behaviour        | 201016 | 2792756 | 2369431 | 2191485 | 2035155 | 1875251 | 1850397 | 554116
 Violence and sexual offences |        |         |         |  477713 |  839521 | 1049988 | 1232210 | 448417
 Other theft                  |        |  251482 |  737010 |  582768 |  515839 |  505800 |  496783 | 168966
 Criminal damage and arson    |        |  207293 |  563360 |  526600 |  516930 |  549252 |  570616 | 195785
 Burglary                     |  37893 |  505841 |  476006 |  455384 |  427448 |  410673 |  409102 | 144143
 Vehicle crime                |  29416 |  411012 |  392300 |  378911 |  356789 |  368599 |  394087 | 146719
 Other crime                  | 142705 | 1530533 |  182205 |   71454 |   53501 |   63296 |   74160 |  29465
 Shoplifting                  |        |  104179 |  303366 |  321207 |  331093 |  339237 |  361982 | 129007
 Violent crime                |  57580 |  729387 |  676732 |  209520 |         |         |         |       
 Drugs                        |        |   71007 |  208111 |  198252 |  177470 |  151401 |  137739 |  43422
 Public order                 |        |         |         |   91823 |  152113 |  194164 |  254129 | 100579
 Robbery                      |   5731 |   75068 |   68042 |   60648 |   52416 |   51651 |   56042 |  22111
 Bicycle theft                |        |         |         |   73342 |   95021 |   88193 |   86670 |  26669
 Theft from the person        |        |         |         |   68442 |   81964 |   83056 |   83483 |  29476
 Public disorder and weapons  |        |   51555 |  147405 |   43185 |         |         |         |       
 Possession of weapons        |        |         |         |   14133 |   21415 |   25168 |   31218 |  11944
(16 rows)

crimes_db=# 

源码编译安装PROJ库

# 安装编译所需依赖
sudo apt-get install build-essential cmake sqlite3 libsqlite3-dev
# 下载和编译PROJ
cd ~
wget https://download.osgeo.org/proj/proj-9.3.0.tar.gz
tar -xvzf proj-9.3.0.tar.gz
cd proj-9.3.0
mkdir build && cd build
cmake ..
make -j$(nproc)
sudo make install
sudo ldconfig

在执行cmake …的时候出现如下错误,这是因为在编译PROJ库时缺少TIFF库

-- Found Sqlite3: /usr/lib/x86_64-linux-gnu/libsqlite3.so
-- Sqlite3 version: 3.45.1
CMake Error at /usr/share/cmake-3.28/Modules/FindPackageHandleStandardArgs.cmake:230 (message):
  Could NOT find TIFF (missing: TIFF_LIBRARY TIFF_INCLUDE_DIR)
Call Stack (most recent call first):
  /usr/share/cmake-3.28/Modules/FindPackageHandleStandardArgs.cmake:600 (_FPHSA_FAILURE_MESSAGE)
  /usr/share/cmake-3.28/Modules/FindTIFF.cmake:272 (FIND_PACKAGE_HANDLE_STANDARD_ARGS)
  CMakeLists.txt:198 (find_package)

安装TIFF库的开发包:

sudo apt-get install libtiff-dev

如果遇到如下错误,则通过conda install -c conda-forge libtiff安装即可

-- Configuring incomplete, errors occurred!
(base) hanbaofu@ubuntu-Super-Server:~/proj-9.3.0/build$ sudo apt-get install libtiff-dev
正在读取软件包列表... 完成
正在分析软件包的依赖关系树... 完成
正在读取状态信息... 完成                 
有一些软件包无法被安装。如果您用的是 unstable 发行版,这也许是
因为系统无法达到您要求的状态造成的。该版本中可能会有一些您需要的软件
包尚未被创建或是它们已被从新到(Incoming)目录移出。
下列信息可能会对解决问题有所帮助:

下列软件包有未满足的依赖关系:
 libdeflate-dev : 依赖: libdeflate0 (= 1.19-1build1) 但是 1.19-1build1.1 正要被安装
 libzstd-dev : 依赖: libzstd1 (= 1.5.5+dfsg2-2build1) 但是 1.5.5+dfsg2-2build1.1 正要被安装
E: 无法修正错误,因为您要求某些软件包保持现状,就是它们破坏了软件包间的依赖关系。
(base) hanbaofu@ubuntu-Super-Server:~/proj-9.3.0/build$ conda install -c conda-forge libtiff
Retrieving notices: done

2.5 为数据设置经纬度坐标

在正式开始之前,需要先安装相应的依赖

2.5.1 安装PROJ库
cd ~/proj-9.3.0
rm -rf build
mkdir build && cd build
cmake .. -DCMAKE_PREFIX_PATH=$CONDA_PREFIX
make -j$(nproc)
sudo make install
sudo ldconfig
2.5.2 安装GDAL

下载源码

wget https://github.com/OSGeo/gdal/releases/download/v3.7.3/gdal-3.7.3.tar.gz
tar -xzf gdal-3.7.3.tar.gz
cd gdal-3.7.3
mkdir build && cd build
cmake ..
make -j$(nproc)
sudo make install
sudo ldconfig

安装完之后检查是否正确安装

# 检查gdal-config是否存在
which gdal-config

# 验证GDAL库文件是否存在
ls -la /usr/local/lib/libgdal*

# 检查GDAL版本
gdal-config --version

设置环境变量

export LD_LIBRARY_PATH=/usr/local/lib:$LD_LIBRARY_PATH
export CPLUS_INCLUDE_PATH=/usr/local/include:$CPLUS_INCLUDE_PATH
export C_INCLUDE_PATH=/usr/local/include:$C_INCLUDE_PATH
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig:$PKG_CONFIG_PATH
2.5.3 安装postgis扩展

在配置PostGIS时,确保 PostGIS 与相应的PG13 环境绑定,如果是其他的PG版本,则修改下面的内容即可

cd ~/gist/postgis-3.4.0
./configure --with-pgconfig=/opt/pgsql/postgresql/bin/pg_config

显式指定GDAL的所有相关路径:

./configure \
  --with-gdal=/usr/local/bin/gdal-config \
  --with-gdalconfig=/usr/local/bin/gdal-config \
  LDFLAGS="-L/usr/local/lib" \
  CPPFLAGS="-I/usr/local/include"
 
 make 
 sudo make install

输出

configure: WARNING: unrecognized options: --with-gdal

  PostGIS is now configured for x86_64-pc-linux-gnu

 -------------- Compiler Info ------------- 
  C compiler:           gcc -std=gnu99 -g -O2 -fno-math-errno -fno-signed-zeros -Wall
  C++ compiler (Wagyu): gcc -std=c++11 -x c++ 
  C++ compiler (FlatGeobuf): gcc -std=c++11 -x c++ 
  CPPFLAGS:              -I$HOME/miniconda3/include   -I$HOME/miniconda3/include/libxml2 -I/home/hanbaofu/miniconda3/include    -DNDEBUG -I/usr/local/include
  LDFLAGS:              -L/usr/local/lib -lm
  SQL preprocessor:     /usr/bin/cpp -traditional-cpp -w -P -Upixel -Ubool
  Archiver:             gcc-ar rs

 -------------- Additional Info ------------- 
  Interrupt Tests:   ENABLED

 -------------- Dependencies -------------- 
  GEOS config:          $HOME/miniconda3/bin/geos-config
  GEOS version:         3.13.1
  GDAL config:          /usr/local/bin/gdal-config
  GDAL version:         3.7.3
  PostgreSQL config:    /usr/local/pgsql/postgresql/bin/pg_config
  PostgreSQL version:   PostgreSQL 18devel
  PROJ4 version:        93
  Libxml2 config:       $HOME/miniconda3/bin/xml2-config
  Libxml2 version:      2.13.7
  JSON-C support:       no
  protobuf support:     yes
  protobuf-c version:   1004001
  PCRE support:         not found
  Perl:                 /usr/bin/perl

 --------------- Extensions --------------- 
  PostgreSQL EXTENSION support:       enabled
  PostGIS Raster:                     enabled
  PostGIS Topology:                   enabled
  SFCGAL support:                     disabled
  Address Standardizer support:       disabled

 -------- Documentation Generation -------- 
  xsltproc:             
  xsl style sheets:     
  dblatex:              
  convert:              
  mathml2.dtd:          http://www.w3.org/Math/DTD/mathml2/mathml2.dtd

然后在psql中执行下面的命令

create extension postgis;

3. 创建gist空间索引

4. 创建Btree-gist索引

btree_gist扩展与PG数据库中默认的btree索引的区别在于:它允许在同一个索引中混合使用不同类型的数据,特别是那些普通B-tree索引不支持的类型。例如:

CREATE TABLE properties (
    id INT,
    address TEXT,
    price NUMERIC,
    location POINT,  -- 空间类型,存储经纬度坐标
    area POLYGON     -- 空间类型,存储物业边界
);

现在创建了一个properties普通Btree索引适用于的数据类型有:数值类型(整数、浮点数)字符串类型(text, varchar等)日期时间类型UUID以及枚举类型等。其无法支持空间类型:如点(point)、线(line)、多边形(polygon)、圆(circle)等。当我们想要执行一个复合查询时,比如:现在你想要租房,然后想查询一个价格在2k-3k每个月,五月份起租,位置在北京市海淀区知春路地铁站附近的房源信息。这里面就涉及到了数值范围条件(价格)以及日期比较(起租日期)以及空间条件(位置信息)。针对于上述需求,那么普通的btree是无法满足的,因为其不支持空间查询。

因此可以使用gist中的btree_gist来支持上述的操作。

-- GiST索引方案,只需要创建一个索引就可以完成对普通数据类型和空间数据类型的查询处理
CREATE INDEX mixed_property_idx ON properties USING gist (price, address, location, area);

否则就需要创建多个类型的索引,分别来处理普通数据类型和空间数据类型

-- 普通B-tree索引处理价格信息
CREATE INDEX property_price_idx ON properties USING btree (price);
-- 位置信息无法使用btree创建,所以需要使用gist中的其他空间索引来创建
CREATE INDEX property_location_idx ON properties USING gist (location);

5. PG中contrib目录下Sql作用

当创建PG中的索引扩展时,系统会读取对应contrib目录下扩展中的sql语句,例如,创建btree_gist扩展,会读取其目录下的sql文件

btree_gist--1.0--1.1.sql
btree_gist--1.1--1.2.sql 
btree_gist--1.2.sql 
btree_gist--1.2--1.3.sql
btree_gist--1.3--1.4.sql
btree_gist--1.4--1.5.sql
btree_gist--1.5--1.6.sql 
btree_gist--1.6--1.7.sql
btree_gist--1.7--1.8.sql

其中:--1.2--1.3表示这是一个PG的索引扩展升级脚本,用于将btree_gist扩展从版本1.2升级到版本1.3。当在本地编译PG源代码时,这些SQL文件会被安装到PG的共享目录中(通常是$PREFIX/share/postgresql/extension/)。这样,当执行ALTER EXTENSION btree_gist UPDATE TO 'X.Z'命令时,PostgreSQL可以找到对应的升级脚本并执行。btree_gist--1.2.sql 这种没有版本范围(–X.Y–X.Z),表示完整的扩展创建脚本,用于直接安装特定版本的扩展,而不是升级

当我们创建btree_gist扩展的时候,需要现在contrib/btree_gist下面进行make以及make install编译,这个时候会在该目录下生成btree_gist.control文件,如果在没编译的时候将在pg中通过指令create extension btree_gist;创建索引扩展,就会出现如下错误:
DETAIL: Could not open extension control file "/usr/local/pgsql/share/extension/btree_gist.control": No such file or directory.
这是因为在本地编译PG源代码时,这些SQL文件会被安装到PG的共享目录中,通过/usr/local/pgsql/bin/pg_config --sharedir指令查询,得到/usr/local/pgsql/share。然后到该路径下/usr/local/pgsql/share/extension/发现了contrib/btree_gist中的sql文件已经被加载到这里。

(base) hhhhhhhh@ubuntu-Super-Server:~/gist/postgres/contrib/btree_gist$ /usr/local/pgsql/bin/pg_config --sharedir
/usr/local/pgsql/share

(base) hhhhh@ubuntu-Super-Server:/usr/local/pgsql/share/extension$ ls
btree_gist--1.0--1.1.sql  btree_gist--1.2.sql       btree_gist--1.5--1.6.sql  btree_gist.control
btree_gist--1.1--1.2.sql  btree_gist--1.3--1.4.sql  btree_gist--1.6--1.7.sql  plpgsql--1.0.sql
btree_gist--1.2--1.3.sql  btree_gist--1.4--1.5.sql  btree_gist--1.7--1.8.sql  plpgsql.control

6.问题解决

无法创建扩展,当前用户不是超级用户:

(base) hahahahah@ubuntu-Super-Server:$ /opt/pgsql/postgresql/bin/psql -U postgres
psql (13.18)
Type "help" for help.

crimes_db=> CREATE EXTENSION postgis;
ERROR:  permission denied to create extension "postgis"
HINT:  Must be superuser to create this extension.
crimes_db=> exit

查看当前用户的权限,通过 SELECT rolname, rolsuper FROM pg_roles WHERE rolname = 'postgres';查看当前用户是否为超级用户:

postgres=> SELECT rolname, rolsuper FROM pg_roles WHERE rolname = 'postgres';
 rolname  | rolsuper 
----------+----------
 postgres | f
(1 row)

解决办法:删除数据库,重新生成用户,然后可以创建扩展

rm -rf /opt/postgres-custom/mydb
cd ~
/opt/pgsql/postgresql/bin/initdb -D /opt/postgres-custom/mydb -U postgres -E UTF8 --locale
=en_US.UTF-8
/opt/pgsql/postgresql/bin/pg_ctl -D /opt/postgres-custom/mydb -l logfile start
/opt/pgsql/postgresql/bin/psql -U postgres
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值