WHCSRL 技术网

GreenPlum工具gpload安装指南

一、介质准备

Gploader介质需从官方下载,下载地址:Download VMware Tanzu™ Greenplum® — VMware Tanzu Network

GreenPlum6.0及之后的版本loader与client合并在了一起,因此只需要根据操作系统下载client的相应介质:

 在6.0之前的版本中client与loader是分开的,因此要分别下载client和loader的介质:

二、安装过程

gpload依赖于python2.7,因此首先要在环境中安装python2.7版本。

根据版本不同,介质安装方式不同:

6.0以下版本(以5.14.0版本为例):

1、准备介质

解压介质包

  1. unzip greenplum-clients-5.14.0-rhel7-x86_64.zip #获得greenplum-clients-5.14.0-rhel7-x86_64.bin
  2. unzip greenplum-loaders-5.14.0-rhel7-x86_64.zip #获得greenplum-loaders-5.14.0-rhel7-x86_64.bin

2、安装(root用户或sudo方式安装)

  1. chmod +x greenplum-clients-5.14.0-rhel7-x86_64.bin
  2. chmod +x greenplum-loaders-5.14.0-rhel7-x86_64.bin
  3. ./greenplum-clients-5.14.0-rhel7-x86_64.bin #安装过程中会提示确认安装目录,使用默认选项即可
  4. ./greenplum-loaders-5.14.0-rhel7-x86_64.bin #安装过程中会提示确认安装目录,使用默认选项即可

3、设置环境变量

  1. source /usr/local/greenplum-clients-5.14.0/greenplum_clients_path.sh #本次会话有效
  2. source /usr/local/greenplum-loaders-5.14.0/greenplum_loaders_path.sh #本次会话有效

6.0及以上版本(以6.18.0为例):

1、准备介质

greenplum-db-clients-6.18.0-rhel7-x86_64.rpm #下载的介质即为rpm包

2、安装

  1. yum install bzip2 libyaml libevent
  2. rpm -ivh greenplum-db-clients-6.18.0-rhel7-x86_64.rpm #默认

安装即可

3、设置环境变量

source /usr/local/greenplum-db-clients-6.18.0/greenplum_loaders_path.sh #本次会话有效

三、测试验证

1、编写控制文件test.yml

  1. ---
  2. VERSION: 1.0.0.1
  3. DATABASE: testdb
  4. USER: test
  5. HOST: 127.0.0.1
  6. PORT: 5432
  7. GPLOAD:
  8. INPUT:
  9. - SOURCE:
  10. LOCAL_HOSTNAME:
  11. - 127.0.0.1
  12. PORT: 15444
  13. FILE:
  14. - /home/test/test.csv #数据文件路径
  15. - COLUMNS:
  16. - id: INT8
  17. - MAX_LINE_LENGTH: 1000000
  18. - FORMAT: csv
  19. - DELIMITER: ','
  20. - HEADER: true
  21. OUTPUT:
  22. - TABLE: public.t_test #测试表,表中包含字段id 类型为INT8
  23. - MODE: insert

2、准备数据文件test.csv

  1. id
  2. 1
  3. 2
  4. 3
  5. 4

3、执行gpload

gpload -f test.yml #成功导入数据则安装成功,否则根据具体提示处理

推荐阅读