1. 如何产生 1T 以上数据
利用tpch 工具数据生成功能
$ ./dbgen -s 1000GB
$ ll -rth *.tbl
-rw-r--r-- 1 oracle oinstall 389 Jul 25 17:00 region.tbl
-rw-r--r-- 1 oracle oinstall 116G Jul 25 17:00 partsupp.tbl
-rw-r--r-- 1 oracle oinstall 2.2K Jul 25 17:00 nation.tbl
-rw-r--r-- 1 oracle oinstall 1.4G Jul 25 17:00 supplier.tbl
-rw-r--r-- 1 oracle oinstall 24G Jul 25 17:00 part.tbl
-rw-r--r-- 1 oracle oinstall 169G Jul 25 17:00 orders.tbl
-rw-r--r-- 1 oracle oinstall 758G Jul 25 17:00 lineitem.tbl
-rw-r--r-- 1 oracle oinstall 24G Jul 25 17:00 customer.tbl
2. oracle 创建表
利用tpch 提供的dss.ddl 文件 以及dss.ri 文件, 创建表和主键,外键
3. 如何导入大数据至oracle
利用oracle 自带的sqlldr 工具
A) 准备控制文件, 例如: 导入数据到orders 表
LOAD DATA
INFILE "orders.tbl"
APPEND
INTO TABLE orders
Fields terminated by "|"
Optionally enclosed by '"'
trailing nullcols
(
O_ORDERKEY,
O_CUSTKEY ,
O_ORDERSTATUS ,
O_TOTALPRICE ,
O_ORDERDATE ,
O_ORDERPRIORITY ,
O_CLERK ,
O_SHIPPRIORITY ,
O_COMMENT
)
B) 执行并行导入操作
sqlldr userid=test/test control=orders.ctl direct=true parallel=true &