plsql中数据生成工具data generator的使用

使用数据库时,有时需要使用大量的数据,可以用PLSQL Developer提供的Data Generator工具,

这里记录一下工具的介绍及几个使用注意事项

1、工具介绍

功能入口位于 工具 菜单下,汉化版名字为 数据生成器,英文版称为 Data Generator。

这个工具可以很方便的生成大量数据。

界面布局很简洁,看到界面就差不多知道后续要怎么做了。鼠标悬停在按钮上方时,会有对功能的简单描述,还是很方便的。

如果对界面不熟悉,可以看看其他文章,网上还挺多的。

2、数据定义(Data Definition)基本字符集合

选中需要处理的表格后,会自动加载表的字段信息(Name,Type,Size), 位于后方的 Data 列用于定义生成的数据。

先说一下预定义的字符集(characters):

标识符 代表字符集合
a abcdefghijklmnopqrstuvwxyz
A ABCDEFGHIJKLMNOPQRSTUVWXYZ
@ A..Z a..z(省略中间的)
# A..Z a..z 0..9
0 0..9(和9一样)
9 0..9(和0一样)
1 1..9
* 所有的ASCII字符

举例来说:

[Aaa00] 会生成类似 Gxe21,Liy05这样的字符串

[AA '-' 1000] 会生成 CX-4903SY-1044这样的数据,定义中 单引号 包裹的内容会直接输出,定义中 没有在单引号内的空格 会被忽略。

[Aa(5..15)' 'Aa(8..20)] 会生成 Masfae Qwwecdsadif 样子的数据,定义中小括号内的数据定义了随机生成的字符数量的界限。

3、数据定义时可用的函数

下面这段引用了(转)PL/SQL Developer Data Generator的使用 - 失乐园 - BlogJava 的内容:

  • Signal(Min, Max, Delta, Noise) 返回技术测定数据(象温度这样的)。

    Min(最小)和 Max(最大)决定范围, Delta(△)为最大更改量,还可以添加一些 Noise(噪声)。例如:Signal(-10, 20, 0.1, 0.1)。

  • Random([Min], Max) 返回Min(最小)和 Max(最大)之间的随机数。

    如果只指定了 Max ,那么 Min 就被设为 0 。对于日期字段,可以输入Min(最小)和 Max(最大)的日期。

  • Sequence(Start, [Inc], [WithinParent]) 返回序号。

    Start 为开始值,Inc 为增量(默认为 1)。对于明细表,可以再指定 WithinParent 关键词来指出序列应该为每个父记录进行重新安排。

  • List('item'(weight), 'item'(weight), ...) 随机地返回指定项目(item)之一。

    加权数(weight)可以被添加到两个括号之间,允许特定项目比其他项目出现的几率更大。

    例如:List('CLERK'(50), 'SALESMAN'(30), 'MANAGER'(10))

  • List(select statement) 象前面的 List 函数,但项目是通过 SQL select statement(select 语句)返回的。

  • Text([Style], MaxCharacters, [WordsPerLine, LinesPerParagraph]) 这个函数返回文本。

    可选择的 Style可以是是象 [aA] 这样的字符集,在这种情况下,词汇从指定的字符集中产生。
    MaxCharacters 决定了生成的文本的最大大小,

    WordsPerLine 和 LinesPerParagraph 决定了行和段落的大小。

    指定的大小可以是指定的数字或范围(最小..最大)。

  • File(path, path, ...) 从特定的路径(path)中随机地选择一个文件,并插入内容。

    允许输入二进制数据(象图片这样的)到数据库中。路径可以使用通配符,象 d:"images"*.bmp 这样的。

可以通过使用下列函数更改前面函数的文本结果:

​ •Uppercase()

​ •LowerCase()

​ •InitCaps()

例如:InitCaps( List(select ename from emp) )

3、使用注意事项

  • 未经测试,直接生成大量数据至数据库引发的无限弹窗报错

    生成数据至数据库时,并不会遇到报错就停止,而是会继续向下执行,如果配置数据时存在错误,plsql会为每一个错误弹出一个窗口,如果一开始就生成了几万条数据,就会有几万个窗口等着你点击,这种时候只能关掉plsql的进程重新开始。

    最佳的操作应该是在定义数据后,修改生成数据的数量,比如10,然后生成对应的sql,单独执行确认配置无误后再执行大数据量的插入。

  • 生成的VARCHAR类型的数据,没有被单引号包裹

    varchar2,nvarchar2等类型的字段插入数据时需要由单引号包裹,该工具生成的数据不包含单引号,插入时会出现 标识符过长,标识符无效等问题。

    可以借用 List 函数解决该问题。如定义:List(select '''' from dual) + [A(4)] + List(select '''' from dual)可以生成类似 'HYSF' 的数据,因为在 oracle中,单引号( ' ) 还会被视为转义符,即 ’‘ 代表 ’

  • 切换到其他需要生成数据的表时,可以保留上一张表对数据的定义

上一篇:MyBatis逆向工程


下一篇:MyBatis-Plus自动生成