利用 UDF 轻松迁移

位运算、布尔运算和逐位运算的乐趣

如果您正从支持位运算、布尔运算以及一些函数的数据库迁移到 IBM® DB2® Universal Database™(UDB),那么您也许会对如何在 DB2 中处理这些类型和函数感到困惑。本文作者提出了一种方法,这个方法中包括使用约束条件或触发器创建的表,表中包含类似于位(bit-like)的数据类型的列或布尔数据类型的列;该方法还包含一组用户定义函数(UDF),用于支持模仿位数据或布尔数据类型的行为的逐位运算和布尔运算。

简介

许多关系数据库(包括 Sybase、Oracle、Microsoft® SQL Server 和 Informix®)都支持位数据类型或布尔(Boolean)数据类型的列,并为这些数据类型提供了逐位(bitwise)函数或布尔(Boolean)函数。T-SQL 也提供了逐位(bitwise)运算 —— integer、smallint 和 tinyint 数据类型之间进行的 AND、OR、NOT、EXCLUSIVE OR 运算;而 PL/SQL 支持 BITAND —— 或用于 integer 数据类型的逻辑
AND。DB2 UDB 没有为位数据类型或布尔数据类型提供本机支持,它既不支持逐位操作,也不支持布尔代数操作。

本文将提供一种方法,该方法包括使用约束条件或触发器创建了一个表,表中包含类似于位(bit-like)或布尔数据类型的列;该方法还包括一组用户定义函数(UDF),用于支持模仿位数据或布尔数据类型的行为的逐位运算和布尔运算。本文还提供了一组在整型变量之间执行逐位运算的 UDF。

回页首

模仿 T-SQL 位数据类型

以下是 T-SQL 参考中对位数据类型的定义:“使用位列(bit column)来获得真(true)和假(false)数据类型,或是(yes)和否(no)的数据类型。位列保存 0 或 1。位列接受 0 或 1 之外的整数值,但总是将它解释为 1。位(bit)数据类型的列不能为 NULL,且不能对其进行索引。”

例如,我们有一个表,它在 Sybase 或 SQL Server 数据库中的声明如下:

create table mytab
(custname varchar(30) not null,
age integer not null,
flag1 bit not null,
flag2 bit not null)

可以使用 DB2 SMALLINT 数据类型和 NOT NULL 约束条件,将该表转换成 DB2:

      CREATE TABLE mytab
(name varchar(30) not null,
age int not null,
flag1 smallint NOT NULL,
flag2 smallint NOT NULL);

同时,我们还需要强制实施特殊规则,以复制 T-SQL 处理位数据类型列的方式。在位数据类型的定义中:“位列保存 0 或 1,它也接受 0 或 1 之外的整数值,但总是将该值解释为 1。”例如,在 Sybase 和 Microsoft SQL Server 中,如果向位列插入值 10,那么它将被解释为 1,而该列将保存值 1。为了确保列 flag1 和 flag2 只保存 1 或 0(无论 INSERT 语句中提供的是何值),需要创建下列 INSERT 触发器:

CREATE TRIGGER DB2ADMIN.INSFORBIT
NO CASCADE BEFORE INSERT ON DB2ADMIN.MAR1
REFERENCING NEW AS new
FOR EACH ROW MODE DB2SQL
BEGIN ATOMIC
if new.c2 <>0 then set new.c2 = 1;
end if;
END

该触发器将确保 0 之外的任何值都被解释为 1。您还需要为 UPDATE 操作创建一个类似的触发器,以确保位列上的值是正确的。

现在,我们需要提供逐位运算函数:& (and)、| (or)、^ (exclusive or)、or ~ (not)。实质上,我们需要编写一组 UDF,实现下列位操作真值表。

& (and) 1 0
1 1 0
0 0 0
| (or) 1 0
1 1 1
0 1 0
^ (exclusive or) 1 0
1 0 1
0 1 0
~ (not)  
1 FALSE
0 0

以下就是这组 UDF:

CREATE FUNCTION DB2ADMIN.BIT_AND(X smallint, Y smallint)
RETURNS INTEGER
------------------------------------------------------------------------
-- SQL UDF (Scalar)
------------------------------------------------------------------------
F1: BEGIN ATOMIC
IF x =1 and y = 1 THEN
RETURN 1 ;
ELSEIF (x < 0 or x > 1) or (y < 0 or y > 1) THEN
SIGNAL SQLSTATE '77701' SET MESSAGE_TEXT ='ONLY 1 OR 0 ARGUMENTS VALUE ACCEPTED';
ELSE RETURN 0;
END IF;
END

请注意,我们通过在变量不为 1 或 0 时发出应用程序错误来限制变量值。

CREATE FUNCTION DB2ADMIN.BIT_OR(X smallint, Y smallint)
RETURNS INTEGER
------------------------------------------------------------------------
-- SQL UDF (Scalar)
------------------------------------------------------------------------
BEGIN ATOMIC
IF x =0 AND y = 0 THEN
RETURN 0;
ELSEIF (x < 0 or x > 1) or (y < 0 or y > 1) THEN
SIGNAL SQLSTATE '77701' SET MESSAGE_TEXT ='ONLY 1 OR 0 ARGUMENTS VALUE ACCEPTED';
ELSE RETURN 1;
END IF;
END
CREATE FUNCTION DB2ADMIN.EXCLUSIVE_OR(X smallint, Y smallint)
RETURNS INTEGER
------------------------------------------------------------------------
-- SQL UDF (Scalar)
------------------------------------------------------------------------
F1: BEGIN ATOMIC
IF (x < 0 or x > 1) or (y < 0 or y > 1) THEN
SIGNAL SQLSTATE '77701' SET MESSAGE_TEXT ='ONLY 1 OR 0 ARGUMENTS VALUE ACCEPTED';
ELSEIF (x = y) THEN
RETURN 0;
ELSE RETURN 1;
END IF;
END
CREATE FUNCTION DB2ADMIN.bit_not(x smallint )
RETURNS INTEGER
------------------------------------------------------------------------
-- SQL UDF (Scalar)
------------------------------------------------------------------------
F1: BEGIN ATOMIC
IF x = 1 THEN
RETURN 0;
ELSEIF (x < 0 or x > 1) THEN
SIGNAL SQLSTATE '77701' SET MESSAGE_TEXT ='ONLY 1 OR 0 ARGUMENT VALUE ACCEPTED';
ELSE
RETURN 1;
END IF;
END

现在,通过 mytab 表定义,我们可以使用以上 UDF 将 T-SQL 语句转换成 DB2 。

T-SQL SQL 语句:

select flag1&flag2 from mytab where custname = 'JOHN SMITH'

将被转换成 DB2 为:

SELECT  bit_and(flag1,flag2) FROM  mytab where custname = 'JOHN SMITH';

T-SQL SQL 语句:

select flag1 | flag2 from mytab where custname = 'SAM BROWN'

将被转换成 DB2 为:

SELECT  bit_or(flag1,flag2) where mytab where custname = 'SAM BROWN';

回页首

模仿 Oracle 的布尔数据类型

让我们考虑下列需要转换成 DB2 UDB 的 PL/SQL 代码。

我们有一个 Oracle 表,如下所示:

        create table myOracle_tab
(custname varchar(30) not null,
age integer not null,
flag1 BOOLEAN,
flag2 BOOLEAN);

并且具有下列 PL/SQL SQL 语句,可以使用它们在列 flag1 和 flag2(均为 BOOLEAN 数据类型)上进行运算:

     select flag1 AND flag2 from mytab where custname = 'JOHN SMITH';
select flag1 OR flag2 from mytab where custname = 'SAM BROWN';

DB2 smallint 数据类型可用于转换 Oracle Boolean 数据类型。PL/SQL 支持下列用于布尔(Boolean)列的值 —— TRUE、FALSE 和 NULL。我们可以用 1 表示 TRUE,0 表示 FALSE,并允许该列为空。以下展示了可以如何转换 CREATE TABLE myOracle_tab 语句:

   create table myOracle_tab
(name char(20),
boolcol smallint constraint bool_cnst check (c2 in(0,1)));

bool_cnst 将确保所插入的值只能是 0 或 1。如果没有提供任何值,则该列将为 NULL。

PL/SQL 支持三种操作符 —— AND、OR 和 NOT,对布尔变量进行运算并返回布尔值。为了将该行为转换到 DB2 中,我们需要创建 UDF 来支持布尔逻辑运算。

x y x AND y x OR y NOT x
TRUE TRUE TRUE TRUE FALSE
TRUE FALSE FALSE TRUE FALSE
TRUE NULL NULL TRUE FALSE
FALSE TRUE FALSE TRUE TRUE
FALSE FALSE FALSE FALSE TRUE
FALSE NULL FALSE NULL TRUE
NULL TRUE NULL TRUE NULL
NULL FALSE FALSE NULL NULL
NULL NULL NULL NULL NULL

下列 UDF 将实现以上运算:

  CREATE FUNCTION DB2ADMIN.bool_and(x smallint, y smallint)
RETURNS SMALLINT
------------------------------------------------------------------------
-- SQL UDF (Scalar)
------------------------------------------------------------------------
F1: BEGIN ATOMIC
IF x IS NULL OR y IS NULL THEN
ELSEIF x =1 AND y = 1 THEN
RETURN 1 ;
ELSE RETURN 0;
END IF;
END
CREATE FUNCTION DB2ADMIN.bool_NOT(x smallint)
RETURNS SMALLINT
------------------------------------------------------------------------
-- SQL UDF (Scalar)
------------------------------------------------------------------------
BEGIN ATOMIC
IF x IS NULL THEN
RETURN NULL;
ELSEIF x=1 THEN RETURN 0;
ELSE RETURN 1;
END IF;
END
CREATE FUNCTION DB2ADMIN.bool_or(x smallint, y smallint)
RETURNS SMALLINT
------------------------------------------------------------------------
-- SQL UDF (Scalar)
------------------------------------------------------------------------
BEGIN ATOMIC
IF x = 1 THEN RETURN 1;
ELSEIF x = 0 THEN
RETURN y;
ELSEIF y = 1 THEN RETURN 1;
ELSE RETURN NULL;
END IF;
END

Oracle SQL 语句:

select flag1 AND flag2 from mytab where custname = 'JOHN SMITH'

将被转换成 DB2 为:

SELECT  bool_and(flag1,flag2) FROM mytab where custname = 'JOHN SMITH';

Oracle SQL 语句:

select flag1  OR  flag2 from mytab where custname = 'SAM BROWN'

将被转换成 DB2 为:

SELECT bool_or(flag1,flag2) FROM  mytab where custname = 'SAM BROWN';

回页首

用于整型变量的逐位操作

正如简介中提到的,PL/SQL 和 T-SQL 支持声明为 integer 的变量之间的逐位运算。逐位运算在其二进制形式的整型变量上执行逻辑 AND、OR、EXLUSIVE OR 和 NOT 运算。

让我们看一个它是如何工作的特定例子。假设我们需要在 110 和 85 这两个整数之间执行逻辑 AND 和逻辑 OR 运算。

首先,要将这两个数字转换成二进制数字,然后通过真值表对每一个位进行 AND 和 OR 运算,最后将二进制结果还原成整型数字。

整数                     二进制形式

   110                    1101110
85 1010101
---- 逻辑 AND
64 1000100 整数 二进制形式 110 1101110
85 1010101
----- 逻辑 OR
127 1111111

对于无法在头脑中轻易将整型数字转换成二进制数字的人们来说,下列将整型转换成二进制的 UDF 也许对他们很有帮助。

CREATE FUNCTION int_to_binary (N1 Integer)
RETURNS varchar(32)
LANGUAGE SQL
SPECIFIC int2bin
BEGIN ATOMIC
DECLARE M1, i, len Integer default 0;
DECLARE temp_str varchar(32) default ' ';
DECLARE result_str varchar(32) default ' ';
SET M1 = N1;
WHILE M1 > 0 DO
SET temp_str = temp_str || cast(mod(m1,2) as char(1));
set m1 = m1/2;
END WHILE;
set len = length (temp_str);
while i < len do
set result_str = result_str || substr(temp_str,len-i,1);
set i = i+1;
end while;
RETURN result_str;
END

既然已经了解了逐位运算和变量转换的定义,那么我们现在就可以提供 DB2 UDF 来支持这些操作了。

为了将应用程序从 Oracle 转换成 DB2,Takashi Tokunaga 编写了一个函数来支持 BITAND,而且还提供了其他一些有用的迁移 UDF:http://www.ibm.com/developerworks/db2/library/samples/db2/0205udfs/index.html

为了完整起见,下面还提供了该函数的代码:

CREATE FUNCTION BITAND (N1 Integer, N2 Integer)
RETURNS Integer
LANGUAGE SQL
SPECIFIC BITANDOracle
CONTAINS SQL
NO EXTERNAL ACTION
DETERMINISTIC
BEGIN ATOMIC
DECLARE M1, M2, S Integer;
DECLARE RetVal Integer DEFAULT 0;
SET (M1, M2, S) = (N1, N2, 0);
WHILE M1 > 0 AND M2 > 0 AND S < 32 DO
SET RetVal = RetVal + MOD(M1,2)*MOD(M2,2)*power(2,S);
SET (M1, M2, S) = (M1/2, M2/2, S+1);
END WHILE;
RETURN RetVal;
END

现在,让我们从 CLP 提示符调用该函数:

C:\Program Files\IBM\SQLLIB\BIN>db2 values bitand(110,85)
1
-----------
68
1 record(s) selected.

为了支持从 Sybase 和 Microsoft SQL Server 进行迁移,需要具有那些用于 BITOR、EXLUSIVE OR 和 NOT 的 UDF。以下是 BITOR UDF:

CREATE FUNCTION BITOR (N1 Integer, N2 Integer)
RETURNS Integer
LANGUAGE SQL
SPECIFIC BITORCONV
BEGIN ATOMIC
DECLARE M1, M2, S , temp1 Integer;
DECLARE RetVal Integer DEFAULT 0;
SET (M1, M2, S) = (N1, N2, 0);
WHILE ( M1 > 0 OR M2 > 0) AND S < 32 DO
SET temp1 = bit_or(mod(m1,2),mod(m2,2));
SET RetVal = RetVal + temp1*power(2,S);
SET (M1, M2, S) = (M1/2, M2/2, S+1);
END WHILE;
RETURN RetVal;
END

注意,该函数使用了我们编写的 BIT_OR UDF 对类似于位数据类型的参数进行运算。

现在,让我们从 CLP 调用这个函数:

C:\Program Files\IBM\SQLLIB\BIN>db2 values bitor(110,85)
1
-----------
127
1 record(s) selected.

下一个 UDF 在给定的两个整数值之间执行 EXLUSIVE OR 运算,这两个值已经被转换成二进制形式:

CREATE FUNCTION BIT_EXLOR (N1 Integer, N2 Integer)
RETURNS Integer
LANGUAGE SQL
SPECIFIC BITOREXL
BEGIN ATOMIC
DECLARE M1, M2, S, temp1 Integer;
DECLARE RetVal Integer DEFAULT 0;
SET (M1, M2, S) = (N1, N2, 0);
WHILE ( M1 > 0 OR M2 > 0 ) AND S < 32 DO
SET temp1 = EXCLUSIVE_OR(smallint(mod(m1,2)),smallint(mod(m2,2)));
SET RetVal = RetVal + temp1*power(2,S);
SET (M1, M2, S) = (M1/2, M2/2, S+1);
END WHILE;
RETURN RetVal;
END

同样,该函数使用前面提供的函数 EXLUSIVE_OR,并且可以按如下方式执行:

C:\Program Files\IBM\SQLLIB\BIN>db2 values bit_exlor (110,85)
1
-----------
59
1 record(s) selected.

为了验证该函数确实按照所设计的方式工作,我们需要再次将每个整型数字转换成二进制数字,对每一个位执行 EXLUSIVE OR 运算,然后将结果还原成 INTEGER:

整型                二进制形式

110                   1101110
85 1010101
---- Exclusive OR
59 0111011

下一个也是最后一个涉及逐位运算的 UDF 是逐位 NOT 运算,在转换成二进制表达式时,该 UDF 对给定的整数值执行逐位逻辑 NOT 运算。

CREATE FUNCTION BITWISE_not (N1 Integer)
RETURNS Integer
LANGUAGE SQL
SPECIFIC BITWNOT
BEGIN ATOMIC
DECLARE M1, S , temp1 Integer;
DECLARE RetVal Integer DEFAULT 0;
SET (M1, S) = (N1, 0);
WHILE M1 > 0 AND S < 32 DO
SET temp1 = bit_not(mod(m1,2));
SET RetVal = RetVal + temp1*power(2,S);
SET (M1, S) = (M1/2, S+1);
END WHILE;
RETURN RetVal;
END

下面展示了它是如何工作的:

C:\Program Files\IBM\SQLLIB\BIN>db2 values bitwise_NOT(110)
1
-----------
17
1 record(s) selected.
  整型 二进制形式 110 1101110
--- 逻辑 NOT
17 0010001

回页首

结束语

模仿位和布尔数据类型以及函数并非一定是一个挑战性的过程。使用本文中所谈论的 UDF 和触发器,您可以很轻松地将数据和应用程序迁移到 DB2 Universal Database 中。

原文链接:http://www.ibm.com/developerworks/cn/data/library/techarticles/dm-0504greenstein/

上一篇:代码块(Block)回调一般阐述


下一篇:PXE简要配置过程