对于支持多种数据库平台及各类字符集的通用产品,可变字符类型会是个未预知的坑,在此记录。取各种制约条件的最严约束如下:
1、varchar/nvarchar类型的最大长度不能超过1300(nvarchar在dm环境映射为varchar),如果需要更大空间请选择Clob/Text
2、数据表所有字段占用字节总长度不能超过65535, 即varchar类型长度总和 * 4 + 其他类型字节长度总和 < 65535
3、内码及编号等纯英文字段,使用varchar类型(节省空间及数据表最大字节限制);
4、业务用户手工输入的文本字段,如果可能是日韩等其他文字,请考虑使用nvarchar(因为对于GBK等本地字符集,varchar存储日韩文为乱码)
5、业务系统如果可能涉及日韩文字,国产数据库请考虑选择UTF-8字符集,而非默认的GBxxx
以下是各数据库平台的字符集编码及长度限制
关于字符集与编码。
字符集的定义其实就是字符的集合(即一种字符集只是表示它收录识别了哪些字符,给每个字符一个逻辑意义的编号,并没有定义如何存储),而字符编码才是定义了这些字符变成字节用于保存、读取和传输。
数据库平台识别的是字符集编码。