程序员通常使用逗号分隔的列表来避免在多对多的关系中创建交叉表,
将这种设计方式定义为一种反模式,称为“乱穿马路”。
目标: 存储多属性值,即多对一
反模式:将多个值以格式化的逗号分隔存储在一个字段中
比如:ProductAccount表(Contacts表),产品与账号信息表,一个产品有有多个联系人账号信息。
1、查询:查询指定账号的产品。不能使用SQL语法中的等号操作符,只能使用like 或者正则表达式,索引将不可用,查询效率降低。
2、关联查询:查询指定 产品的账号信息。简单的sql语句无法实现,而且无法使用索引,查询效率极低。
3、聚合查询:聚合查询使用SQL的内置函数,Count()、Sum()、Avg()等。这些函数是针对分组行而设计的,
并不是为了逗号分隔的列表。 需要借非正常方法来实现。
4、修改、删除:修改或者删除一条记录时,必须执行2条SQL语句:第一条查询老的数据列表;第二条存储更新后的列表。
5、数据的合法性无法验证:用什么来防止用在在ID字段中输入诸如“aaa”这样的非法字段。用户总能找到办法输入他们想输入的东西,
然后数据库变的越来越乱,并且数据变的毫无价值。
6、需要使用合适的分隔符号:如果存储一个字符串列表而不是数字列表,列表中的某些条目可能会包含分隔符。
使用逗号作为分隔符可能会有问题,当然可以换另外一种分隔字符,但你无法确保这个新字符永远不出现在条目中。
7、字段的长度限制会影响分类数量。
如何识别反模式:出现以下现象时,说明已经乱穿马路了。
1、字段存储的值有数量限制:这个问题在选择Varchar列的最大长度时被提及。
2、需要使用正则表达式来提取数据,这可能是一种提示,意味着你应该把这些数据分开存储。
3、要注意保存的内容中不出现特殊定义的分隔符号。比如逗号、(区分全角半角)竖线、横线等。
合理使用反模式:
如果应用程序接收的源数据是有逗号分隔的格式,而你只需要存储和使用它们并且不对其做任何修改,
完全没有必要分开其中的值。
简单理解为:要保存的数据值不会用于查询、或者关联查询,合法性也很容易控制,值也不会太多或太长,才可以用反模式。
解决方案:创建一张交叉表,作为关联使用。
SQL反模式,系列学习汇总