我需要从我的一个表中删除所有重复的记录,问题是没有任何id或唯一或键列,所以我不能做这样的事情:
delete from tbl using tbl,tbl t2 where tbl.locationID=t2.locationID
and tbl.linkID=t2.linkID and tbl.ID>t2.ID
因为它需要id列或唯一或键列
我无法做出一个
ALTER IGNORE TABLE 'mytable' ADD UNIQUE INDEX
因为有些信息总是必要的,但其他信息却没有
我无法做到这一点:
DELETE FROM 'table' WHERE 'field' IN (SELECT 'field' FROM 'table' GROUP BY 'field'HAVING (COUNT('field')>1))
因为它会删除所有重复的,永远不会留下一个
这是我的表的一个例子
+----------+----------------------+-------------+-------------+
| phone | address | name | cellphone |
+----------+----------------------+-------------+-------------+
| 2555555 | 1020 PANORAMA | JUAN CARLOS | 0999999999 | diferent address
| 2555555 | GABRIEL JOSE 1020 | JUAN CARLOS | 0999999999 | good one
| 2555555 | GABRIEL JOSE 1020 | JUAN CARLOS | 0999999999 | duplicated
| 2555555 | C ATARAZANA 1020 | SILVIA | 0777777777 | another good one
| 2555555 | C ATARAZANA 1020 | SILVIA | 0777777777 | another duplicated
| 2555555 | GABRIEL JOSE 1020 | VIOLETA | 0888888888 | diferent person
+----------+----------------------+-------------+-------------+
这就是我想要离开的
+----------+----------------------+--------------+-------------+
| phone | address | name | cellphone |
+----------+----------------------+--------------+-------------+
| 2555555 | 1020 PANORAMA | JUAN CARLOS | 0999999999 |
| 2555555 | GABRIEL JOSE 1020 | JUAN CARLOS | 0999999999 |
| 2555555 | C ATARAZANA 1020 | SILVIA | 0777777777 |
| 2555555 | GABRIEL JOSE 1020 | VIOLETA | 0888888888 |
+----------+----------------------+--------------+-------------+
我不能截断或删除原始表,因为它使用24/7并具有10000000条记录….
请帮我.
解决方法:
使用ALTER IGNORE
添加唯一索引(包含表的所有列)将删除重复项:
ALTER IGNORE TABLE table_name
ADD UNIQUE INDEX all_columns_uq
(phone, address, name, cellphone) ;
在SQL-Fiddle测试.
注意:在版本5.5中(由于快速索引创建的实现中的错误),只有在ALTER之前提供此设置时,上述操作才有效:
SET SESSION old_alter_table=1 ;