我有一个查询,它使用类似的条件,这正在杀死我的服务器
(此查询是我在slow-query-log中经常得到的内容)
顺便说一句,我的表大约有12万行-请忽略语法错误
select * from `images` where `category` like `%,3,%` and ( `tags` like '%,tag1,%' or `tags` like '%,tag2,%' or `tags` like '%,tag3,%' or `tags` like '%,tag4,%')
我现在不想更改查询和数据库设计,因此我决定切换到myisam并为标签列使用全文索引.
之后的服务器负载变化不大,mysql仍会不时使用高达90%的cpu(8分之一).
所以我很想知道,这种全文索引…是要索引旧数据(在添加此索引之前)?因为它发生的非常快,我的桌子很大.
还是只对新存储的数据起作用?
解决方法:
已对现有数据建立索引,但正如Pyrce所建议的那样,具有LIKE%[token]%的查询无法利用全文索引.
像这样重写您的条件,这完全等同于您的初始查询(忽略stopwords and the likes):
WHERE MATCH(tags) AGAINST ('tag1 tag2 tag3 tag4' IN BOOLEAN MODE)
但是,您应该专注于规范化结构.在字段中存储非标量值(例如,逗号分隔的值)违反了first normal form.
创建一个新的image_tag表,并与图像建立1-N关系.常规索引将允许即时查询.
CREATE TABLE image_tags (
image_id INT,
tag VARCHAR(50),
PRIMARY KEY (image_id, tag),
FOREIGN KEY (image_id) REFERENCES images(id), -- replace with "images" table's actual primary key
KEY(tag, image_id) -- this index may be superfluous, check EXPLAIN
);
SELECT images.*
FROM images
JOIN image_tags ON image_id = images.id
WHERE tag IN ('tag1', 'tag2', 'tag3', 'tag4');
重复images.category.