关于ES查询问题跟进,定时任务分词优化

通过ES 模糊查询的时候发现 有个数据根据id不能成功实现;

1、分词去掉部分关键词再搜索也不行;

后来发现是由于定时任务中 数据筛选的字段allContent里面的内容 不同字段用空格拼接的时候 连接到了一起,导致不能成功搜索到数据,因此补充了相关字段后追加的空格 实现了可以模糊查询

2、特殊符号的处理 比如搜索只支持中文和英文

//替换非中英文汉字的正则
protected final static String REGEX_REMOVE_SPECIAL_CHARACTERS = "[^a-zA-Z0-9\\u4e00-\\u9fa5\\uAC00-\\uD7A3\\u0800-\\u4e00]";
使用例子如下:productMap.put("valuePropositionLower", RegexUtil.removeSpecialCharactersLower(history.getValueProposition()));

上一篇:文本数据清洗


下一篇:中文正则表达式匹配-正则中文匹配