专题实战 | 如何快速构建高质量电商行业搜索?

电商搜索特点

1. 关键词堆砌

例如:明星同款夏季连衣裙包邮;

2. 词序对语义影响不大

例如:明星同款女夏季连衣裙包邮,女夏季连衣裙包邮明星同款;

3. 类目预测问题

例如:当用户查询“苹果”时,可能查询的是水果,也可能是手机品牌;

4.查询召回文档相关性差

核心词识别不准确,分词不准确;

5. 搜索引导的业务转化比重较大

据统计,综合类电商搜索引导转化占比40%以上,垂直类电商搜索引导转化占比60%以上;

6. 稳定性要求较高,支持弹性扩容

活动、大促系统QPS可能是平时的百倍千倍,需要平滑的扩缩容,保障系统的稳定;

开放搜索电商行业方案优势

  1. 基于淘系同款搜索引擎-问天(Ha3),提供更高性能的搜索服务,系统稳定高效,海量数据实时更新;
  2. 电商行业知识图谱能力,支持电商属性的分词、纠错、同义词、停用词、实体识别、词权重、类目预测等行业查询语义理解能力,精准定位用户搜索意图,提升业务转化,降低无结果率;
  3. 丰富的电商搜索服务经验,源自阿里巴巴内部搜索技术的云服务输出,集团内500+业务接入,阿里云电商客户服务数千家;
  4. 通过引擎侧的多路召回能力,支持搜索结果、下拉提示、底纹词等场景实现个性化搜索服务
  5. 轻松接入,快速上手,一键式接入行业模板,可根据自身业务自定义选择功能,并满足非技术人员业务干预调优与数字化运营需求;

了解更多电商搜索能力:https://c.tb.cn/F3.0VTxwn

开放搜索电商增强版接入流程

注册阿里云账号(已有账号无需注册),并实名认证,创建好实例,如果是非本人使用,可以授权子账号权限,更多详情查看>

如果您已经对搜索有一定的了解或者是已经使用过开放搜索产品,则可以参考功能流程图以便更快速、更全面的了解开放搜索的能力。

表结构设计

接入开放搜索前,需要预先设计好表结构(可单表,可多表join),以便后期应对各种搜索业务场景和数据推送场景。目前开放搜索支持的多表场景如下:

主辅表关系

关联逻辑

是否支持

表A(主表)、表B

表A(主表)-> 表B

支持

表A(主表)、表B、表C

表A(主表)-> 表B -> 表C

支持

表A(主表)、表B、表C、表D

表A(主表)-> 表B

表A(主表)-> 表C

表A(主表)-> 表D

join层级不超过2层,辅表个数不超过10个

支持

表A(主表)、表B、表C、表D

表A(主表)-> 表B -> 表C -> 表D

超过2层多表数据关联

不支持(独享型可支持3层)

表A(主表)、表B

表A->表B,表B->表A

环状多表数据关联

不支持

表A(主表)、表B、表C … 表K

表A(主表)-> 表B

表A(主表)-> 表C

..

表A(主表)-> 表K

join层级不超过2层,但辅表个数超过10个

不支持(独享型可扩展辅表个数)

详情可参考应用结构--->创建多表join

注意

电商行业模板中以下字段是必须字段,类型、字段标签固定,字段名称可自定义:

专题实战 | 如何快速构建高质量电商行业搜索?


数据接入

开放搜索支持用户通过数据源将数据接入搜索,也支持无数据源,通过API/SDK/控制台上传文件的方式导入数据详情如下:

  1. RDS数据源配置
  2. MaxCompute(原ODPS)数据源配置
  3. POLARDB数据源配置
  4. API/SDK数据导入

电商行业模板配置

选择分析器

电商行业模板中以下索引标签、分析方式固定,索引名称可自定义:

专题实战 | 如何快速构建高质量电商行业搜索?

开放搜索还向用户提供了面向其他行业、语言的分析器,如有相应业务需求,可参考内置分析器


设置查询分析规则

查询分析模板请选择,系统默认勾选的分析包:

专题实战 | 如何快速构建高质量电商行业搜索?

查询分析的详情内容可点击此处进行参考。


设置排序策略

电商行业模板会自动根据用户配置的应用结构中的字段、索引去生成适合该应用的基础排序和业务排序,详情如下:

基础排序

0.6*static_bm25()+0.4*normalize(sales)

业务排序

query_match_ratio(cate_id) * 1000 + floor( if(field_match_ratio(brand) == 1, 1, field_match_ratio(brand) * query_match_ratio(brand)) + if(text_relevance(product_title) + text_relevance(cate_id) + text_relevance(brand) == 0, -1, 0) ) * 1000 + (text_relevance(product_title, default, true) * 0.3 + text_relevance(cate_id) + text_relevance(brand) + 0.5) * (normalize(sales) + 0.3) * if(is_sale, 1, 0.9) * timeliness_ms(up_time)

开放搜索中的排序策略较为灵活,您可根据自己的业务需求进行修改或自定义,详情可参考排序表达式配置

搜索引导服务

下拉提示模型配置

下拉提示是搜索服务的基础功能,在用户输入查询词的过程中,智能推荐候选query,提高用户输入效率,帮助用户尽快找到想要的内容。

专题实战 | 如何快速构建高质量电商行业搜索?

热搜底纹模型配置

热搜和底纹是一个完整搜索引擎必备的基本功能,通常占据着搜索框入口的重要位置,提供不可或缺的业务价值。

专题实战 | 如何快速构建高质量电商行业搜索?

以上所有菜单及功能介绍、操作步骤、注意事项都可以在开放搜索产品文档中找到。


如有产品指导需求,可填写问卷获得专家指导>>https://c.tb.cn/F3.070wOB

如果你想与更多开发者们进行交流、了解最前沿的搜索与推荐技术,可以钉钉扫码加入社群

专题实战 | 如何快速构建高质量电商行业搜索?

若有收获,就点个赞吧

上一篇:宜泊科技加入阿里云原生合作伙伴计划,共建智慧停车新生态


下一篇:诡异的druid链接池链接断开故障经验总结