案例背景
某技术社区作为国内的中文IT内容社区,致力于为中国软件开发者提供知识传播、在线学习、职业发展等全生命周期服务,旗下包括多款产品。
自开始接触阿里云开放搜索产品,在一年的时间里逐步上量,陆续接入PC端、移动端的多个平台,覆盖首页搜索、博客、下载、问答等细分业务的频道搜索。通过开放搜索,为旗下产品的用户提供高质量的搜索服务,并通过搜索能力的优化带来更多的业务转化,以提升整体业务收入。
内容搜索场景需求:
»更多的曝光机会——空结果率低;
»更好的搜索质量——搜索相关性高;
»更丰富的业务特征——结合业务特性调整搜索结果;
»更全面的配套功能——智能纠错、下拉提示等配套能力;
»更低的拥有成本——相较自建搜索引擎更低的TCO成本;
»更便捷的开发使用——上线周期短,降低搜索引擎开发、效果调优难度;
以某论坛社区为例,产品线覆盖多个平台,包含网页、APP、小程序等形式,同时业务上区分多个频道。随着业务的发展,首页综合搜索(后简称“主搜”)的流量越来越大,各种付费、引流业务接入,对搜索流量的运营变得更加重要,对主搜的业务诉求越来越多,需要聚合多个频道的内容,同时搜索结果相关性要求更加精准,在考虑文本相关性的前提下,要加入更多的商业因素考虑,如eCPM等。
成熟的搜索引擎涉及离线模块、在线模块、查询理解服务、算法平台等系统组成,所需大量开发、算法调优以及持续的复杂运维工作,由于人力有限,社区论坛经过多方竞品调研和产品试用,最终接入阿里云开放搜索。
开放搜索最佳实践
更符合IT行业的查询理解功能
在核心索引上配置使用针对IT行业定制了词权重模型,纠错模型,改写模型等,扩大召回结果,精准命中需求;
排序优化
- 排序表达式应用
支持制两轮相关性排序规则来准确控制搜索结果的排序。第一轮为基础排序(粗排),从命中的文档集合里海选出相关文档。第二轮为业务排序(精排),对粗排的结果做更精细筛选,支持任意复杂的表达式和特征函数应用,方便更准确控制排序效果,优化系统性能,提高搜索响应速度。定制CTR点击率预估模型,实现更智能的排序效果.
- 算法调优-人气模型
人气模型是淘宝搜索最基础的排序算法模型,计算量化出每个产品的静态质量及受欢迎的程度的值,将人气模型引入到排序表达式中,可构建更精细化的排序模型;
- 高级定制排序插件-Cava语言
更强的灵活性和定制能力:Cava提供了较表达式更加丰富的语法功能,支持及时编译,满足更多个性化的业务需求。
搜索引导功能
下拉提示
是搜索服务的基础功能,在用户输入查询词的过程中,智能推荐候选query,提高用户输入效率,帮助用户尽快找到想要的内容。
下拉提示实现了基于用户文档内容的query智能抽取,可以通过中文前缀,拼音全拼,拼音首字母简拼查询以及汉字加拼音,分词后前缀,中文同音别字等查询下拉提示的候选query。
业务价值
• 对比客户基于开源自建的服务CTR提升超过80%
• 经迭代,开放搜索返回的搜索结果首位点击率高于某D站内搜索服务的点击率,期间多日点击率高出3%
配置前后效果对比
以上就是社区论坛行业开放搜索最佳实践的内容,如果您对搜索与推荐相关技术感兴趣,欢迎加入钉钉群内交流~
【开放搜索】新用户活动:阿里云实名认证用户享1个月免费试用戳我