特邀嘉宾:丛锡兴--批批网CEO
视频地址:https://yunqi.aliyun.com/2020/session54?liveId=44653
批批网介绍:
批批网APP是一个基于传统批发市场、移动端的服装批发电商平台,率先将视频直播和服装B2B进行结合的电商平台,批批网从2015年发展到今天,已经成为服装批发领域的直播代言人。
*使命:用科技推动产业,让批发变得简单
愿景:成为国内卓越的在线批发平台
价值观:正直、激情、自省、团队、创新*
曲折的搜索之路:
尝试优化搜索功能,引入了搜索算法工程师,成立了专门的搜索项目组,使用开源搜索框架,再二次开发,但结果却没有达到要求,并且遇到很多问题:
1. 效果不理想:通过编写简易的规则,期望提升搜索体验,效果并不明显
2. 人才缺失:.如果想找到专业且合适的算法人才,实际是很难的事情
3. 数据缺乏时效性:难以平衡优质商品和新发布商品之间的权衡关系
4. 商家刷排名:部分商家找到排序漏洞,通过关键词堆砌,获得靠前位置,用户体验不好
搜索之路柳暗花明—阿里云开放搜索解决方案:
1.排序优化:
无需依赖开发工程师,也可以使用表达式实时调整排序结果
• 粗排,从命中的文档集合里海选出相关文档
• 精排,对粗排的结果做更精细筛选,支持任意复杂的表达式和语法。
• 相关性算分策略:取召回的rank_size(目前是100万)个文档按照粗排表达式的定义进行算分;取粗排分最高的N个结果(百级别)按照精排表达式进行算分,并排序;然后根据start与hit的设置取相应结果返回给用户。如果用户获取的结果超过了精排结果数N,则后续按照粗排分数排序结果继续展现。
2.聚合打散子句-distinct:
平衡“优质商品”和“新发布商品”的展示机会
• 打散子句可以在一定程度上保证展示结果的多样性,以提升用户体验。如一次查询可以查出很多的文档,但是如果某个用户的多个文档分值都比较高,则都排在了前面,导致一页中所展示的结果几乎都属于同一用户,这样既不利于结果展示也不利于用户体验。对此,打散子句可以对每个用户的文档进行抽取,使得每个用户都有展示文档的机会。
3.业务排序函数field_term_match_count
解决商家作弊问题: 关键词重复堆砌导致排序分数较高,排序结果靠前.
• 使用query_term_match_count,定义重复多少次为结果堆积。
• //这里以重复3次及其以上的为结果堆砌,if(field_term_match_count(title)>3,1,10)
4.查询语义理解:
预置好的搜索功能,即插即用,非常方便
搜索之路未来可期
未来批批网将会用上开放搜索(OpenSearch)更多高级的功能
• 人气模型—计算量化出每个商品的静态质量及受欢迎的程度的值,不断训练统计形成人气分,构建更精细化的排序模型,精准命中搜索需求
• 类目预测模型—根据用户的查询词来预测用户想要查询哪个类目的结果,结合排序表达式,可以使得更符合搜索意图的结果排序更靠前。
• A/B测试—便业务在全量使用前可以分配一定比例的流量进行先验,避免盲用带来对线上业务的负面影响
以上就是本次云栖大会--“批批网在B2B电商领域的搜索业务探索之路”的内容。如果您对搜索与推荐相关技术感兴趣,欢迎加入钉钉群内交流~
【开放搜索】新用户活动:阿里云实名认证用户享1个月免费试用https://free.aliyun.com/product/opensearch-free-trial