搜索下拉提示(Query
Auto Completion,简称QAC)如今差点儿是每一个搜索引擎必备的基本功能,作用是在用户在搜索框输入查询词的过程中,给用户展示一系列搜索查询query供用户选择,能够方便用户输入、缩短用户搜索时间、提高用户搜索体验。在这方面的研究已经有非常多,如基于上下文、基于时间序列等预測query的热度、个性化排序等,但关于用户怎样与搜索下拉提示(下文简称QAC)交互的研究眼下还是一个空白。
微软的Katja Hofmann前几天(11.3-11.7)刚刚填补了这一空白。她在CIKM
2014会议上发表了一篇paper——An Eye-tracking Study of User
Interactions with Query Auto Completion。研究了用户与QAC的交互过程。通过眼睛定位技术,记录和分析了用户与QAC的交互,得出一系列有趣的结论。本文在阅读论文的基础上,简明扼要的提炼了论文的结论。总结了一点自己的启示。
实用的思路和结论:
1. 将用户的QAC交互过程分为:query examination、query formulation、task completion3个过程。query examination为用户查看QAC的过程。该过程中用户注意到有QAC的提示,并将注意力集中到QAC的结果。query formulation是用户使用QAC的过程。依据QAC提供的结果选择的过程。
task completion是用户选择了QAC的结果后在搜索结果页面的行为。记录用户的搜索任务完毕情况。
2. 针对每一个过程设计了一系列跟QAC相关的统计指标,以反映QAC的质量,详细指标例如以下:
TFF记录用户敲键盘到将注意力转移到QAC下拉列表的时间间隔,这个时间跟QAC下拉结果的排序没有关系。
CFT记录用户注意力集中在QAC下拉列表上所累计停留的时间,这个时间跟QAC下拉结果的排序有关,排序结果质量越好,越跟用户搜索意图相关的query越靠前,用户停留的时间越短。
UQ表示用户提交的单一query数,描写叙述的是一个用query构造的情况。假设QAC质量不好,用户非常难构造一个比較恰当的query。则在没法构造query的情况下就会放弃继续搜索。(笔者见解:也有可能是质量好,一次query搜索就找到须要的结果)
UR表示用户打开一个搜索结果页面就完毕搜索的数量,描写叙述搜索结果质量。打开越少,说明搜索结果质量越高,越早完毕搜索任务。TFC和TCT与其类似。仅仅是从其它角度统计。
3. QAC有非常强的position bias,排名越靠前的query被关注和点击的概率越大,例如以下两图:
右图横轴表示query在QAC的排序位置,左边纵轴表示用户的注意力停留时间,右边纵轴表示点击的概率。每一个位置分别都有两个不同的实验,对照QAC有排序和随机序的情况。
从图能够看出,无论QAC结果是否有排序,top几个位置的query获得的注意力是最高的,被点击的概率也明显高于其它位置的query。这说明top几的query被关注到的概率最大。与query的是否排过序无关,仅仅要在top的位置,肯定会被关注到,有非常强的position
bias,也側面说明QAC的排序终于决定了哪个query被作为查询query。
bias,也側面说明QAC的排序终于决定了哪个query被作为查询query。
但也能够观察到,排序过的结果被点击的概率比随机排序的大一些,由于排序会把更符合用户搜索意图的query排到前面。
4. 虽然不管QAC的结果排序与否,排序位置靠前的query获得的注意力都一样大,但搜索结果质量是不同的。通过实验记录的UQ、UR、TFC、TCT数据表明。高质量query的搜索结果比較好。能够让用户更快找到须要的内容。结束搜索任务。
因此须要把更符合用户意图的query排到更靠前的位置,添加这类query的曝光有助于带来更好的搜索结果质量(电商类的有助于提高成交转化率)
5. 总结了用户使用QAC的3种pattern:a.
依赖QAC搜索的用户。边输边看QAC的结果;b. 偶尔使用QAC的用户;c. 从不使用QAC的用户,这类用户一般在输入的过程中注意力是集中在键盘,不看屏幕。属于电脑使用不熟练的用户,比例较小。
依赖QAC搜索的用户。边输边看QAC的结果;b. 偶尔使用QAC的用户;c. 从不使用QAC的用户,这类用户一般在输入的过程中注意力是集中在键盘,不看屏幕。属于电脑使用不熟练的用户,比例较小。
6. 总结了用户使用QAC的2个目的:a.
拼写提示或拼写纠错;b. query补全
拼写提示或拼写纠错;b. query补全
7. 实验证明MRR这种评价QAC质量的指标的合理性,该指标基于这种如果。排序越靠后的结果被用户注意到的可能性越小,结果就是排序越靠后的结果被点击的可能性越小,从3的实验结果能够得到验证。
启示:
1. QAC的排序非常重要。直接影响搜索结果的质量,对于电商类搜索,会影响终于的转化率。因此能够在排序中引入搜索结果页质量相关的特征,如ctr、成交情况、NDCG等。
2. 用户使用QAC的一个功能是拼写提示。因此能够增加拼写纠错的提示功能,不不过简单的prefix匹配。
參考:
本博客搬迁至:http://ralphadu.com/
版权声明:本文博主原创文章,博客,未经同意不得转载。