经过前面《搜索引擎原理SEO优化上首页之网络蜘蛛Spider》和《搜索引擎原理SEO优化上首页之内容处理与创建索引》介绍,搜索引擎已经完成页面抓取和分析,并把原始页面、索引等信息存储在搜索引擎服务器的数据库里,等待响应用户查询。
搜索引擎接收到用户输入关键词查询请求后,需要理解用户需求,明白检索意图,主要包括指令分析、分词处理和用户意图理解,精灵儿工作室分析过程如下:
1. 指令分析
对用户输入的文本内容进行类型识别,有普通文本、文本+高级指令、纯高级指令,不同类型的指令处理方式不同。图片检索是另一套体系,而且目前也不成熟,暂不讨论。如果是site、inurl、intitle等高级指令,会直接只对特定数据项检索,比如intitle只匹配网页的Title。下面两图是关键词加指令标记的检索结果对比。
2. 分词处理
基于搜索引擎海量词典库分词,一句话可能被分成多种组合词,例如“旅游景点推荐”可以分成“旅游/景点/推荐/旅游景点/景点推荐”等多重词。分词时,会去停止词,如啊、了、的、呀等虚词;同时会根据海量数据库智能错词矫正或者同义词近义词匹配。
输入“海男岛”,搜索引擎优先默认矫正理解成“海南岛”,此时也可以坚持搜索“海男岛”。
3. 搜索意图分析
当用户输入一些简短的热词时,比如搜“刘德华”,搜索引擎不知道用户是要看刘德华的介绍、新闻、音乐还是电影,为了满足尽量多人的检索结果需要,搜索引擎会列出刘德华的简介、最新新闻、音乐、最新视频等头部内容。
当用户搜索一些通用性的词,搜索引擎会根据大数据的相关性,过滤强相关的条件数据。比如搜本地生活信息,如“电影院”,搜索引擎会吧附近的电影院甚至地图检索出来。地理位置、时间、行业等都可能是其他一些通用词的强相关性过滤条件,这样的用户体验更好,检索的结果更吉精准。seo优化上首页,目标客户主要在本地的项目,建议基于城市关键词优化,这样更容易排名上首页,而且客户更精准,转换率更好。
搜索引擎会搜集用户习惯信息,用于持续优化搜索结果。对于群体而言,所有的检索结果页面呈现给大量用户,根据用户对具体页面的观看、停留、回看等信息收集,可以知道内容对总体用户检索需求的解决能力,为以后排名提供重要依据。对于个体而言,这样可以熟悉个体用户的喜好习惯,比如某用户搜索钓鱼杆,以后搜索引擎推送的广告会包含这类商品。
为了更好的优化网站,做到自然排名上首页,精灵儿工作室建议大家时常关注自己优化的关键词在搜索引擎里的检索结果分析,理解搜索引擎的关键词组合和排名逻辑,同时利用关键词分析工具跟踪和挖掘关键词,并监控网站客户来源渠道和用户行为,持续优化,不断改进。