阿里商业评论 | 互联网POI数据及其在营销中的应用
本文发于《阿里商业评论》,转载请注明出处。
作者:常莹、王汉生
POI是英文词组Point Of Interest的首字母缩写,中文直译为“兴趣点”。它是一种对于人所到达的地点的记录,例如某人早上在一个公交站点候车、中午在一家餐厅吃饭、下午到了一座博物馆参观等。我们假设人到达某一位置,意味着这个位置能够为其提供某种效用,所以这个人才会对这个地点“有兴趣”。
基本特征
POI数据的基本结构非常简单。如图一中左上阴影区域所示,只要具备时间、用户ID、到达的地点信息三个要素,就足以构成基本的POI数据结构。我们说用户ID非常重要的原因在于,它是我们串联起用户一系列POI行为的依据。如果缺失了用户ID,我们就只能简单地统计到到达某个地点的用户人次量、以及他们在什么时间到达等信息。这些信息能够告诉我们,用户群体中最具有代表性、最为大众化的偏好是什么;但是在营销越来越走向个性化的时代里,它们的应用价值非常有限。这是因为, 第一,除了那些具有大众化需求的用户之外,市场上还存在着大量需求相对小众的群体。他们的需求多样、特征鲜明,每一种用户单独都不足以成为市场上的主流,但是所有这些小众群体集合在一起的时候,体量可能就会变得非常巨大;这也就是大家通常所说的长尾的价值。一个只能表征人群的大众化需求的数据分析结果,显然无法关注到小众人群的需求;而用户ID的存在,可以为我们解决这个问题。用户ID使得我们可以知道某一个用户中午经常去A餐馆吃饭、晚上则喜欢去B酒吧。也许A餐馆和B酒吧都不是最受欢迎的餐饮场所,但是如果我们发现,绝大部分去过A餐馆的人都会去B酒吧,那么下次当我们再看到一位喜欢去A餐馆的客户的时候,我们完全可以将B酒吧推荐给他/她,因为他/她有很大的可能性会喜欢B酒吧。
第二,用户ID使得我们有可能将POI数据与其他更多数据打通,从而帮助我们更加全面地了解客户和他们的需求,为其提供更为精准高效的服务。我们假定产出左上阴影部分“POI信息”数据的互联网企业,同时也能够收集到图中右侧所示的一些“用户属性信息”。那么我们就可以通过用户ID将这两种数据拼接在一起进行分析。属性信息通常是企业在用户安装应用、注册网站或使用服务时提供的必要信息(例如用户在注册时提供了用于接收验证码的手机号,我们可以从中推断用户所在的地域),或者是用户在使用服务的过程中形成的比较恒定鲜明的特征(例如每天都会数次登陆的用户,我们可以将他们定义为网站或应用的重度用户)。接着上面的例子说,我们可以将那些特别喜欢A餐馆和B酒吧的用户的ID提取出来,然后再提取他们的属性信息,了解他们在各个属性上的分布情况。于是我们就能了解到,这些用户与整个用户群体相比较,是否具有某些突出的特征。比如,他们可能绝大部分都是中年人、特别喜欢看财经新闻等等。这种对于用户群体的特殊偏好和属性特质的研究,会帮助我们更好地锁定自己的目标客户,或者是针对他们的偏好设计更加有竞争力的服务和产品。
有一些互联网服务商(如微博、点评等)不但能够获取POI数据和用户属性信息,还能同时得到用户自主生成的一系列文本信息。这些文本信息能够为POI数据提供更多的附加价值,因为它们包含着客户对于某一类型的商品或者服务的兴趣、评价、态度;这些信息能够被用于了解客户对于产品或服务的评价、确定正确的营销方向、选择合适的营销渠道,以及为广告创意提供灵感和素材。
图二给出了一个更为具体的示意性例子,来帮助理解POI数据结构中有无用户ID,会对于分析结果带来什么样的影响。图形的左半部分,展示了有用户ID和无用户ID的两种POI数据。左下方有用户ID的这部分POI数据,可以通过ID和用户年龄、性别、消费能力等重要信息关联在一起。图形的右半部分,则展示了使用这两种不同的数据,各自能完成哪些分析和应用。上方的两张图是两种数据都可胜任的分析,它们分别展现了客户最喜欢光临的消费场所、客户最喜欢进行消费的时间段。如果我们试图基于这样的分析结果进行营销、为客户推荐更多的消费场所的时候,为了能够将成功的可能性提高到最大,我们会选择那些最多次被光顾的场所(第一张图中最高的柱子)和发生消费次数最多的时段(第二张图中曲线最高的位置);因为对于全体用户这个整体而言,人们有更大的可能会喜欢这个;这就是前面提到过的、对“代表性”的应用。
而当我们将用户ID加入之后,分析的故事就会变得不同。除了上面两幅图能够完成的分析之外,我们还能够识别出那些喜欢去同一类地方的人,他们还喜欢什么?通过什么样的特征可以识别出他们?如右下方的示意图,人群被根据喜欢到达的地点,分成了5个不同的群体,并且我们还找到了每个群体所具备的显著特征。最具有上面两图中所示的代表性需求的人们,聚合成了其中规模最大的一个群体“热血青年”;将这些“热血青年”的POI信息和属性信息集合在一起,我们发现这些人不但喜欢烤肉、火锅、川菜,还喜欢吃北京小吃、自助餐,经常参加团购和去健身房,年龄不大、收入水平中等。
更重要的是,其他那些不具备“代表性”爱好的人群,在这样的分析方法下也得到了表现他们自己特色的机会,比如爱在工作日的早上去K歌的“时髦的大爷大妈”,比如生活习惯很健康、爱好也相对斯文平和的“文艺中年”和“气质美人”,比如多金但繁忙的“精英飞人”;他们各有鲜明的特点,群内的用户彼此高度相似,群与群之间又足够不同,这就是所谓的“典型性”。我们完全可以将一个群里很多用户都喜欢到达的地点,推荐给那些还没有到达这个地方的用户;比起“热血青年”的偏好,人们有更大的可能会喜欢那些和自己更加相似的人们所喜欢的东西。
简而言之,根据“代表性”推荐,相当于把所有的人都归入“热血青年”的类别,给他们无差别的对待。而根据“典型性”推荐,则是以“人以群分”作为基本假设,给一个人找到一群与他/她的爱好最一致的群体,然后根据群体的爱好,来为他/她提供个性化的推荐。
典型应用方向
在上一节中,我们非常概要地对于POI数据的应用做了一个高度简化的介绍。在这一节中,我们将更加聚焦到描述一些非常有趣的具体应用上。据我们有限的了解,这些潜在的应用方向都还没有被充分地落实到实践当中,希望我们的描述能够为此类数据在实践当中的充分应用,起到抛砖引玉的作用。
应用场景1:POI数据可以为个人征信提供新的信用评级依据。这将对信贷公司评估客户的征信水平,以及在营销中锁定目标客户群体有所帮助。这一应用的前提假设,是人们所到达的场所,与他的收入水平和消费能力有关。以图二中右下角的图示为例,从我们已经区隔出来的这五个人群来看,如果一位客户属于“精英飞人”的类别,那么他/她的偿还能力可能会比另一位“热血青年”类客户要高很多。同时,如果我在经营一家小额信贷公司的话,那么我可以将目标用户锁定在“热血青年”;而如果我能够提供较大额度的贷款同时追求更高的收益的话,那么“精英飞人”、“气质美人”、“文艺中年”这三个类型也许会更加适合作为我的目标客户。这些应用可能会需要信贷公司与那些有能力提供基于POI数据获得分析结果的商家进行合作。
应用场景2:POI数据可以帮助企业更好地捕捉到竞争对手的高价值客户。假设我是A航空公司的营销人员,公司面对着众多的竞争对手,希望能够通过扩大客户源和提升客户生命周期价值的方法来提高收入。为了达到这个目的,我首先要对现有的客户进行价值判断。我发现现有客户张先生去年一年在我公司只消费了1,000元。那么,张先生是否是一个高价值的客户呢?答案取决于张先生每年在所有航空公司的消费总额有多少。如果他全年只消费了1,000元,那么他作为航空公司的客户,价值就非常有限。但是如果张先生在A公司只消费了1,000元,却在B、C、D等其他几个航空公司消费了50,000元呢?那么他无疑是一位非常有价值的客户,A公司就应当尝试通过营销手段来不断提升他在自己公司的消费水平。在传统的营销方案中,A公司无法做出这样的判断。因为他们只能看到张先生在自己这里的消费情况,但是无法知道他在其他航空公司的消费。但是,如果能够得到张先生的某种POI数据的话,那么我们就有可能知道张先生在大概什么时间、到达了哪些机场、以及他出现在机场的频率高低;这不但能够帮助我们更加准确地判断张先生作为航空公司客户的真正价值,甚至还能帮助我们有针对性地设计出对于张先生而言非常有吸引力的促销措施,让他更加有可能将更多的此类消费转移过来。
应用场景3:POI数据可以在非常广泛的行业领域里,为商家提供对市场整体竞争环境的分析,帮助他们做到知己知彼、有的放矢的营销。以酒店行业为例,POI数据首先能够告诉我们,客户在一个地区的哪些酒店住宿、一年当中住宿的高峰时段和低谷时段是如何分布的。这些信息对于评估一个地区的行业发展趋势、决定未来在这一地区的发展策略(比如是否需要开设新店?新店选址在何处更加适宜?)都可以提供帮助;并且,通过POI数据完成的此类分析,相较于传统的单纯倚靠业务经验或者市场调研都更加可靠,因为它能够在相同的成本之下覆盖更大的样本量、以及更加全面地展现消费者的各种属性特征和行为特征。其次,我们还能够基于POI数据知道,曾入住过某一家酒店的客户是否还入住了其它酒店?如果有很多客户都会同时入住两家酒店的话,那么它们之间就存在竞争关系。同时,如果这份POI数据当中,还能附加有我们之前曾经提到过的评价之类的文本信息的话,那么我们就能够知道客户对于各个酒店的具体评价如何,酒店可以根据这些信息来锁定竞争对手、改进和调整自己的服务。
应用场景4:POI数据可以为线下的商家提供便捷而精准的线上推广。有些商品的购买决策(例如单价较高的耐用消费品)周期较长,POI数据能够帮助我们识别处于购买决策期的客户,以便于我们对其进行营销。举例来说,如果我们发现有在近期突然开始比较频繁地光临各品牌4S店的客户,那么他们有比较大的可能最近有购车计划。这只是建立先导行为(逛4S店)和实际结果(买车)之间关联的一个简单的例子,我们还可以根据各行各业的业务逻辑发掘出最适合具体行业的一种或多种先导行为,并根据这种业务规律建立预测模型,来推动我们所期望的实际结果的达成。
应用场景5:类似场景4中的为线下商家进行线上推广的思路,在某些季节性比较强的快消行业其实也非常适用,我们以购物中心为例来进行说明。购物中心一般都会销售服装鞋包等季节性非常强的商品,人们购买这类商品的高峰时段也相对集中。比如羽绒服,销量一般集中在应季时节的秋天和反季的夏天。如果我们能够拿到进入购物中心的用户的POI数据,那么我们就有可能在用户到购物中心签到时,根据他/她的偏好,为其显示有哪些品牌在进行羽绒服新品上架或者反季促销的信息。如果我们同时还能够拿到像图二中右下角所示的那种用户分类及画像,那么我们就有可能将推荐细化到品牌的层级,只要我们推荐的品牌与用户个人的风格足够匹配,那么这些更加聚焦于用户偏好的广告,就有可能会比全面列出促销品牌获得更好的效果。例如“热血青年”可能会收到风格活泼、颜色鲜明、中等价位的羽绒服品牌的促销信息,而“气质美人”则可能收到款式别致、颜色淡雅、材质上佳、价格也相对较高的羽绒服品牌的促销信息。再进一步,如果生成这份POI数据的应用/网站本身就包含与购物相关的信息,那么这种推荐甚至还可以进一步地精准到极少数的单品。
以上是我们随便撷取的几则POI数据可以发挥出创新性作用的例子,希望能够帮助大家对于它未来可能的发展空间建立起一些合理的想象。无论是否有特别的指出,这些场景大多都会要求应用者与POI数据的持有者、甚至是不同POI数据持有者之间的深度合作。所以,在下一章节,我们将就产业链中各个角色进行合作的现状和可能性做一些简单的探讨。
数据融合
在介绍POI数据的基本结构时,我们谈到过一些在POI数据应用当中最为常见的思路,例如打通POI数据与客户属性数据。下面我们来简单地谈一谈,另一种更为大胆、实现起来也需要更多技术以及法律监管领域关注的思路。假设图一中阴影部分的“POI信息”,和左下的“POI信息1”、右侧的“用户属性信息”来自不同的互联网服务提供商。那么,我们还能通过用户ID来打通它们吗?如果不考虑POI数据这个条件,实际当中已经有一些在某种程度上打通两个互联网服务商数据的案例。比如大家在访问新浪微博的时候,会看到淘宝商品的广告,而且推送商品的属性会随着你近期在淘宝的浏览、收藏和购买行为而不断调整;这是目前业界应用比较广泛的一种跨服务商营销推广方式。而如果具体到POI数据的应用,似乎还未见到有类似成熟的模式。
希望能够将来自不同网站/应用的用户信息拼接在一起的初衷在于,每一个互联网服务都无法囊括一个人在互联网上的所有行为,比如电商不知道客户对新闻的偏好、而门户网站不知道客户喜欢到哪里进行休闲娱乐。这令我们基于单一互联网服务产生的数据对客户进行画像的行为,非常像是盲人摸象。而如果能够将不同网站的数据打通,那么我们将既能了解客户喜欢读什么样的新闻,也能知道他们喜欢买什么东西、去哪些餐馆吃饭等等。简而言之,拼接后的数据为我们展现出了一个“完整的大象”。从这个角度看,在之前提到的新浪与阿里的合作方式里,双方的信息共享确实起到了扩大广告投放量的作用,但并没有起到让双方都能根据更加丰富的数据而为客户提供更加精准的服务的作用;因而它与我们所期待看到的那种真正的数据打通、以及随之而来的精准营销还有一定的差距。
那么真正能够告诉我们“完整的大象”的样子的数据拼接是可以实现的吗?如果单纯从可能性的角度看,是可行的。最方便的一个方法,就是在各个域名下那些以邮箱为注册ID的用户中,找到在多个域名下都出现过的邮箱,以这些邮箱作为跨域识别用户的标示。这种方案只能打通那些以同一邮箱作为用户名在不同网站注册的用户,对于其他用户的信息拼接则无能为力。当然也有一些在这方面更加完备的技术方案(例如OpenID),但是它们在商务和法务上都面临非常大的挑战。所以相对而言,第一种方法仍然更加具有可实现性。
还有另一种天生已经蕴含了“完整的大象”的样子的数据,并且随着移动互联网的发展,这种数据还会越来越丰满立体,那就是移动服务运营商所收集到的数据。无论是手机号码,还是IMEI码、IMSI码都能在某种程度上作为识别用户的ID;并且当某一个网站或应用的运营者,彼此之间还要为如何打破数据的藩篱而进行探索的时候,运营商天生就已经掌握了用户在各个网站和应用上的、相对明细的行为。所以我们说,运营商天生就拥有“完整的大象”。但是,运营商虽然掌握了详细而完整的数据,却缺乏一个明确的商务模式。而且,无论是采取哪种合作方式,都无法绕开非常敏感的用户隐私保护问题。这些应该是运营商的数据应用成果没有得到快速而广泛的应用的重要原因。
总结与讨论
简而言之,POI数据中隐含着大量客户的偏好信息,能够指引我们为每个人提供更加精准的服务或产品;POI数据之间以及POI数据与其他类型数据之间,也存在着打通的可能,这将使得我们有可能更加完整地认识客户,从而进一步提高服务或产品的精准性。当前,由于隐私保护、数据壁垒等方面的原因,对POI数据的应用方式,与我们能够想象出来的空间相比,仍然还有很大的差距。我们非常期待看到,业界在这个方向能够发展出更加精彩的实际应用。