小程序数据埋点实践之曝光量

什么是数据埋点

所谓数据埋点就是应用在规定流程中 对特定行为或事件进行数据采集 。使用采集的数据做用户分析和页面分析,可以获得应用的总体使用情况,为后续优化产品和运营提供数据支撑。常见数据埋点内容包括:访问量、停留时长、曝光量、点击量、跳出率等等。

微信小程序也为我们提供了自定义分析统计,其中包括 API 上报(代码埋点),填写配置(无埋点,只需在公众后台配置)。而第三方统计平台比较有名的就是阿拉丁统计,只需引入集成的 SDK,开发成本低,能够满足大部分的需求。

数据埋点需要分析页面流程,确定埋点需求,选择埋点方式。如果是代码埋点,主要关注触发时机、条件判断、捕获数据,其次要注意是否有遗漏的场景没有做到埋点。代码埋点虽然成本较大(侵入代码),但是精准度较高,能够很好的满足埋点需求。

什么是曝光量

曝光量顾名思义是 指定元素出现在可观察视图内的次数 ,也可以理解为展示量。

通常我们会使用 点击量 / 曝光量 得出 点击率 ,作为衡量一个内容是否受用户喜爱的指标之一。比如,曝光 100 次只有 10 人点击,和曝光 100 次 有 100 个人点击,很明显后者更受用户喜爱。利用这些数据参考,可以推荐更多用户喜爱的内容,以此来留住用户。

交叉观察者

IntersectionObserver 接口,提供了一种异步观察 目标元素与其祖先元素或*文档视窗(viewport)交叉状态 的方法,祖先元素与视窗(viewport)被称为根(root)。简单来说就是,观察的目标是否和祖先元素和视窗发生交叉,即进入或离开。

小程序从基础库 1.9.3 开始支持 wx.createIntersectionObserver 接口(组件内使用 this.createIntersectionObserver ),使用此接口可创建 IntersectionObserver对象 。对此接口不了解的可以查看官方文档

基础使用

// 创建实例
let ob = this.createIntersectionObserver()
// 相对于文档视窗监听
ob.relativeToViewport()
    .observe(‘.box‘, res => {
        // res.intersectionRatio 为相交比例
        if (res.intersectionRatio > 0) {
            console.log(‘进入页面‘)
        } else {
            console.log(‘离开页面‘)
        }
    })

小程序数据埋点实践之曝光量

阈值

在创建实例时可以传入一些配置,其中 thresholds (阈值)是比较重要的一项配置,它可以控制触发回调的时机。 thresholds 是一个数字类型的数组,默认为 [0] 。即相交比例为 0 时触发一次回调,下面我们来设置阈值,看看会有什么改变:

// 创建实例
let ob = this.createIntersectionObserver({
    thresholds: [0, 0.5, 1]
})

小程序数据埋点实践之曝光量

从图上可以看到,元素在相交比例为 00.51 都各自触发了一次回调。在统计曝光量设置阈值非常有用,通常我会设置为 1 ,表示元素要完全展示在页面上才会进行记录,这样数据会更加真实准确。

收缩和扩展参照区域

除了阈值之外还有另一项重要的设置,在使用 relativeTorelativeToViewport 规定参照区域时,我们可以传入配置 margins 来收缩和扩展参照区域。 margins 包括 leftrighttopbottom 四个参数配置。

// 创建实例
let ob = this.createIntersectionObserver()
// 相对于文档视窗监听
ob.relativeToViewport({
        bottom: -330
    })
    .observe(‘.box‘, res => {
        // res.intersectionRatio 为相交比例
        if (res.intersectionRatio > 0) {
            console.log(‘进入页面‘)
        } else {
            console.log(‘离开页面‘)
        }
    })

上面将参照区域底部收缩 330px,可以理解为整体的区域从底部开始被裁剪 330px,因此元素只有进入页面上半区才会触发回调。

小程序数据埋点实践之曝光量

进入正题

经过以上一些介绍,相信大家对交叉观察者的好处和使用都了解的差不多。接下来进入正题 ~

背景

此次我做的项目是资讯类目的小程序,主要用于发布和转载一些学术文章。对于这种资讯的项目,需要通过数据埋点来收集用户的阅读习惯,以此来为用户推荐文章。

埋点方面用微信后台提供的自定义分析以文章为单位进行收集,而我们自己后台会以用户为单位进行收集。前者得出整体用户阅读偏好和文章热度,后者主要精确到用户,分析用户单位的阅读偏好。

改造组件

在分析页面布局和pm的商讨后,多处需要统计曝光量的文章区域展示都大致相同,刚好也在封装的列表组件里。于是将收集曝光量的逻辑都交由组件内部处理。

组件改造:

  1. 定义 isObserver 属性,该属性由外部传入的布尔值控制是否收集曝光量
  2. 监听传入的 list ,为每个元素绑定交叉观察者

以下部分代码省略,只展示主要逻辑:

<block wx:for="{{list}}" wx:key="id">
    <view class="artic-item artic-item-{{index}}" data-id="{{item.id}}" data-index="{{index}}">
    </view>
</block>
const app = getApp()
Component({
    data: {
        currentLen: 0
    }
    properties: {
        list: {
            type: Array,
            value: []
        },
        isObserver: {
            type: Boolean,
            value: false
        }
    },
    observers: {
        list(list) {
            if (this.data.isObserver === false) {
                return
            }
            if (list.length) {
                // currentLen 记录当前列表的长度
                // 用于计算监听元素的索引,对已经监听过的元素不再重复监听
                let currentLen = this.data.currentLen
                for (let i = 0; i < list.length - currentLen; i++) {
                    let ob = this.createIntersectionObserver({
                        thresholds: [1]
                    })
                    ob.relativeToViewport()
                        .observe(‘.artic-item-‘ + (currentLen + i), res => {
                            // 获取元素的dataset
                            let {
                                id,
                                index
                            } = res.dataset
                            if (res.intersectionRatio === 1) {
                                // 此处收集曝光量,内部处理逻辑会在下面提及
                                this.sendExsureId(id)
                                // 元素出现后取消观察者监听,避免重复触发
                                ob.disconnect()
                            }
                        })
                }
            }
            this.data.currentLen = list.length
        }
    }
})

小程序数据埋点实践之曝光量

发现??

小程序数据埋点实践之曝光量

理想情况应该是切换到第二个分类打印3个文章,但由于组件开始记录第一个分类列表的 currentLen ,在切换到第二个分类时, currentLen 没有被清除,导致循环长度错误。

解决:首先记录列表第一项的 id ,当监听列表变化,用新列表的第一项 id 作与之比较。若不相等,则表示列表被重新赋值,此时将 currentLen 置为0。

Component({
    data: {
        flagId: 0,
        currentLen: 0
    }
    properties: {
        list: {
            type: Array,
            value: []
        },
        isObserver: {
            type: Boolean,
            value: false
        }
    },
    observers: {
        list(list) {
            if (this.data.isObserver === false) {
                return
            }
            if (list.length) {
                // 比较id
                if (this.data.flagId != list[0].id) {
                    this.data.currentLen = 0
                }
                let currentLen = this.data.currentLen
                for (let i = 0; i < list.length - currentLen; i++) {
                    let ob = this.createIntersectionObserver({
                        thresholds: [1]
                    })
                    ob.relativeToViewport()
                        .observe(‘.artic-item-‘ + (currentLen + i), res => {
                            let {
                                id,
                                index
                            } = res.dataset
                            if (res.intersectionRatio === 1) {
                                this.sendExsureId(id)
                                ob.disconnect()
                            }
                        })
                }
            }
            // 设置列表第一项id
            this.data.flagId = list[0] ? list[0].id : 0
            this.data.currentLen = list.length
        }
    }
})

组件优化

因为需要提前监听文章的相交状态,在 list 传入时就开始循环 observe 。现在假设一个场景,在进入页面时,已经为一些文章注册完成回调,但用户并没有看过这些文章就退出页面。那是不是表示这些实例都没有被 disconnect

解决:在 observe 时将每一个观察者实例存入数组,当组件销毁时检查数组中是否有观察者实例,如果有,则调用这些实例的 disconnect

Component({
    data: {
        currentLen: 0,
        obItems: [] // 存放实例的数组
    },
    observers: {
        list(list) {
            if (this.data.isObserver === false) {
                return
            }
            if (list.length) {
                if (this.data.flagId != list[0].id) {
                    this.data.currentLen = 0
                    // 取消实例的监听
                    this.removeObItems()
                }
                let currentLen = this.data.currentLen
                for (let i = 0; i < list.length - currentLen; i++) {
                    let ob = this.createIntersectionObserver({
                        thresholds: [1]
                    })
                    ob.relativeToViewport().observe(‘.artic-item-‘ + (currentLen + i), res => {
                        let {
                            index,
                            id
                        } = res.dataset
                        if (res.intersectionRatio === 1) {
                            this.sendExsureId(id)
                            ob.disconnect()
                            // 取消监听后 将实例移出数组
                            this.data.obItems.shift()
                        }
                    })
                    // 将实例存入数组
                    this.data.obItems.push(ob)
                }
            } else {
                // 取消实例的监听
                this.removeObItems()
            }
            this.data.flagId = list[0] ? list[0].id : 0
            this.data.currentLen = list.length
        }
    },
    lifetimes: {
        detached() {
            // 组件销毁时 取消实例的监听
            this.removeObItems()
        }
    },
    methods: {
        removeObItems() {
            if (this.data.obItems.length) {
                this.data.obItems.forEach(ob => {
                    ob.disconnect()
                })
            }
        }
    }
})

收集处理

现在组件能够收集到曝光文章的ID,剩下的就是往后台发送数据。那么问题来了,难道文章曝光一次就发起一次请求吗?如果不怕和后端同事干架的话,你可以这么做。要知道多次发起请求,服务器??会很大。用户量比较大后,对服务器能够承受的并发量会有很大的考验。所以正确的做法应该是,把收集到的ID缓存起来,在达到一定数量的时候一起发送过去。

接下来对收集的数据做些处理:

// 这个上面收集曝光量的函数
sendExsureId(id) {
    if (typeof app.globalData.exposureIds === ‘undefined‘) {
        // exposureIds 是定义在全局用于存放曝光文章 ID 的数组
        app.globalData.exposureIds = []
    }
    app.globalData.exposureIds.push(id)
    // 当数组到达 50 个,开始上报数据
    if (app.globalData.exposureIds.length >= 50) {
        wx.$api.recordExposure({
            // 因为 ID 比较多,我和后端约定好使用逗号分隔
            ids: app.globalData.exposureIds.join(‘,‘)
        })
        // 上报后清空数组
        app.globalData.exposureIds = []
    }
}

看起来好像实现到这里就大功告成,但是我们还要考虑一种情况。假如用户只看了 40 个就退出小程序,而上报条件是达到 50 个才会发送数据,那么这部分有用的数据就会被丢失。因为小程序没有回调能够监听到小程序被销毁,这里只能使用小程序的 onHide 函数来做些事情。当小程序进入后台时 onHide 函数就会被执行,此时可以在函数里上报数据。

App({
    onHide() {
        if (this.globalData.exposureIds.length) {
            wx.$api.recordExposure({
                ids: this.globalData.exposureIds.join(‘,‘)
            })
            this.globalData.exposureIds = []
        }
    }
})

写在最后

说实话,在埋点这方面的知识不算很熟悉,业务场景也比较简单。因为没有大佬指导,也是看着需求往这方面去做,有哪里错误或遗漏请指出。如果你有更好的方案或经验,欢迎评论区交流??~

小程序数据埋点实践之曝光量

上一篇:小程序重点--this.setData()函数


下一篇:小程序结合php实现支付功能