【数据分析面试】字节跳动数据分析面试题(附答案解析)

更多优质干货内容可以look共粽号:【数据分析星球】,get海量数据分析资料!

01写在前面

数据分析SQL面试笔试题系列第6篇来啦!

数据分析面试会重点考查候选人两方面的能力,一个是基础的数据工具能力,最常考的就是SQL,这部分前面我们已经有4篇连载文章全面剖析了大厂的常考笔试题型,没看的同学不要错过了,可以戳:

考查的另一方面就是业务思维能力了,这一块主要是设定一些常见的业务场景,需要你给出对应的分析思路和方法,这一块对于没有数据分析经验的小伙伴们来说就很不友好了,很多面试的朋友碰到这类题都会很慌,无从下手,因为没做过,也不知道怎么分析啊!!!

不过不用怕,我收集了近几年一些大厂的面试笔试题,有笔试题也有业务题,通过这些题目的详细讲解,你应该就能掌握这类题目的解答思路了,话不多说,今天我们先来扒一扒字节跳动的面试题目吧!

一共有3道题目如下:

SQL笔试题:计算视频好评率

业务题1:使用ABTest对新算法效果进行评估

业务题2:如何评估一场活动的效果?

【数据分析面试】字节跳动数据分析面试题(附答案解析)

02 计算西瓜视频内容好评率

1)需求
西瓜视频近期开展了”2020百大人气创作者”优质内容扶持项目,鼓励用户产出优质的视频内容。现需要统计2020年11月01日至2020年11月30日期间创作的视频中,“科技”大类下“数码测评"子类的视频好评率(好评率=好评数/视频观看次数),写出sql语句进行查询。

用户观看视频后的评价详情表:content_action_info

id(视频id,主键)
create_time (创建时间,格式‘2020-11-01’)
user_id(观看者id)
content_id (视频id,外键)
content_action (视频评价,包括’点赞‘,’差评‘,‘无评价’)

视频详情表:dim_content

content_id (外键)
creator_id(创作者id)
content_category (商品类目)
content_sub_category (品牌名称)

2)解题思路

题目很简单,我们只需要明确好评率的计算公式,然后先定特定的大类和子类即可。

1.好评率=好评数/视频观看次数。

2.要求计算“科技”大类下“数码测评"子类的视频好评率,则要使用where条件筛选指定大类和子类的数据。

3.因为限定条件要指定视频内容的类别,所以要两个表做关联。

代码如下:

select
count(1) as all_action
sum(case when content_action=‘点赞’ then 1 else 0 end) as like_action
sum(case when content_action=‘点赞’ then 1 else 0 end)/count(1) as like_rate
from content_action_info as a
join dim_content as b
on a.content_id=b.content_id
where b.content_category=‘科技’
and b.content_sub_category=‘数码测评’
and a.create_time between ‘2020-11-01’ and ‘2020-11-30’;

03 使用AB Test评估算法效果

1)需求
某个购物APP最近优化了“猜你喜欢”模块的推荐算法,希望进一步提升推荐的精准度,进而提升销售额。现在需要通过AB Test(50%用户保留原先推荐算法的为控制组,50%用户使用新的推荐算法为实验组)来对新的推荐效果进行评估。假设你是此次实验的数据分析师,请问你会如何评估控制组和实验组的表现?请按重要性列出最重要的三个指标并给出你的分析过程。

2)解题思路

指标:推荐商品的销售额、推荐商品点击率、推荐商品的转化率

分析过程:

1.设原假设为使用新的推荐算法后上述指标降低或不变,备择假设为使用新的推荐算法后上述指标增加。

2.选择显著性水平临界值为5%,并根据指标的预期提升确定样本量和试验周期。

3.样本合理分流,AB测试上线,采集数据。

4.使用T检验,计算P值,进行效果验证。

5.分析结论,如果P值小于5%,那么原假设不成立,备择假设成立,即使用新算法后指标提升。

反之无法推翻原假设,不能证明使用新算法后指标提升.

针对AB Test的拓展阅读,包括如何确定试验样本量和分流,可以翻看公众号历史文章:【长文干货】AB测试:原理流程、实际案例及面试指南。

04 如何评估一场活动的效果

1)需求
某APP近期上线了一个拉新活动,并在各个渠道进行了推广投放,活动结束后,作为数据分析师,你如何评估这场活动的效果?

2)解题思路

如果要对一个活动效果进行分析,无非是要回答以下3个问题:

1、活动效果怎么样?要不要继续做?

2、如果可以继续做,活动的做的好的方面是哪些?问题或者瓶颈环节在哪?

3、针对问题环节的改进方案是什么?

具体展开来讲,可以从以下几个方面

1、活动关键指标达成分析

活动关键核心指标达成情况,比如拉新多少用户,达成多少GMV?ROI如何?

2、活动关键流程漏斗分析

活动的关键流程是什么?以及各个流程的漏斗分析,定位问题发生的环节。

3、活动的渠道、用户分析

活动在哪些渠道推送?活动推送给哪些用户?用户画像是啥样的?各渠道用户的质量/ROI如何?

4、活动策略、节奏分析

活动玩法的裂变效果如何?利益点是否有吸引力?活动整个过程节奏把控如何,前期预热、中期爆发和尾期是否过短/过长,运营应该在何时进行适当干预。

以上就是数分面试宝典系列—SQL高频笔试题第6篇文章的内容,部分历史文章请回翻公众号,更多数据分析面试笔试的文章持续更新中,敬请期待,如果觉得不错,也欢迎分享、点赞和收藏哈~

上一篇:WebAPI性能优化实例


下一篇:用centos光盘安装RPM包的方法