场景分析
-
单线程下:加减乘除,全局汇总
-
多线程下:局部加减乘除,持久化DB,多个bolt汇总一个bolt
使用场景
网站最常用的两个指标:
PV(page views):count (session_id) 即页面浏览量。
UV(user views):count(distinct session_id) 即独立访客数。
a)用ip地址分析
指访问某个站点或点击某个网页的不同ip的人数,在同一天内,UV只记录第一次进入网站的具有独立IP的访问者,在同一天内再次访问该网站则不计数。
b) 用Cookie分析UV值
当客户端第一次访问某个网站服务器的时候,网站服务器会给这个客户端的电脑发,出一个Cookie,通常放在这个客户端电脑的C盘当中。在这个Cookie中会分配一个独一无二的编号,这其中会记录一些访问服务器的信息,如访问时间,访问了哪些页面等等。当你下次再访问这个服务器的时候,服务器就可以直接从你的电脑中找到上一次放进去的Cookie文件,并且对其进行一些更新,但那个独一无二的编号是不会变的
实时处理的业务场景: 汇总型(网站PV,销售额,订单数),去重型(网站UV,顾客数,销售商品数)
概念:用户指定一个任务,可以被多个线程执行,并发度数量等于线程excutor的数量
Task就是具体的处理逻辑对象,一个executor线程可以执行一个或多个tasks,默认每个executor只执行一个task,往往认为task是执行线程,其实不是