1.第一步准备准备数据,先销售单销售明细收款明细3张大表准备一下,Oracle里面形成一张视图,过程略过,数据到中间库,然后远程一个小时一次的频率同步过来到本地电脑的vertica上。
处理成了跟示例超市数据源差不多的样子,再处理过程为了让毛利更准确,再款别里面去掉券,积分等没用实际产生收益的款别,然后重新分摊到商品上,以求更准确的计算单品商品以及品类毛利
从测试上来看 ,按我们目前夸张的速度未来2两年总计流水不过亿的情况下,一台金牌双路服务器的配置,提前以大宽表从结构入库,常规查询,应该是全部可以做到10内秒响应,只选最近一两年的数据应该在5秒内。
数据校验花蛮多时间,顺带从展现的异常,查到了几个收银员的违规操作,且查实处罚