# 分布分析
分布分析主要能够提供【维度指标化】之后的数据分解能力,将原有维度按照一定的数值区间进行维度划分,进而分析每个维度区间的分布情况,在以下分析场景中十分常见:
1. 分析订单的金额分布
2. 分析某类特殊事件的发生时段分布
3. 分析某类特殊事件的发生次数分布
4. 分析触发某类事件的用户年龄分布
由此可见,分布分析主要针对的是数值型和日期型这两类属性,比如:金额、年龄、时间、频次,因此当用户打点上传的数据中包括这两类属性时,那么在日常的分析中就有可能会使用分布分析来解决一些特定问题。
# 常用指标
# 1.X事件的次数分布
X 事件的次数分布,指在指定日期范围间内触发 X 事件的次数分布。e.g.在2020/01/01 - 2020/10/01 期间触发了启动事件的次数分布,启动了[1,3)次的2人,[3,10)次的10人等。 支持细分维度对比,比如细分城市维度,即可查看不同城市的用户启动次数分布
支持增加过滤条件,比如筛选平台=Android,仅Android平台的用户启动次数分布
支持分析一段时间的汇总情况,或者是按日、周、月不同时间粒度细分看趋势
# 2.X事件的活跃时段分布
X 事件的活跃时段分布,指在指定日期范围内触发 X 事件的时段分布。e.g. 在2020/01/01 - 2020/10/01 期间,一天24小时各个时段中启动的用户各有多少。
比如通过下图可以看到用户访问集中在上午9点到12点,下午2点到5点期间,其中上午10点到11点期间访问的用户最多 支持细分维度查看,比如细分设备品牌,查看不同设备品牌的用户的活跃时段,通过下图可以看到在工作时间华为设备的访问量明显居多,在晚9点到次日9点休息期间,小米访问量更多。 支持按日、周、月的时间粒度细分,可以查看不同时段里不同时间的活跃趋势,可以通过表格查看,比如下图展现近 30 日每天用户在不同时段的活跃情况。 也可以按每周几聚合,比如通过下图,可以发现用户基本活跃时段
# 3.X事件的活跃天数分布
X 事件的活跃天数分布,指在指定日期范围内触发 X 事件的天数分布。 e.g. 在2020/01/01 - 2020/10/01 期间触发了启动事件的天数分布,启动了[1,3)天的2人,[3,10)天的10人等。 可以查看任意事件在某一个时间区间里的活跃天数,如下图体现过去 30 天里不同活跃天数的用户分布,其中多数用户活跃天数在 2 天到 5 天之间,10 天以上的用户最少 支持按周、按月的时间粒度细分,比如下图查看最近4个月里 用户活跃天数的变化# 4.X 事件 Y 属性的总和/均值/人均值等分布
对于数值型的属性值,支持分析属性的总和、均值、人均值、最大值、最小值的分布,比如分析一段时间里不同支付订单金额区间的用户分布。总和/人均值: 用户的指标属性的值累加, 跟区间范围去比较, 看位于哪个区间
最大值: 用户的指标属性的最大值, 跟区间范围去比较, 看位于哪个区间
最小值: 用户的指标属性的最小值, 跟区间范围去比较, 看位于哪个区间
去重数: 用户的指标属性的值去重后的个数, 跟区间范围, 看位于哪个区间
均值: 用户的指标属性的值累加 除以 触发次数 的值, 跟区间范围, 看位于哪个区间
分布分析也支持字符串属性的分析,这类属性的分析场景在实际工作中比较少见,只能统计属性值的去重数的分布情况,例如:统计某次大促活动中,支付订单的品类分布情况,可以在分布分析中,选择支付订单事件的商品品类属性的去重数分布,同时增加商品品类的细分维度。 |