# 分布分析

分布分析主要能够提供【维度指标化】之后的数据分解能力,将原有维度按照一定的数值区间进行维度划分,进而分析每个维度区间的分布情况,在以下分析场景中十分常见:
 1. 分析订单的金额分布
 2. 分析某类特殊事件的发生时段分布
 3. 分析某类特殊事件的发生次数分布
 4. 分析触发某类事件的用户年龄分布
由此可见,分布分析主要针对的是数值型和日期型这两类属性,比如:金额、年龄、时间、频次,因此当用户打点上传的数据中包括这两类属性时,那么在日常的分析中就有可能会使用分布分析来解决一些特定问题。

# 常用指标

# 1.X事件的次数分布

X 事件的次数分布,指在指定日期范围间内触发 X 事件的次数分布。
e.g.在2020/01/01 - 2020/10/01 期间触发了启动事件的次数分布,启动了[1,3)次的2人,[3,10)次的10人等。

image1

支持细分维度对比,比如细分城市维度,即可查看不同城市的用户启动次数分布
支持增加过滤条件,比如筛选平台=Android,仅Android平台的用户启动次数分布
支持分析一段时间的汇总情况,或者是按日、周、月不同时间粒度细分看趋势

image1.2

# 2.X事件的活跃时段分布

X 事件的活跃时段分布,指在指定日期范围内触发 X 事件的时段分布。
e.g. 在2020/01/01 - 2020/10/01 期间,一天24小时各个时段中启动的用户各有多少。
比如通过下图可以看到用户访问集中在上午9点到12点,下午2点到5点期间,其中上午10点到11点期间访问的用户最多

image2.1

支持细分维度查看,比如细分设备品牌,查看不同设备品牌的用户的活跃时段,通过下图可以看到在工作时间华为设备的访问量明显居多,在晚9点到次日9点休息期间,小米访问量更多。

image2.2

支持按日、周、月的时间粒度细分,可以查看不同时段里不同时间的活跃趋势,可以通过表格查看,比如下图展现近 30 日每天用户在不同时段的活跃情况。

2.3

也可以按每周几聚合,比如通过下图,可以发现用户基本活跃时段

2.4

# 3.X事件的活跃天数分布

X 事件的活跃天数分布,指在指定日期范围内触发 X 事件的天数分布。 e.g. 在2020/01/01 - 2020/10/01 期间触发了启动事件的天数分布,启动了[1,3)天的2人,[3,10)天的10人等。 可以查看任意事件在某一个时间区间里的活跃天数,如下图体现过去 30 天里不同活跃天数的用户分布,其中多数用户活跃天数在 2 天到 5 天之间,10 天以上的用户最少

image3.1

支持按周、按月的时间粒度细分,比如下图查看最近4个月里 用户活跃天数的变化

image3.2

# 4.X 事件 Y 属性的总和/均值/人均值等分布

对于数值型的属性值,支持分析属性的总和、均值、人均值、最大值、最小值的分布,比如分析一段时间里不同支付订单金额区间的用户分布。

总和/人均值: 用户的指标属性的值累加, 跟区间范围去比较, 看位于哪个区间

最大值: 用户的指标属性的最大值, 跟区间范围去比较, 看位于哪个区间

最小值: 用户的指标属性的最小值, 跟区间范围去比较, 看位于哪个区间

去重数: 用户的指标属性的值去重后的个数, 跟区间范围, 看位于哪个区间

均值: 用户的指标属性的值累加 除以 触发次数 的值, 跟区间范围, 看位于哪个区间

分布分析也支持字符串属性的分析,这类属性的分析场景在实际工作中比较少见,只能统计属性值的去重数的分布情况,例如:统计某次大促活动中,支付订单的品类分布情况,可以在分布分析中,选择支付订单事件的商品品类属性的去重数分布,同时增加商品品类的细分维度。