统计数据中位数四分位数/百分位数

分位数

1、概念

分位数(Quantile),TP=Top Percentile,即对一批数值型数据进行排序之后,排在p%位置的数值大小,是数据分析中非常重要的统计指标之一。常用的分位数包括:80分位数,90分位数,99分位数等。

四分位数

四分位数(Quartile):即统计学中,把所有数值由小到大排列并分成四等份,处于三个分割点位置的得分就是四分位数。

  • 第一四分位数 (Q1),又称“较小四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。
  • 第二四分位数 (Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。
  • 第三四分位数 (Q3),又称“较大四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。
  • 第三四分位数与第一四分位数的差距又称四分位距(InterQuartile Range,IQR)。

首先确定四分位数的位置:

  • Q1的位置= (n+1) × 0.25
  • Q2的位置= (n+1) × 0.5
  • Q3的位置= (n+1) × 0.75

    n表示项数
    对于四分位数的确定,有不同的方法,另外一种方法基于N-1 基础。即
    Q1的位置=(n-1)x 0.25
    Q2的位置=(n-1)x 0.5
    Q3的位置=(n-1)x 0.75

    实例

    数据总量: 6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36
    由小到大排列的结果: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49

一共11项
Q1 的位置=(11+1) × 0.25=3,
Q2 的位置=(11+1)× 0.5=6,
Q3的位置=(11+1) × 0.75=9
Q1 = 15,
Q2 = 40,
Q3 = 43