numpy.nanpercentile
numpy.nanpercentile(a, q, axis=None, out=None, overwrite_input=False, interpolation='linear', keepdims=) [source]
沿指定轴计算数据的第q个百分位数,而忽略nan值。
返回数组元素的第q个百分点。
1.9.0版中的新功能。
参数 : | a :array_like 输入数组或可以转换为数组的对象, 其中包含要忽略的nan值。 q :array_like of float 要计算的百分位数或百分位数序列, 必须在0到100之间(含0和100)。 axis :{int, tuple of int, None}, 可选 沿其计算百分位数的一个或多个轴。 默认值为沿数组的展平版本计算百分位数。 out :ndarray, 可选 放置结果的备用输出数组。 它的形状和缓冲区长度必须与预期的输出相同, 但是(必要时)将强制转换(输出的)类型。 overwrite_input :bool, 可选 如果为True,则允许通过中间计算来修改输入数组a, 以节省内存。在这种情况下,此功能完成后输入a的内容是不确定的。 interpolation :
这个可选参数指定了当需要的百分比位于两个数据点 之间时使用的插值方法: 1)‘linear’:
2)‘lower’: 3)‘higher’: 4)‘nearest’: 5)‘midpoint’: keepdims : 如果将其设置为True, 则缩小的轴将保留为尺寸1的尺寸。 使用此选项,结果将针对原始数组a正确传递。 如果这不是默认值, 它将通过(在空数组的特殊情况下)传递到基础数组的mean函数。 如果数组是子类,并且mean不具有kwarg keepdims, 则将引发RuntimeError。 |
返回值 : | percentile :scalar 或 ndarray 如果q是单个百分位数,而axis = None, 则结果是标量。 如果给出了多个百分位数, 则结果的第一个轴对应于百分位数。 其他轴是a减小后剩余的轴。 如果输入包含小于float64的整数或浮点数, 则输出数据类型为float64。 否则,输出数据类型与输入的数据类型相同。 如果指定了out,则返回该数组。 |
Notes
给定长度为N的向量V
,V
的第q个百分位数是从最小值到整数的方式的值q/100
。如果归一化排名与q
的位置完全不匹配,则两个最近邻居的值和距离以及内插参数将确定百分位数。如果q = 50
,此函数与中位数相同;如果q = 0
,则与最小值相同;如果q = 100
,则与最大值相同。
例子
>>> a = np.array([[10., 7., 4.], [3., 2., 1.]])
>>> a[0][1] = np.nan
>>> a
array([[10., nan, 4.],
[ 3., 2., 1.]])
>>> np.percentile(a, 50)
nan
>>> np.nanpercentile(a, 50)
3.0
>>> np.nanpercentile(a, 50, axis=0)
array([6.5, 2. , 2.5])
>>> np.nanpercentile(a, 50, axis=1, keepdims=True)
array([[7.],
[2.]])
>>> m = np.nanpercentile(a, 50, axis=0)
>>> out = np.zeros_like(m)
>>> np.nanpercentile(a, 50, axis=0, out=out)
array([6.5, 2. , 2.5])
>>> m
array([6.5, 2. , 2.5])
>>> b = a.copy()
>>> np.nanpercentile(b, 50, axis=1, overwrite_input=True)
array([7., 2.])
>>> assert not np.all(a==b)