DataFrame.value_counts(subset=None, normalize=False, sort=True, ascending=False) [source]
返回一个包含DataFrame中唯一行数的Series。 1.1.0版中的新功能。
参数: | subset :list-like, 可选 计算唯一组合时要使用的列。 normalize: 返回比例而不是频率。 sort : 按频率排序。 ascending: 升序排列。 |
返回值: | Series |
Notes
返回的Series将具有一个MultiIndex,每个输入列具有一个级别。默认情况下,结果中将省略包含任何NA值的行。默认情况下,生成的Series将按降序排列,以便第一个元素是出现频率最高的行。
例子,
>>> df = pd.DataFrame({'num_legs': [2, 4, 4, 6],
... 'num_wings': [2, 0, 0, 0]},
... index=['falcon', 'dog', 'cat', 'ant'])
>>> df
num_legs num_wings
falcon 2 2
dog 4 0
cat 4 0
ant 6 0
>>> df.value_counts()
num_legs num_wings
4 0 2
6 0 1
2 2 1
dtype: int64
>>> df.value_counts(sort=False)
num_legs num_wings
2 2 1
4 0 2
6 0 1
dtype: int64
>>> df.value_counts(ascending=True)
num_legs num_wings
2 2 1
6 0 1
4 0 2
dtype: int64
>>> df.value_counts(normalize=True)
num_legs num_wings
4 0 0.50
6 0 0.25
2 2 0.25
dtype: float64