Python pandas.DataFrame.value_counts函数方法的使用

Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。本文主要介绍一下Pandas中pandas.DataFrame.value_counts方法的使用。

DataFrame.value_counts(subset=None, normalize=False, sort=True, ascending=False)    [source]

返回一个包含DataFrame中唯一行数的Series。 1.1.0版中的新功能。

参数:

subset :list-like, 可选

计算唯一组合时要使用的列。

normalizebool, 默认为 False

返回比例而不是频率。

sort :bool, 默认为 True

按频率排序。

ascendingbool, 默认为 False

升序排列。

返回值:

Series

Notes

返回的Series将具有一个MultiIndex,每个输入列具有一个级别。默认情况下,结果中将省略包含任何NA值的行。默认情况下,生成的Series将按降序排列,以便第一个元素是出现频率最高的行。

例子,

>>> df = pd.DataFrame({'num_legs': [2, 4, 4, 6],
...                    'num_wings': [2, 0, 0, 0]},
...                   index=['falcon', 'dog', 'cat', 'ant'])
>>> df
        num_legs  num_wings
falcon         2          2
dog            4          0
cat            4          0
ant            6          0
>>> df.value_counts()
num_legs  num_wings
4         0            2
6         0            1
2         2            1
dtype: int64
>>> df.value_counts(sort=False)
num_legs  num_wings
2         2            1
4         0            2
6         0            1
dtype: int64
>>> df.value_counts(ascending=True)
num_legs  num_wings
2         2            1
6         0            1
4         0            2
dtype: int64
>>> df.value_counts(normalize=True)
num_legs  num_wings
4         0            0.50
6         0            0.25
2         2            0.25
dtype: float64

推荐阅读
cjavapy编程之路首页