Python pandas.DataFrame.count函数方法的使用

pandas.DataFrame.count() 是用于计算 DataFrame 中每列非空元素的数量的方法。它返回一个 Series,其中索引是 DataFrame 的列名,值是对应列中的非空元素数量。本文主要介绍一下Pandas中pandas.DataFrame.count方法的使用。

DataFrame.count(axis=0, level=None, numeric_only=False)

计算每列或每行的非NA单元格。

NoneNaNNaT和可选的numpy.inf(取决于pandas.options.mode.use_inf_as_na)被视为NA

参数:

axis : {0 或 ‘index’, 1 或 ‘columns’}, 默认为 0

如果为每列生成0或'index'计数。

如果为每行生成1或'columns'计数

level : intstr, 可选

如果轴是MultiIndex(分层),

则沿特定级别计数,折叠到DataFrame中。

一个str指定级别名称。

numeric_only : boolean, 默认为 False

仅包含floatintboolean数据。

返回:

SeriesDataFrame

对于每个列/行,non-NA/null条目的数量。

如果指定了level,则返回DataFrame

例子

1)统计行方向上的非缺失值数目

import pandas as pd 
import numpy as np

# 创建一个字典形式的DataFrame 
data = {'A': [-5, 8, 12, None, 5, 3],
        'B': [-1, None, 6, 4, None, 3],
        'C': ['sam', 'haris', 'alex', np.nan,  'peter', 'nathan']}
df = pd.DataFrame(data)
 
# 使用.count()方法统计行方向上的非缺失值数目 
print(df.count(axis=0)) 

2)使用示例

import pandas as pd
import numpy as np

# 创建示例 DataFrame
df = pd.DataFrame({"Person":
                   ["John", "Myla", "Lewis", "John", "Myla"],
                   "Age": [24., np.nan, 21., 33, 26],
                   "Single": [False, True, True, True, False]})

# 显示整个 DataFrame
print("DataFrame:")
print(df)
print()

# 使用 count() 方法计算每列非空元素的数量
print("每列计数(不计算 NA 值):")
print(df.count())
print()

# 使用 count() 方法计算每行非空元素的数量
print("每行计数:")
print(df.count(axis='columns'))
print()

# 使用 count(level="Person") 计算 MultiIndex 中的一个级别的计数
print("按 Person 列计算 Age 列的计数:")
print(df.set_index(["Person", "Single"]).groupby(level=1).count())

推荐阅读
cjavapy编程之路首页