pandas.DataFrame.mean 方法用于计算 DataFrame 的平均值(算术平均数),默认沿列计算(axis=0)。它可以沿指定轴计算均值,并可以处理缺失值 (NaN)。skipna=True 可忽略 NaN,否则 NaN 会影响计算结果。numeric_only=True 仅计算数值列,忽略字符串或对象列。本文主要介绍一下Pandas中pandas.DataFrame.mean方法的使用。

DataFrame.mean(self, axis=None, skipna=None, level=None, numeric_only=None, **kwargs) [source]

返回所请求轴的值的平均值。

参数:       

axis{index (0), columns (1)}

要应用的功能的轴。

skipnabool,默认为True

计算结果时排除NA/null值。

levelint或级别名称,

默认为None

如果轴是MultiIndex(分层),

则沿特定级别计数,并折叠为Series

numeric_onlybool

默认值None

仅包括floatintboolean列。

如果为None,将尝试使用所有内容,

然后仅使用数字数据。未针对Series实施。

**kwargs

要传递给函数的其他关键字参数。

返回

SeriesDataFrame(如果指定level)

例子

1)计算每列的均值

import pandas as pd

df = pd.DataFrame({
    'A': [1, 2, 3, 4],
    'B': [5, 6, None, 8],  # 存在 NaN
    'C': [9, 10, 11, 12]
})

print(df.mean())

2)计算每行的均值

import pandas as pd

# 创建 DataFrame
df = pd.DataFrame({
    'A': [10, 20, 30, 40],
    'B': [5, None, 15, 25],  # 第二行存在 NaN
    'C': [1, 2, 3, 4]
})

# 计算每一行的均值
print(df.mean(axis=1))

3)不忽略 NaN

import pandas as pd

# 创建一个包含 NaN 值的 DataFrame
df = pd.DataFrame({
    'A': [1, 2, 3, 4],
    'B': [5, None, 7, 8],  # B 列包含 NaN
    'C': [9, 10, 11, 12]
})

# 计算每列的均值,不忽略 NaN
print(df.mean(skipna=False))

4)仅计算数值列

import pandas as pd

# 创建 DataFrame
df = pd.DataFrame({
    'A': [1, 2, 3, 4],
    'B': [5, 6, None, 8],  # 包含 NaN
    'C': [9, 10, 11, 12]
})

# 添加一个非数值列
df["D"] = ["x", "y", "z", "w"]

# 计算均值,仅包含数值列
mean_values = df.mean(numeric_only=True)

# 输出结果
print(mean_values)

推荐文档

相关文档

大家感兴趣的内容

随机列表