DataFrame.update(other, join='left', overwrite=True, filter_func=None, errors='ignore') [source]
使用来自另一个DataFrame的非NA值进行适当的修改。
在索引上对齐,没有返回值。
参数: | other : 应该至少有一个与原始 如果传递了一个Series,则必须设置它的name属性, 并将其用作列名,以便与原始的DataFrame保持一致。 join : 只实现left join,保留原始对象的索引和列。 overwrite : 如何处理重复键的非NA值: 1) True:用其他 DataFrame的值覆盖原始数据的值。 2) False:仅更新原始DataFrame中NA的值。 filter_func :
可以选择替换NA以外的值。 对于应该更新的值返回True。 errors : 如果为 则当 将引发 在版本0.24.0中更改: 从 更改 为 |
返回值: | None : 方法直接更改调用对象 |
Raises: | ValueError 当 当错误不是
如果 |
例子
>>> df = pd.DataFrame({'A': [1, 2, 3], ... 'B': [400, 500, 600]}) >>> new_df = pd.DataFrame({'B': [4, 5, 6], ... 'C': [7, 8, 9]}) >>> df.update(new_df) >>> df A B 0 1 4 1 2 5 2 3 6
由于更新,DataFrame的长度不会增加,只会更新匹配的索引/列标签上的值
>>> df = pd.DataFrame({'A': ['a', 'b', 'c'], ... 'B': ['x', 'y', 'z']}) >>> new_df = pd.DataFrame({'B': ['d', 'e', 'f', 'g', 'h', 'i']}) >>> df.update(new_df) >>> df A B 0 a d 1 b e 2 c f
对于Series,必须设置其name属性
>>> df = pd.DataFrame({'A': ['a', 'b', 'c'], ... 'B': ['x', 'y', 'z']}) >>> new_column = pd.Series(['d', 'e'], name='B', index=[0, 2]) >>> df.update(new_column) >>> df A B 0 a d 1 b y 2 c e >>> df = pd.DataFrame({'A': ['a', 'b', 'c'], ... 'B': ['x', 'y', 'z']}) >>> new_df = pd.DataFrame({'B': ['d', 'e']}, index=[1, 2]) >>> df.update(new_df) >>> df A B 0 a x 1 b d 2 c e
如果其他包含NaN,则相应的值不会在原始数据帧中更新
>>> df = pd.DataFrame({'A': [1, 2, 3], ... 'B': [400, 500, 600]}) >>> new_df = pd.DataFrame({'B': [4, np.nan, 6]}) >>> df.update(new_df) >>> df A B 0 1 4.0 1 2 500.0 2 3 6.0