DataFrame.to_csv(path_or_buf=None, sep=',', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression='infer', quoting=None, quotechar='"', line_terminator=None, chunksize=None, date_format=None, doublequote=True, escapechar=None, decimal='.', errors='strict') [source]
对象写入一个逗号分隔值(csv)文件。
版本0.24.0中的更改:更改了系列参数的顺序
参数: | path_or_buf : 默认为 文件路径或对象,如果没有提供, 结果将作为字符串返回。 如果一个文件对象被传递, 它应该用 禁用通用换行符。 在版本0.24.0中更改:以前为Series命名为 sep : 长度为1的字符串。输出文件的字段分隔符。 na_rep : 缺失的数据表示。 float_format : 浮点数的格式字符串。 columns : 要写的列。 header : 写出列名。如果给定了字符串列表, 则假定它是列名的别名。 在版本0.24.0中更改:以前对于Series默认为 index : 写行名(索引)。 index_label : 或 列标签索引列(s)(如果需要的话)。 如果没有给出,并且头和索引为真, 则使用索引名。 如果对象使用多索引, 则应该给出一个序列。 如果为False,不要打印索引名称的字段。 使用index_label=False在R中更容易导入。 mode : Python写入模式,默认为 encoding : 表示要在输出文件中使用的编码的字符串, 默认为 compression : 如果为 如果是dict, 则 压缩模式可以是下列任何值:
如果压缩模式是 并且 那么从以下扩展中检测压缩模式: 或 (否则不压缩)。 如果给定的
或推断为上述选项之一, 则其他项作为附加压缩选项传递。 在版本1.0.0中更改:现在可以是一个 如果压缩模式是 则键 其他条目作为附加压缩选项。 在版本1.1.0中更改:支持在压缩模式
中以键的形式传递压缩选项。 quoting :可选常量从 默认为 如果您设置了一个 那么
quotechar : 长度为1的字符串。用于引用字段的字符。 line_terminator : 输出文件中要使用的换行字符或字符序列。 默认 在 在版本0.24.0中进行了更改。 chunksize : 每次要写入的行。 date_format : 日期时间对象的格式字符串。 doublequote : 控制字段内引用 escapechar : 长度为1的字符串。 在适当时用于转义 decimal : 可识别为十进制分隔符的字符。例如,使用‘.’表示欧洲数据。 errors : 指定如何处理编码和解码错误。有关完整的选项列表, 请参阅 新版本1.1.0。 |
返回值: | None 或 str 如果 则返回结果 否则返回 |
例子
>>> df = pd.DataFrame({'name': ['Raphael', 'Donatello'], ... 'mask': ['red', 'purple'], ... 'weapon': ['sai', 'bo staff']}) >>> df.to_csv(index=False) 'name,mask,weapon\nRaphael,red,sai\nDonatello,purple,bo staff\n'
创建包含‘out.zip’ 的 ‘out.csv’
>>> compression_opts = dict(method='zip', ... archive_name='out.csv') >>> df.to_csv('out.zip', index=False, ... compression=compression_opts)