DataFrame.to_stata(**kwargs) [source]
将DataFrame对象导出为Stata dta格式。
将数据格式写入Stata数据集文件。“dta”
文件包含Stata数据集。
参数: | path :str, buffer 或 path object 字符串,路径对象( 或 或实现二进制w 如果使用缓冲区, 则在写入文件数据后缓冲区不会自动关闭。 在1.0.0版中更改。 以前这是 convert_dates : 包含日期时间类型的字典, 映射列到写入日期时要使用的stata内部格式。 选项为
列可以是整数或名称。 未指定转换类型的日期时间列将转换为 如果 则引发 write_index : 将索引写入Stata数据集。 byteorder :str 可以是 默认值为s time_stamp: 用作文件创建日期的日期时间。默认值是当前时间。 data_label : 数据集的标签。必须为80个字符或更小。
将列作为键、变量标签作为值的字典。 每个标签必须是80个字符或更小。 version: 默认为 在输出dta文件中使用的版本。 设置为None, 可以让熊猫根据框架中的列数在118 或119种格式之间进行选择。 Stata 10和更高版本可以读取版本114。 Stata 13或更高版本可以读取117版。 Stata 14和更高版本支持版本118。 Stata 15和更高版本支持119版。 版本114, 将字符串变量限制为244个字符或更少, 而版本117和更高版本, 允许长度不超过2,000,000个字符的字符串。 版本118和119支持Unicode字符, 版本119支持超过32,767个变量。 0.23.0版中的新功能。 在1.0.0版中进行了更改: 添加了对格式118和119的支持。 convert_strl : 要转换为Stata StrL格式的字符串列的列名称列表。 仅当版本为117时可用。 如果字符串的字符数超过8个且重复值, 则以StrL格式存储字符串会生成较小的dta文件。 0.23.0版中的新功能。 compression : 用于动态压缩输出dta。 如果为字符串, 则指定压缩模式。 如果是dict,则 压缩模式必须为
如果压缩模式为 则从以下扩展名检测压缩:
如果dict and 模式为 或推断为上述之一,则其他条目作为附加压缩选项传递。 1.1.0版中的新功能。 |
Raises: |
1) 如果日期时间包含时区信息 2) 列dtype在Stata中是不可表示的
1) 也不是 2) 在 3) 分类标签包含超过32,000个字符 |
例如,
>>> df = pd.DataFrame({'animal': ['falcon', 'parrot', 'falcon', ... 'parrot'], ... 'speed': [350, 18, 361, 15]})