numpy.loadtxt 是一个用于从文本文件中加载数据的函数。它能够将文件中的数据读入一个NumPy数组中,并且支持多种配置选项来处理不同格式的文本文件。本文主要介绍一下NumPy中loadtxt方法的使用。

numpy.loadtxt

numpy.loadtxt(fname, dtype=, comments='#', delimiter=None, converters=None, skiprows=0, usecols=None, unpack=False, ndmin=0, encoding='bytes', max_rows=None)[source]

从文本文件加载数据。

文本文件中的每一行必须具有相同数量的值。

参数 :

fnamefile, str,pathlib.Path

要读取的文件,文件名或生成器。 

如果文件扩展名是.gz.bz2

则首先将文件解压缩。 请注意,

生成器应返回字节字符串。

dtypedata-type, 可选

结果数组的数据类型; 默认值:float

 如果这是结构化数据类型,

则结果数组将为一维,并且每一行将被解释为数组的元素。 

在这种情况下,使用的列数必须与数据类型中的字段数匹配。

commentsstr 或 str的sequence, 可选

用于指示注释开始的字符或字符列表。 无表示无评论。 

为了向后兼容,字节字符串将被解码为“latin1”

 默认值为“#”

delimiterstr, 可选

用于分隔值的字符串。 为了向后兼容,

字节字符串将被解码为“latin1”。 默认为空格。

convertersdict, 可选

将列号映射到函数的字典,

该函数会将列字符串解析为所需的值。 例如,

如果第0列是日期字符串:

converters = {0:datestr2num}

 转换器也可以用于提供缺失数据的默认值

(但另请参见 genfromtxt):

converters = {3:lambda s:float(s.strip()或0)}

 默认值:None

skiprowsint, 可选

跳过第一行,包括注释; 默认值:0

usecolsintsequence, 可选

要读取的列,第一列为0。 例如,usecols =(1,4,5)

将提取第二,第五和第六列。 默认值为“None”

将导致读取所有列。在版本1.11.0中进行了更改:

当必须读取单个列时,可以使用整数而不是元组。 

例如,usecols = 3读取第四列的方式与

usecols =(3,)相同。

unpackbool, 可选

如果为True,则对返回的数组进行转置,

以便可以使用x,y,z = loadtxt(...)解压缩参数。 

与结构化数据类型一起使用时,将为每个字段返回数组。 

默认值为False

ndminint, 可选

返回的数组将至少具有ndmin维。 否则,将挤压一维轴。

 合法值:0(默认),12

1.6.0版中的新功能。

encodingstr,可选

用于解码输入文件的编码。 不适用于输入流。

 特殊值 ‘bytes’可实现向后兼容的解决方法,

可确保您尽可能接收字节数组作为结果,

并将“latin1”编码的字符串传递给转换器。

 覆盖此值以接收unicode数组,

并将字符串作为输入传递给转换器。 

如果设置为None,则使用系统默认值。 

默认值为 ‘bytes’

1.14.0版中的新功能。

max_rowsint, 可选

在行数之后读取max_rows内容行。 默认为读取所有行。

1.16.0版中的新功能。

返回值 :

outndarray

从文本文件读取数据。

Notes

此功能旨在成为简单格式文件的快速阅读器。genfromtxt函数可对例如缺少值的行进行更复杂的处理。

1.10.0版中的新功能。

Python float.hex方法产生的字符串可用作float的输入。

例子

1)从文件中加载简单的数据

import numpy as np

# 生成 data.txt 文件
with open('data.txt', 'w') as file:
    file.write('1.0 2.0 3.0\n')
    file.write('4.0 5.0 6.0\n')
    file.write('7.0 8.0 9.0\n')

data = np.loadtxt('data.txt')
print(data)

2)指定数据类型

import numpy as np


# 生成 data.txt 文件
with open('data.txt', 'w') as file:
    file.write('1.0 2.0 3.0\n')
    file.write('4.0 5.0 6.0\n')
    file.write('7.0 8.0 9.0\n')

data = np.loadtxt('data.txt', dtype=float)
print(data)

3)跳过行和选择列

import numpy as np

# 生成 data.txt 文件
with open('data.txt', 'w') as file:
    file.write('1.0 2.0 3.0\n')
    file.write('4.0 5.0 6.0\n')
    file.write('7.0 8.0 9.0\n')

data = np.loadtxt('data.txt', skiprows=1, usecols=(0, 2))
print(data)

4)使用分隔符

import numpy as np

# 生成 data.csv 文件
with open('data.csv', 'w') as file:
    file.write('1.0, 2.0, 3.0\n')
    file.write('4.0, 5.0, 6.0\n')
    file.write('7.0, 8.0, 9.0\n')

data = np.loadtxt('data.csv', delimiter=',')
print(data)

5)读取特定的行数

import numpy as np


# 生成 data.txt 文件
with open('data.txt', 'w') as file:
    file.write('1.0 2.0 3.0\n')
    file.write('4.0 5.0 6.0\n')
    file.write('7.0 8.0 9.0\n')

data = np.loadtxt('data.txt', max_rows=2)
print(data)

6)使用转换器

import numpy as np

# 生成 data_with_strings.txt 文件
with open('data_with_strings.txt', 'w') as file:
    file.write('1.0 2.0 3.0\n')
    file.write('4.0 A 6.0\n')
    file.write('7.0 8.0 9.0\n')


def converter(value):
    if value == b'A':
        return 5.0
    return float(value)

data = np.loadtxt('data_with_strings.txt', converters={1: converter})
print(data)

7)使用示例

import numpy as np
from io import StringIO

# 示例1:简单的字符串数据加载
c = StringIO("0 1\n2 3")
data1 = np.loadtxt(c)
print("Example 1:\n", data1)

# 示例2:带有指定dtype的字符串数据加载
d = StringIO("M 21 72\nF 35 58")
data2 = np.loadtxt(d, dtype={'names': ('gender', 'age', 'weight'),
                             'formats': ('S1', 'i4', 'f4')})
print("\nExample 2:\n", data2)

# 示例3:使用分隔符并选择特定列
c = StringIO("1,0,2\n3,0,4")
x, y = np.loadtxt(c, delimiter=',', usecols=(0, 2), unpack=True)
print("\nExample 3:")
print("x:", x)
print("y:", y)

# 示例4:使用转换器将带有尾随减号的字段转换为负数
s = StringIO('10.01 31.25-\n19.22 64.31\n17.57- 63.94')
def conv(fld):
    return -float(fld[:-1]) if fld.endswith(b'-') else float(fld)

data4 = np.loadtxt(s, converters={0: conv, 1: conv})
print("\nExample 4:\n", data4)

推荐文档

相关文档

大家感兴趣的内容

随机列表