1、Dataset
数据集(dataset)用于从给定数据集读取和转换数据点。 下面提到实施的基本语法:
trainset = torchvision.datasets.CIFAR10(root = './data', train = True, download = True, transform = transform)
DataLoader用于shuffle和batch数据。它可以用于与多处理工作线程并行加载数据。
trainloader = torch.utils.data.DataLoader(trainset, batch_size = 4, shuffle = True, num_workers = 2)
例如:加载CSV文件
使用Python Panda加载CSV文件。原始文件的格式如下:(图像名称,68个地标——每个地标都有一个x, y坐标)。。
landmarks_frame = pd.read_csv('faces/face_landmarks.csv') n = 65 img_name = landmarks_frame.iloc[n, 0] landmarks = landmarks_frame.iloc[n, 1:].as_matrix() landmarks = landmarks.astype('float').reshape(-1, 2)