问题如下:
1、利用pytorch复现googlenet网络
2、定义训练过程函数中
def train(epoch):
running_loss = 0 # 损失值归零
for batch_idx, data in enumerate(train_loader, start=0):
images, labels = data #将输入x和相应的标签y从数据中拿出来
# 将输入和目标y都放到GPU上面
images, labels = images.to(device), labels.to(device)
...
labels.to(device)
报错“AttributeError: 'tuple' object has no attribute 'to'”,发现是因为Python中的元组类(tuple)没有调用to
的方法。
3、解决
(1)执行labels = torch.tensor(labels).to(device)
试图将tuple转为tensor,但是报错:"ValueError: too many dimensions 'str'";
(2)这是因为“张量表示由数值
组成的多维数组”,故字符串str无法直接转为tensor
4、将tuple字符串元素数值化
(1)方法一:调用sklearn的preprocessing(成功运行)
from sklearn import preprocessing
le = preprocessing.LabelEncoder() #获取一个LabelEncoder
labels = le.fit_transform(labels) #训练LabelEncoder
labels = torch.as_tensor(labels)
成功运行
(2)方法二:直接将tuple元素强转为int型(运行报错)
images, labels = data #将输入x和相应的标签y从数据中拿出来
print(labels)
输出:('177', '166', '100', '136')
由于labels实际上是数字,所以思考能否直接将元素转为int型?
labels = [int(i) for i in labels]
labels = torch.as_tensor(labels)
经过此操作成功将labels转为了tensor,但是运行之后报错:
RuntimeError: CUDA error: CUBLAS_STATUS_ALLOC_FAILED when calling `cublasCreate(handle)`
Q:请问方法二为什么会报错呢?