解决torch.to(device)是否赋值的坑

torch.to(device)是否赋值的坑

在我们用GPU跑程序时，需要在程序中把变量和模型放到GPU里面。

有一些坑需要注意，本文用RNN模型实例

首先，定义device

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

对于变量，需要进行赋值操作才能真正转到GPU上：

all_input_batch=all_input_batch.to(device)

对于模型，不需要进行赋值：

 model = TextRNN()
 model.to(device)

对模型进行to(device)，还有一种方法，就是在定义模型的时候全部对模型网络参数to(device)，这样就可以不需要model.to(device)这句话。

class TextRNN(nn.Module):

    def __init__(self):
        super(TextRNN, self).__init__()
        #self.cnt = 0
        self.C = nn.Embedding(n_class, embedding_dim=emb_size,device=device)
        self.rnn = nn.RNN(input_size=emb_size, hidden_size=n_hidden,device=device)
        self.W = nn.Linear(n_hidden, n_class, bias=False,device=device)
        self.b = nn.Parameter(torch.ones([n_class])).to(device)


    def forward(self, X):
        X = self.C(X)
        #print(X.is_cuda)
        X = X.transpose(0, 1) # X : [n_step, batch_size, embeding size]
        outputs, hidden = self.rnn(X)
        # outputs : [n_step, batch_size, num_directions(=1) * n_hidden]
        # hidden : [num_layers(=1) * num_directions(=1), batch_size, n_hidden]
        outputs = outputs[-1] # [batch_size, num_directions(=1) * n_hidden]
        model = self.W(outputs) + self.b # model : [batch_size, n_class]
        return model

pytorch中model=model.to(device)用法

这代表将模型加载到指定设备上。

其中，device=torch.device("cpu")代表的使用cpu，而device=torch.device("cuda")则代表的使用GPU。

当我们指定了设备之后，就需要将模型加载到相应设备中，此时需要使用model=model.to(device)，将模型加载到相应的设备中。

将由GPU保存的模型加载到CPU上

将torch.load()函数中的map_location参数设置为torch.device('cpu')

device = torch.device('cpu')
model = TheModelClass(*args, **kwargs)
model.load_state_dict(torch.load(PATH, map_location=device))

将由GPU保存的模型加载到GPU上。确保对输入的tensors调用input = input.to(device)方法。

device = torch.device("cuda")
model = TheModelClass(*args, **kwargs)
model.load_state_dict(torch.load(PATH))
model.to(device)

将由CPU保存的模型加载到GPU上

确保对输入的tensors调用input = input.to(device)方法。

map_location是将模型加载到GPU上，model.to(torch.device('cuda'))是将模型参数加载为CUDA的tensor。

最后保证使用.to(torch.device('cuda'))方法将需要使用的参数放入CUDA。

device = torch.device("cuda")
model = TheModelClass(*args, **kwargs)
model.load_state_dict(torch.load(PATH, map_location="cuda:0"))  # Choose whatever GPU device number you want
model.to(device)

总结

以上为个人经验，希望能给大家一个参考，也希望大家多多支持小闻网。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

解决torch.to(device)是否赋值的坑

目录

torch.to(device)是否赋值的坑

有一些坑需要注意，本文用RNN模型实例

pytorch中model=model.to(device)用法

将由GPU保存的模型加载到CPU上

将由CPU保存的模型加载到GPU上

总结

评论(0)

提示：请文明发言取消回复

文章展示

软路由中文固件 OpenWrt (x86_x64) 精简版（2021.12.31更新）

PrimeOS_Mainline_v0.4.5_Windows x64 安装包

自编译超精简版OpenWrt旁路由x86固件

红米 K70 / POCO F6 Pro (vermeer) 国行版 Fastboot 线刷包 & Recovery 卡刷包 ROM

猫盘刷机教程+固件下载（单群晖）-小闻网

中兴 B860AV1.1-T 电视盒子刷 Armbian 操作系统

解决torch.to(device)是否赋值的坑

目录

torch.to(device)是否赋值的坑

有一些坑需要注意，本文用RNN模型实例

pytorch中model=model.to(device)用法

将由GPU保存的模型加载到CPU上

将由CPU保存的模型加载到GPU上

总结

相关文章

评论(0)

提示：请文明发言 取消回复

标签

文章展示

提示：请文明发言取消回复