Pytorch: 왜 model.cuda()가 속성 대신 클래스 메서드입니까?

에 만든 2017년 04월 15일 · 3코멘트 · 출처: pytorch/pytorch

import torch
from torch.autograd import Variable

a = Variable(torch.Tensor([1, 2]))
if torch.cuda.is_available():
    b = a.cuda()

b_data = b.data
b_grad = b.grad
b_grad_data = b.grad.data

.data 및 .grad 가 클래스 속성이면 .cuda() 를 속성으로 유지하여 b = a.cuda 를 수행할 수 있습니다. .cuda() , .data 및 .grad 가 torch.Tensor 이므로 cuda() 를 속성으로 변경할 수 있으므로 API 일관성이 향상될 것이라고 생각하고 제안합니다. . 이렇게 하면 GPU 상주 모델에 model.cuda 로 액세스할 수 있습니다.

출처

kdexd

가장 유용한 댓글

cuda 는 CPU에서 GPU로 데이터를 복사하는 비교적 비용이 많이 드는 작업이기 때문에 메서드로 만들어졌습니다. grad 및 data 는 해당 Tensor에 대한 참조만 검색하는 저렴한 작업( O(1) )입니다. cuda 메소드를 만드는 것이 합리적이라고 생각합니다.

chenzhekl 에 2017년 04월 16일

👍10

모든 3 댓글

cuda 는 CPU에서 GPU로 데이터를 복사하는 비교적 비용이 많이 드는 작업이기 때문에 메서드로 만들어졌습니다. grad 및 data 는 해당 Tensor에 대한 참조만 검색하는 저렴한 작업( O(1) )입니다. cuda 메소드를 만드는 것이 합리적이라고 생각합니다.

chenzhekl 에 2017년 04월 16일

👍10

.cuda()는 CPU 데이터를 GPU에 복사합니다. 데이터를 GPU에 항상 유지하고 싶지는 않을 것입니다. 즉, 정말 필요할 때만 GPU에 데이터를 저장합니다.

lg-zhang 에 2017년 04월 16일

위의 두 의견에서 언급했듯이 .cuda 를 속성으로 만드는 것은 부적절합니다. .cuda() 를 참조할 때 새 개체를 반환하고 많은 일이 발생합니다.

soumith 에 2017년 04월 16일

이 페이지가 도움이 되었나요?

0 / 5 - 0 등급

관련 문제

optim에서 사용된 운동량 공식에 대한 문서에 메모 추가

keskarnitish · 3코멘트

가변 입력 크기 훈련이 느림

kuangliu · 3코멘트

[build/nccl]이 불안정한 Debian에서 libnccl을 빌드하지 못했습니다.

cdluminate · 3코멘트

행렬 곱셈 연산자

bartvm · 3코멘트

LSTM은 게이트 바이어스 초기화를 잊어 버렸습니다.

ikostrikov · 3코멘트