Pytorch: Versi 1.3 tidak lagi mendukung Tesla K40m?

Dibuat pada 27 Nov 2019  ·  61Komentar  ·  Sumber: pytorch/pytorch

Bug

Saya menggunakan Tesla K40m, menginstal pytorch 1.3 dengan conda, menggunakan CUDA 10.1

Untuk Mereproduksi

Langkah-langkah untuk mereproduksi perilaku:

  1. Miliki kotak dengan Tesla K40m
  2. conda install pytorch cudatoolkit -c pytorch
  3. acara cuda tersedia
python -c 'import torch; print(torch.cuda.is_available());'
>>> True
  1. Buat instance model dan panggil .forward()
Traceback (most recent call last):
  File "./baselines/get_results.py", line 395, in <module>
    main(args)
  File "./baselines/get_results.py", line 325, in main
    log_info = eval_main(eval_args)
  File "/mnt/cdtds_cluster_home/s0816700/git/midi_degradation_toolkit/baselines/eval_task.py", line 165, in main
    log_info = trainer.test(0, evaluate=True)
  File "/mnt/cdtds_cluster_home/s0816700/git/midi_degradation_toolkit/mdtk/pytorch_trainers.py", line 110, in test
    evaluate=evaluate)
  File "/mnt/cdtds_cluster_home/s0816700/git/midi_degradation_toolkit/mdtk/pytorch_trainers.py", line 220, in iteration
    model_output = self.model.forward(input_data, input_lengths)
  File "/mnt/cdtds_cluster_home/s0816700/git/midi_degradation_toolkit/mdtk/pytorch_models.py", line 49, in forward
    self.hidden = self.init_hidden(batch_size, device=device)
  File "/mnt/cdtds_cluster_home/s0816700/git/midi_degradation_toolkit/mdtk/pytorch_models.py", line 40, in init_hidden
    return (torch.randn(1, batch_size, self.hidden_dim, device=device),
RuntimeError: CUDA error: no kernel image is available for execution on the device

Pertama kali mencoba menurunkan versi ke cudatoolkit=10.0, yang menunjukkan masalah yang sama.

Kode akan berjalan dengan baik jika Anda mengulangi langkah-langkah di atas tetapi sebagai gantinya conda install pytorch=1.2 cudatoolkit=10.0 -c pytorch .

Perilaku yang diharapkan

Jika tidak lagi mendukung GPU tertentu, harap isi dengan pesan kesalahan yang berguna.

Lingkungan

Unfort menjalankan skrip Anda setelah saya 'memperbaiki' sehingga versi pytorch akan menjadi 1.2 di sini - masalah yang dihadapi dengan versi 1.3.

Collecting environment information...
PyTorch version: 1.2.0
Is debug build: No
CUDA used to build PyTorch: 10.0.130

OS: Scientific Linux release 7.6 (Nitrogen)
GCC version: (GCC) 4.8.5 20150623 (Red Hat 4.8.5-36)
CMake version: version 2.8.12.2

Python version: 3.7
Is CUDA available: Yes
CUDA runtime version: Could not collect
GPU models and configuration: GPU 0: Tesla K40m
Nvidia driver version: 430.50
cuDNN version: /usr/lib64/libcudnn.so.6.5.18

Versions of relevant libraries:
[pip3] numpy==1.16.3
[pip3] numpydoc==0.8.0
[conda] blas                      1.0                         mkl  
[conda] mkl                       2019.4                      243  
[conda] mkl-service               2.3.0            py37he904b0f_0  
[conda] mkl_fft                   1.0.15           py37ha843d7b_0  
[conda] mkl_random                1.1.0            py37hd6b4f25_0  
[conda] pytorch                   1.2.0           py3.7_cuda10.0.130_cudnn7.6.2_0    pytorch
[conda] torchvision               0.4.0                py37_cu100    pytorch

cc @ezyang @gchanan @zou3519 @jerryzh168 @ngimel

binaries cuda docs triaged

Komentar yang paling membantu

Saya hanya ingin menyarankan agar kemampuan komputasi yang kompatibel untuk binari yang telah dikompilasi ditambahkan di suatu tempat ke dokumentasi, terutama ketika memberikan instruksi penginstalan untuk binari. Informasi itu tampaknya tidak tersedia di mana pun.

Semua 61 komentar

Untuk memastikan, apakah Anda menggunakan 1.3.0 atau 1.3.1 ?

1.3.1

conda list 'pytorch|cuda'
>>> # packages in environment at /home/s0816700/miniconda3/envs/mdtk:
>>> #
>>> # Name                    Version                   Build  Channel
>>> cudatoolkit               10.1.243             h6bb024c_0  
>>> pytorch                   1.3.1           py3.7_cuda10.1.243_cudnn7.6.3_0    pytorch

Apakah env pada titik kegagalan.

cc @ngimel

K40m memiliki kemampuan komputasi 3,5, yang menurut saya tidak lagi didukung.

Baik. Tolong, bisakah Anda menerapkan peringatan "oldgpu" yang berguna? Seperti di sini: https://github.com/pytorch/pytorch/issues/6529

Kesalahan saat ini sangat tidak jelas bagi pengguna biasa seperti saya.

--- EDIT ---
Juga bagus untuk menautkan pengguna:

  1. ke halaman yang merinci kapasitas komputasi apa yang Anda dukung (jika ada) dan
  2. bagaimana cara mengetahui berapa kapasitas komputasi GPU Anda (saya kira di sini: https://developer.nvidia.com/cuda-gpus#compute untuk sebagian besar?)

Berjuang (ed/ing) untuk menemukan kedua hal itu!

Selain itu, @SsnL - mungkin baris ini perlu diperbarui jika Anda benar:
https://github.com/pytorch/pytorch/blob/bf61405ed61816b23c57718722145f26f217666a/torch/__init__.py#L10. Dari mana Anda mendapatkan informasi tentang dukungan kemampuan komputasi minimal?

@JamesOwers Jika saya tidak salah, komit ini meningkatkan kemampuan komputasi minimal menjadi 3,7.

Tidak ada alasan teknis untuk diubah menjadi 3.7 kan?
Kode masih mendukung 3.5 (dan bahkan 3.0 lagi).

Ini hanya untuk Conda? Sepertinya itu berubah dari 3,5 dan 5,0+ menjadi 3,7 dan 5,0+ jadi selalu hilang 3,5 atau 3,7. Saya kira itu terlalu lama/menjadi terlalu besar untuk mendukung lebih dari 2 arsitektur yang dibangun.

@soumith mungkin mengoreksi saya, tapi saya pikir alasan utamanya adalah ukuran binari yang semakin besar.

@ptrblck itulah alasannya tetapi anehnya berubah dari mendukung K40 (+ beberapa kartu konsumen) dan bukan K80 menjadi mendukung K80 dan bukan K40 (+ beberapa kartu konsumen).

pada GPU NVIDIA dengan kemampuan komputasi >= 3.0.

Saya juga berharap ada cara agar pesan mencerminkan lengkungan cuda minimum dari daftar lengkungan cuda ketika dikompilasi. Ini akan membuatnya lebih mudah ketika diubah menjadi 3.7, misalnya. Atau ketika pengguna mendukung 3.0 dengan mengompilasinya sendiri.

Ini juga sedang dibahas di https://github.com/pytorch/pytorch/issues/24205#issuecomment -560185215

Saya hanya ingin menyarankan agar kemampuan komputasi yang kompatibel untuk binari yang telah dikompilasi ditambahkan di suatu tempat ke dokumentasi, terutama ketika memberikan instruksi penginstalan untuk binari. Informasi itu tampaknya tidak tersedia di mana pun.

k40m dengan cuda10.0 mendapatkan kesalahan yang sama!!!
membangun dari sumber mendapatkan lebih banyak Kesalahan!!!

hai teman-teman, saya telah membuat roda python 3.6 pytorch 1.3.1 linux_x86_64 tanpa batasan kemampuan komputasi, dan ini berfungsi pada GPU 3.5 saya. saya akan dengan senang hati membuat roda untuk versi python dan pytorch yang berbeda jika seseorang dapat memberi tahu saya saluran distribusi yang tepat (yaitu bukan google drive ).

@jayenashar Apakah Anda dapat memberikan instruksi untuk membangun Pytorch versi 1.3.1 untuk GPU tertentu (NVIDIA Tesla K20 GPU) & Python 3.6.8? Saya telah mencoba membuat versi yang kompatibel tetapi saya masih mengalami masalah kompatibilitas perangkat keras:
[W NNPACK. cpp:77 ] Tidak dapat menginisialisasi NNPACK! Alasan: Perangkat keras tidak didukung.

@anowlan123 Saya tidak melihat alasan untuk membangun GPU tertentu, tetapi saya yakin Anda dapat mengekspor variabel lingkungan TORCH_CUDA_ARCH_LIST untuk kemampuan komputasi spesifik Anda ( 3.5 ), lalu gunakan build- instruksi dari sumber untuk pytorch .

Roda pytorch 1.3.1 yang saya buat seharusnya berfungsi untuk Anda (python 3.6.9, GPU NVIDIA Tesla K20). Saya menyiapkan akun pypi untuk mencoba dan mendistribusikannya, tetapi tampaknya ada batas 60MB, dan roda saya adalah 139MB. Jadi saya telah mengunggahnya di sini: https://github.com/UNSWComputing/pytorch/releases/download/v1.3.1/torch-1.3.1-cp36-cp36m-linux_x86_64.whl

Dear @anowlan123 ,

Saya akan sangat tertarik dengan roda pytorch1.4 yang bekerja dengan Keppler K40 dan cuda9.2. Apakah Anda dapat membantu? Saya berpikir untuk menginstalnya melalui miniconda.

@PeteKey Anda tidak menentukan versi python, tetapi saya membuat roda dengan python 3.6, pytorch 1.4.1, dan magma-cuda92. silakan coba di sini: https://github.com/UNSWComputing/pytorch/releases/download/v1.4.1/torch-1.4.1-cp36-cp36m-linux_x86_64.whl jika Anda memiliki masalah, harap tingkatkan ke cuda10.2 .

@anowlan123 , python 3.6 baik-baik saja tapi saya kira ada sesuatu yang belum berfungsi. Adakah ide bagaimana cara memperbaikinya? Saya menjalankan ini di ubuntu 14.04 jika itu penting.

File "/home/pk/miniconda3/envs/pytorch1.4py36_unsw_anowlan123/lib/python3.6/site-packages/torch/__init__.py", baris 81, di
dari obor._C impor *
ImportError: libmkl_intel_lp64.so: tidak dapat membuka file objek bersama: Tidak ada file atau direktori seperti itu

@jayenashar Terima kasih, masih memiliki masalah kompatibilitas yang sama. @PeteKey setelah saya membuat lingkungan conda, saya menggunakan skrip ini untuk membangun dari sumber.

!/bin/bash

Pastikan lingkungan conda diaktifkan

cd /rumah/pengguna
conda aktifkan env

conda install numpy ninja pyyaml ​​mkl mkl-include setuptools cmake cffi
conda install -c pytorch magma-cuda101

cd ~/anaconda3/envs/env/compiler_compat
mv ld ld-old

Persiapan Repo Pyorch

cd /home/pengguna/Unduhan
git clone --recursive https://github.com/pytorch/pytorch
cd /home/pengguna/Unduhan/pytorch
sinkronisasi submodul git
git submodule update --init --recursive

Tentukan variabel lingkungan untuk pytorch build tertentu

export CMAKE_PREFIX_PATH=${CONDA_ PREFIX:- "$(dirname $(yang conda))/../"}
ekspor PYTORCH_BUILD_VERSION=1.3.1
ekspor PYTORCH_BUILD_NUMBER=1
ekspor TORCH_CUDA_ARCH_LIST=3.5

Bangun dan pasang

python setup.py instal

Bersihkan bangunan

setup.py bersih --semua

cd ~/anaconda3/envs/env/compiler_compat
mv ld-old ld

python 3.6 baik-baik saja tetapi saya kira ada sesuatu yang belum berfungsi. Adakah ide bagaimana cara memperbaikinya? Saya menjalankan ini di ubuntu 14.04 jika itu penting.

File "/home/pk/miniconda3/envs/pytorch1.4py36_unsw_anowlan123/lib/python3.6/site-packages/torch/ init .py", baris 81, di
dari obor._C impor *
ImportError: libmkl_intel_lp64.so: tidak dapat membuka file objek bersama: Tidak ada file atau direktori seperti itu

@PeteKey saya pikir itu karena Anda menggunakan roda di conda. coba instal mkl di conda env Anda.

juga, tingkatkan ubuntu Anda

@ anowlan123 saya tidak melihat di mana Anda checkout v1.3.1 di git repo. saya juga tidak yakin di mana instalasi Anda dipasang. di sini adalah skrip yang saya gunakan, itu hanya membuat roda, lalu saya menggunakan pip untuk menginstalnya.

#!/bin/bash
CONDA_ENV=py369
PYTHON_VERSION=3.6.9
CUDA_VERSION=102
PYTORCH_BUILD_VERSION=1.3.1

set -e
set -u

conda create --yes --name $CONDA_ENV python=$PYTHON_VERSION
conda activate $CONDA_ENV
conda install --yes numpy ninja pyyaml mkl mkl-include setuptools cmake cffi
conda install --yes --channel pytorch magma-cuda$CUDA_VERSION

cd ~/pytorch
git checkout v$PYTORCH_BUILD_VERSION
git submodule sync
git submodule update --init --recursive
export CMAKE_PREFIX_PATH=${CONDA_PREFIX:-"$(dirname $(which conda))/../"}
export PYTORCH_BUILD_VERSION
PYTORCH_BUILD_NUMBER=0 python setup.py bdist_wheel

@PeteKey saya baru saja mengunggah file untuk conda (py3.5 dan py3.6) ke https://github.com/UNSWComputing/pytorch/releases/tag/v1.4.1 . saya pikir Anda dapat mengunduh file dan menginstalnya dengan conda install $filename tetapi saya tidak yakin bagaimana memberi tahu conda untuk menginstal dependensi. mungkin dengan --only-deps ? berikut adalah dependensi tarball py3.6 jika Anda membutuhkannya:

    "blas * mkl", 
    "cudatoolkit >=9.2,<9.3", 
    "mkl >=2018", 
    "ninja", 
    "numpy >=1.11", 
    "python >=3.6,<3.7.0a0"

Saya baru saja mengkompilasinya sekali dan berhasil dengan K40 (jadi itulah bukti konsep yang dilakukan), tetapi kemudian saya melakukan sesuatu dan itu menjadi kacau jadi saya mulai dari awal.

Apa langkah terbaik untuk menginstal torchvision untuk cuda 10.0 dan cudatoolkit 10.0, dan kemudian mengkompilasi pytorch 1.4? Saya kira pertanyaannya adalah dalam urutan mana saya harus melakukan sesuatu agar tidak berakhir dengan kekacauan karena miniconda install suka 'menyelesaikan' banyak hal dan perasaan saya adalah yang menyebabkan kekacauan nanti karena ingin mengunduh pytorch 1.4 dari saluran dll.

mungkin yang terbaik adalah menginstal upstream pytorch 1.4.1 untuk cuda 10.0 dan kemudian menginstal paket yang dapat saya buat untuk Anda. ini adalah cara saya membuat tarball conda dengan pytorch/builder :

export PYTORCH_REPO=pytorch
export PYTORCH_BRANCH=v1.4.1
export PYTORCH_BUILD_VERSION=1.4.1
export PYTORCH_BUILD_NUMBER=0
export TORCH_CONDA_BUILD_FOLDER=pytorch-nightly
export TORCH_PACKAGE_NAME=torch
export PIP_UPLOAD_FOLDER=""
export NIGHTLIES_ROOT_FOLDER="$HOME/local/builder/binaries_v1.4.1"
cd pytorch-builder/cron
./build_multiple.sh conda 3.6 cu92

@jayenashar , saya sangat dekat tetapi satu hal yang masih aneh adalah bahkan ketika saya mengekspor CUDA_VERSION=100, torch.version.cuda masih menunjukkan cuda 10.2 ... yang agak terlalu baru untuk beberapa kode yang saya coba Lari.

Jika Anda memberi tahu saya cara memaksa kompilasi untuk digunakan dan kemudian memiliki pytorch dengan cuda 10, ini akan menyelesaikan rasa sakit saya. Di bawah ini saya daftar paket saya (saya dapat melihat cuda100 dan cudatulkit 10.0 di sana) jadi saya bingung.

Nama Versi Bangun Saluran

_libgcc_mutex 0.1 utama
bla 1.0 mkl
bzip2 1.0.8 h7b6447c_0
ca-sertifikat 2020.1.1 0
sertifikat 2020.4.5.1 py38_0
cffi 1.14.0 py38he30daa8_1
cloudpickle 1.4.1 py_0 conda-forge
cmake 3.14.0 h52cb24c_0
cuda100 1.0 0 pytorch
cudatoolkit 10.0.130 0
pengendara sepeda 0.10.0 py_2 conda-forge
cytoolz 0.10.1 py38h516909a_0 conda-forge
dask-core 2.16.0 py_0 conda-forge
dekorator 4.4.2 py_0 conda-forge
ekspat 2.2.6 he6710b0_0
tipe bebas 2.9.1 h8a8886c_1
icu 58.2 hf484d3e_1000 conda-forge
imagecodecs-lite 2019.12.3 py38h1e0a361_0 conda-forge
imageio 2.8.0 py_0 conda-forge
intel-openmp 2020.1 217
joblib 0.15.1 py_0 conda-forge
jpeg 9b h024ee3a_2
kiwisolver 1.2.0 py38hbf85e49_0 conda-forge
krb5 1.17.1 h173b8e3_0
ld_impl_linux-64 2.33.1 h53a641e_7
libblas 3.8.0 15_mkl conda-forge
libcblas 3.8.0 15_mkl conda-forge
libcurl 7.69.1 h20c2e04_0
libedit 3.1.20181209 hc058e9b_0
libffi 3.3 he6710b0_1
libgcc-ng 9.1.0 hdf63c60_0
libgfortran-ng 7.3.0 hdf63c60_0
liblapack 3.8.0 15_mkl conda-forge
libpng 1.6.37 hbc83047_0
libssh2 1.9.0 h1ba5d50_1
libstdcxx-ng 9.1.0 hdf63c60_0
libtiff 4.1.0 h2733197_0
magma-cuda100 2.5.2 1 pytorch
matplotlib-base 3.1.3 py38hef1b27d_0
mkl 2020.1 217
mkl-include 2020.1 217
mkl-service 2.3.0 py38he904b0f_0
mkl_fft 1.0.15 py38ha843d7b_0
mkl_random 1.1.0 py38h962f231_0
ncurses 6.2 he6710b0_1
networkx 2.4 py_1 conda-forge
ninja 1.9.0 py38hfd86e86_0
numpy 1.18.1 py38h4f9e942_0
numpy-base 1.18.1 py38hde5b4d6_1
olefile 0.46 py_0
openssl 1.1.1g h7b6447c_0
bantal 7.1.2 py38hb39fc2d_0
pip 20.0.2 py38_3
pycparser 2.20 py_0
pyparsing 2.4.7 pyh9f0ad1d_0 conda-forge
python 3.8.2 hcff3b4d_14
python-dateutil 2.8.1 py_0 conda-forge
python_abi 3.8 1_cp38 conda-forge
pytorch 1.4.0 py3.8_cuda10.0.130_cudnn7.6.3_0 pytorch
pywavelets 1.1.1 py38h8790de6_1 conda-forge
pyyaml ​​5.3.1 py38h7b6447c_0
readline 8.0 h7b6447c_0
rhash 1.3.8 h1ba5d50_0
scikit-image 0.17.2 py38hcb8c335_0 conda-forge
scikit-learn 0.23.0 py38h3a94b23_0 conda-forge
scipy 1.4.1 py38h18bccfc_3 conda-forge
setuptools 46.4.0 py38_0
enam 1.14.0 py38_0
sqlite 3.31.1 h62c20be_1
threadpoolctl 2.0.0 pyh5ca1d4c_0 conda-forge
tifffile 2020.5.11 py_0 conda-forge
tk 8.6.8 hbc83047_0
toolz 0.10.0 py_0 conda-forge
obor 1.4.1 pypi_0 pypi
torchvision 0.5.0 py38_cu100 pytorch
tornado 6.0.4 py38h1e0a361_1 conda-forge
roda 0.34.2 py38_0
xz 5.2.5 h7b6447c_0
yaml 0.1.7 had09818_2
zlib 1.2.11 h7b6447c_3
zstd 1.3.7 h0b5b093_0

@jayenashar , saya sangat dekat tetapi satu hal yang masih aneh adalah bahkan ketika saya mengekspor CUDA_VERSION=100, torch.version.cuda masih menunjukkan cuda 10.2 ... yang agak terlalu baru untuk beberapa kode yang saya coba Lari.

@PeteKey Saya tidak 100% yakin CUDA_VERSION dalam skrip saya benar-benar berfungsi. Ini mungkin hanya mengatur nomor versi paket dan tidak mengatur versi CUDA yang dibuatnya. jika Anda menjalankan nvcc --version pada mesin yang Anda gunakan untuk membangun dari sumber, itu mungkin perlu 10.0.

@jayenashar , @anowlan123 , terima kasih atas bantuannya. Pada akhirnya saya telah mengkompilasi pytorch 1.5 untuk cuda10.2 dan menginstal paket lain melalui pip install, dan akhirnya kode yang ingin saya jalankan dimulai. Jadi, K40 lama saya menjadi lebih hidup.

@jayenashar , @anowlan123 , pertanyaan terakhir lagi... bl...y pytorch entah bagaimana telah dikompilasi tanpa magma ... Tahukah Anda jika saya perlu menyiapkan flag untuk itu. Saya sudah menginstal magma ...

@jayenashar , @anowlan123 , dipecahkan, ekspor MAGMA_HOME=/home/pk/miniconda3/pkgs/magma-cuda102-2.5.2-1/

Teman-teman, terima kasih telah memberikan solusi untuk menjalankan obor dengan K40! 👍🏻

Saya tampaknya telah membuat obor dari sumber dengan baik, tetapi gagal mengimpor ekstensi from torch.utils.cpp_extension import xxx

lingkungan saya:
K40, ekspor *ARCH=3.5
Torch v1.5.0, build selesai ok dan saya bisa import torch

Catatan, sumber yang dibuat obor==1.5.0 tidak menggantikan pytorch==1.3.1, yang diinstal conda, yang saya hapus bersama dengan dependensinya.

Apakah saya perlu menentukan dalam build sumber obor untuk menggunakan CUDA dan cpp_extension ?

Terima kasih

@breznak

Ada beberapa perbedaan antara conda dan pip sehingga namanya berbeda (pytorch vs torch) sehingga versi lama tidak diganti.

from torch.utils import cpp_extension bekerja untuk saya dengan paket 1.3.1 pip saya, jadi saya tidak yakin apa masalahnya dengan paket Anda.

from torch.utils import cpp_extension berfungsi untuk saya dengan paket 1.3.1 pip saya, jadi saya tidak yakin apa masalahnya dengan paket Anda.

bekerja untuk saya juga, tetapi saya perlu obor >= 1.4, dan saya perlu membangun dari sumber (K40) ..inilah perbedaannya.

apakah salah satu file yang saya unggah ke https://github.com/UNSWComputing/pytorch/releases/tag/v1.4.1 berfungsi untuk Anda?

apakah salah satu file yang saya unggah ke https://github.com/UNSWComputing/pytorch/releases/tag/v1.4.1 berfungsi untuk Anda?

Terima kasih! Saya akan menguji tetapi menebak dari nama saya rasa tidak, sayangnya.
Kendala saya adalah:

py>= 3.6
cuda >=10.1
torch>=1.4.1

Saya berasumsi karena Anda mencoba pytorch 1.5.0 terlebih dahulu, itu adalah pilihan Anda, jadi coba yang ini: https://github.com/UNSWComputing/pytorch/releases/tag/v1.5.0 Juga diasumsikan minimum py & cuda adalah apa Anda sudah menginstal, jadi dibangun berdasarkan asumsi tersebut.

@jayenashar terima kasih banyak telah mendukung ini!
Saya sudah mencoba repo Anda, tetapi import torch gagal untuk saya setelah menginstal dengan

from torch._C import *
ImportError: /home/xxx/miniconda3/envs/detectron2-env/lib/python3.6/site-packages/torch/lib/libtorch_python.so: undefined symbol: PySlice_Unpack

EDIT: Ini sepertinya masalah python, saya salah dengan python default: python 3.7 adalah default di conda env saya. Saya dapat install python==3.6 dari conda-forge, tetapi tidak yakin apakah kesalahan ini terkait dengan penggunaan python itu?

Apakah Anda menggunakan Python 3.6.0? Saya yakin ada masalah dengan itu dan Anda memerlukan 3.6 lainnya (yaitu, 3.6.1- 3.6.10)

Jika Anda menjalankan python3.7, seharusnya tidak mencoba menggunakan versi obor ini, jadi saya kira Anda memiliki python 3.6.0

Apakah Anda menggunakan Python 3.6.0? Saya percaya ada masalah dengan itu

kamu benar. (Saya telah menginstal python 3.7 default di conda env, karena saya salah memberi tahu Anda bahwa saya memiliki 3.6, saya menginstal python 3.6.0 tersedia di conda-forge.) Saya akan melihat apakah ada versi 3.6.x yang lebih baru tersedia di conda.

Dear @jayenashar Bisakah Anda membuat PyTorch 1.5.0 untuk Python 3.7? Saya mencoba membangun dari sumber, tetapi menemui beberapa kesalahan tak terduga. Sangat menghargai usaha Anda!
Pengaturan saya adalah:

Python 3.7
CUDA 10.1

Pembaruan: Saya menyiapkan lingkungan Python 3.6 dan paket yang disediakan oleh @jayenashar (https://github.com/UNSWComputing/pytorch/releases/tag/v1.5.0) berfungsi dengan baik.
Torchvision terbaru (0.6.0) dari Conda tampaknya juga berfungsi.

Tidak masalah. Untuk siapa pun yang membuat permintaan di masa mendatang, saya ingin info berikut dalam permintaan Anda:

  • versi pytorch - level tambalan (1.3.0 seharusnya bekerja dengan sebagian besar GPU. 1.3.1 menjatuhkan dukungan untuk banyak GPU kami.)
  • conda atau pip
  • versi cuda - level minor (9.2, 10.1, 10.2 - perhatikan bahwa 10.2 mendukung GPU lama. lihat https://developer.nvidia.com/cuda-gpus untuk menemukan kemampuan komputasi GPU Anda dan https://en.wikipedia.org/ wiki/CUDA#GPUs_supported untuk menemukan versi cuda yang didukung)
  • versi python - level minor (perhatikan bahwa python 3.6.0 tidak berfungsi, tetapi 3.6.x lainnya harus berfungsi)

Saya tidak membutuhkan GPU atau kemampuan komputasi yang tepat. Jika versi pytorch yang Anda pilih mendukungnya, itu akan disertakan.

Saya tidak membutuhkan OS. Saya hanya membangun paket linux.

@wydwww periksa https://github.com/UNSWComputing/pytorch/releases/tag/v1.5.0 untuk unggahan terbaru. :)

Terima kasih @jayenashar , saya sangat menghargai pekerjaan Anda! Berkat paket bawaan Anda, saya dapat menjalankan pytorch (torchvision) di cluster kami :+1:

yakin ada masalah dengan itu dan Anda memerlukan 3.6 lainnya (yaitu, 3.6.1- 3.6.10)

semuanya berfungsi dengan baik dengan py 3.7.

jadi coba yang ini: https://github.com/UNSWComputing/pytorch/releases/tag/v1.5.0

untuk referensi bagi orang yang menginstal dari binari ini, Anda harus menggunakan conda (bukan python, pip) untuk menginstal paket-paket ini.
conda install pytorch-....tar.gz

@jayenashar Adakah keberuntungan membangun pytorch 1.6? Saya mengalami kesalahan kompilasi saat ini, dan saya mencoba untuk men-debug-nya. Saya bisa membangun 1.5.1 jadi saya tidak yakin apa yang terjadi.

sayangnya mesin [jarak jauh] saya untuk membangun sedang down, dan tidak ada ETA ketika saya bisa mendapatkannya untuk menghidupkannya kembali, maaf. belum mencoba 1.6.

Jadi "bug" itu cukup konyol. Saya lupa membersihkan folder build sebelum mencoba membangun 1.6.0. Setelah saya membersihkannya, build berhasil.

Ini file whl jika ada yang membutuhkannya. Itu dibangun tanpa tes atau operator caffe2: https://github.com/KevinMusgrave/pytorch/releases/tag/v1.6.0-compute-capability-3.5

@jayenashar Hanya berkomentar di sini untuk terima kasih. Berhasil membuat 1,5 bekerja di K40 :)

@jayenashar mungkinkah Anda mengkompilasi versi untuk tesla k40c dengan NVCC rilis 9.2, V9.2.148?

pytorch version -  closer to 1.6.0
conda or pip - any
cuda version - 10
python version - 3.8.5 or other

Ketika saya menggunakan nvcc --version itu melempar 9.2, tetapi ketika saya melakukan nvidia-smi itu menghasilkan: Driver Version: 410.104 CUDA Version: 10.0
Jadi saya tidak yakin dengan versi cuda. Adakah ide mengapa versi ini tidak cocok?

Sunting: Saya berhasil menjalankan PyTorch 1.4.1 dengan Torchvision 0.5.0 di Tesla K40c dengan prosedur berikut:

  1. Mengunduh pytorch-1.4.1-py3.7_cuda9.2.148_cudnn7.6.3_0.tar.bz2 dari solusi @jayenashar di https://github.com/UNSWComputing/pytorch/releases/tag/v1.4.1
  2. Menginstal TorchVision dengan conda install torchvision=0.5.0=py37_cu92
  3. Paket PyTorch yang diganti dengan conda install pytorch-1.4.1-py3.7_cuda9.2.148_cudnn7.6.3_0.tar.bz2

@Vichoko https://github.com/UNSWComputing/pytorch/releases/tag/v1.6.0

Anda mungkin telah menginstal cuda-nvcc-9-2 dan driver yang telah dikompilasi. mungkin lebih mudah untuk meng-upgrade nvcc.

@jayenashar Bisakah Anda mengkompilasi versi untuk Tesla K40c dengan yang berikut:

  • PyTorch: kemungkinan terbaru
  • Python: 3.7.7
  • CUDA: 10.2
  • konda

Terimakasih banyak!

maaf @sophiaas sepertinya saya tidak bisa melakukan CUDA 10.2 dengan mudah. @KevinMusgrave memiliki 10.1 di https://github.com/KevinMusgrave/pytorch/releases/tag/v1.6.0-compute-capability-3.5 di roda dan saya mencoba membangun versi conda sekarang.

@sophiaas saya mengunggah paket conda 10.1 ke https://github.com/UNSWComputing/pytorch/releases/tag/v1.6.0

saya akan terus mencoba membuat 10.2 tetapi itu terus memberi saya build khusus CPU.

@jayenashar Terima kasih! Sangat menghargai itu.

Jika itu membantu, saya memasang beberapa binari pip yang kompatibel dengan K40 di https://nelsonliu.me/files/pytorch/whl/torch_stable.html . Versi 1.3.1 hingga 1.6.0, berharap dapat terus diperbarui untuk rilis baru.

Anda dapat menginstalnya dengan pip (ubah versi yang diinginkan seperlunya):

pip install torch==1.3.1+cu92 -f https://nelsonliu.me/files/pytorch/whl/torch_stable.html

Saya menguji semua binari ini (kecuali yang CUDA 10.2, berharap untuk mendapatkannya segera) dengan menjalankan contoh pemodelan bahasa tingkat kata pada K40 dan secara manual memverifikasi bahwa kebingungannya sama dalam versi dan umumnya masuk akal.

@nelson-liu itu bagus. maka saya hanya perlu khawatir tentang paket conda.

ini adalah bagaimana saya menguji cuda: python -c 'import torch; torch.randn([3,5]).cuda()'

@jayenashar
Itu sangat bagus untuk melihat rilis Anda!
Saya berencana untuk berlangganan rilis mendatang Anda juga jika Anda masih berencana untuk terus memperbarui dengan rilis pytorch nanti. Apakah Anda berencana untuk selalu merilis ke repo bercabang itu? Di mana saya harus meminta bangunan khusus, di sini atau di tempat lain?

@Guptajakala ya saya akan merilis repo bercabang itu, kecuali seseorang tahu tempat yang lebih baik. saya mencoba pypi tetapi tampaknya mereka memiliki batas ukuran file dan itulah alasan build resmi tidak mendukung GPU lama. saya dapat mencoba saluran anaconda.

sekarang saya menerima permintaan di sini karena tampaknya ini adalah tempat yang dapat ditemukan.

@jayenashar
Hai, apakah ini berfungsi dengan python 3.6.9?
image
Saya mengunduh yang ini dan menjalankan perintah
conda install ./pytorch-1.6.0-py3.7_cuda10.1.243_cudnn7.6.3_0.tar.bz2

Setelah instalasi, saya mengimpornya tetapi dikatakan
No module named 'torch'

daftar conda menunjukkan item ini
pytorch 1.6.0 py3.7_cuda10.1.243_cudnn7.6.3_0 <unknown>

@Guptajakala tidak, Anda tidak dapat menggunakan pytorch py3.7 dengan python 3.6.

apakah Anda ingin saya membuatkan Anda satu untuk python 3.6?

@jayenashar
itu akan bagus, terima kasih!

@jayenashar luar biasa !

Apakah halaman ini membantu?
0 / 5 - 0 peringkat

Masalah terkait

szagoruyko picture szagoruyko  ·  3Komentar

cdluminate picture cdluminate  ·  3Komentar

bartolsthoorn picture bartolsthoorn  ·  3Komentar

keskarnitish picture keskarnitish  ·  3Komentar

bartvm picture bartvm  ·  3Komentar