Tensorflow: ImportError: libcublas.so.9.0: tidak dapat membuka file objek bersama: Tidak ada file atau direktori seperti itu

Dibuat pada 23 Des 2017  ·  136Komentar  ·  Sumber: tensorflow/tensorflow

Saya menginstal tf-nightly build dan saya mendapatkan kesalahan berikut saat mengimpor tensorflow.
ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory .

Jika saya memeriksa cuda 9, saya mendapatkan yang berikut:

ldconfig -v
/usr/local/cuda-8.0/targets/x86_64-linux/lib:
    libnvgraph.so.8.0 -> libnvgraph.so.8.0.61
    libnppicom.so.8.0 -> libnppicom.so.8.0.61
    libnppial.so.8.0 -> libnppial.so.8.0.61
    libcufftw.so.8.0 -> libcufftw.so.8.0.61
    libcufft.so.8.0 -> libcufft.so.8.0.61
    libnppif.so.8.0 -> libnppif.so.8.0.61
    libcublas.so.8.0 -> libcublas.so.8.0.88
    libnvblas.so.8.0 -> libnvblas.so.8.0.88
    libnppi.so.8.0 -> libnppi.so.8.0.61
    libcusolver.so.8.0 -> libcusolver.so.8.0.61
    libnppidei.so.8.0 -> libnppidei.so.8.0.61
    libnvrtc-builtins.so.8.0 -> libnvrtc-builtins.so.8.0.61
    libnvrtc.so.8.0 -> libnvrtc.so.8.0.61
    libnpps.so.8.0 -> libnpps.so.8.0.61
    libcuinj64.so.8.0 -> libcuinj64.so.8.0.61
    libnppig.so.8.0 -> libnppig.so.8.0.61
    libOpenCL.so.1 -> libOpenCL.so.1.0.0
    libnppicc.so.8.0 -> libnppicc.so.8.0.61
    libnppist.so.8.0 -> libnppist.so.8.0.61
    libnppisu.so.8.0 -> libnppisu.so.8.0.61
    libnppim.so.8.0 -> libnppim.so.8.0.61
    libcurand.so.8.0 -> libcurand.so.8.0.61
    libcudart.so.8.0 -> libcudart.so.8.0.61
    libnvToolsExt.so.1 -> libnvToolsExt.so.1.0.0
    libnppitc.so.8.0 -> libnppitc.so.8.0.61
    libnppc.so.8.0 -> libnppc.so.8.0.61
    libcusparse.so.8.0 -> libcusparse.so.8.0.61
/usr/local/cuda-9.1/targets/x86_64-linux/lib:
    libnppicc.so.9.1 -> libnppicc.so.9.1.85
    libnppisu.so.9.1 -> libnppisu.so.9.1.85
    libcufftw.so.9.1 -> libcufftw.so.9.1.85
    libcufft.so.9.1 -> libcufft.so.9.1.85
    libnppial.so.9.1 -> libnppial.so.9.1.85
    libnppist.so.9.1 -> libnppist.so.9.1.85
    libcublas.so.9.1 -> libcublas.so.9.1.85
    libnvblas.so.9.1 -> libnvblas.so.9.1.85
    libnppitc.so.9.1 -> libnppitc.so.9.1.85
    libcusolver.so.9.1 -> libcusolver.so.9.1.85
    libnvrtc.so.9.1 -> libnvrtc.so.9.1.85
    libnvrtc-builtins.so.9.1 -> libnvrtc-builtins.so.9.1.85
    libnppidei.so.9.1 -> libnppidei.so.9.1.85
    libOpenCL.so.1 -> libOpenCL.so.1.0.0
    libnppig.so.9.1 -> libnppig.so.9.1.85
    libnppc.so.9.1 -> libnppc.so.9.1.85
    libcudart.so.9.1 -> libcudart.so.9.1.85
    libnvToolsExt.so.1 -> libnvToolsExt.so.1.0.0
    libnvgraph.so.9.1 -> libnvgraph.so.9.1.85
    libnppif.so.9.1 -> libnppif.so.9.1.85
    libcusparse.so.9.1 -> libcusparse.so.9.1.85
    libaccinj64.so.9.1 -> libaccinj64.so.9.1.85
    libcuinj64.so.9.1 -> libcuinj64.so.9.1.85
    libnppim.so.9.1 -> libnppim.so.9.1.85
    libnppicom.so.9.1 -> libnppicom.so.9.1.85
    libnpps.so.9.1 -> libnpps.so.9.1.85
    libcurand.so.9.1 -> libcurand.so.9.1.85

Saya itu karena ketidakcocokan nama. libcublas.so.9.0 =! libcublas.so.9.1 ? Dan jika demikian bagaimana kita bisa mengatasi ini?

Komentar yang paling membantu

Sudahkah Anda menyelesaikannya? Masalah ini disebabkan tensorflow-gpu-1.5 diperlukan cuda 9.0 , jadi Anda harus menginstal tensorflow-gpu-1.4. Dan ingat uninstall tensorflow-gpu-1.5. Silakan gunakan "pip install --upgrade tensorflow-gpu==1.4" ini

Semua 136 komentar

Saya pikir ini karena Anda memiliki CUDA 9.1 dan bukan 9.0, saya menghadapi masalah yang persis sama.

@Timonzimm saya tahu dan saya pikir seluruh masalah ini adalah f** penamaan libcublas.so.xxx yang nvidia menempatkan. Ini pada dasarnya adalah ketidakcocokan pada sistem linux setiap kali nomor itu berubah, jadi karena tidak dapat menemukan kecocokan yang tepat maka ia menganggap file tersebut tidak ada dan melempar kesalahan.

Saya pikir Anda harus menggunakan tautan simbol dari ''cuda/'' ke ''cuda/9.1", atau versi cuda Anda terlalu baru untuk cabang master tensorflow

@ burui11087 Saya benar-benar lupa tentang symlinking. Terima kasih telah mengingatkan saya.

Sepertinya ini diselesaikan (dan akar penyebabnya adalah ketidakcocokan versi CUDA - 9.0 vs 9.1)?
Menutup ini karena saya memahaminya untuk diselesaikan, tetapi tolong beri tahu saya jika saya salah.

FYI @gunan @av8ramit (yang sedang mengerjakan rilis 1.5 yang akan datang)

Saya juga mengalami masalah yang sama persis dengan kirk86. Bagi saya, saya menginstal cuda toolkit 8.0, dan cudnn 5.1.
Lalu saya melakukan apa yang kalian katakan di atas, semuanya tidak berhasil.

Untuk menggunakan nightlies, Anda harus menginstal CUDA 9.0 dan cudnn 7.
@yangfengKAUST dengan versi saat ini dari cuda dan cudnn yang diinstal TF hanya mengeluh bahwa ia tidak dapat menemukan versi yang diharapkan.

@Timonzimm saya menghadapi masalah yang sama. Sudahkah Anda mengetahuinya?

Saya telah menginstal versi 8.0, 9.0, 9.1 + cudnn yang tampaknya spesifik untuk masing-masing. Tautan sym tidak berfungsi dari lib 9.1. Saya menduga bahwa terkadang symlink di LD_LIBRARY_PATH juga tidak berfungsi ketika saya mengganti versi pada tautan /usr/local/cuda. Saya akhirnya hanya melakukannya dengan cara berteknologi rendah untuk memuat perpustakaan ke dalam program Java saya sampai saya dapat menemukan cara yang lebih bersih untuk menangani jalur di dalam Eclipse.

    try {
        System.load("/usr/local/cuda/lib64/libcublas.so.9.0");
        System.load("/usr/local/cuda/lib64/libcusolver.so.9.0");
        System.load("/usr/local/cuda/lib64/libcudart.so.9.0");
        System.load("/usr/local/cuda/lib64/libcufft.so.9.0");
        System.load("/usr/local/cuda/lib64/libcurand.so.9.0");

        System.load("/home/greg/Desktop/platform/tensorbuilder/jni/libtensorflow_jni.so");
      } catch (UnsatisfiedLinkError e) {
          System.err.println("Native code library failed to load.\n" + e);
          System.exit(1);
      }

.

@asimshankar Ingin tahu bahwa dalam komentar Anda di atas maksud Anda bahwa kami harus menurunkan versi cuda ke 9.0 dan tensorflow 1.5 tidak berfungsi dengan cuda 9.1 ?

Anda telah menutup masalah ini tetapi tidak jelas tindakan apa yang benar yang harus kami ambil!

Catatan: Saya juga menginstal cuda 9.1 alih-alih cuda 9.0.

Sekedar informasi, saya sudah menginstal keduanya. Membangun dari awal akan bekerja dengan baik, tetapi binari malam menggunakan 9.0.

@AwasthiMaddy - Ya, binari rilis TensorFlow 1.5 dibuat untuk CUDA 9.

Sudahkah Anda menyelesaikannya? Masalah ini disebabkan tensorflow-gpu-1.5 diperlukan cuda 9.0 , jadi Anda harus menginstal tensorflow-gpu-1.4. Dan ingat uninstall tensorflow-gpu-1.5. Silakan gunakan "pip install --upgrade tensorflow-gpu==1.4" ini

@aipeteryao - Terima kasih.

Seseorang perlu memperbaiki halaman https://www.tensorflow.org/install/install_linux jika ini benar, saya hanya mengikuti instruksinya dengan tepat, dan memberitahu Anda untuk menginstal CUDA 8.0 (khususnya, bukan "CUDA terbaru").

Kemudian segera setelah Anda selesai, Anda mendapatkan kesalahan ini (mencari cublas 9.0, yang, dari apa yang saya baca di sini, juga tidak akan berfungsi, karena CUDA 9.1 adalah default yang Anda dapatkan dari NVIDIA).

Entah instruksi halaman web harus bekerja dengan yang terbaru dari semuanya, atau harus memberi tahu Anda secara eksplisit untuk menginstal tensorflow-gpu-1.4 (misalnya) dan bukan tensorflow-gpu..

Mendukung komentar bwesons. Saya memiliki CUDA 8.0 dan Tensorflow 1.3. Saya mengikuti instruksi pemasangan saat ini untuk TF 1.5 (GPU, ubuntu, virtualenv) dan rusak seperti dijelaskan di atas. Mengembalikan ke TF 1.3 hingga masalah ini teratasi.

@aipeteryao Ini sudah diperbaiki, terima kasih! Saya akhirnya menghapus versi terbaru dan menginstal 1.4, di virtualenv saya.

pip3 uninstall tensorflow-gpu
pip3 install --upgrade tensorflow-gpu==1.4

Halaman penginstalan untuk Ubuntu harus diperbarui: https://www.tensorflow.org/install/install_linux
Karena TensorFlow 1.5 mengharapkan Cuda 9.0 ( NOT 9.1 ), serta cuDNN 7

Sebenarnya, kita harus melihat dokumen resmi tensorflow , itu memberikan lingkungan tensorflow (termasuk python,gcc,cuda,cudnn,dan seterusnya).

@bwesen ya, Anda benar. Komputer saya menginstal CUDA 8.0, cudnn 6.0, tensorflow 1.4.

Saya pikir masalah ini harus tetap terbuka. @bwesen 's komentar benar. Dokumen memberitahu Anda untuk menginstal Cuda 8.0 dan menggunakan pip install --upgrade tensorflow-gpu . Saat ini itu memberi Anda tensorflow 1.5 yang tidak berfungsi dengan Cuda 8.0

ping ke @asimshankar

Saya memiliki masalah yang sama (dengan cuda 9.1 + tensorflow 1.5). Saya pikir untuk mengatasinya, salah satu opsi adalah menurunkan versi cuda ke 9.0. Opsi lainnya adalah menurunkan versi cuda ke 8.0 dan tensorflow ke 1.4. Jika Anda telah menginstal cuda 8.0, Anda hanya perlu memodifikasi variabel lingkungan LD_LIBRARY_PATH (dan CUDA_HOME ) untuk menunjuk ke direktori cuda 8.0 (yaitu /usr/local/cuda-8.0 ).

Saya mendapatkan masalah ini (Cuda 9.1.85, cuDNN 7.05)

Mencoba dengan tensorflow 1.5, itu rusak. Dicopot, dipasang 1.4 dengan pip3 install --upgrade tensorflow-gpu==1.4 , masih rusak.

@DylanDmitri 1.5 mengharapkan Cuda 9.0, bukan 9.1

Sudahkah Anda mencoba dengan driver Cuda 9.0?

@DylanDmitri @mkaze Anda membutuhkan Cuda 9.0.

Juga, bagi siapa pun yang mengalami masalah dalam menginstal persyaratan, saya sarankan untuk memeriksa ulang instalasi cuDNN Anda. File .deb tidak berfungsi untuk saya karena tidak menyalin file ke tempat yang tepat. Saya harus menggunakan file .tgz dan menyalin file secara manual sesuai dengan petunjuk nVidia untuk mendapatkan instalasi yang berfungsi.

Mengapa tidak menginstal cuda-9-0 saja?

sudo dpkg -i cuda-repo-ubuntu1604_9.0.176-1_amd64.deb
sudo apt-key adv --fetch-keys \
     http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda-9-0

Mengapa tidak menginstal cuda-9-0 saja?

@abrahamrhoffman Itu mudah bagi siapa saja yang memiliki hak sudo tetapi bagaimana dengan orang-orang di sistem bersama seperti lingkungan cluster dengan hak pengguna yang sederhana. Dalam kasus tersebut bahkan jika Anda meminta dari admin sistem untuk menginstal perpustakaan apa pun, kemungkinan besar jawabannya adalah TIDAK! Karena mereka takut akan mengganggu pengaturan dan lingkungan pengguna lain.

@abrahamrhoffman Maukah Anda juga memberikan pembenaran atas suara yang tidak

Saya menginstal cuda-9.0 dan masih tidak berfungsi. Ini benar-benar menjengkelkan.

Pastikan untuk mengatur variabel PATH Anda dengan tepat, seperti yang dijelaskan di sini: https://stackoverflow.com/questions/39287744/ubuntu-16-04-nvidia-toolkit-8-0-rc-darknet-compilation-error-expected -a/41290056#41290056

export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

cuda 9.1 adalah versi saat ini. Saya ingin TF menggunakannya. Bagaimana caranya?

Bahkan tf-nightly-gpu tidak mencari cuda 9.1. meh

Saya mencoba tautan simbolik dari semua nama file 9.0 ke semua nama file 9.1 dan tidak berhasil. Pada akhirnya, TF tahu versi sebenarnya. Repo bahkan tidak memiliki 9.0 lagi jadi saya khawatir saya akan merusak barang-barang nvidia saya jika saya menghapus 9.1 dan kemudian menginstal 9.0 secara manual.

Saya memperbaikinya untuk saat ini dengan:

Unduh deb (jaringan) dari: https://developer.nvidia.com/cuda-90-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1604&target_type=debnetwork

Kemudian: dpkg -i cuda-repo-ubuntu1604_9.0.176-1_amd64.deb

Kemudian: pembaruan bakat

Kemudian: aptitude install cuda-9-0

Pertama saya menginstal tensorflow 1.5, rusak, dan saya mendapatkan kesalahan berikut:
ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory
kemudian saya mencopot pemasangan, memasang 1.4 dengan pip install --upgrade tensorflow-gpu==1.4, tidak berhasil, dan saya mendapatkan kesalahan berikut:
ImportError: libcublas.so.8.0: cannot open shared object file: No such file or directory

@xiezhongzhao Apa versi Cuda yang Anda gunakan? Untuk tensorflow 1.5 Anda harus menginstal Cuda 9.0 dan untuk tensorflow 1.4 Anda harus menggunakan cuda 8.0. Jika versi tensorflow dan versi cuda kompatibel, maka periksa variabel lingkungan yaitu CUDA_HOME dan LD_LIBRARY_PATH .

@mkaze saya menggunakan Cuda9.1

@xiezhongzhao Instal Cuda 9.0 dan Anda akan baik-baik saja. Tensorflow 1.5 tidak berfungsi dengan Cuda 9.1.

@mkaze Terima kasih banyak

Saya juga mendapatkan masalah ini dan berjuang untuk menyelesaikannya.

$ pip3 install tensorflow-gpu
$ python3
>>> import tensorflow
Traceback (most recent call last):
  File "/home/ubuntu/.local/lib/python3.5/site-packages/tensorflow/python/pywrap_tensorflow.py", line 58, in <module>
    from tensorflow.python.pywrap_tensorflow_internal import *
  File "/home/ubuntu/.local/lib/python3.5/site-packages/tensorflow/python/pywrap_tensorflow_internal.py", line 28, in <module>
    _pywrap_tensorflow_internal = swig_import_helper()
  File "/home/ubuntu/.local/lib/python3.5/site-packages/tensorflow/python/pywrap_tensorflow_internal.py", line 24, in swig_import_helper
    _mod = imp.load_module('_pywrap_tensorflow_internal', fp, pathname, description)
  File "/usr/lib/python3.5/imp.py", line 242, in load_module
    return load_dynamic(name, filename, file)
  File "/usr/lib/python3.5/imp.py", line 342, in load_dynamic
    return _load(spec)
ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory

Saya menginstal mengikuti instruksi ini
https://www.tensorflow.org/install/install_linux#nvidia_requirements_to_run_tensorflow_with_gpu_support

Saya yakin saya menginstal versi yang tepat dari nvidia. nama file adalah
cuda-repo-ubuntu1604_9.0.176-1_amd64.deb
dan cudnn-9.0-linux-x64-v7.tgz (versi 7.0.5)

Saya mengatur jalur sesuai instruksi pada dokumen tensorflow dan juga mencoba instruksi yang diberikan abrahamrhoffman atas.

Ketika saya menjalankan ldconfig -v saya mendapatkan beberapa lib 9.0, tetapi tidak melihat libcublas.so.9.0

/usr/local/cuda-9.0/targets/x86_64-linux/lib:
    libaccinj64.so.9.0 -> libaccinj64.so.9.0.176
    libOpenCL.so.1 -> libOpenCL.so.1.0.0
    libnvToolsExt.so.1 -> libnvToolsExt.so.1.0.0
    libcuinj64.so.9.0 -> libcuinj64.so.9.0.176
    libcudart.so.9.0 -> libcudart.so.9.0.176
/usr/local/cuda-9.1/targets/x86_64-linux/lib:
    libnppif.so.9.1 -> libnppif.so.9.1.85
    libcusparse.so.9.1 -> libcusparse.so.9.1.85
    libcusolver.so.9.1 -> libcusolver.so.9.1.85
    libnpps.so.9.1 -> libnpps.so.9.1.85
    libnppial.so.9.1 -> libnppial.so.9.1.85
    libnvgraph.so.9.1 -> libnvgraph.so.9.1.85
    libcuinj64.so.9.1 -> libcuinj64.so.9.1.85
    libaccinj64.so.9.1 -> libaccinj64.so.9.1.85
    libnppicc.so.9.1 -> libnppicc.so.9.1.85
    libcudart.so.9.1 -> libcudart.so.9.1.85
    libnppc.so.9.1 -> libnppc.so.9.1.85
    libnppicom.so.9.1 -> libnppicom.so.9.1.85
    libOpenCL.so.1 -> libOpenCL.so.1.0.0
    libnppig.so.9.1 -> libnppig.so.9.1.85
    libnvToolsExt.so.1 -> libnvToolsExt.so.1.0.0
    libnppidei.so.9.1 -> libnppidei.so.9.1.85
    libcurand.so.9.1 -> libcurand.so.9.1.85
    libnvblas.so.9.1 -> libnvblas.so.9.1.128
    libnvrtc.so.9.1 -> libnvrtc.so.9.1.85
    libnppitc.so.9.1 -> libnppitc.so.9.1.85
    libnppist.so.9.1 -> libnppist.so.9.1.85
    libcublas.so.9.1 -> libcublas.so.9.1.128
    libnppim.so.9.1 -> libnppim.so.9.1.85
/sbin/ldconfig.real: /usr/local/cuda-9.1/targets/x86_64-linux/lib/libcudnn.so.7 is not a symbolic link

    libcudnn.so.7 -> libcudnn.so.7.0.5
    libcufftw.so.9.1 -> libcufftw.so.9.1.85
    libcufft.so.9.1 -> libcufft.so.9.1.85
    libnppisu.so.9.1 -> libnppisu.so.9.1.85
    libnvrtc-builtins.so.9.1 -> libnvrtc-builtins.so.9.1.85

Saya tidak menginstal 9.1, setidaknya tidak sengaja. Ini pada contoh Amazon ec2 dengan stok ubuntu 16.04.
nvidia-smi juga mengembalikan gpu, ini adalah instance g3.4xlarge

setiap bimbingan sangat dihargai.

Per panduan CUDNN di:

http://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html

Anda perlu menyalin file yang belum dibongkar (dari direktori yang Anda jalankan $ tar -xzvf cudnn-9.0-linux-x64-v7.tgz atau yang serupa) ke dalam subdirektori /usr/local/cuda :

$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h
/usr/local/cuda/lib64/libcudnn*

Terima kasih atas jawabannya @entropy43.

Saya seharusnya lebih spesifik. Saya melakukan dua perintah cp dan chmod setelah tar . Ketika saya melihat di folder cuda folder tempat saya menjalankan perintah tar seperti ls cuda/lib64 saya mengerti
libcudnn.so libcudnn.so.7 libcudnn.so.7.0.5 libcudnn_static.a

Saya mencoba bagian ini juga dari dokumen nvidia
2.3.2. Installing from a Debian File

dan tes lulus di sini di 2.4. Verifying

Saran apa pun untuk mendapatkan lib itu dihargai

Bisakah seseorang meringkas di mana posisi ini saat ini? Saya menggunakan TF1.3 + cuda 8 tanpa masalah. Saya ingin memutakhirkan tetapi sepertinya proses penginstalan untuk versi yang lebih baru benar-benar rusak. Nasihat?

Mirip dengan apa yang ditanyakan yazabazra di atas:
TF1.6 Ubuntu 16.04
nvcc -V
nvcc: driver compiler NVIDIA (R) Cuda
Hak Cipta (c) 2005-2017 NVIDIA Corporation
Dibuat pada Jum_Nov__3_21:07:56_CDT_2017
Alat kompilasi Cuda, rilis 9.1, V9.1.85
Yang membalas driver tampilan Nvidia 390+
Penting untuk dilihat: https://devtalk.nvidia.com/default/topic/1000340/cuda-setup-and-installation/-quot-nvidia-smi-has-failed-because-it-couldn-t-communicate-with -the-nvidia-driver-quot-ubuntu-16-04/post/5243047/#5243047

whelp untuk menambahkan semuanya,, Setelah banyak kerumitan, saya memperbarui Nvidia ke rilis terbaru lihat di atas, karena dokumen TF menunjukkan bahwa ada bug di rilis sebelumnya..

Sekarang saya mendapatkan:
ImportError: libcublas.so.9.0: tidak dapat membuka file objek bersama: Tidak ada file atau direktori seperti itu
Gagal memuat waktu proses TensorFlow asli.

Yang tampaknya merupakan ketidakcocokan antara 9.0 (keinginan TF) vs 9.1 Yang merupakan Nvidia terbaru.
Tampaknya lebih baik menjalankan dengan 9.1 tetapi saya lebih suka menghindari membangun TF dari sumber dan tampaknya itu mungkin tidak memperbaikinya..

Bisakah kombo ini dibuat untuk bekerja dengan paket biner?
TF 1.6 Cuda 9.1 ??

Catatan lebih lanjut dan hati-hati bagi mereka yang mencari di sini .. setelah memutakhirkan Nvidia saya memasukkan versi TF saya yang lebih lama di conda env terpisah tidak lagi berfungsi seperti yang diinginkan TF yang lebih lama: ImportError: libcublas.so.8.0: tidak dapat membuka file objek bersama: Tidak ada file seperti itu atau direktori
jadi 9.1 tidak akan memotongnya .. bagaimana menentukan lebih besar dari?? vs versi tertentu? sekedar saran.. Sementara aku mati di air..

Dan inilah mengapa ketersediaan biner yang mendukung 9.1 akan menyenangkan: (dari catatan rilis TF1.6)

Menggunakan XLA:GPU dengan CUDA 9 dan CUDA 9.1 menghasilkan hasil sampah dan/atau
CUDA_ILLEGAL_ADDRESS gagal.

Google menemukan pada pertengahan Desember 2017 bahwa kompiler PTX-ke-SASS di CUDA 9
dan CUDA 9.1 terkadang tidak menghitung dengan benar carry bit ketika
menguraikan perhitungan alamat 64-bit dengan offset besar (misalnya memuat [x + large_constant]) menjadi aritmatika 32-bit di SASS.

Akibatnya, versi ptxas ini salah mengkompilasi sebagian besar program XLA yang menggunakan:
lebih dari 4GB memori temp. Ini menghasilkan hasil sampah dan/atau
CUDA_ERROR_ILLEGAL_ADDRESS gagal.

Perbaikan di CUDA 9.1.121 diharapkan pada akhir Februari 2018. Kami tidak mengharapkan a
perbaikan untuk CUDA 9.0.x. Sampai perbaikan tersedia, satu-satunya solusi adalah
turunkan ke CUDA 8.0.x
atau nonaktifkan XLA:GPU.

Mungkin salah satu nightlies melakukannya?

Solusi lain? dapatkah seseorang menginstal beberapa revisi Cuda karena TF tampaknya mencari Rev tertentu? Jika demikian, ada saran bagaimana caranya?

Jadi Idealnya saya dapat menjalankan TF 1.4 (yang saat ini membutuhkan Cuda 8.0) di satu lingkungan conda dan TF 1.6 (yang saat ini membutuhkan Cuda 9.0) di lingkungan lain?

Jadi saya baru saja menambahkan Sudo apt-get -y install cuda-toolkit-9.0 dan saya menjalankan dengan TF1.6

@dartdog setelah menginstal ImportError: libcudnn.so.7: cannot open shared object file: No such file or directory ?

@dartdog

sudo apt-get install cuda-7-0
vim ~/.bashrc
export PATH=/usr/local/cuda-7.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda7.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

Ini seharusnya dimasukkan dalam dokumentasi tensorflow, seperti yang dikatakan oleh @bwesen. Itu juga harus dimasukkan dalam daftar kesalahan. Apakah mungkin bagi kita untuk melakukan ini? Saya pikir saya akan membuka masalah baru, meminta untuk menambahkan dukungan untuk cuda 9.1, atau menyebutkan bahwa Anda memerlukan cuda 9.0 secara khusus di dokumen, dan juga memasukkan ini ke dalam daftar kesalahan

Oke, teman-teman. Saya sekarang telah membuka masalah baru di https://github.com/tensorflow/tensorflow/issues/17629.

Saya juga menangani masalah ini. Apa yang berhasil bagi saya dengan tensorflow-gpu 1.6:

  • Saya mengunduh toolkit dari arsip sebagai 9.0 tetapi terinstal sebagai 9.1 (Saya tidak tahu mengapa ...)
  • Masih belum ditemukan libcublas.so.9.0
  • Jalankan: sudo apt-get install cuda-libraries-9-0 seperti yang disarankan di akhir petunjuk penginstalan.
  • Masalahnya tampaknya telah terpecahkan.

Jika Anda ingin tensorflow berfungsi dengan versi CUDA Anda, Anda harus menghapus instalannya terlebih dahulu, lalu mengompilasinya dari sumber dan menentukan versi CUDA saat menjalankan ./configure
Informasi terperinci dapat ditemukan di sini: https://www.tensorflow.org/install/install_sources

Saya mencoba tautan ini (yang membuat tensorflow secara manual)

Mungkin perlu waktu lebih lama tetapi Anda dapat menentukan versi minor dengan cara ini.

@mldm4 sebenarnya, perintah sudo apt-get install cuda mungkin menginstal 9.1 untuk Anda karena Anda juga memilikinya di sistem Anda. Saya memiliki masalah yang sama, dan saya melakukan sudo apt-get install cuda-9-0 untuk menginstal versi tertentu (saya juga mengunduh dari arsip).
Saya pikir perintah yang Anda lakukan ( sudo apt-get install cuda-libraries-9-0 ) juga mengunduh cuda 9.0.
Masalah ini tidak terpecahkan, seperti yang saya sebutkan di edisi 17629, saya tahu masalahnya adalah bahwa TensorFlow mengharapkan versi 9.0, sementara saya memiliki 9.1. Masalahnya adalah menyebutkan ini dengan lebih jelas di dokumen dan memasukkannya ke dalam masalah instalasi umum di bagian bawah dokumen, atau memperbarui tensorflow untuk menerima Cuda 9.1.

jadi belum ada solusi?

@utas :

*Harap baca postingan dengan seksama! *

Adalah tugas Anda untuk membaca utasnya, dan menemukan solusinya; tidak hanya gulir ke akhir.

@abrahamrhoffman itu tidak sopan.

Saya baru saja mengubah batchrc saya dari cuda-9.1 menjadi hanya cuda. Kemudian tensorflow saya dapat menemukan libcublas.so.9.0

@DanlanChen Itu mungkin karena Anda juga menginstal 9.1. Untuk menginstal 9.0, dalam langkah-langkah untuk mengunduh, lakukan sudo apt-get install cuda-9-0 alih-alih sudo apt-get install cuda .

@cubetastic33 Saya menurunkan versi tensorflow saya dan menggunakan cuda8.0, terima kasih.

@DanlanChen tapi kemudian, saya kira lebih

Saya menghadapi masalah yang sama, tetapi saya mencoba menjalankan tensorflow menggunakan nvidia-docker. Saya telah menginstal cuda-9-0 di Host, tetapi ketika saya mencoba menjalankan wadah buruh pelabuhan saya, saya mendapatkan

ImportError: libcuda.so.1: cannot open shared object file: No such file or directory

@magick93 dan semua itu muncul di sini!

MENDENGARKAN! Apa pun yang Anda butuhkan adalah menurunkan versi cuda 9.1 Anda -> cuda 9.0. Itu dia! Lakukan saja (jika Anda mengunduh cuda 9.1 sebelumnya, Anda dapat menjalankan perintah berikut di terminal Anda):

sudo apt-get install cuda-9-0 dan hapus cuda 9.1 dengan rm -rf.

Btw, jangan lupa ganti $PATH di ~/.bashrc (9.1 -> 9.0).

Hai @Oktai15

MENDENGARKAN! Apa pun yang Anda butuhkan adalah menurunkan versi cuda 9.1 Anda -> cuda 9.0. Itu dia! Lakukan saja

Ya, saya telah melakukan ini - berkali-kali.

sudo apt-get install cuda-9-0
[sudo] password for anton: 
Reading package lists... Done
Building dependency tree       
Reading state information... Done
cuda-9-0 is already the newest version (9.0.176-1).
0 upgraded, 0 newly installed, 0 to remove and 7 not upgraded.
$ ldconfig -p | grep cuda
    libnvrtc.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnvrtc.so.9.0
    libnvrtc.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnvrtc.so
    libnvrtc-builtins.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnvrtc-builtins.so.9.0
    libnvrtc-builtins.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnvrtc-builtins.so
    libnvgraph.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnvgraph.so.9.0
    libnvgraph.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnvgraph.so
    libnvblas.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnvblas.so.9.0
    libnvblas.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnvblas.so
    libnvToolsExt.so.1 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnvToolsExt.so.1
    libnvToolsExt.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnvToolsExt.so
    libnpps.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnpps.so.9.0
    libnpps.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnpps.so
    libnppitc.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppitc.so.9.0
    libnppitc.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppitc.so
    libnppisu.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppisu.so.9.0
    libnppisu.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppisu.so
    libnppist.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppist.so.9.0
    libnppist.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppist.so
    libnppim.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppim.so.9.0
    libnppim.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppim.so
    libnppig.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppig.so.9.0
    libnppig.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppig.so
    libnppif.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppif.so.9.0
    libnppif.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppif.so
    libnppidei.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppidei.so.9.0
    libnppidei.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppidei.so
    libnppicom.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppicom.so.9.0
    libnppicom.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppicom.so
    libnppicc.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppicc.so.9.0
    libnppicc.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppicc.so
    libnppial.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppial.so.9.0
    libnppial.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppial.so
    libnppc.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppc.so.9.0
    libnppc.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libnppc.so
    libicudata.so.55 (libc6,x86-64) => /usr/lib/x86_64-linux-gnu/libicudata.so.55
    libcusparse.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libcusparse.so.9.0
    libcusparse.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libcusparse.so
    libcusolver.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libcusolver.so.9.0
    libcusolver.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libcusolver.so
    libcurand.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libcurand.so.9.0
    libcurand.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libcurand.so
    libcuinj64.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libcuinj64.so.9.0
    libcuinj64.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libcuinj64.so
    libcufftw.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libcufftw.so.9.0
    libcufftw.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libcufftw.so
    libcufft.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libcufft.so.9.0
    libcufft.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libcufft.so
    libcudnn.so.7 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libcudnn.so.7
    libcudart.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libcudart.so.9.0
    libcudart.so.7.5 (libc6,x86-64) => /usr/lib/x86_64-linux-gnu/libcudart.so.7.5
    libcudart.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libcudart.so
    libcudart.so (libc6,x86-64) => /usr/lib/x86_64-linux-gnu/libcudart.so
    libcuda.so.1 (libc6,x86-64) => /usr/lib/x86_64-linux-gnu/libcuda.so.1
    libcuda.so (libc6,x86-64) => /usr/lib/x86_64-linux-gnu/libcuda.so
    libcublas.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libcublas.so.9.0
    libcublas.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libcublas.so
    libaccinj64.so.9.0 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libaccinj64.so.9.0
    libaccinj64.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libaccinj64.so
    libOpenCL.so.1 (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libOpenCL.so.1
    libOpenCL.so (libc6,x86-64) => /usr/local/cuda-9.0/targets/x86_64-linux/lib/libOpenCL.so

Namun saya bahkan tidak dapat menjalankan skrip tensorflow sederhana ini, karena hasilnya saya mendapatkan ImportError: No module named tensorflow.python.client

from tensorflow.python.client import device_lib

def get_available_gpus():
    local_device_protos = device_lib.list_local_devices()
    return [x.name for x in local_device_protos if x.device_type == 'GPU']

get_available_gpus()

Saya memiliki masalah yang sama yang dialami semua orang di sini, menginstal 9.0 memang membantu tetapi kemudian saya mendapat masalah lain.
Kemudian saya mengikuti ini dan akhirnya berhasil untuk saya.

@Oktai15 tidak rm -rf menghapus sistem Anda? Harap lebih jelas di sini, karena orang mungkin mencobanya tanpa masuk ke direktori yang diperlukan, dan akhirnya mengosongkan folder rumah mereka.

@magick93 masalah Anda tampaknya menjadi sesuatu yang lain, bukan versi CUDA.

Saya memiliki masalah yang sama, saya pikir saya menyelesaikannya dengan beberapa perubahan, kombinasi ini berfungsi untuk saya

Ubuntu 16, cuda 9.0, cudnn 7.0, python 3,5, tensorflow 1.6

Jika Anda menginstal cuda baru saat Anda masih memiliki versi sebelumnya, pastikan untuk menentukan jalur seperti ini

export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

@Abduoit versi Ubuntu Anda tidak terlalu penting. Masalahnya, TensorFlow 1.6 mengharapkan CUDA menjadi versi 9.0, dan cuDNN menjadi versi 7.0.4 (ya, 0.4 _tidak masalah)

Traceback (panggilan terakhir terakhir):
File "utils.py", baris 15, di
impor tensorflow sebagai tf
File "/home/sagar/miniconda2/lib/python2.7/site-packages/tensorflow/__init__.py", baris 24, di
dari impor tensorflow.python *
File "/home/sagar/miniconda2/lib/python2.7/site-packages/tensorflow/python/__init__.py", baris 49, di
dari tensorflow.python impor pywrap_tensorflow
File "/home/sagar/miniconda2/lib/python2.7/site-packages/tensorflow/python/pywrap_tensorflow.py", baris 74, di
meningkatkan ImportError(msg)
ImportError: Traceback (panggilan terakhir terakhir):
File "/home/sagar/miniconda2/lib/python2.7/site-packages/tensorflow/python/pywrap_tensorflow.py", baris 58, di
dari tensorflow.python.pywrap_tensorflow_internal impor *
File "/home/sagar/miniconda2/lib/python2.7/site-packages/tensorflow/python/pywrap_tensorflow_internal.py", baris 28, di
_pywrap_tensorflow_internal = meneguk_import_helper()
File "/home/sagar/miniconda2/lib/python2.7/site-packages/tensorflow/python/pywrap_tensorflow_internal.py", baris 24, di swig_import_helper
_mod = imp.load_module('_pywrap_tensorflow_internal', fp, nama path, deskripsi)
ImportError: libcublas.so.9.0: tidak dapat membuka file objek bersama: Tidak ada file atau direktori seperti itu

Gagal memuat waktu proses TensorFlow asli.

Lihat https://www.tensorflow.org/install/install_sources#common_installation_problems
sudo apt-get install cuda-7-0
vim ~/.bashrc
ekspor PATH=/usr/local/cuda-7.0/bin${PATH:+:${PATH}}
ekspor LD_LIBRARY_PATH=/usr/local/cuda7.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
ekspor PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
ekspor LD_LIBRARY_PATH=/usr/local/cuda9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PA
untuk beberapa alasan dan solusi umum. Sertakan seluruh jejak tumpukan
di atas pesan kesalahan ini saat meminta bantuan.

Seperti yang disebutkan @pascalwhoop , saya mengikuti instruksi di sini http://www.python36.com/install-tensorflow141-gpu/ untuk membangun Tensorflow dari sumber.

Setiap kali dikatakan cuda 9.0 saya mengubah ke 9.1, dan cudnn 7.0 saya menempatkan 7.1.2.

Bekerja dengan baik, sejauh ini!

@SAGGSOC mengapa Anda menginstal cuda 7.0? Anda membutuhkan CUDA 9.0 dan CuDNN 7.0.4

Semua orang yang mengalami masalah: siapa yang siap untuk mengubah ini menjadi gambar buruh pelabuhan yang solid yang dibagikan dengan komunitas. Alih-alih lakukan penarikan gambar 6gb sekali yang berfungsi daripada DLing 5 versi CuDNN sebelum semuanya berfungsi ..

https://github.com/pascalwhoop/tf_openailab_gpu_docker

Saya mulai beberapa waktu lalu tetapi berhenti karena mengalihkan fokus proyek. Tapi saya pikir itu layak untuk dikejar. Jauhkan seluruh kesulitan menemukan kombinasi yang tepat dari 17 bagian yang bergerak dari kebanyakan ppl.

Hanya untuk memperjelas beberapa hal bagi siapa saja yang mungkin tersandung pada posting ini. Saya telah menginstal cuda-8.0, cuda-9.0, cuda-9.1 di sistem saya. Anda tidak perlu menghapus apa pun untuk membuatnya berfungsi dengan tensorflow. Alih-alih jika Anda kehilangan cuda-9.0 dari sistem Anda, seperti yang telah ditunjukkan oleh orang lain, Anda harus menginstalnya yang merupakan prasyarat agar tensorflow berfungsi dengan baik.

Jika Anda telah menginstal cuda-9.0 di sistem Anda dan tensorflow mengeluh tentang libcublas.so.9.0 lagi seperti yang dikatakan orang lain, paparkan itu selama runtime melalui variabel lingkungan LD_LIBRARY_PATH Anda di .bashrc membuatnya arahkan ke /usr/local/cuda-9.0/lib64 . Ini seharusnya berfungsi bahkan untuk tensorflow 1.7.

Apa yang saya coba dan gagal capai adalah membangun dari sumber. Untuk beberapa alasan bazel selalu keluar dengan kesalahan. Jika Anda mencoba membangun dengan cuda-9.0/cuda-9.1 dan cudnn7 ia mengeluh tentang gcc7. Menggunakan kompilasi gcc5 tampaknya berfungsi dengan baik tetapi pada akhirnya saya selalu mendapatkan kesalahan dan build tidak berhasil.

Pertanyaan saya adalah apakah ada yang berhasil mengkompilasi dari sumber dengan cuda-9.1/cuda-9.0 tanpa masalah?

Ini berhasil untuk saya:

Unduh CUDA Toolkit 9.0 dari bagian rilis NVidia sebelumnya.
Kemudian:

sudo dpkg -i cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb
sudo apt-key add /var/cuda-repo-9-0-local/7fa2af80.pub 
sudo apt-get update
sudo apt-get install cuda-9.0

Perhatikan 9.0 pada baris terakhir di atas.

export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64

Pengaturan saya
Tensorflow 1.7
cuDNN 7.1.2
Ubuntu 16.04

etemiz,
Saya memiliki pengaturan yang sama dan itu juga berfungsi untuk saya.

Terima kasih atas posting Anda :)

Saya memiliki situasi yang sama. Saya memiliki cuda 9.1, dan tensorflow tidak akan menemukan perpustakaan untuk cuda 9.0.

Saya telah menginstal cuda 9.0 dengan perintah: Sudo apt-get install cuda-libraries-9-0

Itu memecahkan masalah saya.

Dengan cuda 8 dan 9.0 terinstal, pengaturan LD_LIBRARY_PATH di .bashrc dan .profile tidak berfungsi. Jadi, saya mengatur
LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64 di bidang variabel Lingkungan pycharm dan berfungsi.

di atas berfungsi untuk menginstal di Ubuntu Server 17. yaitu,

  • menginstal cuda-9.0 (BUKAN 9.1)
  • cuDNN v7.1.2 (21 Mar 2018) untuk CUDA 9.0
  • segala sesuatu yang lain sesuai dengan petunjuk instalasi tf resmi

jauh lebih mudah daripada kompilasi.

hati-hati pengguna conda. saya mengalami masalah yang sama dan menggaruk-garuk kepala selama dua hari, sampai akhirnya saya menemukan bahwa salinan lokal libcudnn.so digunakan oleh conda, di bawah:
/miniconda3/lib/libcudnn.so yang menunjuk ke libcudnn.so.7 yang menunjuk ke libcudnn.so.7.0.5
saya tidak ingat siapa dan bagaimana meletakkannya di sana tetapi cukup banyak membebani sistem default libcudnn.so.7.1.2 !!!

setelah dihapus, semuanya berfungsi seperti pesona:
tensorflow 1.7 atau 1.8-nightly, cuda-9.1, cudnn-7.1.2 di ubuntu 16.04

Entah bagaimana, saya memecahkan ini dengan menginstal:
cuda 9.1 (dari manajer paket),
cudnn 7.1 untuk 9.1
dan dari anaconda:
dengan menggunakan perintah default ini 'conda install -c anaconda tensorflow-gpu'
cudatoolkit 9.0,
aliran tensor 1.7,
tensorflow-gpu 1.7

Saya menggunakan linux Antergos, GTX 1060 di PC saya. Ini bekerja dengan baik di notebook saya (Xubuntu 18.04, GT 840m). Di buku catatan saya, saya menggunakan:
cuda 9.1 (dari nvidia ppa), cudnn 7.1 untuk 9.1 (dari nvidia web), dan sisanya sama

Terima kasih @Suananda! Ini bekerja seperti sihir.

Jika Anda memiliki CUDA versi lama, tautan pustaka mungkin mengarah ke pustaka lama bahkan Anda menginstal CUDA yang lebih baru terutama jika Anda menginstalnya secara manual. Coba hapus instalasi lama Anda, lalu Sudo ldconfig untuk memperbarui tautan dinamis.

Belum ada solusi!?

Bagi siapa saja yang mungkin tersandung pada ini, saya telah merilis roda komunitas tensorflow 1.8.0-rc1 terbaru yang dibuat dengan cuda 9.1. Anda dapat menemukannya di sini !

Saya telah menemukan alasannya adalah ldconf, ldconfig adalah perintah manajemen perpustakaan tautan dinamis yang tujuannya adalah untuk memungkinkan perpustakaan tautan dinamis digunakan oleh sistem.

ldconf default hanya mencari /lib dan /usr/lib, serta file library di bawah direktori yang terdaftar di file konfigurasi /etc/ld. jadi. kon.

jadi semua ini disebabkan oleh perpustakaan dinamis CUDA di jalur CUDA yang diinstal seperti: /path/cuda-9.0/lib64 atau /path/cuda-9.0/lib. (misalnya CUDA saya diinstal di /usr/local/cuda-9.0)

  1. jika Anda menginstal manual CUDA, maka setelah menginstal, Anda harus menambahkan path cuda/lib64 ke file /etc/ld.so.conf
    sudo echo "/usr/local/cuda-9.0/lib64/" >> /etc/ld.so.conf
    kemudian
    sudo ldconfig

    tentu saja, Anda dapat menambahkan manual jalur, seperti:
    vim /etc/ld.so.conf
    lalu tambahkan path '/usr/local/cuda-9.0/lib64' di akhir.
    sudo ldconfig
    setelah operasi, buka kembali ipython atau pycharm ,
    impor tensorflow sebagai tf
    wow, Anda akan menikmatinya!

  2. jika Anda menginstal CUDA dengan perintah seperti 'dpkg -i cuda-repo-ubuntu1604_9.0.176-1_amd64.deb' atau lainnya, mungkin menambahkan jalur cuda lib ke /etc/ld.so.conf secara otomatis . tetapi untuk amannya, periksa /etc/ld.so.conf dan lihat apakah jalurnya menambahkannya .

@NYcleaner
Di Ubuntu, ada file /etc/ld.so.conf.d/cuda-9-1.conf berisi:
/usr/local/cuda-9.1/targets/x86_64-linux/lib

Apakah ini cukup atau apakah saya perlu menambahkan direktori /usr/local/cuda-9.1/lib64/ ke dalamnya?

@sebma
anda harus menambahkan jalur /usr/local/cuda-9.1/lib64/ ke sana, file * .so ada di lib64

sudo bash -c "echo /usr/local/cuda/lib64/ >/etc/ld.so.conf.d/cuda.conf"
sudo ldconfig

dari https://Gist.github.com/zhanwenchen/e520767a409325d9961072f666815bb8

@mashu Nah opsi lainnya adalah komunitas menyediakan roda yang sudah jadi . Jika Anda membaca 2-3 utas di atas, Anda juga akan melihatnya disebutkan lagi.

@Suananda Terima kasih, ini berfungsi untuk saya di lingkungan tensorflow conda.
Sarankan orang resmi untuk mengubah panduan instalasi " https://www.tensorflow.org/install/install_linux#InstallingAnaconda ", langkah 4 dari instalasi Anaconda, dari "instal pip --ignore-installed --upgrade tfBinaryURL" ke "conda instal -c anaconda tensorflow-gpu"

Softlink tampaknya tidak menyelesaikan masalah ini:

➜  cuda ls lib64 
libaccinj64.so                libcufftw_static.a     libnppial.so.9.2      libnppig_static.a    libnvblas.so.9.2
libaccinj64.so.9.2            libcuinj64.so          libnppial.so.9.2.88   libnppim.so          libnvblas.so.9.2.88
libaccinj64.so.9.2.88         libcuinj64.so.9.2      libnppial_static.a    libnppim.so.9.2      libnvgraph.so
libcublas_device.a            libcuinj64.so.9.2.88   libnppicc.so          libnppim.so.9.2.88   libnvgraph.so.9.2
libcublas.so                  libculibos.a           libnppicc.so.9.2      libnppim_static.a    libnvgraph.so.9.2.88
libcublas.so.9.0              libcurand.so           libnppicc.so.9.2.88   libnppist.so         libnvgraph_static.a
libcublas.so.9.2              libcurand.so.9.2       libnppicc_static.a    libnppist.so.9.2     libnvrtc-builtins.so
libcublas.so.9.2.88           libcurand.so.9.2.88    libnppicom.so         libnppist.so.9.2.88  libnvrtc-builtins.so.9.2
libcublas_static.a            libcurand_static.a     libnppicom.so.9.2     libnppist_static.a   libnvrtc-builtins.so.9.2.88
libcudadevrt.a                libcusolver.so         libnppicom.so.9.2.88  libnppisu.so         libnvrtc.so
libcudart.so                  libcusolver.so.9.2     libnppicom_static.a   libnppisu.so.9.2     libnvrtc.so.9.2
libcudart.so.9.2              libcusolver.so.9.2.88  libnppidei.so         libnppisu.so.9.2.88  libnvrtc.so.9.2.88
libcudart.so.9.2.88           libcusolver_static.a   libnppidei.so.9.2     libnppisu_static.a   libnvToolsExt.so
libcudart_static.a            libcusparse.so         libnppidei.so.9.2.88  libnppitc.so         libnvToolsExt.so.1
libcufft.so                   libcusparse.so.9.2     libnppidei_static.a   libnppitc.so.9.2     libnvToolsExt.so.1.0.0
libcufft.so.9.2               libcusparse.so.9.2.88  libnppif.so           libnppitc.so.9.2.88  libOpenCL.so
libcufft.so.9.2.88            libcusparse_static.a   libnppif.so.9.2       libnppitc_static.a   libOpenCL.so.1
libcufft_static.a             libnppc.so             libnppif.so.9.2.88    libnpps.so           libOpenCL.so.1.0
libcufft_static_nocallback.a  libnppc.so.9.2         libnppif_static.a     libnpps.so.9.2       libOpenCL.so.1.0.0
libcufftw.so                  libnppc.so.9.2.88      libnppig.so           libnpps.so.9.2.88    stubs
libcufftw.so.9.2              libnppc_static.a       libnppig.so.9.2       libnpps_static.a
libcufftw.so.9.2.88           libnppial.so           libnppig.so.9.2.88    libnvblas.so

Masih punya:

Traceback (most recent call last):
  File "/usr/local/lib/python3.6/dist-packages/tensorflow/python/pywrap_tensorflow.py", line 58, in <module>
    from tensorflow.python.pywrap_tensorflow_internal import *
  File "/usr/local/lib/python3.6/dist-packages/tensorflow/python/pywrap_tensorflow_internal.py", line 28, in <module>
    _pywrap_tensorflow_internal = swig_import_helper()
  File "/usr/local/lib/python3.6/dist-packages/tensorflow/python/pywrap_tensorflow_internal.py", line 24, in swig_import_helper
    _mod = imp.load_module('_pywrap_tensorflow_internal', fp, pathname, description)
  File "/usr/lib/python3.6/imp.py", line 243, in load_module
    return load_dynamic(name, filename, file)
  File "/usr/lib/python3.6/imp.py", line 343, in load_dynamic
    return _load(spec)
ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory

During handling of the above exception, another exception occurred:

ketika saya menjalankan kode saya di lingkungan linux secara langsung, semuanya baik-baik saja. Tetapi ketika saya menjalankan pycharm lokal melalui penerjemah jarak jauh, saya mengalami masalah: ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory. "Failed to load the native TensorFlow runtime."

ekspor PATH=${PATH}:/usr/local/cuda-9.0/bin
ekspor CUDA_HOME=${CUDA_HOME}:/usr/local/cuda:/usr/local/cuda-9.0
ekspor LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:/usr/local/cuda-9.0/lib64
ekspor LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/extras/CUPTI/lib64

jika menggunakan pycharm - tambahkan ke juru bahasa

bagaimana dengan f** Saya hanya ingin menggunakan tensorflow1.8 dan cuda9.1?

@dongzhuoyao Jadi apa masalahnya? lihat komentar saya 6 utas di atas dan Anda akan menemukan solusi Anda di sana!

Saya kira masalahnya muncul lagi dengan cuda 9.2 dan tensorflow-gpu 1.8 . Di virtualenv, saya mendapatkan:

>>> import tensorflow as tf
ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory

Folder /usr/local/cuda-9.2/lib64 memiliki libcublas berikut:

$ ls /usr/local/cuda-9.2/lib64 | grep libcublas
libcublas_device.a
libcublas.so
libcublas.so.9.2
libcublas.so.9.2.113
libcublas.so.9.2.88
libcublas_static.a

Versi:

Ubuntu 16.04
cuda 9.2
cudnn 7.1.4
tensorflow-gpu 1.8.0

Kami memerlukan pembaruan ke tensorflow-gpu untuk menggunakan cuda 9.2.

Juga, jika saya menurunkan versi ke cuda 9.0, apakah saya harus menghapus cuda 9.2 terlebih dahulu atau langsung menginstal 9.0? Apakah saya akan memiliki instalasi yang saling bertentangan?

@mebble Ini dia: tautan . Itu roda tf 1.8 untuk cuda 9.2.

jika saya ingin menurunkan versi ke cuda 9.0, apakah saya harus menghapus cuda 9.2 terlebih dahulu?

Jangan downgrade. Instal versi lain apa pun yang Anda inginkan, mereka akan diinstal di /usr/local/cuda-x.x

Terima kasih! Saya lupa menyebutkan bahwa saya menggunakan python 3.5.2 dan pip 10.0.1 . Saya pikir rodanya untuk python 3.6 sehingga pemasangannya tidak berfungsi. Ada yang buat 3.5 juga?

@kirk86 setelah menginstal whl yang Anda berikan memberikan kesalahan serupa untuk libmpi.so.40
Saya menggunakan GPU CentOS dan K80, cuda 9.2 dan cudnn v7.1

Saran

Sejauh yang saya tahu Anda dapat memiliki sub-paket xxx,yyy,zzz dll. dan menginstalnya sebagai berikut

pip install mainpackage[xxx]

Dengan cara ini, back-end yang ada bersama yang berbeda dapat disediakan. Tensorflow dapat dibuat dengan opsi yang berbeda, jadi setidaknya beberapa cuda-toolkit build dapat disediakan dengan cara ini.

Inti dari paket adalah untuk menghemat waktu pembuatan, tetapi pembuatan paket untuk kumpulan pustaka yang sangat spesifik yang menginstal dengan baik, tetapi tidak berfungsi adalah kontra-produktif. Akan lebih baik untuk tidak memiliki paket seperti itu sejak awal.

@mebble buat saja lingkungan virtual conda untuk python 3.6. Pastikan Anda juga telah menginstal openmpi di sistem Anda.

@pavan-08 Instal openmpi di sistem Anda juga nccl 2.x apa pun yang terbaru dari nvidia. Saya telah mengkompilasi tf dengan sebagian besar paket dan perpustakaan, sehingga dapat digunakan hdfs, kafta, aws, dll. Itu sebabnya meminta libmpi.so karena itu dari perpustakaan openmpi.

Dengan cuda 9.2 dan tensorflow-gpu 1.8 saya tidak dapat membuat tensorflow

output yang dideklarasikan 'external/local_config_cuda/cuda/cuda/lib/libcudnn.so.7' adalah tautan simbolik yang menjuntai

symlink ada

Versi:

Ubuntu 17.10
cuda 9.2
sisa 7.1.4
tensorflow-gpu 1.8.0

Ini berfungsi untuk saya (tensorflow-gpu==1.8.0 dan versi cuda adalah 9.0, instal di anaconda)

export LD_LIBRARY_PATH=LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64/

saran dari: https://stackoverflow.com/questions/48428415/importerror-libcublas-so-9-0-cannot-open-shared-object-file

@Jackiexiao Ya, itulah yang akan saya katakan. Saya menggunakan workstation, jadi bagi saya yang perlu saya lakukan hanyalah menggunakan CUDA 9.0 alih-alih 9.2 (karena beberapa versi CUDA diinstal)

Ini berhasil untuk saya:
Karena Tensorflow > 1.4 memerlukan CUDA 9, saya mencopot semua versi CUDA :

  1. sudo rm -rf /usr/local/cuda*
  2. dpkg -l | grep cuda- | awk '{cetak $2}' | xargs -n1 sudo dpkg --purge

Instal excatly CUDA 9.0 dan CuDNN 7.0.x dan reboot.

Silakan lihat kombinasi CUDA, CuDNN dan Tensorflow .

Kesalahan ini terjadi terutama karena kombinasi versi Nvidia-driver, CUDA, CuDNN dan Tensorflow-gpu yang salah
image

Terima kasih!

| |
杨康
|
|
[email protected]
|

签名 由 网易 邮箱 大师 定制

Pada 18/08/2018 08:00, Dhruv Srivastava menulis:

Silakan lihat kombinasi CUDA dan CuDNN.

Kesalahan ini terjadi terutama karena kombinasi versi Nvidia-driver, CUDA, CuDNN dan Tensorflow-gpu yang salah


Anda menerima ini karena Anda berkomentar.
Balas email ini secara langsung, lihat di GitHub, atau matikan utasnya.

@dhruvhacks Bagus. Saya pikir orang harus menginstal versi yang tepat dari tensorflow-gpu dengan versi yang tepat cuda.

Saya menggunakan Ubuntu 18.08, dan menginstal Cuda 9.0 di:

/usr/local/cuda-9.0

Saya memutuskan untuk mencari libcublas.so.9.0 :

# build search index
updatedb
# find the "missing" file
locate libcublas.so.9.0

Itu memberi tahu saya bahwa file itu ada di /usr/local/cuda-9.0/lib64/stubs/libcublas.so.9.0 , yang membantu saya menyadari bahwa saya memiliki dua masalah: Di ~/.bash_profile Saya telah menetapkan: export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64/ , tetapi file saya ada di stubs direktori

export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64/stubs/

Akhirnya, libcublas.so.9.0 dimiliki oleh root, jadi saya mengubah izin dan pemilik file:

sudo chown -R MY_USER:MY_GROUP /usr/local/cuda-9.0/
sudo chmod -R 777 /usr/local/cuda-9.0/

Dan semuanya baik-baik saja!

Dengan cuda 8 dan 9.0 terinstal, pengaturan LD_LIBRARY_PATH di .bashrc dan .profile tidak berfungsi. Jadi, saya mengatur
LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64 di bidang variabel Lingkungan pycharm dan berfungsi.

Tepat, Terima kasih banyak untuk memecahkan masalah, saya telah menghabiskan berhari-hari untuk memecahkan ini. sangat menghargai sobat

Saya mengalami masalah ini juga ketika saya menggunakan PyCharm untuk men-debug kode saya di server jarak jauh (aws deep learning ami). Versi cuda adalah 9.0 dan cudnn adalah 7.1.4 dan tensorflow adalah 1.10.0 (untuk gpu). Saya dapat mengimpor tensorflow secara normal dengan terminal yang terhubung ke server saya tetapi gagal mengimpor tensorflow di konsol python PyCharm. Masalah terjadi saat ini. Oleh karena itu, saya tidak dapat men-debug dengan PyCharm...
Solusi saya adalah : masukkan baris ini di terminal setelah terhubung ke server Anda

sudo ldconfig /usr/local/cuda/lib64

Dan saya mereferensikan Tautan ini

@NYcleaner Terima kasih banyak! Itu membantu! dan saya menemukan hanya menggunakan tautan simbolik juga berfungsi.
sudo echo "/usr/local/cuda/lib64/" >> /etc/ld.so.conf
sudo ldconfig

Ini masih menjadi masalah dengan Cuda 9.1 dan Tensorflow 1.11

cuda 10.0 tensorflow 1.11

Solusi yang lebih baik lagi - hapus tensorflow, instal pytorch
Mengapa tensorflow dapat mengerem dengan mudah?
Mengapa saya tidak bisa menginstalnya dan menjalankannya?
Mengapa begitu mudah dengan pytorch dan tidak dapat diprediksi dengan tf? Apakah salah dengan itu?

Mengapa tidak menginstal cuda-9-0 saja?

sudo dpkg -i cuda-repo-ubuntu1604_9.0.176-1_amd64.deb
sudo apt-key adv --fetch-keys \
     http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda-9-0

Di bawah ubuntu 18.04 cuda 9-0 tidak (resmi) tersedia. Ini bekerja, meskipun.

Halo semua,
Saya menggunakan PyTorch sebanyak mungkin, tetapi untuk proyek tertentu di mana saya perlu mengekspor model (Keras) ke tensorflowjs, saya terpaksa menggunakan tf. Satu-satunya solusi yang berhasil bagi saya adalah membangun dari sumber, setelah menginstal CUDA dari multiverse Ubuntu, seperti yang dijelaskan di sini:

https://medium.com/@asmello/how -to-install-tensorflow-cuda-9-1-into-ubuntu-18-04-b645e769f01d

Kesempatan yang bagus!

Solusi yang lebih baik lagi - hapus tensorflow, instal pytorch
Mengapa tensorflow dapat mengerem dengan mudah?
Mengapa saya tidak bisa menginstalnya dan menjalankannya?
Mengapa begitu mudah dengan pytorch dan tidak dapat diprediksi dengan tf? Apakah salah dengan itu?

Solusi bodoh

Saya telah menginstal Cuda 10 dan Tensor Flow versi terbaru, tetapi saya telah menerima ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory , saya telah melakukan downgrade dan saya masih menerima pesan ini...

Saya telah menginstal Cuda 10 dan Tensor Flow versi terbaru, tetapi saya telah menerima ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory , saya telah melakukan downgrade dan saya masih menerima pesan ini...

Bisakah Anda memberi tahu kami versi OS dan perintah persis yang Anda keluarkan untuk "menurunkan versi"?

Saya mencoba Deepin 15.8 dan Mint 19.1, saya akan menguji Windows 10 nanti. Perintah pip install --upgrade tensorflow-gpu==version , saya mencoba versi master : 1.9.0, 1.10.1, 1.11.0 dan 1.12.0. Versi cuda dan drivernya:

image

@Sphinxs , menurut saya Anda memiliki dua cara: a) mengkompilasi ulang python wheel secara lokal sehingga menunjuk ke versi cuda yang diinstal atau b) menginstal cuda-9.0 seperti yang saya lakukan untuk instalasi 18.04 saya dan masih berfungsi setelah berbulan-bulan.

Solusi yang lebih baik lagi - hapus tensorflow, instal pytorch
Mengapa tensorflow dapat mengerem dengan mudah?
Mengapa saya tidak bisa menginstalnya dan menjalankannya?
Mengapa begitu mudah dengan pytorch dan tidak dapat diprediksi dengan tf? Apakah salah dengan itu?

pria itu ada benarnya. TF BISA dikompilasi untuk bekerja dengan versi CUDA yang lebih modern... mengapa tidak menawarkannya saja kepada kebanyakan orang dengan paket tensorflow-gpu-cuda110 atau sesuatu yang sementara sampai perpustakaan dapat mengetahui versi cuda yang mendasarinya secara dinamis?

Solusi yang lebih baik lagi - hapus tensorflow, instal pytorch
Mengapa tensorflow dapat mengerem dengan mudah?
Mengapa saya tidak bisa menginstalnya dan menjalankannya?
Mengapa begitu mudah dengan pytorch dan tidak dapat diprediksi dengan tf? Apakah salah dengan itu?

aku muak!!!!

aku muak!!!!

Komentar ini tidak menambahkan apa pun ke masalah ini. Juga tidak ada yang memaksa siapa pun untuk menggunakan TF, tetapi Jika Anda benar-benar perlu dan tidak dapat membuat paket pip berfungsi, mengapa tidak membuatnya sendiri? Itulah yang akhirnya saya lakukan di beberapa titik. Saya melihat ada juga build yang didukung komunitas di sini
https://github.com/tensorflow/tensorflow cukup gulir ke bawah.
Mungkin membangun untuk GPU Anda dan berkontribusi?

Solusi yang lebih baik lagi - hapus tensorflow, instal pytorch
Mengapa tensorflow dapat mengerem dengan mudah?
Mengapa saya tidak bisa menginstalnya dan menjalankannya?
Mengapa begitu mudah dengan pytorch dan tidak dapat diprediksi dengan tf? Apakah salah dengan itu?

aku muak!!!!

Ini adalah halaman masalah. Tolong, nyatakan masalah Anda sehingga dapat diperbaiki, atau, lebih baik lagi, bantu memperbaikinya.

@raphaunix bolehkah saya bertanya dari mana bagan ini berasal?

Saya membuat Tensorflow 1.11.0 berfungsi dengan menjalankan perintah berikut:

conda create -n tf python=2
conda activate tf
pip install tensorflow-gpu==1.11
conda install cudatoolkit==9.0

Saya telah menemukan alasannya adalah ldconf, ldconfig adalah perintah manajemen perpustakaan tautan dinamis yang tujuannya adalah untuk memungkinkan perpustakaan tautan dinamis digunakan oleh sistem.

ldconf default hanya mencari /lib dan /usr/lib, serta file library di bawah direktori yang terdaftar di file konfigurasi /etc/ld. jadi. kon.

jadi semua ini disebabkan oleh perpustakaan dinamis CUDA di jalur CUDA yang diinstal seperti: /path/cuda-9.0/lib64 atau /path/cuda-9.0/lib. (misalnya CUDA saya diinstal di /usr/local/cuda-9.0)

1.jika Anda menginstal manual CUDA, maka setelah menginstal, Anda harus menambahkan path cuda/lib64 ke file /etc/ld.so.conf
sudo echo "/usr/local/cuda-9.0/lib64/" >> /etc/ld.so.conf
kemudian
sudo ldconfig
tentu saja, Anda dapat menambahkan manual jalur, seperti:
vim /etc/ld.so.conf
lalu tambahkan path '/usr/local/cuda-9.0' di akhir.
lalu perbarui
sudo ldconfig
setelah operasi, buka kembali ipython atau pycharm ,
import tensorflow as tf
wow, Anda akan menikmatinya!

jika Anda menginstal CUDA dengan perintah seperti 'dpkg -i cuda-repo-ubuntu1604_9.0.176-1_amd64.deb' atau lainnya, mungkin menambahkan jalur cuda lib ke /etc/ld.so.conf secara otomatis . tetapi untuk amannya, periksa /etc/ld.so.conf dan lihat apakah jalurnya menambahkannya .

@jabalazs Alih-alih conda install cudatoolkit==9.0 Saya mencoba pip install cudatoolkit==9.0 tetapi ini tidak berhasil, apakah Anda tahu mengapa?

Saya menemukan bahwa runtime saya di colab tidak menggunakan GPU itulah mengapa saya mendapatkan kesalahan saya

Solusi yang lebih baik lagi - hapus tensorflow, instal pytorch
Mengapa tensorflow dapat mengerem dengan mudah?
Mengapa saya tidak bisa menginstalnya dan menjalankannya?
Mengapa begitu mudah dengan pytorch dan tidak dapat diprediksi dengan tf? Apakah salah dengan itu?

Solusi bagus @dodler ! tapi saya pikir Anda kehilangan perintah untuk membuat saran bagus ini mudah diikuti melalui xD.

pip uninstall tensorflow
pip install torch

Selamat mengkode!

Saya menghadapi kesalahan yang sama saat mencoba menggunakan Thundersvm untuk mempercepat NuSVR dengan GPU di Google Colab.
Menginstal Cuda 9.0 memecahkan masalah bagi saya.
Ikuti saja:

!wget https://developer.nvidia.com/compute/cuda/9.0/Prod/local_installers/cuda-repo-ubuntu1704-9-0-local_9.0.176-1_amd64-deb

!ls # Check if required cuda 9.0 amd64-deb file is downloaded

!dpkg -i cuda-repo-ubuntu1704-9-0-local_9.0.176-1_amd64-deb

!ls /var/cuda-repo-9-0-local | grep .pub

!apt-key add /var/cuda-repo-9-0-local/7fa2af80.pub

!apt-get update

!sudo apt-get install cuda-9.0

Apakah halaman ini membantu?
0 / 5 - 0 peringkat