Tensorflow: Tingkatkan ke CuDNN 7 dan CUDA 9

Dibuat pada 5 Agu 2017  ·  170Komentar  ·  Sumber: tensorflow/tensorflow

Sistem Informasi

  • Sudahkah saya menulis kode khusus (sebagai lawan menggunakan skrip contoh stok yang disediakan di TensorFlow) : Tidak
  • Platform dan Distribusi OS (mis., Linux Ubuntu 16.04) : Windows Server 2012
  • TensorFlow diinstal dari (sumber atau biner) : binary
  • Versi TensorFlow (gunakan perintah di bawah) : 1.3.0-rc1
  • Versi Python : 3.5.2
  • Versi Bazel (jika dikompilasi dari sumber) : N/A
  • Versi CUDA/cuDNN : CUDA V8.0.44, CuDNN 6.0
  • Model dan memori GPU : Nvidia GeForce GTX 1080 Ti, 11 GB
  • Perintah yang tepat untuk mereproduksi : N/A

Jelaskan masalahnya

Harap tingkatkan TensorFlow untuk mendukung CUDA 9 dan CuDNN 7. Nvidia mengklaim ini akan memberikan peningkatan kinerja 2x pada GPU Pascal.

feature

Komentar yang paling membantu

Berbicara tentang metode yang akan ditambahkan, konvolusi grup dari cudnn7 akan menjadi fitur penting bagi komunitas visi.

Semua 170 komentar

@tfboyd apakah Anda memiliki komentar tentang ini?

cuDNN 7 masih dalam mode pratinjau dan sedang dikerjakan. Kami baru saja pindah ke cuDNN 6.0 dengan 1.3, yang akan menjadi final dalam beberapa minggu. Anda dapat mengunduh cuDNN 1.3.0rc2 jika Anda tertarik dengan itu. Saya belum mengkompilasi dengan cuDNN 7 atau CUDA 9. Saya telah mendengar bahwa CUDA 9 tidak mudah untuk diinstal pada semua platform dan hanya paket instalasi tertentu yang tersedia. Ketika perpustakaan sudah final, kami akan memulai evaluasi akhir. NVIDIA juga baru saja mulai mengirimkan tambalan ke platform ML utama untuk mendukung aspek perpustakaan baru ini dan saya menduga akan ada pekerjaan tambahan.

Sunting: Saya bermaksud mengatakan CUDA 9 tidak mudah dipasang di semua platform dan malah mengatakan cuDNN. Saya juga berubah yakin akan ada pekerjaan saya curiga akan ada pekerjaan tambahan. Sisa pernyataan konyol saya saya tinggalkan, misalnya saya tidak menyadari cuDNN 7 ditayangkan kemarin.

Tidak mengatakan bagaimana Anda harus membaca situs web. Tetapi 2x lebih cepat pada pascal tampaknya menjadi bagian dari rilis CUDA 8. Saya kira itu tergantung pada bagaimana Anda membaca situs. NVIDIA belum memberi tahu kami bahwa CUDA 9 akan mempercepat Pascal 2x (dalam segala hal) dan sementara segala sesuatu mungkin terjadi, saya tidak berharap itu terjadi.

https://developer.nvidia.com/cuda-toolkit/whatsnew

Situs ini sedikit membingungkan tetapi saya pikir bagian yang Anda kutip terletak di bawah CUDA 8. Saya hanya menyebutkan ini sehingga Anda tidak memiliki harapan yang tidak realistis untuk rilis mereka. Untuk Volta harus ada beberapa keuntungan besar dari apa yang saya mengerti dan saya pikir (saya tidak yakin sekarang) orang hanya mendapatkan sampel rekayasa Volta untuk memulai pekerjaan tingkat tinggi untuk bersiap-siap untuk rilis penuh.

@tfboyd cuDNN 7 tidak lagi dalam mode pratinjau seperti kemarin. Ini telah dirilis secara resmi untuk CUDA 8.0 dan CUDA 9.0 RC.

Ahh aku merindukan itu. Terima kasih @sclarkson dan maaf atas info yang salah.

Saya pasti akan mencobanya karena akhirnya gcc 6 didukung oleh CUDA 9 dan Ubuntu 17.04 hadir bersamanya.

Jika Anda beruntung, beri tahu utasnya. Saya pribadi baru mulai
sepenuhnya menguji cuDNN 6 (Secara internal sudah banyak diuji tetapi saya belum
menggunakannya secara pribadi). Saya sering lambat untuk meng-upgrade ke hal-hal terbaru. Ku
tebak Anda mungkin tidak melihat perubahan nyata dengan cuDNN 7 sampai semuanya menjadi
ditambal untuk menggunakan API terbaru. Saya ingin menekankan lagi bahwa saya salah semua
dari waktu. Apa yang saya lihat sebagai orang luar adalah penambahan versi cuDNN baru
metode/API baru. Ada yang menarik dan ada yang tidak langsung
berguna. Kemudian API tersebut diekspos melalui API TensorFlow atau hanya digunakan
di belakang layar untuk membuat metode yang ada lebih cepat. Levelku yang sangat tinggi
pemahamannya adalah cuDNN 7 + CUDA 9 akan meningkatkan dukungan FP16 dengan fokus pada
Volta. Saya pikir salah satu fokus utama adalah bagaimana mendapatkan model (banyak bukan hanya
beberapa) untuk bertemu dengan FP16 tanpa harus terus-menerus menebak yang benar
config/hyperparameters untuk digunakan. Saya ingin menekankan bahwa ini adalah bagaimana saya
memahami percakapan dan saya mungkin salah atau setengah benar.

STRES: Jika ada metode yang menurut Anda perlu ditambahkan (atau manfaatkan untuk
performance) ke TensorFlow dari cuDNN kami selalu tertarik pada daftar.
Secara internal, ini terjadi dengan cuDNN 6 dan kami fokus pada penerapan
tim fitur mengatakan mereka ingin itu akan membantu proyek mereka.

Pada Sabtu, 5 Agustus 2017 pukul 08:46, Courtial Florian [email protected]
menulis:

Saya pasti akan mencobanya karena akhirnya gcc 6 didukung oleh CUDA 9 dan
Ubuntu 17.04 hadir bersamanya.


Anda menerima ini karena Anda disebutkan.
Balas email ini secara langsung, lihat di GitHub
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-320450756 ,
atau matikan utasnya
https://github.com/notifications/unsubscribe-auth/AWZessKqj_nPY1br9SD9L9SX-8Kf5Dbtks5sVI5TgaJpZM4OuRL7
.

Berbicara tentang metode yang akan ditambahkan, konvolusi grup dari cudnn7 akan menjadi fitur penting bagi komunitas visi.

Keren saya akan menambahkannya ke daftar saya mulai. Aku mungkin lupa tapi merasa bebas
untuk mengingatkan saya untuk menerbitkan semacam daftar di mana saya dapat memberikan beberapa panduan
pada apa yang mungkin sedang dikerjakan. Bukan janji tapi kita mau
umpan balik sehingga kami dapat memprioritaskan apa yang diinginkan dan dibutuhkan orang. Terima kasih Yuxin.

Pada Sabtu, 5 Agustus 2017 pukul 12:26, ​​Yuxin Wu [email protected] menulis:

Berbicara tentang metode yang akan ditambahkan, konvolusi grup dari cudnn7 akan menjadi
fitur penting untuk komunitas visi.


Anda menerima ini karena Anda disebutkan.
Balas email ini secara langsung, lihat di GitHub
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-320465264 ,
atau matikan utasnya
https://github.com/notifications/unsubscribe-auth/AWZesv9udRRxy9WvsK2eUEZCj7LAGM8bks5sVMHVgaJpZM4OuRL7
.

Saya baru saja mencoba mengkompilasi dengan cuDNN 7 dengan CUDA 8 dan gagal yang saya ketik
dari yang diharapkan. Ada tambalan yang masuk dari NVIDIA yang seharusnya membantu baris
hal-hal. Hanya kepala jika ada yang mencoba.

Pada Sabtu, 5 Agustus 2017 pukul 13:47, Toby Boyd [email protected] menulis:

Keren saya akan menambahkannya ke daftar saya mulai. Aku mungkin lupa tapi merasa bebas
untuk mengingatkan saya untuk menerbitkan semacam daftar di mana saya dapat memberikan beberapa panduan
pada apa yang mungkin sedang dikerjakan. Bukan janji tapi kita mau
umpan balik sehingga kami dapat memprioritaskan apa yang diinginkan dan dibutuhkan orang. Terima kasih Yuxin.

Pada Sabtu, 5 Agustus 2017 pukul 12:26, ​​Yuxin Wu [email protected]
menulis:

Berbicara tentang metode yang akan ditambahkan, konvolusi grup dari cudnn7 akan menjadi
fitur penting untuk komunitas visi.


Anda menerima ini karena Anda disebutkan.
Balas email ini secara langsung, lihat di GitHub
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-320465264 ,
atau matikan utasnya
https://github.com/notifications/unsubscribe-auth/AWZesv9udRRxy9WvsK2eUEZCj7LAGM8bks5sVMHVgaJpZM4OuRL7
.

Saya mencoba menjalankan cuDNN 7 dengan CUDA 8/9. CUDA 8 tidak didukung oleh GTX 1080 Ti - setidaknya penginstal mengatakan demikian ^^

Saya mengalami kesulitan besar untuk menjalankannya bersama-sama. Saya ingin menunjukkan artikel hebat ini yang merangkum apa yang sudah saya coba: https://nitishmutha.github.io/tensorflow/2017/01/22/TensorFlow-with-gpu-for-windows.html

Contoh CUDA bekerja melalui Visual-Studio di kedua kombinasi pengaturan.
Berikut output dari deviceQuery.exe yang dikompilasi menggunakan Visual-Studio:

PS C:\ProgramData\NVIDIA Corporation\CUDA Samples\v9.0\bin\win64\Release> deviceQuery.exe
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v9.0\bin\win64\Release\deviceQuery.exe Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "GeForce GTX 1080 Ti"
  CUDA Driver Version / Runtime Version          9.0 / 9.0
  CUDA Capability Major/Minor version number:    6.1
  Total amount of global memory:                 11264 MBytes (11811160064 bytes)
  (28) Multiprocessors, (128) CUDA Cores/MP:     3584 CUDA Cores
  GPU Max Clock rate:                            1683 MHz (1.68 GHz)
  Memory Clock rate:                             5505 Mhz
  Memory Bus Width:                              352-bit
  L2 Cache Size:                                 2883584 bytes
  Maximum Texture Dimension Size (x,y,z)         1D=(131072), 2D=(131072, 65536), 3D=(16384, 16384, 16384)
  Maximum Layered 1D Texture Size, (num) layers  1D=(32768), 2048 layers
  Maximum Layered 2D Texture Size, (num) layers  2D=(32768, 32768), 2048 layers
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       49152 bytes
  Total number of registers available per block: 65536
  Warp size:                                     32
  Maximum number of threads per multiprocessor:  2048
  Maximum number of threads per block:           1024
  Max dimension size of a thread block (x,y,z): (1024, 1024, 64)
  Max dimension size of a grid size    (x,y,z): (2147483647, 65535, 65535)
  Maximum memory pitch:                          2147483647 bytes
  Texture alignment:                             512 bytes
  Concurrent copy and kernel execution:          Yes with 2 copy engine(s)
  Run time limit on kernels:                     Yes
  Integrated GPU sharing Host Memory:            No
  Support host page-locked memory mapping:       Yes
  Alignment requirement for Surfaces:            Yes
  Device has ECC support:                        Disabled
  CUDA Device Driver Mode (TCC or WDDM):         WDDM (Windows Display Driver Model)
  Device supports Unified Addressing (UVA):      Yes
  Supports Cooperative Kernel Launch:            No
  Supports MultiDevice Co-op Kernel Launch:      No
  Device PCI Domain ID / Bus ID / location ID:   0 / 1 / 0
  Compute Mode:
     < Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 9.0, CUDA Runtime Version = 9.0, NumDevs = 1, Device0 = GeForce GTX 1080 Ti
Result = PASS

@tfboyd apakah Anda memiliki tautan yang mengonfirmasi pembaruan cuDNN dari Nvidea?

@4F2E4A2E 1080 Ti pasti mendukung CUDA 8.0. Itulah yang saya gunakan dengan TensorFlow selama beberapa bulan terakhir.

Hai semua, jadi saya punya gtx 1080 ti dengan cuda 8.0. Saya mencoba menginstal tensorflow-gpu, apakah saya menggunakan cuDNN 5.1, 6.0 atau 7.0?

Saya sarankan tetap menggunakan 5.1 untuk saat ini. Saya menjalankan beberapa kinerja yang lebih dalam
tes pada 6 dan mendapatkan hasil yang beragam yang membutuhkan lebih banyak pengujian untuk mengetahuinya.

Pada 6 Agustus 2017 21:30, "colmantse" [email protected] menulis:

Hai semua, jadi saya punya gtx 1080 ti dengan cuda 8.0. Saya mencoba menginstal
tensorflow-gpu, apakah saya menggunakan cuDNN 5.1, 6.0 atau 7.0?


Anda menerima ini karena Anda disebutkan.
Balas email ini secara langsung, lihat di GitHub
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-320566071 ,
atau matikan utasnya
https://github.com/notifications/unsubscribe-auth/AWZeshvEFsdeWz-1uyzl_L6HE15E0BzSks5sVpLlgaJpZM4OuRL7
.

terima kasih, saya mencoba dengan cudnn 6.0 tetapi tidak berhasil, saya kira karena instalasi tf-gpu dummy saya. cudnn 5.1 berfungsi untuk saya dengan python 3.6

@tpankaj Terima kasih! Saya menjalankannya dengan CUDA 8 dan cuDNN 5.1

Berikut adalah set lengkap fitur di cuDNN 7:

Fitur Utama dan Peningkatan
Rilis cuDNN ini mencakup fitur dan peningkatan utama berikut.
Inti Tensor
Versi 7.0.1 dari cuDNN adalah yang pertama mendukung operasi Tensor Core di
penerapan. Tensor Cores menyediakan perkalian matriks yang sangat optimal
blok bangunan yang tidak memiliki perilaku numerik yang setara dalam tradisional
instruksi, oleh karena itu, perilaku numeriknya sedikit berbeda.
cudnnSetConvolutionMathType, cudnnSetRNNMatrixMathType, dan
cudnnMathType_t
cudnnSetConvolutionMathType dan cudnnSetRNNMatrixMathType
fungsi memungkinkan Anda memilih apakah akan menggunakan operasi Tensor Core atau tidak di
lapisan konvolusi dan RNN masing-masing dengan mengatur mode matematika ke
CUDNN_TENSOR_OP_MATH atau CUDNN_DEFAULT_MATH.
Operasi Tensor Core melakukan akumulasi floating point paralel dari beberapa
produk titik mengambang.
Menyetel mode matematika ke CUDNN_TENSOR_OP_MATH menunjukkan bahwa perpustakaan akan menggunakan
Operasi Inti Tensor.
Standarnya adalah CUDNN_DEFAULT_MATH. Default ini menunjukkan bahwa Tensor Core
operasi akan dihindari oleh perpustakaan. Mode default adalah operasi serial
sedangkan, Tensor Core adalah operasi paralel, oleh karena itu, keduanya mungkin menghasilkan
dalam hasil numerik yang sedikit berbeda karena urutan operasi yang berbeda.
Pustaka kembali ke mode matematika default saat operasi Tensor Core
tidak didukung atau tidak diizinkan.
cudnnSetConvolutionGroupCount
Antarmuka baru yang memungkinkan aplikasi melakukan grup konvolusi di
lapisan konvolusi dalam satu panggilan API.
cudnnCTCLoss
cudnnCTCLoss menyediakan implementasi GPU dari Connectionist Temporal
Fungsi kehilangan klasifikasi (CTC) untuk RNN. Fungsi kerugian CTC digunakan untuk:
pengenalan fonem dalam pengenalan ucapan dan tulisan tangan.
CUDNN_BATCHNORM_SPATIAL_PERSISTENT
Fungsi CUDNN_BATCHNORM_SPATIAL_PERSISTENT adalah kumpulan baru
mode normalisasi untuk cudnnBatchNormalizationForwardTraining
dan cudnnBatchNormalizationBackward. Mode ini mirip dengan
CUDNN_BATCHNORM_SPATIAL, bagaimanapun, ini bisa lebih cepat untuk beberapa tugas.
cudnnQueryRuntimeError
Fungsi cudnnQueryRuntimeError melaporkan kode kesalahan yang ditulis oleh GPU
kernel saat menjalankan cudnnBatchNormalizationForwardTraining
dan cudnnBatchNormalizationBackward dengan
Mode CUDNN_BATCHNORM_SPATIAL_PERSISTENT.
cudnnGetConvolutionForwardAlgorithm_v7
API baru ini mengembalikan semua algoritme yang diurutkan berdasarkan kinerja yang diharapkan
(menggunakan heuristik internal). Algoritma ini adalah output yang mirip dengan
cudnnFindConvolutionForwardAlgorithm.
cudnnGetConvolutionBackwardDataAlgorithm_v7
API baru ini mengembalikan semua algoritme yang diurutkan berdasarkan kinerja yang diharapkan
(menggunakan heuristik internal). Algoritma ini adalah output yang mirip dengan
cudnnFindConvolutionBackwardAlgorithm.
cudnnGetConvolutionBackwardFilterAlgorithm_v7
API baru ini mengembalikan semua algoritme yang diurutkan berdasarkan kinerja yang diharapkan
(menggunakan heuristik internal). Algoritma ini adalah output yang mirip dengan
cudnnFindConvolutionBackwardFilterAlgorithm.
CUDNN_REDUCE_TENSOR_MUL_NO_ZEROS
Fungsi MUL_NO_ZEROS adalah pengurangan perkalian yang mengabaikan nol dalam
data.
CUDNN_OP_TENSOR_NOT
Fungsi OP_TENSOR_NOT adalah operasi unary yang mengambil nilai negatif dari
(alfa*A).
cudnnGetDropoutDescriptor
Fungsi cudnnGetDropoutDescriptor memungkinkan aplikasi untuk putus sekolah
nilai-nilai.

Baiklah saya berpikir untuk memulai masalah baru yang lebih merupakan "blog" dari CUDA 9 RC + cuDNN 7.0. Saya memiliki TF build "di tangan saya" yang ditambal bersama tetapi CUDA 9RC dan cuDNN 7.0 dan saya ingin melihat apakah ada yang tertarik untuk mencobanya. Saya juga perlu memastikan tidak ada alasan aneh mengapa saya tidak bisa membagikannya. Ada perubahan yang perlu dilakukan pada beberapa library upstream yang digunakan TensorFlow tetapi Anda akan mulai melihat PR datang dari NVIDIA dalam waktu dekat. Saya dan tim dapat menguji CUDA 8 + cuDNN 6 pada Volta dan kemudian CUDA 9RC + cuDNN 7 pada Volta (V100) dengan kode FP32. Saya hanya melakukan build Linux dan Python 2.7 tetapi jika semua/salah satu dari Anda tertarik, saya ingin mencoba dan melibatkan komunitas lebih dari yang kami lakukan dengan cuDNN 6.0. Ini mungkin tidak terlalu menyenangkan, tetapi saya ingin menawarkan dan mencoba membuat ini terasa lebih seperti kita bersama-sama vs. Saya membayar informasi. Saya juga masih ingin membuat daftar fitur apa yang sedang kami kerjakan tetapi tidak menjanjikan untuk cuDNN 7 (dan 6.0). @cancan101 terima kasih untuk daftar lengkapnya.

@tfboyd : Saya akan berterima kasih atas deskripsi tentang melakukan CUDA 9.0RC+cuDNN 7.0. Saya sendiri menggunakan sistem yang aneh (ubuntu 17.10 beta dengan TF1.3, CUDA 8.0 dan cuDNN 6.0 gcc-4.8), dan memutakhirkan ke cuda 9 dan cudnn 7 sebenarnya akan menjadi kompiler yang bagus.

Saya akan melihat apa yang bisa saya lakukan untuk mendapatkan apa yang Anda butuhkan untuk membangun diri sendiri dan a
biner. Pemimpin tim kinerja menunjukkan bahwa saya dapat mencoba dan mewujudkannya
jadi kita bisa lebih transparan dan saya berharap lebih menyenangkan sebagai sebuah komunitas.
Memberi Anda tambalan dan cara membuatnya tidak terlalu sulit tetapi sedikit
lebih keras. Ini juga akan sangat informal karena saya tidak punya waktu untuk mengelola
cabang dan tambalan bisa sedikit membusuk (tidak berlaku bersih) dengan sangat cepat. NS
tambalan digunakan untuk memastikan semua orang yang terlibat baik-baik saja dengan perubahan
umum dan saya berharap PR individu akan mulai masuk.

Pada Jumat, 11 Agustus 2017 pukul 05.22, Erlend Aune [email protected]
menulis:

@tfboyd https://github.com/tfboyd : Saya akan berterima kasih atas deskripsinya
saat melakukan CUDA 9.0RC+cuDNN 7.0. Saya sendiri menggunakan sistem yang aneh (ubuntu
17.10 beta dengan TF1.3, CUDA 8.0 dan cuDNN 6.0 gcc-4.8), dan meningkatkan ke
cuda 9 dan cudnn 7 sebenarnya akan menjadi compilerwise yang bagus.


Anda menerima ini karena Anda disebutkan.
Balas email ini secara langsung, lihat di GitHub
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-321798364 ,
atau matikan utasnya
https://github.com/notifications/unsubscribe-auth/AWZesj4WRkFKNX-Nt2oKtvp0oyQVBtM5ks5sXEdqgaJpZM4OuRL7
.

@tfboyd : Saya tertarik, bagaimana Anda membagikannya? Sebuah cabang?

@tfboyd Saya pasti akan sangat tertarik juga. Terima kasih!

Mencoba mencari tahu minggu ini. Logistik seringkali lebih sulit daripada saya
memikirkan.

Pada 12 Agustus 2017 10:18, "Tanmay Bakshi" [email protected] menulis:

@tfboyd https://github.com/tfboyd Saya pasti akan sangat tertarik sebagai
dengan baik. Terima kasih!


Anda menerima ini karena Anda disebutkan.
Balas email ini secara langsung, lihat di GitHub
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-321994065 ,
atau matikan utasnya
https://github.com/notifications/unsubscribe-auth/AWZesjO42Rl1WCyW0KR22KgbydKh1O4Zks5sXd6AgaJpZM4OuRL7
.

Instruksi dan biner untuk dimainkan jika Anda menyukai Python 2.7. Saya akan menutup ini karena saya akan memperbarui masalah yang saya buat untuk melacak upaya. @tanmayb123 @Froskekongen

https://github.com/tensorflow/tensorflow/issues/12474

Saya baru saja mencoba menginstal tensorflow-gpu-1.3.0 yang telah dikompilasi sebelumnya untuk Python 3.6 pada Windows x64 dan menyediakan pustaka cuDNN versi 7.0 dengan Cuda 8.0 dan setidaknya bagi saya, semuanya tampak berfungsi. Saya tidak melihat pengecualian atau masalah apa pun.
Apakah ini yang diharapkan? Apakah cuDNN 7.0 kompatibel dengan cuDNN 6.0? Mungkinkah ini menyebabkan masalah?

@apacha saya sedikit terkejut itu berhasil. Saya telah melihat kesalahan sebelumnya dalam pengujian saya di mana biner TensorFlow tidak dapat menemukan cuDNN karena mencarinya berdasarkan nama dan file *.so menyertakan 6.0/7.0 dalam namanya. Kemungkinan besar Anda masih memiliki cuDNN 6 di jalur Anda. Saya tidak suka menebak-nebak tentang pengaturan Anda, tetapi jika saya bertaruh, saya akan mengatakan itu masih menggunakan cuDNN 6.

Sehubungan dengan kompatibilitas mundur minus TensorFlow sedang dikompilasi untuk mencari versi tertentu. Aku tidak tahu.

Akhirnya, itu bukan masalah besar. cuDNN 7 PR hampir disetujui/digabung dan biner yang telah dikompilasi sebelumnya kemungkinan akan pindah ke cuDNN 7 pada 1.5.

PEMBARUAN tentang kemajuan ke CUDA 9RC dan cuDNN 7

  • PR dari NVIDIA hampir disetujui
  • Perubahan EIGEN telah disetujui dan digabungkan
  • Pengujian FP16 telah dimulai dengan sungguh-sungguh pada V100 (Volta)

@tfboyd hanya demi kelengkapan: Saya menggunakan cuDNN 5 sebelumnya dan karena saya harus memperbarui untuk tensorflow 1.3, saya hanya melompat ke cuDNN versi 7 untuk mencobanya. Saya telah secara eksplisit menghapus cudnn64_5.dll dan tidak ada cudnn64_6.dll di jalur instalasi CUDA saya. Mungkin itu keajaiban Windows. :-P

Meskipun perhatikan satu hal: Saya masih menggunakan CUDA 8.0, bukan 9.0.

@apacha Ini mungkin keajaiban windows. Saya tidak ingin terdengar menghakimi karena saya tidak tahu. Saya pikir keajaiban windows dimungkinkan karena panggilan cuDNN seharusnya tidak berubah dan dengan demikian sepertinya kompatibel ke belakang. Untuk build linux, TensorFlow sedang mencari file tertentu (atau seperti itulah tampilannya ketika saya mendapatkan kesalahan) dan sangat tidak senang jika tidak menemukan cudnnblahblah.6.so. Terima kasih atas pembaruan dan spesifikasinya.

Apakah ada cabang / tag apa pun yang dapat kami periksa dan coba?
Memulai instalasi baru, Ubuntu 17... lalu gcc baru menerapkan CUDA 9, saya melihat bahwa CuDNN yang cocok adalah 7... Anda lihat ke mana saya menuju.
Saya pasti dapat meretas pengaturan saya di banyak tempat (dan memulainya dari awal lagi dengan Ubuntu 16) hanya saja saya sangat dekat, perbaikannya dikatakan dekat ... mengapa membuat lompatan besar di masa lalu jika saya bisa membuat lompatan kecil di masa depan!

PR hampir disetujui. Mereka sedang dalam peninjauan. Saya curiga beberapa lagi
paling lama berminggu-minggu, tetapi peninjauan ini dapat memakan waktu. Saya pikir ini semua
mereka. Mungkin ada straggler atau perubahan untuk mendapatkan perubahan EIGEN untuk
CUDA 9. Saya sendiri belum menyiapkannya. Mereka semakin dekat setiap hari.

https://github.com/tensorflow/tensorflow/pull/12504
https://github.com/tensorflow/tensorflow/pull/12503
https://github.com/tensorflow/tensorflow/pull/12502

Pada Selasa, 12 Sep 2017 jam 19:49, Remi Morin [email protected]
menulis:

Apakah ada cabang / tag apa pun yang dapat kami periksa dan coba?
Memulai instalasi baru, Ubuntu 17... lalu gcc baru menerapkan CUDA 9,
Saya melihat bahwa CuDNN yang cocok dengan adalah 7 ... Anda melihat ke mana saya menuju.
Saya pasti dapat meretas pengaturan saya di banyak tempat (dan memulainya dari awal
lagi dengan Ubuntu 16) hanya saya sangat dekat, perbaikannya dikatakan dekat ... mengapa
membuat lompatan besar di masa lalu jika saya bisa membuat lompatan kecil di masa depan!


Anda menerima ini karena Anda disebutkan.
Balas email ini secara langsung, lihat di GitHub
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-329041739 ,
atau matikan utasnya
https://github.com/notifications/unsubscribe-auth/AWZesrpX6TSN6fVESEsql3QNtjgo-LM9ks5sh0KqgaJpZM4OuRL7
.

@tfboyd Apakah ini masih menjadi masalah? Saya menyadari bahwa cuda 9.0 baru saja dirilis hari ini.

cuda 9.0 telah dirilis, saya tidak dapat menemukan file instal cuda 8.0 ....
tolong perbarui tensorflow...

cuda 9.0 telah dirilis, saya tidak dapat menemukan file instal cuda 8.0 ....

@zjjott https://developer.nvidia.com/cuda-toolkit-archive

@thomasjo makasih

Jadi setelah @tfboyd menyetujui PR yang dia sebutkan, akankah tensorflow 1.3 sekarang kompatibel dengan CUDA 9 dan cuDNN 7? Adakah orang di mana saja yang benar-benar berhasil menginstal ini?

@voxmenthe Saya baru saja mencoba menginstal tf1.3 dengan CUDA 9.0 dan cuDNN7. Saya mendapatkan kesalahan terkait dalam masalah ini #12489

EDIT: Pada dasarnya, saya tidak tahu caranya. Tetapi pindah ke cabang master (yang pada awalnya tidak diinstal untuk saya) tanpa perubahan lebih lanjut, saya dapat menginstalnya. Meskipun, sekarang ketika saya mencoba mengimpor tensorflow dikatakan tidak ada modul platform.

Adakah indikasi seberapa dekat PR terkait dengan masuk? Saya menginstal cuDNN 7 kemudian menyadari itu menyebabkan masalah - saya dapat menurunkan versi ke v6 tetapi saya pikir saya mungkin menunggu jika hampir diselesaikan ...

PR tampaknya disetujui. Saya belum menjalankan build sendiri dalam beberapa hari. Perlu diingat 1.3 tidak akan memiliki perubahan ini seperti beberapa waktu lalu. 1.4 akan memiliki perubahan. Semoga minggu ini saya dapat mengunduh versi terbaru dan melakukan build baru. Saya menduga seseorang akan melakukannya dengan baik sebelum saya punya waktu.

Adakah kemungkinan Anda orang pintar membuat tutorial untuk tf 1.3 atau 1.4 dengan CUDA v9.0, cudnn 7.0 untuk Win 10 x64? Saya sudah mencoba menginstal (Anaconda) tetapi terus mendapatkan kesalahan '_pywrap_tensorflow_internal' dan saya telah memeriksa msvcp140.dll ditambahkan ke jalur saya ..

@devilsnare007 : Saya kira peluang terbaik adalah dengan mengikuti https://github.com/philferriere/dlwin. Cukup ganti versi yang terdaftar dengan versi saat ini. Perhatikan, bahwa TF 1.4 bahkan belum dirilis. Tetapi TF 1.3 seharusnya berfungsi dengan baik dengan instruksi yang diberikan. Setelah semuanya ditingkatkan dan TF 1.4 telah dirilis, kami akan memperbarui tutorial itu.

Akankah cuDNN 7.0 didukung saat TF 1.4 dirilis?

@soloice
Di kepala (pada beberapa hari yang lalu) saya dapat mengkompilasi CUDA 9 (versi rilis) dengan cuDNN 7.0 tanpa perubahan khusus dan menjalankan beberapa tes tf_cnn_benchmarks.py pada GTX 1080. Semuanya terlihat baik-baik saja. TF 1.4 yang seharusnya RC minggu ini akan memiliki biner CUDA 8 dan cuDNN 6 tetapi juga akan dikompilasi dengan baik dengan CUDA 9 dan cuDNN 7. Tujuannya adalah agar TF 1.5 memiliki CUDA 9 dan cuDNN 7 dalam biner. Ini memberi orang waktu untuk memutakhirkan pustaka sistem mereka dan lebih banyak waktu untuk pengujian. Jika Anda menjalankan Voltas jangan ragu untuk memulai utas lain dan saya akan memperbaruinya akan berlangsung di FP16 secara real time.

@tfboyd Senang mendengar bahwa TF 1.4 dikompilasi dengan cuDNN 7! Jika pada titik tertentu Anda merasa ingin membuat panduan penginstalan, itu akan menjadi layanan publik yang bagus untuk komunitas DL.

Tidak masalah, itu seharusnya cukup mudah dan saya senang mencoba dan mengisinya
celah.

Pada Senin, 9 Oktober 2017 pukul 09:42, Jeff [email protected] menulis:

@tfboyd https://github.com/tfboyd Senang mendengar kompilasi TF 1.4
dengan cuDNN 7! Jika pada titik tertentu Anda merasa ingin membuat panduan pemasangannya
akan menjadi layanan publik yang bagus untuk komunitas DL.


Anda menerima ini karena Anda disebutkan.
Balas email ini secara langsung, lihat di GitHub
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-335212652 ,
atau matikan utasnya
https://github.com/notifications/unsubscribe-auth/AWZesp7d2aT8gsGOWb6YjHH_CnpKXUIPks5sqkztgaJpZM4OuRL7
.

Apakah ada kemungkinan untuk memiliki whl yang berfungsi dengan CUDA 9 dan cuDNN 7.0?

Terima kasih!

Saya akan memublikasikan milik saya (yang kemungkinan bukan 1.4 tetapi beberapa yang hampir cocok
dan saya menyertakan hash dalam namanya) ketika saya membuatnya untuk pengujian tetapi itu akan
menjadi ubuntu 16.04 (saya lupa versi gcc apa), linux, python 2.7 hanya FYI.
Dan saya tidak benar-benar ingin membagikan bangunan itu karena itu bisa
membingungkan bagi orang-orang dan saya akan menekankan untuk semua yang Anda tahu saya menyertakan beberapa
pintu belakang gila. Meskipun menambahkan beberapa kode rahasia terasa seperti terlalu banyak pekerjaan
untuk saya.

Saya pikir build nightly-gpu hampir hidup dalam pip (saya cukup yakin mereka
selalu terjadi, Anda hanya perlu menemukannya) yang berarti setelah 1,4 tahun
build malam akan pindah ke CUDA 9 + cuDNN 7 dengan sangat cepat.

Pada Senin, 9 Oktober 2017 pukul 11:41, alexirae [email protected] menulis:

Apakah ada kemungkinan untuk memiliki whl yang berfungsi dengan CUDA 9 dan cuDNN 7.0?

Terima kasih!


Anda menerima ini karena Anda disebutkan.
Balas email ini secara langsung, lihat di GitHub
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-335249979 ,
atau matikan utasnya
https://github.com/notifications/unsubscribe-auth/AWZeskJ5LXJwFcRpm-sKZ9QORoltrHOEks5sqmj1gaJpZM4OuRL7
.

@tfboyd Terima kasih atas balasan Anda. Akhirnya saya berhasil membangun TF terbaru dari sumber dengan dukungan CUDA 8 + cuDNN 7 di Ubuntu 16.04 dan semuanya berfungsi dengan baik di GTX 1080 Ti.

@tfboyd Apakah 14.rc TF mendukung CuDNN 7 dan CUDA 9?

Itu disertakan jika Anda membangun dari sumber. Saya ingin mengubah default
binari yang mengharuskan saya menjalankan beberapa tes regresi pada K80 di AWS untuk
pastikan semuanya terlihat bagus serta dapatkan build yang dibuat. Kita
segera mengalami masalah karena driver NVIDIA membutuhkan penurunan kinerja
di Kokoro berjalan di Google Cloud sebesar 30%. Tidak ada yang lurus
maju, tetapi CUDA 9 dan cuDNN 7 berada di sumber 1,4 dan memiliki seperti yang diharapkan di
tes yang sangat terbatas pada Pascal bagi saya.

Pada Kam, 12 Okt 2017 jam 02:40, Konstantin [email protected]
menulis:

@tfboyd https://github.com/tfboyd Apakah 14.rc TF mendukung CuDNN 7 dan
KUDA 9?


Anda menerima ini karena Anda disebutkan.
Balas email ini secara langsung, lihat di GitHub
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-336075883 ,
atau matikan utasnya
https://github.com/notifications/unsubscribe-auth/AWZesq03dvnXWd0GLXODBTNCWExlZGPnks5srd6pgaJpZM4OuRL7
.

Apakah ada kemungkinan untuk memiliki whl yang berfungsi dengan CUDA 9, cuDNN 7.0 dan python 3.5?

Setelah TF 1.4 diselesaikan, build malam akan dipindahkan ke CUDA 9 +
cuDNN 7 dengan asumsi tidak ada masalah. Build yang saya buat dan bagikan untuk bersenang-senang adalah
selalu python 2.7 karena itu adalah default pada sistem pengujian saya.

Pada Mon, 16 Oktober 2017 di 06:59, Diego Stalder [email protected]
menulis:

Apakah ada kemungkinan untuk memiliki whl yang berfungsi dengan CUDA 9, cuDNN 7.0 dan
piton 3.5?


Anda menerima ini karena Anda disebutkan.
Balas email ini secara langsung, lihat di GitHub
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-336894073 ,
atau matikan utasnya
https://github.com/notifications/unsubscribe-auth/AWZesqgclWqET4OufQHV3FAD4XxgnZiKks5ss2E6gaJpZM4OuRL7
.

Tanggal rilis yang diharapkan?

Semua yang mengunyah sedikit, cukup buat #master dari sumber. Ini tidak terlalu sulit (hanya memakan waktu), Anda mendapatkan CUDA/cuDNN terbaru, _dan_ optimasi tambahan melalui instalasi pip/whl (misalnya, lihat optimasi CPU di tut ini ). Ditambah waktu berikutnya CUDA/cuDNN meningkatkan, Anda dapat membangun lagi tanpa harus menunggu.

membangun dari sumbernya, TF1.4 bekerja dengan cuda 9.0, cuDNN v7.0.3 dan python3.5

Bisakah saya membangun dari sumber di platform win10?
Ingin TF bekerja pada cuda 9.0, cuDNN v7, python3. 6 , dan menang10

Membangun dari sumbernya, TF1.4 bekerja dengan cuda 9.0, cuDNN v7.0.3 dan python2.7 juga.

@affromero Apakah Anda memiliki masalah dengan jsoncpp secara kebetulan?

Saya melakukan pengujian tf_cnn_benchmarks pada bangunan AWS dari cabang TF 1.4RC0 dengan CUDA 9 / cuDNN 7 dan hasilnya sama atau sedikit lebih cepat dari CUDA 8 + cuDNN 6.

Sunting: hapus penyebutan Saya tidak menanggapi komentar elipeters. :-)

@elipeters

Ketika kami mengatakan membangun yang kami maksud adalah membangun dari sumber bukan menginstal file roda. Sebuah roda telah dikompilasi dan 1.4 binari mendukung CUDA 8 + cuDNN 6. Untuk mendapatkan CUDA 9 Anda perlu membangun dari sumber. Saya belum pernah membuat windows build. Setelah 1.4 dikirimkan, tim akan mengalihkan build malam ke CUDA 9.

Ada kandidat rilis ke-2 (rc1) untuk 1.4 sebagai roda yang telah dikompilasi sebelumnya ( https://pypi.python.org/pypi/tensorflow ). Adakah yang mengujinya dengan CUDA 9?

Mencoba, tetapi tidak dengan cuda 9.0 yang berfungsi.

Aku akan mencoba lagi.

1.4 adalah CUDA 8 + cuDNN 6 ini tidak akan berfungsi dengan CUDA 9 Anda harus mengkompilasi dari sumber
setelah 1.4 dirilis, kami akan bekerja untuk mengalihkan build malam ke CUDA 9 dan kemudian 1.5 kemungkinan besar akan menjadi CUDA 9.

Saya tahu CUDA 9 berfungsi dengan baik saat membuat 1.4 dari sumber (ubuntu 16.04/python 2) karena saya melakukan benchmark di AWS akhir pekan lalu.

Saya memiliki resep terbaru untuk membangun dari sumber di sini (harap posting tautan ke roda CUDA 9.0 Anda di sana juga setelah Anda membuatnya)

Anda adalah Yaroslavia terbaik.

Pada hari Rabu, 25 Okt 2017 jam 8:11 pagi, Yaroslav Bulatov [email protected]
menulis:

Saya punya resep terbaru tentang membangun dari sumber di sini
https://github.com/yaroslavvb/tensorflow-community-wheels (silakan posting
tautan ke roda CUDA 9.0 Anda di sana juga setelah Anda membuatnya)


Anda menerima ini karena Anda disebutkan.
Balas email ini secara langsung, lihat di GitHub
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-339361959 ,
atau matikan utasnya
https://github.com/notifications/unsubscribe-auth/AWZesmRwb0UmLWxzANWCq5RrT6teYtr5ks5sv0-IgaJpZM4OuRL7
.

halo, saya mencoba membangun tensorflow gpu dengan win10 env, kemudian saya juga bertemu dengan masalah ini, adakah yang bisa membantu saya, terima kasih dulu.
lingkungan saya
win10 + gtx 1080ti + cuda 9.0 + cuDNN 7 + profesi studio visual 2015 + cmake 3.6.3 + python 3.5.4

ketika saya beralih ke tensorflow r1.4,dan membangun dengan cmake di lingkungan win10,masalah itu terjadi:

`CUSTOMBUILD : Kesalahan internal : pernyataan gagal di: "C:/dvs/p4/build/sw/rel/gpu_drv/r384/r384_00/drivers/compiler/edg/EDG_4.12/src/lookup.c", baris 2652 [ C:\TF\tensorflow\tensorflow\contrib\cmake\build\tf_core_gpu_kernels.vcxproj]

1 kesalahan besar terdeteksi dalam kompilasi "C:/Users/ADMINI~1/AppData/Local/Temp/tmpxft_00000c94_00000000-8_adjust_contrast_op_gpu.cu.cpp4.ii".

Kompilasi dibatalkan.

sesuaikan_contrast_op_gpu.cu.cc

CUSTOMBUILD : nvcc error : 'cudafe++' mati dengan status 0xC0000409 [C:\TF\tensorflow\tensorflow\contrib\cmake\build\tf_core_gpu_kernels.vcxproj]

CMake Error di tf_core_gpu_kernels_generated_adjust_contrast_op_gpu.cu.cc.obj.Release. cmake:267 (pesan):
Kesalahan menghasilkan file
C:/TF/tensorflow/tensorflow/contrib/cmake/build/CMakeFiles/tf_core_gpu_kernels.dir/__/__/core/kernels/Release/tf_core_gpu_kernels_generated_adjust_contrast_op_gpu.cu.cc.obj`
image

masalah di atas terlihat seperti masalah cuda compolie itu sendiri, tetapi ketika saya mengganti versi tensorflow ke r1.3 masalah lain muncul:

`c:\tftest\tensorflow\tensorflow\contrib\cmake\build\external\eigen_archive\eigen\src/Core/util/Macros.h(416): kesalahan fatal C1017:
[C:\TFtest\tensorflow\tensorflow\contrib\cmake\build\tf_core_gpu_kernels.vcxproj]

CMake Error di tf_core_gpu_kernels_generated_adjust_contrast_op_gpu.cu.cc.obj.Release. cmake:267 (pesan):
Kesalahan menghasilkan file
C:/TF/test/tensorflow/tensorflow/contrib/cmake/build/CMakeFiles/tf_core_gpu_kernels.dir/__/__/core/kernels/Release/tf_core_gpu_kernels_generated_adjust_contrast_op_gpu.cu.cc.obj`
image

sepertinya file adjust_contrast_op_gpu.cu.cc memiliki beberapa masalah, tetapi saya tidak dapat menemukan kesalahan apa pun darinya.

masalah seperti di atas mengganggu saya beberapa hari, berharap seseorang membantu saya melakukan percobaan ini dan sukses, dan sangat mengharapkan peningkatan google tensorflow mendukung cuda 9.0 dan cudnn 7 di lingkungan win10.

Adakah yang merilis whl untuk TensorFlow dengan CUDA 9 dan cuDNN 7.0?

@vellamike Saya tahu pertanyaan Anda umum, tetapi tim TF akan memiliki CUDA 9 di binari dengan 1,5 yang seharusnya mendarat di Q4. Untuk saat ini, Anda harus membangun dari sumber.

Saya mencoba membangun 1.4 dengan CUDA 9 dan cuDNN 7 di mac 10.13 high sierra. Saya terus mendapatkan kesalahan ini

ERROR: /Users/smitshilu/tensorflow/tensorflow/core/kernels/BUILD:2948:1: output 'tensorflow/core/kernels/_objs/depthwise_conv_op_gpu/tensorflow/core/kernels/depthwise_conv_op_gpu.cu.pic.o' was not created.
ERROR: /Users/smitshilu/tensorflow/tensorflow/core/kernels/BUILD:2948:1: not all outputs were created or valid.
Target //tensorflow/tools/pip_package:build_pip_package failed to build

Ada solusi untuk ini?

Mengapa 1.4 masih tidak memiliki CUDA 9 di binari? Versi ini dirilis sudah lama dan untuk digunakan dengan bangunan V100 dari sumber diperlukan yang tidak begitu lancar dan cepat mengikuti sejumlah masalah yang dilaporkan.

@ViktorM Masalah apa yang Anda kompilasi dari sumber? Itu agak rumit tapi tidak terlalu sulit.

26-SEP-2017 adalah GA untuk CUDA 9. Jika kami merilis binari CUDA 9 + cuDNN 7 di Q4 saya pikir ini akan menjadi yang tercepat yang kami upgrade cuDNN. Saya tidak di sini selama 8,5 hingga 9 jadi saya tidak tahu. Saya ingin kita pergi sedikit lebih cepat tetapi ini juga berarti siapa pun dengan pengaturan CUDA 8 harus memutakhirkan tidak hanya ke CUDA 9 tetapi mereka juga perlu memutakhirkan driver perangkat mereka ke 384.x, yang dapat saya katakan bukan sesuatu yang produksi orang anggap enteng.

Idealnya kita akan memiliki build yang tak terbatas (atau hanya beberapa lagi tetapi matriksnya meledak dengan cepat), tetapi itu adalah masalah lain yang akan membutuhkan waktu lama untuk dijelaskan dan saya ragu banyak orang yang peduli.

BTW, saya mengamati 85 T ops/detik dengan CUDA 9 pada float16 matmul/V100 menggunakan wadah NGC TensorFlow Nvidia (berlawanan dengan 8,8 T ops/s pada GTX 1080 saya di rumah). Sangat menantikan peningkatan ini dalam versi yang didukung secara resmi!

@yaroslavvb Dengan sangat jujur, kami sedang menangani beberapa masalah FP16. Ada jalur di tf_cnn_benchmarks untuk FP16 dan fokusnya adalah pada ResNet50 terlebih dahulu dan kami juga sedang mengerjakan penskalaan otomatis untuk FP16. Anda dapat mencobanya jika Anda tertarik tetapi kami secara aktif mengatasi beberapa masalah. Orang-orang ada di dalamnya dan itu hanya membutuhkan waktu. Kami akhirnya memiliki DGX-1 di rumah sehingga kami juga dapat bermain dengan wadah yang sama dan mencoba untuk melacak kinerja pada platform yang tepat untuk bergerak maju.

Ok, Jadi saya akan menginstal Ubuntu 17.10 dan saya hanya ingin mencoba semua hal terbaru untuk bersenang-senang.
Sebelum saya melakukannya, saya hanya ingin tahu apakah ada yang mencoba membangun tumpukan di bawah ini dari sumber dan mendapat keberuntungan?

-> Ubuntu 17.10, CUDA 9.0, cuDNN 7.0, TF master
-> Ubuntu 17.10, CUDA 8.0, cnDNN 6.1, TF 1.4

Saya mengalami masalah yang sama dengan @xsr-ai, khususnya menggunakan Python 3.6.3, VS 2017, CUDA 9, cuDNN 7.

@aluo-x Maksud Anda, Anda mencoba di Windows 10? Dengan asumsi karena Anda mengatakan VS 2017.

Ya itu benar. Inilah kesalahan spesifiknya:

CustomBuild:
  Building NVCC (Device) object CMakeFiles/tf_core_gpu_kernels.dir/__/__/core/kernels/Release/tf_core_gpu_kernels_generated_adjust_contrast_op_gpu.cu.cc.obj
  CMake Error at tf_core_gpu_kernels_generated_adjust_contrast_op_gpu.cu.cc.obj.Release.cmake:222 (message):
    Error generating
    C:/optimae/tensorflow-1.4.0/tensorflow/contrib/cmake/build/CMakeFiles/tf_core_gpu_kernels.dir/__/__/core/kernels/Release/tf_core_gpu_kernels_generated_adjust_contrast_op_gpu.cu.cc.obj


C:\Program Files (x86)\Microsoft Visual Studio\2017\BuildTools\Common7\IDE\VC\VCTargets\Microsoft.CppCommon.targets(171,5): error MSB6006: "cmd.exe" exited with code 1. [C:\optimae\tensorflow-1.4.0\
tensorflow\contrib\cmake\build\tf_core_gpu_kernels.vcxproj]

@aluo-x Apakah Anda menggunakan c-make terbaru? yaitu Rilis kandidat atau rilis stabil?

Menggunakan cmake 3.9.5, swig 3.0.12, CUDA 9.0.176, cuDNN 7.0.3. VS 2017 19.11.25547.

@aluo-x Bahkan saya tidak beruntung dengan c-make. Tapi bisakah kamu mencoba membangun dengan Bazel?

@smitshilu Jika saya tidak salah, Anda mendapatkan kesalahan tentang penyelarasan, bukan? Mirip dengan yang dijelaskan di sini untuk pytorch: https://github.com/pytorch/pytorch/issues/2692

Saya mencoba menerapkan solusi yang sama, yaitu menghapus semua ___align__(sizeof(T))_ dari file yang bermasalah:
_tensorflow/core/kernel/concat_lib_gpu_impl.cu.cc_
_tensorflow/core/kernels/depthwise_conv_op_gpu.cu.cc_
_tensorflow/core/kernels/split_lib_gpu.cu.cc_

Saya tidak yakin apakah ini menyebabkan masalah, tetapi sejauh ini tampaknya berfungsi dengan baik. Dan dari apa yang saya pahami, runtime akan selalu menggunakan penyelarasan tetap 16 untuk memori bersama.

Untuk orang-orang yang tertarik, kami telah mengunggah roda CUDA 9. Tidak perlu membangun sendiri! https://github.com/mind/wheels/releases/tag/tf1.4-gpu-cuda9

Ubuntu 17.10, CUDA 9, CuDNN 7, Python 3.6, bazel 0.7.0 + TF dari sumber (master).

Ikuti instruksi seperti dalam jawaban ini untuk mengaktifkan dan menjalankan CUDA:
https://askubuntu.com/questions/967332/how-can-i-install-cuda-9-on-ubuntu-17-10

Catatan, Anda mungkin ingin menggunakan perintah ini sebagai gantinya untuk versi 64 bit:

sudo ln -s /usr/bin/gcc-6 /usr/local/cuda-9.0/bin/gcc 
sudo ln -s /usr/bin/g++-6 /usr/local/cuda-9.0/bin/g++ 
sudo ./cuda_9.0.176_384.81_linux-run --override

Untuk menginstal Tensorflow Anda perlu

  1. Sebelum mengkompilasi TF: konfigurasikan variabel jalur dengan benar (jalur dari halaman NVIDIA tidak berfungsi untuk saya):
export PATH=/usr/local/cuda-9.0/bin:${PATH}
export LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:/usr/local/cuda-9.0/lib64
  1. Sebelum kompilasi: Konfigurasikan bazel untuk menggunakan versi gcc yang sama seperti selama instalasi CUDA:
sudo update-alternatives --remove-all g++
sudo update-alternatives --remove-all gcc
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-6 10
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-6 10
  1. Saat mengikuti instruksi TF setelah Anda mendapatkan catatan langkah pembuatan bazel, Anda akan memerlukan flag tambahan untuk dikompilasi dengan versi gcc yang lebih tinggi dari 4.*:
    bazel build --config=opt --config=cuda --cxxopt="-D_GLIBCXX_USE_CXX11_ABI=0" //tensorflow/tools/pip_package:build_pip_package

@alexbrad Saya mengalami masalah yang sama dalam membangun GPU Mac dengan CUDA 9, cuDNN 7. Solusi ini juga berfungsi untuk saya dan sejauh ini saya belum mengalami masalah menggunakan TF.
Perubahan sumber dan roda: https://github.com/nathanielatom/tensorflow/releases/tag/v1.4.0-mac

Ubuntu 16.04, TensorFlow 1.4 dengan CUDA 9.0 dan cuDNN 7.0.3 sudah diinstal dan diuji:

Instal Tensorflow 1.4 dari Sumber

cd ~/Downloads
git clone https://github.com/tensorflow/tensorflow
cd tensorflow
git checkout r1.4
  • Konfigurasi untuk versi CUDA: 9.0
  • Konfigurasi untuk versi cuDNN: 7.0.3
  • Dapatkan kemampuan komputasi Anda dari https://developer.nvidia.com/cuda-gpus
  • Saya mengatur ini ke 6.1 karena saya memiliki GeForce GTX 1070
  • Konfigurasikan opsi lain yang sesuai

./configure

Memasang Bazel

sudo add-apt-repository ppa:webupd8team/java
sudo apt-get update && sudo apt-get install oracle-java8-installer
echo "deb [arch=amd64] http://storage.googleapis.com/bazel-apt stable jdk1.8" | sudo tee /etc/apt/sources.list.d/bazel.list
curl https://bazel.build/bazel-release.pub.gpg | sudo apt-key add -
sudo apt-get update && sudo apt-get install bazel
sudo /sbin/ldconfig -v

Membangun TensorFlow

bazel build --config=opt --config=cuda //tensorflow/tools/pip_package:build_pip_package --cxxopt="-D_GLIBCXX_USE_CXX11_ABI=0
bazel-bin/tensorflow/tools/pip_package/build_pip_package /tmp/tensorflow_pkg
pip install /tmp/tensorflow_pkg/tensorflow-1.4.0-cp36-cp36m-linux_x86_64.whl

Nama file roda tensorflow di atas mungkin berbeda
Hanya ls /tmp/tensorflow_pkg untuk memeriksa

Langkah-langkah penginstalan untuk Mac 10.13, CUDA 9 dan tensorflow 1.4 https://Gist.github.com/smitshilu/53cf9ff0fd6cdb64cca69a7e2827ed0f

Adakah yang bisa memberi tahu saya, bagaimana saya bisa membuat paket tensorflow whl dari sumber untuk windows di linux (Ubuntu 16.04) dengan bazel? Itu mungkin untuk versi 1.2 jika saya benar. Terima kasih.

@ValeryPiashchynski Anda dapat mengikuti langkah-langkah ini https://www.tensorflow.org/install/install_sources

@smitshilu Terima kasih atas jawabannya. Saya dapat membuat paket roda di Ubuntu mengikuti langkah-langkah ini dan semuanya berfungsi dengan baik di Ubuntu. Tetapi saya tidak dapat menginstal paket whl itu di OS Windows (ada kesalahan: tidak mendukung roda). Jadi pertanyaan saya adalah bagaimana saya bisa membangun paket di Ubuntu yang kemudian dapat saya instal di Windows?

~ @ValeryPiashchynski Saya rasa itu tidak mungkin.~

(mengeluarkannya karena komentar di bawah menyarankan sebaliknya)

Pembuatan silang di Ubuntu untuk Windows harus dimungkinkan suatu hari nanti melalui dentang. Ini mungkin akan membutuhkan banyak perbaikan, karena binari Windows saat ini dibuat dengan MSVC. Pada dasarnya saya menanyakan pertanyaan yang sama ketika berbicara langsung dengan @gunan Senin lalu. Haruskah ini bercabang menjadi masalah GH sendiri, karena tidak ada hubungannya secara langsung dengan CUDA?

Kompilasi silang dimungkinkan dengan bazel tetapi tidak yakin bagaimana melakukannya di tensorflow. Sebagai referensi
https://github.com/bazelbuild/bazel/wiki/Building-with-a-custom-toolchain
https://github.com/bazelbuild/bazel/issues/1353

Adakah yang tahu jika build tensorflow 1.5 nightly yang diposting di sini (win10 build) memiliki dukungan CUDA9+CuDNN7?
https://pypi.python.org/pypi/tf-nightly-gpu/1.5.0.dev20171115

Sebagai tambahan, sangat tidak bertanggung jawab untuk menutup tiket ini serta #14126 hanya karena Anda mengatakan "Ini akan dirilis dengan TF 1.5". MXNET 0.12 sudah memiliki CUDA9 FP16 dalam produksi. Tensorflow dan CNTK harus cepat. Hal ini tidak hanya menguntungkan bagi Volta.

Belum, kami sedang berupaya meningkatkan infra build kami untuk CUDA 9.
Kami bertujuan untuk memiliki paket pip dengan CUDA 9 sebelum akhir minggu ini.

saya memiliki dua komputer, dan kemarin saya menginstal 1080ti dan menginstal semuanya (cuda8 dan cudnn6) driver grafis baru, visual studio 2015
saya membandingkan waktu zaman 1080ti vs 980ti
dan saya melihat 1080ti menjalankan setiap zaman dalam 22 menit tetapi 980ti berjalan dalam 13 menit !!!(batch=60 untuk 1080 vs batch=20untuk 980ti)
mengapa 1080ti bekerja lebih lambat dari 980ti !!!! dan bagaimana saya bisa memeriksa apa yang salah?!

Apa waktu berjalan jika Anda menggunakan 20 batch untuk 1080Ti?

@gunan , hanya ingin tahu apakah ada ETA baru untuk ini?

@smitshilu
di 1080ti dengan 20 batch = 26 menit
dan dengan 60batch = 19 menit
di 980gtx dengan batch 20 = 14 menit !!!!
saya menggunakan windows, instal driver versi terakhir dengan cuda 8 dan cudnn 6
bagaimana saya bisa mengetahui mengapa ini berjalan lebih lambat dari 980?

@nasergh Apakah Anda memiliki GTX 1080ti dan 980ti di SLI?

@vickylance
Tidak
dua komputer yang berbeda!
keduanya adalah hard disk cori7 dan 1TB dan saya memuat gambar data dari HDD sata 1TB
tetapi di 980 saya memiliki windows di hard disk SSD
saya mencoba versi driver yang berbeda hal terakhir yang saya periksa 388.13 diunduh dari situs web asus dengan CUDA 8 dan cudnn 6
saya tidak tahu yang mana dari ini alasannya
1- jendela! mungkin itu bekerja lebih baik di linux
2- kecepatan HDD
3- 1080TI palsu
4- CUDA dan cudnn tidak kompatibel dengan 1080ti
5- CPU (CPU pada komputer 1080TI lebih kuat dari 980)
apa yang Anda sarankan ?

@nasergh
1) Apakah RAMnya sama? jika begitu. Saya tidak yakin apakah itu akan sangat mempengaruhi tetapi periksa apakah MHz dari RAM juga sama di kedua sistem.
2) Periksa % pemanfaatan GPU saat berjalan pada 980ti dan 1080ti. Gunakan alat ini jika Anda ingin memeriksa penggunaan GPU. https://docs.microsoft.com/en-us/sysinternals/downloads/process-explorer Ada yang lebih baik di luar sana, tetapi inilah yang muncul di kepala saya.
3) Jika Anda ingin mendapatkan kinerja terbaik, saya sarankan menginstal Ubuntu16.04 sebagai dual boot pada sistem 1080ti Anda dan menggunakan CUDA 9.0 dan cuDNN 7.0
4) Juga windows membutuhkan banyak sumber daya sistem itu sendiri, jadi menjalankannya pada SSD pasti memberikan keunggulan, tetapi tidak sebesar itu seperti yang terlihat dalam skenario pengujian Anda.

Mungkin itu adalah arsitektur papan yang dipilih.
TF dikonfigurasi secara default untuk 3.0, 3.5 dan 5.2; sementara 1080TI adalah 6.1 (Pascal) sedangkan 980 adalah 5.2 (Maxwell) menurut https://en.wikipedia.org/wiki/CUDA#GPUs_supported.
Mungkin downgrade ke 3.0 atau 5.2 tidak efisien pada 1080TI, sementara itu asli untuk 980?
Coba komputasi dengan kedua kemampuan 5.2 dan 6.1 (lihat CMakeLists.txt l.232 dan l.246)

De : nasergh [mailto:[email protected]]
Utusan : mercredi 22 novembre 2017 17:17
: tensorflow/tensorflow
Cc : sylvain-bougnoux; manual
Objek : Re: [tensorflow/tensorflow] Upgrade ke CuDNN 7 dan CUDA 9 (#12052)

@vickylance
Tidak
dua komputer yang berbeda!
keduanya adalah hard disk cori7 dan 1TB dan saya memuat gambar data dari HDD sata 1TB
tetapi di 980 saya memiliki windows di hard disk SSD
saya mencoba versi driver yang berbeda hal terakhir yang saya periksa 388.13 diunduh dari situs web asus dengan CUDA 8 dan cudnn 6
saya tidak tahu yang mana dari ini alasannya
1- jendela! mungkin itu bekerja lebih baik di linux
2- kecepatan HDD
3- 1080TI palsu
4- CUDA dan cudnn tidak kompatibel dengan 1080ti
apa yang Anda sarankan ?

Anda menerima ini karena Anda berlangganan utas ini.
Balas email ini secara langsung, lihat di GitHub, atau matikan utasnya.

lingkungan: cuda9.0+cudnn7.0+tf1.4,dan saya menemukan kesalahan ketika saya menjalankan contoh "ptb", TypeError: __init__() mendapat argumen kata kunci yang tidak terduga 'input_size', 'input_size' adalah parameter dari CudnnLSTM

setelah menonton utas ini selama berbulan-bulan saya akan mencobanya di linux Gentoo

saya punya asus strix 1080ti
1- di ubunto saya dapat menggunakan driver di situs web nvidia atau saya harus mengunduh dari asus (karena saya tidak melihat driver untuk linux di situs web asus)
2- versi terakhir ok atau saya harus menginstal 378.13 karena saya melihat di sebagian besar komentar mereka mengatakan menggunakan 378.13?
Terima kasih

Bagi mereka yang menggunakan Windows, saya baru saja mengunggah TF 1.4.0 yang dibuat dengan CUDA 8.0.61.2, cuDNN 7.0.4, Python 3.6.3, dengan dukungan AVX ke repo saya . Semoga ini cukup sampai CUDA 9 diselesaikan di Windows.

saya mencoba menginstal CUDA9 dan cudnn 7 di ubuntu 16.04 dan python 3.6
tapi aku gagal :(
saya mencoba semuanya, mencari di mana-mana tetapi masih memberikan kesalahan yang sama "importError: libcublas.so.8.0 tidak dapat membuka file objek bersama: tidak ada file atau direktori seperti itu
saya pikir tensor ingin menjalankan CUDA8
bagaimana saya bisa memberitahu dia untuk menggunakan cuda9 ?!!!! jika jawaban dijalankan dari sumber bagaimana tepatnya? saya tidak melihat situs web yang sangat jelas tentang pembuatan dari sumber
Terima kasih

Anda harus menginstal tf dari source@nasergh

@denganku6696
bagaimana saya bisa menginstalnya dari sumber?

saya tahu saya dapat mengunduh salah satu dari ini
https://github.com/mind/wheels/releases
tapi saya tidak tahu download yang mana dan bagaimana cara menginstalnya!?

@nasergh lihat README kami untuk cara menginstal. Jika Anda tidak keberatan menginstal MKL, Anda dapat melakukannya

pip --no-cache-dir install https://github.com/mind/wheels/releases/download/tf1.4-gpu-cuda9-37/tensorflow-1.4.0-cp36-cp36m-linux_x86_64.whl

Jika Anda tidak ingin menginstal MKL, Anda dapat melakukannya

pip --no-cache-dir install https://github.com/mind/wheels/releases/download/tf1.4-gpu-cuda9-nomkl/tensorflow-1.4.0-cp36-cp36m-linux_x86_64.whl

Saya akan menggunakan masalah ini sebagai masalah pelacakan untuk dukungan CUDA 9.
Saat ini, ada dua pemblokir:
1 - https://github.com/tensorflow/tensorflow/pull/14770
2 - Di windows, sepertinya kami memiliki bug dengan NVCC. Membangun TF dengan CUDA9 tampaknya gagal dengan crash kompiler. NVIDIA membantu menyelidiki ini, dan setelah kami memiliki pembaruan, kami akan melanjutkan.

@danqing
Terima kasih
1- MKL seberapa meningkatkan kecepatan?
2- dalam versi tanpa MKL saya perlu menginstal MKL?!

untuk 1, lihat ini - perhatikan bahwa perhitungan yang dilakukan pada GPU tidak akan memiliki kecepatan yang jelas.

untuk 2, Anda tidak. pastikan Anda menginstal versi yang benar.

btw, ini adalah utas dengan banyak pelanggan. jika Anda memiliki masalah di masa mendatang dengan roda kami, silakan buka masalah di repo kami alih-alih berkomentar di bawah, jadi kami tidak mengirim spam ke banyak orang.

@Tweakmind : Saya tidak bisa melewati bagian ini:

Membangun TensorFlow

bazel build --config=opt --config=cuda //tensorflow/tools/pip_ package:build_pip_package --cxxopt="-D_GLIBCXX_USE_CXX11_ABI=0
bazel-bin/tensorflow/tools/pip_package/build_pip_package /tmp/tensorflow_pkg
instal pip /tmp/tensorflow_pkg/tensorflow-1.4.0-cp36-cp36m-linux_x86_64.whl

Baris pertama tampaknya tidak lengkap (tidak ada tanda kutip ganda)? Apakah ini tiga garis atau dua garis?

@goodmangu kode yang benar, menurut saya, adalah:

bazel build --config=opt --config=cuda //tensorflow/tools/pip_package:build_pip_package --cxxopt="-D_GLIBCXX_USE_CXX11_ABI=0"

Tanda kutip ganda hilang dari perintah.

Saya melewati bagian ini menggunakan skrip di sini , tetapi diblokir oleh beberapa kesalahan kompiler cuda di https://github.com/tensorflow/tensorflow/issues/15108

Terima kasih teman-teman. Dihargai ini. Saya membuatnya bekerja pada hari yang sama dengan menggunakan biner Linux build malam sebagai gantinya. Lihat: https://github.com/tensorflow/tensorflow
Sekarang menjalankan 3 GTX 1080 Tis dengan Keras. Dingin!

Menghabiskan dua hari terakhir mencoba membangun Tensorflow dari sumber (r1.4) untuk MacBook Pro saya dengan eGPU. Driver bekerja, dengan Cuda 8.0, cuDNN 6.0, Mac OSX Sierra 10.12. Sangat dekat dengan akhir, tetapi diblokir oleh beberapa kesalahan build setelah 20 menit. Adakah yang beruntung sejauh ini? Adakah paket yang berhasil dibuat yang dapat Anda bagikan? Terima kasih sebelumnya.

@goodmangu Bisakah Anda menentukan "binari Linux build malam" mana yang Anda gunakan?

Tentu, yang ini: tf_nightly_gpu-1.head-cp27-none-linux_x86_64.whl

Masih tidak ada dukungan Windows 10 untuk Cuda 9.0 + cuDNN 7.0? Hanya memverifikasi.
GPU Tensorflow 1.4.0

@goodmangu Saya mencoba dengan 1.4 tetapi OSX 10.13 dan CUDA 9 cuDNN 7. Anda dapat menemukan langkah-langkahnya di sini

@eeilon79 ada bug nvcc di windows yang mencegah kita membangun binari. Kami mendapatkan bantuan dari nvidia untuk memperbaiki masalah tersebut.

Apakah ada pembaruan untuk CUDA 9 di Tensorflow Nightly Version (1.5-dev) di bawah paket pip tf-nightly-gpu ? Perlu menggunakan 1,5 ini untuk CuDNNLSTM di Keras

OK, PR baru saja digabungkan.
Dalam waktu sekitar 10-12 jam nightlies baru kami harus dibangun dengan cuda9, kecuali untuk windows.
Di windows, kami masih diblokir oleh bug NVCC.

Saya menyelesaikan paket CUDA 9 dan CUDANN 7 umum untuk sistem Gentoo dan mencoba tes dummy dan sepertinya bekerja dengan dummy import tensorflow sebagai tf di python, tetapi saya perlu melakukan tes tambahan:

Saya menggunakan komit: c9568f1ee51a265db4c5f017baf722b9ea5ecfbb

Di windows, kami masih diblokir oleh bug NVCC.

Maukah Anda memposting tautan di sini untuk masalah itu? Terima kasih sebelumnya!

@smitshilu Artikel Anda membantu saya.
Dan saya menulis artikel dengan beberapa elemen yang ditambahkan.
https://github.com/masasys/MacTF1.4GPU

@arbynacosta
saya berlari
bazel build --config=opt --config=cuda //tensorflow/tools/pip_ package:build_pip_package --cxxopt="-D_GLIBCXX_USE_CXX11_ABI=0"
tapi saya mendapatkan kesalahan ini
Kesalahan : perintah build hanya didukung dari dalam ruang kerja.

saya juga mencoba tensor nightly tetapi memberikan kesalahan
atributerror : modul 'tensorflow' tidak memiliki atribut ....
keluaran dir(tf)
['__doc__', '__loader__', '__name__', __package__' '__path__ __spec__]

Maaf @goodmangu , saya sedang pergi. Apakah Anda membuatnya bekerja? Saya memang melewatkan tanda kutip ganda penutup seperti yang ditunjukkan oleh @arbynacosta . Saya menjalankan ini di bawah Ubuntu 17.10 sekarang dengan CUDA 9.0 dan cuDNN 7.0.4. Saya dapat mengerjakan build MacOS jika diperlukan. Saya menebus Win10 dan MacOS tetapi dapat mengerjakannya akhir pekan ini jika orang membutuhkannya.

@nasergh , apakah Anda menjalankan perintah itu dari dalam direktori tensorflow yang dikloning. Pastikan WORKSPACE ada di direktori.

Sebagai contoh:

~/Downloads/tensorflow$ ls
ACKNOWLEDGMENTS     bazel-bin         bazel-testlogs      configure          LICENSE       tensorflow   WORKSPACE
ADOPTERS.md         bazel-genfiles    BUILD               configure.py       models.BUILD  third_party
arm_compiler.BUILD  bazel-out         CODE_OF_CONDUCT.md  CONTRIBUTING.md    README.md     tools
AUTHORS             bazel-tensorflow  CODEOWNERS          ISSUE_TEMPLATE.md  RELEASE.md    util

@Tweakmind
saya menjalankan perintah
sudo su
dan kemudian goto folder tensorflow (ada file ruang kerja di sana)
tapi saya mendapatkan kesalahan ini

root<strong i="10">@pc</strong>:/home/pc2/tensorflow# bazel build --config=opt --config=cuda //tensorflow/tools/pip_package:build_pip_package --cxxopt="-D_GLIBCXX_USE_CXX11_ABI=0"
..........
WARNING: Config values are not defined in any .rc file: opt
ERROR: /root/.cache/bazel/_bazel_root/cccfa03cbaf937d443248403ec70306e/external/local_config_cuda/crosstool/BUILD:4:1: Traceback (most recent call last):
    File "/root/.cache/bazel/_bazel_root/cccfa03cbaf937d443248403ec70306e/external/local_config_cuda/crosstool/BUILD", line 4
        error_gpu_disabled()
    File "/root/.cache/bazel/_bazel_root/cccfa03cbaf937d443248403ec70306e/external/local_config_cuda/crosstool/error_gpu_disabled.bzl", line 3, in error_gpu_disabled
        fail("ERROR: Building with --config=c...")
ERROR: Building with --config=cuda but TensorFlow is not configured to build with GPU support. Please re-run ./configure and enter 'Y' at the prompt to build with GPU support.
ERROR: no such target '@local_config_cuda//crosstool:toolchain': target 'toolchain' not declared in package 'crosstool' defined by /root/.cache/bazel/_bazel_root/cccfa03cbaf937d443248403ec70306e/external/local_config_cuda/crosstool/BUILD
INFO: Elapsed time: 6.830s
FAILED: Build did NOT complete successfully (2 packages loaded)
    currently loading: @bazel_tools//tools/jdk

@nasergh Pastikan Anda mengikuti semua petunjuk di sini:
https://www.tensorflow.org/install/install_sources

Jika Anda membangun dengan dukungan GPU, pastikan Anda mengonfigurasi dengan tepat.

Instal Tensorflow 1.4 dari Sumber.

cd $HOME/Downloads
git clone https://github.com/tensorflow/tensorflow
cd tensorflow
git checkout r1.4
./configure

Output sampel dan opsi akan berbeda dari yang ada di instruksi

  • Pastikan Anda mengonfigurasi untuk versi CUDA: 9.0
  • Pastikan Anda mengonfigurasi untuk versi cuDNN: 7.0.4
  • Pastikan Anda mengetahui kemampuan komputasi Anda dari https://developer.nvidia.com/cuda-gpus
  • Saya mengatur ini ke 6.1 karena saya memiliki GeForce GTX 1070

Memasang Bazel

sudo add-apt-repository ppa:webupd8team/java
sudo apt-get update && sudo apt-get install oracle-java8-installer
echo "deb [arch=amd64] http://storage.googleapis.com/bazel-apt stable jdk1.8" | sudo tee /etc/apt/sources.list.d/bazel.list
curl https://bazel.build/bazel-release.pub.gpg | sudo apt-key add -
sudo apt-get update && sudo apt-get install bazel
sudo /sbin/ldconfig -v

Membangun TensorFlow

bazel build --config=opt --config=cuda //tensorflow/tools/pip_package:build_pip_package --cxxopt="-D_GLIBCXX_USE_CXX11_ABI=0"
bazel-bin/tensorflow/tools/pip_package/build_pip_package /tmp/tensorflow_pkg
pip install /tmp/tensorflow_pkg/tensorflow-1.4.0-cp36-cp36m-linux_x86_64.whl

@Tweakmind : terima kasih telah

@Tweakmind
saya mengikuti dan juga mengonfigurasi file tetapi dikatakan

pc2<strong i="7">@pc</strong>:~/Downloads/tensorflow$ bazel build --config=opt --config=cuda //tensorflow/tools/pip_package:build_pip_package --cxxopt="-D_GLIBCXX_USE_CXX11_ABI=0"
ERROR: Skipping '//tensorflow/tools/pip_package:build_pip_package': error loading package 'tensorflow/tools/pip_package': Encountered error while reading extension file 'cuda/build_defs.bzl': no such package '@local_config_cuda//cuda': Traceback (most recent call last):
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 1042
        _create_local_cuda_repository(repository_ctx)
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 905, in _create_local_cuda_repository
        _get_cuda_config(repository_ctx)
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 662, in _get_cuda_config
        _cudnn_version(repository_ctx, cudnn_install_base..., ...)
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 360, in _cudnn_version
        _find_cudnn_header_dir(repository_ctx, cudnn_install_base...)
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 612, in _find_cudnn_header_dir
        auto_configure_fail(("Cannot find cudnn.h under %s" ...))
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 129, in auto_configure_fail
        fail(("\n%sCuda Configuration Error:%...)))

Cuda Configuration Error: Cannot find cudnn.h under /usr/lib/x86_64-linux-gnu
WARNING: Target pattern parsing failed.
ERROR: error loading package 'tensorflow/tools/pip_package': Encountered error while reading extension file 'cuda/build_defs.bzl': no such package '@local_config_cuda//cuda': Traceback (most recent call last):
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 1042
        _create_local_cuda_repository(repository_ctx)
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 905, in _create_local_cuda_repository
        _get_cuda_config(repository_ctx)
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 662, in _get_cuda_config
        _cudnn_version(repository_ctx, cudnn_install_base..., ...)
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 360, in _cudnn_version
        _find_cudnn_header_dir(repository_ctx, cudnn_install_base...)
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 612, in _find_cudnn_header_dir
        auto_configure_fail(("Cannot find cudnn.h under %s" ...))
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 129, in auto_configure_fail
        fail(("\n%sCuda Configuration Error:%...)))

Cuda Configuration Error: Cannot find cudnn.h under /usr/lib/x86_64-linux-gnu
INFO: Elapsed time: 0.082s
FAILED: Build did NOT complete successfully (0 packages loaded)
    currently loading: tensorflow/tools/pip_package

saya pikir saya menginstal cuda dan cudnn dengan benar
```
temukan /usr | grep libcudnn
/usr/share/doc/libcudnn7
/usr/share/doc/libcudnn7/hak cipta
/usr/share/doc/libcudnn7/NVIDIA_SLA_cuDNN_Support.txt
/usr/share/doc/libcudnn7/changelog.Debian.gz
/usr/share/lintian/override/libcudnn7
/usr/lib/x86_64-linux-gnu/libcudnn.so.7.0.4
/usr/lib/x86_64-linux-gnu/libcudnn.so.7

```

@goodmangu , saya akan mengerjakan build MacOS selama akhir pekan.

@nasergh , Apakah Anda menginstal cuDNN?

Berikut panduan saya untuk cuDNN termasuk sumber dan dokumen untuk menguji pemasangan:

Unduh file cuDNN 7.0.4

Anda harus masuk ke akun pengembang Nvidia di browser Anda

Periksa Setiap Hash

cd $HOME/Downloads
md5sum cudnn-9.0-linux-x64-v7.tgz && \
md5sum libcudnn7_7.0.4.31-1+cuda9.0_amd64.deb && \
md5sum libcudnn7-dev_7.0.4.31-1+cuda9.0_amd64.deb && \
md5sum libcudnn7-doc_7.0.4.31-1+cuda9.0_amd64.deb

Keluaran harus:

fc8a03ac9380d582e949444c7a18fb8d cudnn-9.0-linux-x64-v7.tgz
e986f9a85fd199ab8934b8e4835496e2 libcudnn7_7.0.4.31-1+cuda9.0_amd64.deb
4bd528115e3dc578ce8fca0d32ab82b8 libcudnn7-dev_7.0.4.31-1+cuda9.0_amd64.deb
04ad839c937362a551eb2170afb88320 libcudnn7-doc_7.0.4.31-1+cuda9.0_amd64.deb

Instal cuDNN 7.0.4 dan perpustakaan

tar -xzvf cudnn-9.0-linux-x64-v7.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
sudo dpkg -i libcudnn7_7.0.4.31-1+cuda9.0_amd64.deb
sudo dpkg -i libcudnn7-dev_7.0.4.31-1+cuda9.0_amd64.deb
sudo dpkg -i libcudnn7-doc_7.0.4.31-1+cuda9.0_amd64.deb

Memverifikasi cuDNN

Ubuntu 17.10 menyertakan versi 7+ dari kompiler GNU
CUDA tidak kompatibel dengan versi yang lebih tinggi dari 6
Kesalahan yang dikembalikan adalah:

kesalahan -- versi GNU tidak didukung! versi gcc lebih dari 6 tidak didukung!

Perbaiki - Instal Versi 6 dan buat tautan simbolis di direktori bin CUDA:

sudo apt-get install gcc-6 g++-6
sudo ln -sf /usr/bin/gcc-6 /usr/local/cuda/bin/gcc
sudo ln -sf /usr/bin/g++-6 /usr/local/cuda/bin/g++

Sekarang buat mnistCUDNN untuk menguji cuDNN

cp -r /usr/src/cudnn_samples_v7/ $HOME
cd $HOME/cudnn_samples_v7/mnistCUDNN
make clean && make
./mnistCUDNN

Jika cuDNN diinstal dengan benar, Anda akan melihat:

Tes lulus!

Dear @Tweakmind
cara Anda berhasil terima kasih atas bantuan Anda (saya mencoba memasang tensor selama lebih dari 3 minggu!!!)
masalahnya adalah saya menginstalnya di python3.6 dan sekarang saya punya masalah dengan paket PIL

Traceback (most recent call last):
  File "/home/pc2/venv/lib/python3.6/site-packages/keras/utils/data_utils.py", line 551, in get
    inputs = self.queue.get(block=True).get()
  File "/home/pc2/anaconda3/lib/python3.6/multiprocessing/pool.py", line 644, in get
    raise self._value
  File "/home/pc2/anaconda3/lib/python3.6/multiprocessing/pool.py", line 119, in worker
    result = (True, func(*args, **kwds))
  File "/home/pc2/venv/lib/python3.6/site-packages/keras/utils/data_utils.py", line 391, in get_index
    return _SHARED_SEQUENCES[uid][i]
  File "/home/pc2/venv/lib/python3.6/site-packages/keras/preprocessing/image.py", line 761, in __getitem__
    return self._get_batches_of_transformed_samples(index_array)
  File "/home/pc2/venv/lib/python3.6/site-packages/keras/preprocessing/image.py", line 1106, in _get_batches_of_transformed_samples
    interpolation=self.interpolation)
  File "/home/pc2/venv/lib/python3.6/site-packages/keras/preprocessing/image.py", line 345, in load_img
    raise ImportError('Could not import PIL.Image. '
ImportError: Could not import PIL.Image. The use of `array_to_img` requires PIL.

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
  File "<stdin>", line 7, in <module>
  File "/home/pc2/venv/lib/python3.6/site-packages/keras/legacy/interfaces.py", line 87, in wrapper
    return func(*args, **kwargs)
  File "/home/pc2/venv/lib/python3.6/site-packages/keras/models.py", line 1227, in fit_generator
    initial_epoch=initial_epoch)
  File "/home/pc2/venv/lib/python3.6/site-packages/keras/legacy/interfaces.py", line 87, in wrapper
    return func(*args, **kwargs)
  File "/home/pc2/venv/lib/python3.6/site-packages/keras/engine/training.py", line 2115, in fit_generator
    generator_output = next(output_generator)
  File "/home/pc2/venv/lib/python3.6/site-packages/keras/utils/data_utils.py", line 557, in get
    six.raise_from(StopIteration(e), e)
  File "<string>", line 3, in raise_from
StopIteration: Could not import PIL.Image. The use of `array_to_img` requires PIL.

saya mencoba memasang bantal tetapi tidak membantu
saya juga mencoba menginstal PIL tetapi

UnsatisfiableError: The following specifications were found to be in conflict:
  - pil -> python 2.6*
  - python 3.6*

@nasergh Apa yang Anda dapatkan dengan:

pip install pillow

Milik saya terlihat seperti:

~$ pip install pillow
Requirement already satisfied: pillow in ./anaconda3/lib/python3.6/site-packages

@nasergh , saya perlu crash tetapi saya akan check-in ketika saya bangun.

@goodmangu , saya tidak akan dapat melakukan pembuatan Mac selama akhir pekan karena saya tidak memiliki akses ke Mac Pro 2012 saya. Mudah-mudahan, Anda baik-baik saja dengan Ubuntu untuk saat ini. Saya tahu itu bekerja dengan baik untuk saya. Aku harus mendapatkannya kembali akhir pekan depan.

@Tweakmind - Terima kasih! , apakah Anda melihat peningkatan kinerja dengan CUDA 9 dan cuDNN 7?

Saya juga pikir beberapa langkah yang disebutkan oleh @Tweakmind di bawah ini berlebihan, Anda juga perlu:

tar -xzvf cudnn-9.0-linux-x64-v7.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

atau

sudo dpkg -i libcudnn7_7.0.4.31-1+cuda9.0_amd64.deb
sudo dpkg -i libcudnn7-dev_7.0.4.31-1+cuda9.0_amd64.deb
sudo dpkg -i libcudnn7-doc_7.0.4.31-1+cuda9.0_amd64.deb

@gunan
CUDA 9.1.85 baru saja dirilis beberapa saat yang lalu dengan CuDNN 7.0.5, dengan perbaikan bug kompiler nvcc. Saya ingin tahu apakah ini memungkinkan pengguna win10 mengkompilasi Tensorflow 1.4.1? Ini adalah tentang waktu.

Dari korespondensi kami dengan NVIDIA, saya tidak berpikir 9.1 memperbaiki masalah ini.
Namun, kami memiliki solusi. Pertama, kita membutuhkan PR ini untuk digabungkan menjadi eigen:
https://bitbucket.org/eigen/eigen/pull-requests/351/win-nvcc/diff

Kemudian kami akan memperbarui ketergantungan eigen kami, yang seharusnya memperbaiki semua build kami untuk CUDA9

pr ditolak tetapi tampaknya digabungkan secara manual. Apakah kita harus menunggu rilis eigen atau dibuat oleh sumbernya?

Keren, apakah akan ada di Nightly pip?

@Tweakmind
saya mencoba membangun kembali tensor dengan menggunakan python 2.7
tetapi di bazel build saya mendapatkan kesalahan ini
saya juga menginstal numpy tetapi tidak ada perubahan.

bazel build --config=opt --config=cuda //tensorflow/tools/pip_package:build_pip_package --cxxopt="-D_GLIBCXX_USE_CXX11_ABI=0"
ERROR: /home/gh2/Downloads/tensorflow/util/python/BUILD:5:1: no such package '@local_config_python//': Traceback (most recent call last):
    File "/home/gh2/Downloads/tensorflow/third_party/py/python_configure.bzl", line 310
        _create_local_python_repository(repository_ctx)
    File "/home/gh2/Downloads/tensorflow/third_party/py/python_configure.bzl", line 274, in _create_local_python_repository
        _get_numpy_include(repository_ctx, python_bin)
    File "/home/gh2/Downloads/tensorflow/third_party/py/python_configure.bzl", line 257, in _get_numpy_include
        _execute(repository_ctx, [python_bin, "-c",..."], <2 more arguments>)
    File "/home/gh2/Downloads/tensorflow/third_party/py/python_configure.bzl", line 76, in _execute
        _python_configure_fail("\n".join([error_msg.strip() if ... ""]))
    File "/home/gh2/Downloads/tensorflow/third_party/py/python_configure.bzl", line 37, in _python_configure_fail
        fail(("%sPython Configuration Error:%...)))
Python Configuration Error: Problem getting numpy include path.
Traceback (most recent call last):
  File "<string>", line 1, in <module>
**ImportError: No module named numpy**
Is numpy installed?
 and referenced by '//util/python:python_headers'
ERROR: Analysis of target '//tensorflow/tools/pip_package:build_pip_package' failed; build aborted: Loading failed
INFO: Elapsed time: 10.826s
FAILED: Build did NOT complete successfully (26 packages loaded)
    currently loading: tensorflow/core ... (3 packages)
    Fetching http://mirror.bazel.build/.../~ooura/fft.tgz; 20,338b 5s
    Fetching http://mirror.bazel.build/zlib.net/zlib-1.2.8.tar.gz; 19,924b 5s
    Fetching http://mirror.bazel.build/.../giflib-5.1.4.tar.gz; 18,883b 5s

Tampaknya OSX dikecualikan dalam versi 7.0.5 dari cuDNN. Ada yang tau detailnya?

Saya masih tidak bisa membuat tensorflow-gpu berfungsi di Windows 10 (dengan CUDA 9.0.176 dan cudnn 7.0).
Saya telah menghapus instalan tensorflow dan tensorflow-gpu dan menginstalnya kembali (dengan --no-cache-dir untuk memastikan pengunduhan versi terbaru dengan solusi eigen). Ketika saya menginstal keduanya, GPU saya tidak dikenali:

InvalidArgumentError (lihat di atas untuk traceback): Tidak dapat menetapkan perangkat untuk operasi 'random_uniform_1/sub': Operasi secara eksplisit ditetapkan ke / device:GPU :0 tetapi perangkat yang tersedia adalah [ / job:localhost/replica :0/ task:0/device : CPU:0 ]. Pastikan spesifikasi perangkat mengacu pada perangkat yang valid.

Ketika saya menginstal hanya tensorflow-gpu ia mengeluh tentang dll yang hilang:

ImportError: Tidak dapat menemukan 'cudart64_80.dll'. TensorFlow mengharuskan DLL ini dipasang di direktori yang dinamai dalam variabel lingkungan %PATH% Anda. Unduh dan instal CUDA 8.0 dari URL ini: https://developer.nvidia.com/cuda-toolkit

Yang aneh karena versi CUDA saya 9.0, bukan 8.0, dan dikenali (uji deviceQuery lulus).
Versi python saya adalah 3.6.3. Saya mencoba menjalankan kode ini di Spyder (3.2.4) untuk menguji tensorflow-gpu.
Apa yang saya lewatkan?

Saya mencoba membangun dari sumber dengan bazel di win 7, dapatkan kesalahan

Tidak ada toolcahin untuk cpu 'x64_windows'

Adakah yang bisa membangun whl?

@hadaev8 , saya butuh lebih banyak informasi untuk membantu. Saya dapat bekerja pada whl tetapi akan memiliki ketergantungan yang berat dan bukan Win7, setelah saya menyelesaikan MacOS, saya akan menyelesaikan Win10. Bagaimanapun, posting detail Anda.

@eeilon79 , saya perlu membuat ulang ini di bawah Win10. Saat ini saya fokus pada MacOS sekarang setelah Ubuntu diselesaikan. Saya akan kembali ke Win 10.

@nasergh , apakah ada persyaratan untuk python 2.7?

Dengan CUDA 8.0 dan cuDNN 6.0, beginilah cara saya menginstal TensorFlow dari sumber untuk dukungan Cuda GPU dan AVX2 di Win10::

Persyaratan:

* Windows 10 64-Bit
* Visual Studio 15 C++ Tools
* NVIDIA CUDA® Toolkit 8.0
* NVIDIA cuDNN 6.0 for CUDA 8.0
* Cmake
* Swig

Instal Pembaruan Edisi Komunitas Visual Studio 3 dengan Windows Kit 10.0.10240.0
Ikuti instruksi di: https://github.com/philferriere/dlwin (Terima kasih Phil)

Buat Virtual Drive N: untuk kejelasan
Saya sarankan membuat direktori dari C: atau drive pilihan Anda dan membuat N: berdasarkan instruksi ini (min 2GB):
https://technet.microsoft.com/en-us/library/gg318052 (v=ws.10).aspx

Instal Cuda 8.0 64-bit
https://developer.nvidia.com/cuda-downloads (Gulir ke bawah ke Legacy)

Instal cuDNN 6.0 untuk Cuda 8.0
https://developer.nvidia.com/rdp/cudnn-download
Letakkan folder cuda dari zip di N:\dan ganti nama cuDNN-6

Instal CMake
https://cmake.org/files/v3.10/cmake-3.10.0-rc5-win64-x64.msi

Instal Swig (swigwin-3.0.12)
https://sourceforge.net/projects/swig/files/swigwin/swigwin-3.0.12/swigwin-3.0.12.zip

cntk-py36

```conda create --name cntk-py36 python=3.6 numpy scipy h5py jupyter
aktifkan cntk-py36
instal pip https://cntk.ai/PythonWheel/GPU/cntk-2.2-cp36-cp36m-win_amd64.whl
python -c "impor cntk; print(cntk.__version__)"
conda instal pygpu
pip install keras

#### Remove old tensorflow in Tools if it exists
```cd C:\Users\%USERNAME%\Tools\
move tensorflow tensorflow.not
git clone --recursive https://github.com/tensorflow/tensorflow.git
cd C:\Users\%USERNAME%\Tools\tensorflow\tensorflow\contrib\cmake
Edit CMakeLists.txt

Komentari ini:

# if (tensorflow_OPTIMIZE_FOR_NATIVE_ARCH)
#   include(CheckCXXCompilerFlag)
#   CHECK_CXX_COMPILER_FLAG("-march=native" COMPILER_OPT_ARCH_NATIVE_SUPPORTED)
#   if (COMPILER_OPT_ARCH_NATIVE_SUPPORTED)
#     set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -march=native")
#   endif()
# endif()

Tambahkan ini:

if (tensorflow_OPTIMIZE_FOR_NATIVE_ARCH)
  include(CheckCXXCompilerFlag)
  CHECK_CXX_COMPILER_FLAG("-march=native" COMPILER_OPT_ARCH_NATIVE_SUPPORTED)
  if (COMPILER_OPT_ARCH_NATIVE_SUPPORTED)
    set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -march=native")
  else()
    CHECK_CXX_COMPILER_FLAG("/arch:AVX2" COMPILER_OPT_ARCH_AVX_SUPPORTED)
    if(COMPILER_OPT_ARCH_AVX_SUPPORTED)
      set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} /arch:AVX2")
    endif()
  endif()
endif()

pembuatan mkdir & pembuatan cd

"C:\Program Files (x86)\Microsoft Visual Studio 14.0\VC\bin\amd64\vcvars64.bat"

cmake .. -A x64 -DCMAKE_BUILD_TYPE=Release ^
-DSWIG_EXECUTABLE=N:/swigwin-3.0.12/swig.exe ^
-DPYTHON_EXECUTABLE=N:/Anaconda3/python.exe ^
-DPYTHON_LIBRARIES=N:/Anaconda3/libs/python36.lib ^
-Dtensorflow_ENABLE_GPU=ON ^
-DCUDNN_HOME="n:\cuDNN-6" ^
-Dtensorflow_WIN_CPU_SIMD_OPTIONS=/arch:AVX2

-- Gedung untuk: Visual Studio 14 2015
-- Memilih Windows SDK versi 10.0.14393.0 untuk menargetkan Windows 10.0.16299.
-- Identifikasi kompiler C adalah MSVC 19.0.24225.1
-- Identifikasi compiler CXX adalah MSVC 19.0.24225.1
-- Periksa compiler C yang berfungsi: C:/Program Files (x86)/Microsoft Visual Studio 14.0/VC/bin/x86_amd64/cl.exe
-- Periksa compiler C yang berfungsi: C:/Program Files (x86)/Microsoft Visual Studio 14.0/VC/bin/x86_amd64/cl.exe -- berfungsi
-- Mendeteksi informasi ABI kompiler C
-- Mendeteksi info ABI kompiler C - selesai
-- Periksa compiler CXX yang berfungsi: C:/Program Files (x86)/Microsoft Visual Studio 14.0/VC/bin/x86_amd64/cl.exe
-- Periksa kompiler CXX yang berfungsi: C:/Program Files (x86)/Microsoft Visual Studio 14.0/VC/bin/x86_amd64/cl.exe -- berfungsi
-- Mendeteksi informasi ABI kompiler CXX
-- Mendeteksi info ABI kompiler CXX - selesai
-- Mendeteksi fitur kompilasi CXX
-- Mendeteksi fitur kompilasi CXX - selesai
-- Melakukan Tes COMPILER_OPT_ARCH_NATIVE_SUPPORTED
-- Melakukan Tes COMPILER_OPT_ARCH_NATIVE_SUPPORTED - Gagal
-- Melakukan Tes COMPILER_OPT_ARCH_AVX_SUPPORTED
-- Melakukan Tes COMPILER_OPT_ARCH_AVX_SUPPORTED - Berhasil
-- Melakukan Tes COMPILER_OPT_WIN_CPU_SIMD_SUPPORTED
-- Melakukan Tes COMPILER_OPT_WIN_CPU_SIMD_SUPPORTED - Berhasil
-- Ditemukan CUDA: C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0 (ditemukan versi yang sesuai "8.0", minimum yang diperlukan adalah "8.0")
-- Ditemukan PythonInterp: C:/Users/%USERNAME%/Anaconda3/python.exe (versi ditemukan "3.6.3")
-- Ditemukan PythonLibs: C:/Users/%USERNAME%/Anaconda3/libs/python36.lib (ditemukan versi "3.6.3")
-- Ditemukan SWIG: C:/Users/%USERNAME%/Tools/swigwin-3.0.12/swig.exe (versi ditemukan "3.0.12")
-- Konfigurasi selesai
-- Pembuatan selesai
-- File build telah ditulis ke: C:/Users/%USERNAME%/Tools/tensorflow/tensorflow/contrib/cmake/build

MSBuild /p:Configuration=Release tf_python_build_pip_package.vcxproj

@Tweakmind
python 3.6, tensorflow terakhir dari master, cuda 9.0, cudnn 7.0.5 untuk cuda 9.0, basel dan swig dimuat hari ini.

@Tweakmind apakah Anda membangun dengan master atau ?

@Tweakmind
Bolehkah Anda membangun di windows dengan cuda 9 cudnn 7 dan berbagi .whl?

@Tweakmind

Apakah Anda tidak mencoba membangun win 10 dengan cuda 9 cudnn 7?

Terima kasih atas keahlian Anda!

@hadaev8 @alc5978
pip install -U tf-nightly-gpu sekarang memberikan build win10 tertanggal 20171221, yang didasarkan pada TF 1.5 beta dengan CUDA 9.0 dan CuDNN 7.0.5. Saya menjalankannya tadi malam, tidak apa-apa. Sekarang kita harus pindah ke CUDA 9.1 untuk kecepatan peluncuran kernel CUDA 12x. Dukungan windows Tensorflow cukup lambat dan anemia. Build resmi yang stabil harus ditawarkan secepatnya. Saya sebenarnya untuk Tensorflow 1.5 stable akan dirilis dengan CUDA 9.1, pada akhir Januari tolong?

Buka http://www.python36.com/install-tensorflow141-gpu/ untuk langkah demi langkah instalasi tensorflow dengan cuda 9.1 dan cudnn7.05 di ubuntu. Dan buka http://www.python36.com/install-tensorflow-gpu-windows untuk langkah demi langkah instalasi tensorflow dengan cuda 9.1 dan cudnn 7.0.5 di Windows.

Sudah 2018, hampir akhir Januari dan instalasi TF dengan CUDA9.1 dan CuDNN7 di Windows 10 masih belum selesai?

1.5 adalah RC dengan CUDA 9 + cuDNN 7 dan akan menjadi GA dalam beberapa hari ke depan. (CUDA 9.1 adalah GA pada bulan Desember dan memerlukan peningkatan driver perangkat lain yang mengganggu banyak pengguna. Rencana saat ini adalah mempertahankan build default pada CUDA 9.0.x dan terus meningkatkan ke versi cuDNN yang lebih baru).

Saya membuka masalah untuk membahas CUDA 9.1.

Peningkatan kecepatan peluncuran kernel 12x lebih bernuansa daripada angka 12x. Ujung atas 12x adalah untuk ops dengan banyak argumen dan gangguan terhadap pengguna tinggi karena peningkatan driver perangkat. Saya berharap untuk memiliki "saluran" yang menguji 9.1 dalam waktu dekat dan mencari cara untuk menangani paradigma ini.

Saya berharap akhirnya akan menjadi CUDA 9.1, bukan 9.0.

Saya berharap akhirnya akan menjadi CUDA 9.1, bukan 9.0 juga.

Saya yakin akhirnya akan menjadi CUDA 9.1, bukan 9.0 juga kan? :)

@ViktorM @Magicfeng007 @alc5978
Utas 9.1

Jika ada yang masih menghadapi masalah seperti Keras dengan backend TensorFlow tidak menggunakan GPU.... ikuti petunjuk di halaman ini. Ini diperbarui dan berfungsi 100% dengan benar.
https://research.wmz.ninja/articles/2017/01/configuring-gpu-accelerated-keras-in-windows-10.html

Halo semua
Saya hari ini menginstal tensorflow-gpu 1.6.0rc1 di win10 dengan pustaka CUDA 9.0 dan cuDNN 7.0.5 dengan http://www.python36.com/install-tensorflow-using-official-pip-pacakage/

Semuanya tampak baik-baik saja

Saya membuat satu skrip untuk prasyarat GPU NVIDIA (CUDA-9.0 dan cuDNN-7.0) untuk TensorFlow terbaru (v1.5+), ini tautannya .

Apakah halaman ini membantu?
0 / 5 - 0 peringkat