Tensorflow: рдХреНрд░реИрд╢: рдЬрдм рдХрдиреНрд╡рдиреЗрдЯ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рддреЛ cuDNN рд╣реИрдВрдбрд▓ рдирд╣реАрдВ рдмрдирд╛ рд╕рдХрд╛

рдХреЛ рдирд┐рд░реНрдорд┐рдд 6 рдЬрдире░ 2017  ┬╖  145рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ  ┬╖  рд╕реНрд░реЛрдд: tensorflow/tensorflow

Tensorflow (GPU) рдХреЛ рд╕рдлрд▓рддрд╛рдкреВрд░реНрд╡рдХ рдЖрдпрд╛рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛, рд▓реЗрдХрд┐рди рдПрдХ рд╕рддреНрд░ рдЪрд▓рд╛рддреЗ рд╕рдордп рдЬрд┐рд╕рдореЗрдВ рдПрдХ рдХрдирд╡рд▓реНрд╢рдирд▓ рдиреНрдпреВрд░рд▓ рдиреЗрдЯрд╡рд░реНрдХ (CNN) рд╢рд╛рдорд┐рд▓ рд╣реЛрддрд╛ рд╣реИ, рдкрд╛рдпрдерди рдирд┐рдореНрди рд╕рдВрджреЗрд╢ рдХреЗ рд╕рд╛рде рдХреНрд░реИрд╢ рд╣реЛ рдЬрд╛рддрд╛ рд╣реИ:

E tensorflow/stream_executor/cuda/cuda_dnn.cc:385] could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR
E tensorflow/stream_executor/cuda/cuda_dnn.cc:352] could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM
F tensorflow/core/kernels/conv_ops.cc:605] Check failed: stream->parent()->GetConvolveAlgorithms(&algorithms)

рд╕рдорд╕реНрдпрд╛ CUDA рдЯреВрд▓рдХрд┐рдЯ 7.5/8.0 рдФрд░ Tensorflow рдХреЗ pip/source рд╕реЗ рд╕реНрдерд╛рдкрд┐рдд рдХрд┐рд╕реА рднреА рд╕рдВрдпреЛрдЬрди рдкрд░ рдмрдиреА рд░рд╣рддреА рд╣реИред рд╕реАрдПрдирдПрди рдХрд╛ рдЙрдкрдпреЛрдЧ рдирд╣реАрдВ рдХрд░рдиреЗ рд╡рд╛рд▓реЗ рдкрд░реАрдХреНрд╖рдг рд╕рддреНрд░ рд╕рдлрд▓рддрд╛рдкреВрд░реНрд╡рдХ рдЪрд▓рд╛рдП рдЬрд╛рддреЗ рд╣реИрдВред

рдЕрдкрдиреА рд╕рдорд╕реНрдпрд╛ рдХреЗ рд▓рд┐рдП рд╡реЗрдм рдкрд░ рдЦреЛрдЬ рдХрд░ рдЖрдкрдХреЛ рдХреМрди рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд GitHub рдореБрджреНрджреЗ рдпрд╛ StackOverflow рдереНрд░реЗрдб рдорд┐рд▓реЗ рд╣реИрдВ?

рд╕рдорд╕реНрдпрд╛ https://github.com/tensorflow/tensorflow/issues/6586 рдХреЗ рд╕рдорд╛рди рд╣реИ, рдЬрд╣рд╛рдВ рдореИрдВрдиреЗ рдкрд╣рд▓реА рдмрд╛рд░ рдЯрд┐рдкреНрдкрдгреА рдХреА рдереАред рд▓реЗрдХрд┐рди рдЬрдм рд╕реЗ рдореИрдВ рдореИрдХ рдкрд░ рд╕рдорд╕реНрдпрд╛ рдХрд╛ рдЕрдиреБрднрд╡ рдХрд░рддрд╛ рд╣реВрдВ, рдореБрдЭреЗ рдПрдХ рдЕрд▓рдЧ рдореБрджреНрджрд╛ рдЦреЛрд▓рдиреЗ рдХрд╛ рд╕реБрдЭрд╛рд╡ рджрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред

рдкрд░реНрдпрд╛рд╡рд░рдг рдХреА рдЬрд╛рдирдХрд╛рд░реА

рдСрдкрд░реЗрдЯрд┐рдВрдЧ рд╕рд┐рд╕реНрдЯрдо: рдореИрдХреЛрдЬрд╝ рд╕рд┐рдПрд░рд╛ 10.12.2
Xcode рд╕рдВрд╕реНрдХрд░рдг 8.2 (8C38) (рдЬрдм рдореИрдВрдиреЗ рдмрд╛рдж рдореЗрдВ CUDA 7.5 рдХреА рдХреЛрд╢рд┐рд╢ рдХреА, рддреЛ рдореИрдВрдиреЗ рдХрдорд╛рдВрдб рд▓рд╛рдЗрди рдЯреВрд▓реНрд╕ рд╕рдВрд╕реНрдХрд░рдг 7.3.1 рд╕реНрдерд╛рдкрд┐рдд рдХрд┐рдпрд╛ рдХреНрдпреЛрдВрдХрд┐ CUDA 7.5 рдореЗрдВ рд╣рд╛рд▓ рдХреЗ рдХрдВрдкрд╛рдЗрд▓рд░реЛрдВ рдХрд╛ рд╕рдорд░реНрдерди рдирд╣реАрдВ рдерд╛ред)
рдкрд╛рдпрдерди 3.5.2 (рдПрдирд╛рдХреЛрдВрдбрд╛)

CUDA рдХрд╛ рд╕реНрдерд╛рдкрд┐рдд рд╕рдВрд╕реНрдХрд░рдг: 8.0 (рд╢реБрд░реВ рдореЗрдВ) рдФрд░ 7.5 рджреЛрдиреЛрдВ рдХреА рдХреЛрд╢рд┐рд╢ рдХреА (рдпрд╣рд╛рдВ рд░рд┐рдкреЛрд░реНрдЯ рдХреА рдЧрдИ, рдХреЗрд╡рд▓ рдЯреВрд▓рдХрд┐рдЯ - рдбреНрд░рд╛рдЗрд╡рд░ рдЕрднреА рднреА 8.0 рд╣реИ)
cuDNN рдХрд╛ рд╕рдВрд╕реНрдерд╛рдкрд┐рдд рд╕рдВрд╕реНрдХрд░рдг: 5.1 (CUDA рд╕рдВрд╕реНрдХрд░рдгреЛрдВ рдХреЗ рдЕрдиреБрд╕рд╛рд░ рд╡рд┐рднрд┐рдиреНрди рд╕рдВрд╕реНрдерд╛рдкрди)
(рдХреГрдкрдпрд╛ ls -l /path/to/cuda/lib/libcud* рдХрд╛ рдЖрдЙрдЯрдкреБрдЯ рд╕рдВрд▓рдЧреНрди рдХрд░реЗрдВ):

lrwxr-xr-x  1 root   wheel        33  5 Jan 20:33 /usr/local/cuda/lib/libcuda.1.dylib -> /usr/local/cuda/lib/libcuda.dylib
-rwxr-xr-x@ 1 root   wheel      8280 13 Apr  2016 /usr/local/cuda/lib/libcuda.dylib
lrwxr-xr-x@ 1 root   wheel        45 13 Apr  2016 /usr/local/cuda/lib/libcudadevrt.a -> /Developer/NVIDIA/CUDA-7.5/lib/libcudadevrt.a
lrwxr-xr-x@ 1 root   wheel        50 13 Apr  2016 /usr/local/cuda/lib/libcudart.7.5.dylib -> /Developer/NVIDIA/CUDA-7.5/lib/libcudart.7.5.dylib
lrwxr-xr-x@ 1 root   wheel        46 13 Apr  2016 /usr/local/cuda/lib/libcudart.dylib -> /Developer/NVIDIA/CUDA-7.5/lib/libcudart.dylib
lrwxr-xr-x@ 1 root   wheel        49 13 Apr  2016 /usr/local/cuda/lib/libcudart_static.a -> /Developer/NVIDIA/CUDA-7.5/lib/libcudart_static.a
lrwxr-xr-x  1 root   wheel        16  5 Jan 17:14 /usr/local/cuda/lib/libcudnn.5 -> libcudnn.5.dylib
-rwxr-xr-x@ 1 ymfa   staff  58975112 10 Jun  2016 /usr/local/cuda/lib/libcudnn.5.dylib
lrwxr-xr-x@ 1 ymfa   staff        16 10 Jun  2016 /usr/local/cuda/lib/libcudnn.dylib -> libcudnn.5.dylib
lrwxr-xr-x  1 root   wheel        16  5 Jan 17:14 /usr/local/cuda/lib/libcudnn5.dylib -> libcudnn.5.dylib
-rw-r--r--@ 1 ymfa   staff  56392320 10 Jun  2016 /usr/local/cuda/lib/libcudnn_static.a

рдореИрдВрдиреЗ рдкрд╛рдЗрдк рдФрд░ рд╕реНрд░реЛрдд рджреЛрдиреЛрдВ рд╕реЗ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХреАред рдореИрдВрдиреЗ рдкрд╣рд▓реА рдмрд╛рд░ рдмрд╛рдЗрдирд░реА рдкрд╛рдЗрдк рдкреИрдХреЗрдЬ рд╕реЗ рд╕реНрдерд╛рдкрд┐рдд рдХрд┐рдпрд╛ рд╣реИ:

  1. рдЖрдкрдХреЗ рджреНрд╡рд╛рд░рд╛ рдЗрдВрд╕реНрдЯреЙрд▓ рдХрд┐рдП рдЧрдП рдкрд╛рдЗрдк рдкреИрдХреЗрдЬ рдХрд╛ рд▓рд┐рдВрдХ:
    tensorflow-gpu
  2. python -c "import tensorflow; print(tensorflow.__version__)" рд╕реЗ рдЖрдЙрдЯрдкреБрдЯред
    0.12.head

рдмрд╛рдж рдореЗрдВ рдореИрдВрдиреЗ рд╕реНрд░реЛрдд рд╕реЗ рд╕реНрдерд╛рдкрд┐рдд рдХрд┐рдпрд╛ (рдкрд╛рдЗрдк рдкреИрдХреЗрдЬ рдХреА рд╕реНрдерд╛рдкрдирд╛ рд░рджреНрдж рдХрд░ рджреА рдЧрдИ рдереА):

  1. рдкреНрд░рддрд┐рдмрджреНрдз рд╣реИрд╢ ( git rev-parse HEAD )
    d67c09d98a576e1fbf2f3609ddb842e53890f31c
  2. bazel version . рдХрд╛ рдЖрдЙрдЯрдкреБрдЯ

    рдмрд┐рд▓реНрдб рд▓реЗрдмрд▓: 0.4.3-рд╣реЛрдордмреНрд░реЗрд╡
    рд▓рдХреНрд╖реНрдп рдмрдирд╛рдПрдВ: bazel-out/local-opt/bin/src/main/java/com/google/devtools/build/lib/bazel/BazelServer_deploy.jar
    рдирд┐рд░реНрдорд╛рдг рд╕рдордп: рдЧреБрд░реБ рджрд┐рд╕рдВрдмрд░ 22 15:20:15 2016 (1482420015)
    рдЯрд╛рдЗрдорд╕реНрдЯреИрдореНрдк рдмрдирд╛рдПрдБ: 1482420015
    рдЯрд╛рдЗрдорд╕реНрдЯреИрдореНрдк рдХреЛ рдЗрдВрдЯ рдХреЗ рд░реВрдк рдореЗрдВ рдмрдирд╛рдПрдБ: 1482420015

рдпрджрд┐ рд╕рдВрднрд╡ рд╣реЛ, рддреЛ рдиреНрдпреВрдирддрдо рдкреНрд░рддрд┐рд▓рд┐рдкрд┐ рдкреНрд░рд╕реНрддреБрдд рдХрд░рдиреЗ рдпреЛрдЧреНрдп рдЙрджрд╛рд╣рд░рдг рдкреНрд░рджрд╛рди рдХрд░реЗрдВ

рдореИрдВрдиреЗ рдиреЗрдЯрд╡рд░реНрдХ рдХреЛ рд╕рд░рд▓ рдмрдирд╛рдХрд░ рдФрд░ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдбреЗрдЯрд╛ рдХреЛ рдХреЗрд╡рд▓ рдмреАрд╕ рдЫрд╡рд┐рдпреЛрдВ рдФрд░ рд╡рд░реНрдЧреАрдХрд░рдг рдХреЗ рд▓рд┐рдП рджреЛ рд╡рд░реНрдЧреЛрдВ рддрдХ рдХрдо рдХрд░рдХреЗ рдПрдХ рдиреНрдпреВрдирддрдо рдЙрджрд╛рд╣рд░рдг рдмрдирд╛рдпрд╛ред рдореБрджреНрджрд╛.рдЬрд╝рд┐рдк рдореЗрдВ рдкрд╛рдпрдерди рдХреЛрдб рдФрд░ рдбреЗрдЯрд╛ рд╣реЛрддрд╛ рд╣реИред рдореИрдВрдиреЗ рджреЛ рд╕рдВрдХреЗрдВрджреНрд░рд┐рдд рдкрд░рддреЗрдВ рд▓рд┐рдЦреАрдВ рдХреНрдпреЛрдВрдХрд┐ рдореИрдВрдиреЗ рдкрд╛рдпрд╛ рдХрд┐ рдХреЗрд╡рд▓ рдПрдХ рд╕рдВрдХреЗрдВрджреНрд░рд┐рдд рдкрд░рдд рд╡рд╛рд▓рд╛ рдиреЗрдЯрд╡рд░реНрдХ рдмрд┐рдирд╛ рдХрд┐рд╕реА рд╕рдорд╕реНрдпрд╛ рдХреЗ рдЪрд▓рддрд╛ рд╣реИред

рд╕реНрд░реЛрдд рд╕реЗ рд╕рдВрдХрд▓рд┐рдд CUDA 7.5 рдФрд░ Tensorflow рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдкреВрд░реНрдг рд▓реЙрдЧ

I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcublas.7.5.dylib locally
I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcudnn.5.dylib locally
I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcufft.7.5.dylib locally
I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcuda.1.dylib locally
I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcurand.7.5.dylib locally
W tensorflow/core/platform/cpu_feature_guard.cc:95] The TensorFlow library wasn't compiled to use SSE4.1 instructions, but these are available on your machine and could speed up CPU computations.
W tensorflow/core/platform/cpu_feature_guard.cc:95] The TensorFlow library wasn't compiled to use SSE4.2 instructions, but these are available on your machine and could speed up CPU computations.
W tensorflow/core/platform/cpu_feature_guard.cc:95] The TensorFlow library wasn't compiled to use AVX instructions, but these are available on your machine and could speed up CPU computations.
I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:874] OS X does not support NUMA - returning NUMA node zero
I tensorflow/core/common_runtime/gpu/gpu_device.cc:885] Found device 0 with properties: 
name: GeForce GT 650M
major: 3 minor: 0 memoryClockRate (GHz) 0.9
pciBusID 0000:01:00.0
Total memory: 1023.69MiB
Free memory: 740.18MiB
I tensorflow/core/common_runtime/gpu/gpu_device.cc:906] DMA: 0 
I tensorflow/core/common_runtime/gpu/gpu_device.cc:916] 0:   Y 
I tensorflow/core/common_runtime/gpu/gpu_device.cc:975] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GT 650M, pci bus id: 0000:01:00.0)
E tensorflow/stream_executor/cuda/cuda_dnn.cc:385] could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR
E tensorflow/stream_executor/cuda/cuda_dnn.cc:352] could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM
F tensorflow/core/kernels/conv_ops.cc:605] Check failed: stream->parent()->GetConvolveAlgorithms(&algorithms)

рдкрд╛рдЗрдк рд╕реЗ рд╕реНрдерд╛рдкрд┐рдд CUDA 8.0 рдФрд░ Tensorflow рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдкреВрд░реНрдг рд▓реЙрдЧ

I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcublas.dylib locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcudnn.dylib locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcufft.dylib locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcuda.1.dylib locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcurand.dylib locally
I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:901] OS X does not support NUMA - returning NUMA node zero
I tensorflow/core/common_runtime/gpu/gpu_device.cc:885] Found device 0 with properties: 
name: GeForce GT 650M
major: 3 minor: 0 memoryClockRate (GHz) 0.9
pciBusID 0000:01:00.0
Total memory: 1023.69MiB
Free memory: 590.00MiB
I tensorflow/core/common_runtime/gpu/gpu_device.cc:906] DMA: 0 
I tensorflow/core/common_runtime/gpu/gpu_device.cc:916] 0: Y 
I tensorflow/core/common_runtime/gpu/gpu_device.cc:975] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GT 650M, pci bus id: 0000:01:00.0)
E tensorflow/stream_executor/cuda/cuda_dnn.cc:385] could not create cudnn handle: CUDNN_STATUS_NOT_INITIALIZED
E tensorflow/stream_executor/cuda/cuda_dnn.cc:392] error retrieving driver version: Invalid argument: expected %d.%d or %d.%d.%d form for driver version; got ""
E tensorflow/stream_executor/cuda/cuda_dnn.cc:352] could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM
F tensorflow/core/kernels/conv_ops.cc:532] Check failed: stream->parent()->GetConvolveAlgorithms(&algorithms)
awaiting tensorflower builinstall

рд╕рдмрд╕реЗ рдЙрдкрдпреЛрдЧреА рдЯрд┐рдкреНрдкрдгреА

рдпрд╣рд╛рдВ рдХреБрдЫ рдФрд░ рдЬрд╛рдирдХрд╛рд░реА рджреА рдЧрдИ рд╣реИ рдХрд┐ рдореИрдВрдиреЗ рдЗрд╕реЗ рдЕрд╕реНрдерд╛рдпреА рд░реВрдк рд╕реЗ рдХреИрд╕реЗ рд╣рд▓ рдХрд┐рдпрд╛ред рдореЗрд░рд╛ рдорд╛рдирдирд╛ тАЛтАЛтАЛтАЛрд╣реИ рдХрд┐ рдпреЗ рд╕рднреА рдореБрджреНрджреЗ GPU рдореЗрдореЛрд░реА рдЖрд╡рдВрдЯрди рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИрдВ рдФрд░ рдЗрдирдХрд╛ рд░рд┐рдкреЛрд░реНрдЯ рдХреА рдЬрд╛ рд░рд╣реА рддреНрд░реБрдЯрд┐рдпреЛрдВ рд╕реЗ рдХреЛрдИ рд▓реЗрдирд╛-рджреЗрдирд╛ рдирд╣реАрдВ рд╣реИред рдЗрд╕рд╕реЗ рдкрд╣рд▓реЗ рдЕрдиреНрдп рддреНрд░реБрдЯрд┐рдпрд╛рдВ рдереАрдВ рдЬреЛ рдХрд┐рд╕реА рдкреНрд░рдХрд╛рд░ рдХреА рдореЗрдореЛрд░реА рдЖрд╡рдВрдЯрди рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рдВрдХреЗрдд рджреЗрддреА рдереАрдВ, рд▓реЗрдХрд┐рди рдХрд╛рд░реНрдпрдХреНрд░рдо рдЖрдЧреЗ рдмрдврд╝рддрд╛ рд░рд╣рд╛, рдЕрдВрддрддрдГ рд╕рднреА рдХреЛ рдорд┐рд▓рдиреЗ рд╡рд╛рд▓реА рдХреБрдбрди рддреНрд░реБрдЯрд┐рдпрд╛рдВ рджреЗ рд░рд╣рд╛ рдерд╛ред рдореЗрд░рд╛ рдорд╛рдирдирд╛ тАЛтАЛтАЛтАЛрд╣реИ рдХрд┐ рдпрд╣ рдХрднреА-рдХрднреА рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ, рдЗрд╕рдХрд╛ рдХрд╛рд░рдг рдпрд╣ рд╣реИ рдХрд┐ рдпрджрд┐ рдЖрдк рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдХреЗ рдЕрд▓рд╛рд╡рд╛ рдЕрдиреНрдп рдЪреАрдЬреЛрдВ рдХреЗ рд▓рд┐рдП рдЬреАрдкреАрдпреВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВ рдЬреИрд╕реЗ рдХрд┐ рдЖрдкрдХрд╛ рдкреНрд░рд╛рдердорд┐рдХ рдкреНрд░рджрд░реНрд╢рди, рдЙрдкрд▓рдмреНрдз рдореЗрдореЛрд░реА рдореЗрдВ рдЙрддрд╛рд░-рдЪрдврд╝рд╛рд╡ рд╣реЛрддрд╛ рд╣реИред рдХрднреА-рдХрднреА рдЖрдк рдЬреЛ рдЪрд╛рд╣рддреЗ рд╣реИрдВ рдЙрд╕реЗ рдЖрд╡рдВрдЯрд┐рдд рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ рдФрд░ рджреВрд╕рд░реА рдмрд╛рд░ рдпрд╣ рдирд╣реАрдВ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред

рдПрдкреАрдЖрдИ рд╕реЗ
https://www.tensorflow.org/versions/r0.12/how_tos/using_gpu/
"рдбрд┐рдлрд╝реЙрд▓реНрдЯ рд░реВрдк рд╕реЗ, TensorFlow рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдХреЗ рд▓рд┐рдП рджреГрд╢реНрдпрдорд╛рди рд╕рднреА GPU (CUDA_VISIBLE_DEVICES рдХреЗ рдЕрдзреАрди) рдХреА рд▓рдЧрднрдЧ рд╕рднреА GPU рдореЗрдореЛрд░реА рдХреЛ рдореИрдк рдХрд░рддрд╛ рд╣реИред рдпрд╣ рдореЗрдореЛрд░реА рд╡рд┐рдЦрдВрдбрди рдХреЛ рдХрдо рдХрд░рдХреЗ рдбрд┐рд╡рд╛рдЗрд╕ рдкрд░ рдЕрдкреЗрдХреНрд╖рд╛рдХреГрдд рдХреАрдорддреА GPU рдореЗрдореЛрд░реА рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдХрд╛ рдЕрдзрд┐рдХ рдХреБрд╢рд▓рддрд╛ рд╕реЗ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред"

рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдбрд┐рдлрд╝реЙрд▓реНрдЯ рдЖрд╡рдВрдЯрди рдХрд┐рд╕реА рддрд░рд╣ рд╕реЗ рдЯреВрдЯрд╛ рд╣реБрдЖ рд╣реИ рдЬреЛ рдЗрд╕ рдЕрдирд┐рд╢реНрдЪрд┐рдд рд╡реНрдпрд╡рд╣рд╛рд░ рдФрд░ рдХреБрдЫ рд╕реНрдерд┐рддрд┐рдпреЛрдВ рдХреЛ рдХрд╛рдо рдХрд░рдиреЗ рдФрд░ рджреВрд╕рд░реЛрдВ рдХреЛ рд╡рд┐рдлрд▓ рдХрд░рдиреЗ рдХрд╛ рдХрд╛рд░рдг рдмрдирддрд╛ рд╣реИред

рдореИрдВрдиреЗ рдиреНрдпреВрдирддрдо рдорд╛рддреНрд░рд╛ рдореЗрдВ рдореЗрдореЛрд░реА рдЖрд╡рдВрдЯрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП TF рдХреЗ рдбрд┐рдлрд╝реЙрд▓реНрдЯ рд╡реНрдпрд╡рд╣рд╛рд░ рдХреЛ рдмрджрд▓рдХрд░ рдФрд░ рд╡реЗрдмрдкреЗрдЬ рдореЗрдВ рд╡рд┐рд╕реНрддреГрдд рд░реВрдк рд╕реЗ рдЖрд╡рд╢реНрдпрдХрддрд╛рдиреБрд╕рд╛рд░ рдмрдврд╝рдиреЗ рдХреЗ рджреНрд╡рд╛рд░рд╛ рдЗрд╕ рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рдорд╛рдзрд╛рди рдХрд┐рдпрд╛ рд╣реИред
рдХреЙрдиреНрдлрд┐рдЧ = tf.ConfigProto ()
config.gpu_options.allow_growth = рд╕рд╣реА
рд╕рддреНрд░ = tf. рд╕рддреНрд░ (рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди = рдХреЙрдиреНрдлрд╝рд┐рдЧ, ...)

рдореИрдВрдиреЗ рд╡реИрдХрд▓реНрдкрд┐рдХ рддрд░реАрдХреЗ рд╕реЗ рднреА рдХреЛрд╢рд┐рд╢ рдХреА рд╣реИ рдФрд░ рдЗрд╕реЗ рдХрд╛рдо рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдерд╛ рдФрд░ рдкреНрд░рдпреЛрдЧрд╛рддреНрдордХ рд░реВрдк рд╕реЗ рдХрд╛рдо рдХрд░рдиреЗ рд╡рд╛рд▓реЗ рдкреНрд░рддрд┐рд╢рдд рдХреЛ рдЪреБрдирдиреЗ рдореЗрдВ рдЕрд╕рдлрд▓ рд░рд╣рд╛ред рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ рдпрд╣ рд▓рдЧрднрдЧ .7 рд╣реЛ рдЧрдпрд╛ред

рдХреЙрдиреНрдлрд┐рдЧ = tf.ConfigProto ()
config.gpu_options.per_process_gpu_memory_fraction = 0.4
рд╕рддреНрд░ = tf. рд╕рддреНрд░ (рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди = рдХреЙрдиреНрдлрд╝рд┐рдЧ, ...)

рдЕрднреА рднреА рдЯреАрдПрдл рдЯреАрдо рдХреЗ рдХрд┐рд╕реА рднреА рд╡реНрдпрдХреНрддрд┐ рдиреЗ рдЗрд╕рдХреА рдкреБрд╖реНрдЯрд┐ рдирд╣реАрдВ рдХреА рд╣реИ, рд▓реЗрдХрд┐рди рдпрд╣ рджреЗрдЦрдиреЗ рдХреЗ рд▓рд╛рдпрдХ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рдЕрдиреНрдп рд╕рдорд╛рди рд╡реНрдпрд╡рд╣рд╛рд░ рдХреА рдкреБрд╖реНрдЯрд┐ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред

рд╕рднреА 145 рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcublas.so locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcudnn.so locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcufft.so locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcuda.so.1 locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcurand.so locally
I tensorflow/core/common_runtime/gpu/gpu_device.cc:885] Found device 0 with properties:
name: GeForce GTX 1080
major: 6 minor: 1 memoryClockRate (GHz) 1.835
pciBusID 0000:02:00.0
Total memory: 7.92GiB
Free memory: 3.76GiB
I tensorflow/core/common_runtime/gpu/gpu_device.cc:906] DMA: 0
I tensorflow/core/common_runtime/gpu/gpu_device.cc:916] 0:   Y
I tensorflow/core/common_runtime/gpu/gpu_device.cc:975] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GTX 1080, pci bus id: 0000:02:00.0)
E tensorflow/stream_executor/cuda/cuda_dnn.cc:385] could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR
E tensorflow/stream_executor/cuda/cuda_dnn.cc:352] could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM
F tensorflow/core/kernels/conv_ops.cc:532] Check failed: stream->parent()->GetConvolveAlgorithms(&algorithms)

рдореИрдВ рдареАрдХ рдЙрд╕реА рд╕рдорд╕реНрдпрд╛ рд╕реЗ рдорд┐рд▓рд╛ рдЬреИрд╕рд╛ рдЖрдк CUDA8 рдФрд░ TF r0.12.1 рдХреЗ рд╕рд╛рде рдХрд░рддреЗ рд╣реИрдВред

@EncodeTS рдореИрдВрдиреЗ рдЕрднреА рдЕрдкрдиреА рдкрд╣рд▓реА рдкреЛрд╕реНрдЯ рдореЗрдВ рдПрдХ рдиреНрдпреВрдирддрдо рдкреНрд░рддрд┐рд▓рд┐рдкрд┐ рдкреНрд░рд╕реНрддреБрдд рдХрд░рдиреЗ рдпреЛрдЧреНрдп рдЙрджрд╛рд╣рд░рдг рдЬреЛрдбрд╝рд╛ рд╣реИред рдХреНрдпрд╛ рдЖрдк рдЬрд╛рдВрдЪ рд╕рдХрддреЗ рд╣реИрдВ рдХрд┐ рдпрд╣ рдЖрдкрдХреА рдорд╢реАрди рдкрд░ рд╕рдорд╕реНрдпрд╛ рдХреЛ рдкреБрди: рдЙрддреНрдкрдиреНрди рдХрд░рддрд╛ рд╣реИ рдпрд╛ рдирд╣реАрдВ? рдореЗрд░реА рдорд╢реАрди рдкрд░, рдПрдХ рдХрдирд╡рд▓реНрд╢рдирд▓ рд▓реЗрдпрд░ рдХрд╛рдо рдХрд░рддреА рд╣реИ, рд▓реЗрдХрд┐рди рджреЛ рдХрдирд╡рд▓реНрд╢рдирд▓ рд▓реЗрдпрд░ рдирд╣реАрдВ, рдЬрд┐рд╕рд╕реЗ рдореБрдЭреЗ рд▓рдЧрд╛ рдХрд┐ рд╕рдорд╕реНрдпрд╛ рдХреБрдЫ рд╕рдВрд╕рд╛рдзрди рд╕реАрдорд╛рдУрдВ рдХреЗ рдХрд╛рд░рдг рд╣реЛ рд╕рдХрддреА рд╣реИред

рдореИрдВ рдкреБрд╖реНрдЯрд┐ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ рдХрд┐ рдореИрдХреЛрдЬрд╝ рдПрдирд╡реАрдбрд┐рдпрд╛ 750 рдкрд░

рдиреНрдпреВрдирддрдо рдЙрджрд╛рд╣рд░рдг рдореЗрд░реЗ рдЙрдмрдВрдЯреВ рдкрд░ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред рдРрд╕рд╛ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдореБрдЭреЗ рдЬрд┐рд╕ рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝рд╛ рдерд╛, рдЙрд╕рдХреЗ рдореЗрд░реЗ рдХрдВрдкреНрдпреВрдЯрд░ рдкрд░ рдШрдЯрдирд╛ рдХреА рд╕рдВрднрд╛рд╡рдирд╛ рдмрд╣реБрдд рдХрдо рд╣реИред

рдореБрдЭреЗ рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝ рд░рд╣рд╛ рд╣реИред рд╕реАрдкреАрдпреВ рдХреЗ рд▓рд┐рдП рдордЬрдмреВрд░ рд╣реЛрдиреЗ рдкрд░ рдЧреНрд░рд╛рдл рдареАрдХ рдЪрд▓реЗрдЧрд╛, рд▓реЗрдХрд┐рди рдЬреАрдкреАрдпреВ рдкрд░ рджреБрд░реНрдШрдЯрдирд╛рдЧреНрд░рд╕реНрдд рд╣реЛ рдЧрдпрд╛ред

рд╡рд╛рддрд╛рд╡рд░рдг

рдУрдПрд╕: рдореИрдХреЛрдЬрд╝ 10.12.2
GPU: GeForce GT 750M
рдЯреАрдПрдл: 0.12.1 (рдкрд╛рдЗрдк рд╕реНрдерд╛рдкрд┐рдд)
рдкрд╛рдпрдерди: 3.6.0
CUDA: 8.0
рд╕реАрдпреВрдбреАрдПрдирдПрди: 5.1

( ls -l /path/to/cuda/lib/libcud* рдХрд╛ рдЖрдЙрдЯрдкреБрдЯ):

lrwxr-xr-x  1 root  wheel     33 Dec 14 14:25 /usr/local/cuda/lib/libcuda.1.dylib -> /usr/local/cuda/lib/libcuda.dylib
-rwxr-xr-x  1 root  wheel  13504 Dec  2 16:48 /usr/local/cuda/lib/libcuda.dylib
lrwxr-xr-x  1 root  wheel     45 Nov  3 11:40 /usr/local/cuda/lib/libcudadevrt.a -> /Developer/NVIDIA/CUDA-8.0/lib/libcudadevrt.a
lrwxr-xr-x  1 root  wheel     50 Nov  3 11:40 /usr/local/cuda/lib/libcudart.8.0.dylib -> /Developer/NVIDIA/CUDA-8.0/lib/libcudart.8.0.dylib
lrwxr-xr-x  1 root  wheel     46 Nov  3 11:40 /usr/local/cuda/lib/libcudart.dylib -> /Developer/NVIDIA/CUDA-8.0/lib/libcudart.dylib
lrwxr-xr-x  1 root  wheel     49 Nov  3 11:40 /usr/local/cuda/lib/libcudart_static.a -> /Developer/NVIDIA/CUDA-8.0/lib/libcudart_static.a
lrwxr-xr-x  1 root  wheel     47 Dec 14 10:21 /usr/local/cuda/lib/libcudnn.5.dylib -> /Developer/NVIDIA/CUDA-8.0/lib/libcudnn.5.dylib
lrwxr-xr-x  1 root  wheel     45 Dec 14 10:21 /usr/local/cuda/lib/libcudnn.dylib -> /Developer/NVIDIA/CUDA-8.0/lib/libcudnn.dylib
lrwxr-xr-x  1 root  wheel     48 Dec 14 10:21 /usr/local/cuda/lib/libcudnn_static.a -> /Developer/NVIDIA/CUDA-8.0/lib/libcudnn_static.a

рдЙрджрд╛рд╣рд░рдг

@ymfa рджреНрд╡рд╛рд░рд╛ рдкреНрд░рджрд╛рди рдХрд┐рдпрд╛ рдЧрдпрд╛ рдиреНрдпреВрдирддрдо рдЙрджрд╛рд╣рд░рдг рдореЗрд░реЗ рд╕реЗрдЯрдЕрдк рдкрд░ рд╡рд┐рдлрд▓ рдФрд░ рд╕рдлрд▓ рд╣реЛрддрд╛ рд╣реИред рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рддреАрди рдЖрдЙрдЯрдкреБрдЯ рд╣реИрдВ рдЬрд┐рдирдХрд╛ рдЙрддреНрдкрд╛рджрди рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред
рдЕрд╕рдлрд▓(1)

I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcublas.dylib locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcudnn.dylib locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcufft.dylib locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcuda.1.dylib locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcurand.dylib locally
I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:901] OS X does not support NUMA - returning NUMA node zero
I tensorflow/core/common_runtime/gpu/gpu_device.cc:885] Found device 0 with properties: 
name: GeForce GT 750M
major: 3 minor: 0 memoryClockRate (GHz) 0.9255
pciBusID 0000:01:00.0
Total memory: 2.00GiB
Free memory: 1.76GiB
I tensorflow/core/common_runtime/gpu/gpu_device.cc:906] DMA: 0 
I tensorflow/core/common_runtime/gpu/gpu_device.cc:916] 0:   Y 
I tensorflow/core/common_runtime/gpu/gpu_device.cc:975] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GT 750M, pci bus id: 0000:01:00.0)
Training...
E tensorflow/stream_executor/cuda/cuda_dnn.cc:385] could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR
E tensorflow/stream_executor/cuda/cuda_dnn.cc:352] could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM
F tensorflow/core/kernels/conv_ops.cc:532] Check failed: stream->parent()->GetConvolveAlgorithms(&algorithms) 
Abort trap: 6

рдЕрд╕рдлрд▓(2)

I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcublas.dylib locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcudnn.dylib locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcufft.dylib locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcuda.1.dylib locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcurand.dylib locally
I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:901] OS X does not support NUMA - returning NUMA node zero
I tensorflow/core/common_runtime/gpu/gpu_device.cc:885] Found device 0 with properties: 
name: GeForce GT 750M
major: 3 minor: 0 memoryClockRate (GHz) 0.9255
pciBusID 0000:01:00.0
Total memory: 2.00GiB
Free memory: 1.53GiB
I tensorflow/core/common_runtime/gpu/gpu_device.cc:906] DMA: 0 
I tensorflow/core/common_runtime/gpu/gpu_device.cc:916] 0:   Y 
I tensorflow/core/common_runtime/gpu/gpu_device.cc:975] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GT 750M, pci bus id: 0000:01:00.0)
Training...
E tensorflow/stream_executor/cuda/cuda_blas.cc:372] failed to create cublas handle: CUBLAS_STATUS_NOT_INITIALIZED
W tensorflow/stream_executor/stream.cc:1390] attempting to perform BLAS operation using StreamExecutor without BLAS support
Traceback (most recent call last):
  File "/usr/local/lib/python3.6/site-packages/tensorflow/python/client/session.py", line 1021, in _do_call
    return fn(*args)
  File "/usr/local/lib/python3.6/site-packages/tensorflow/python/client/session.py", line 1003, in _run_fn
    status, run_metadata)
  File "/usr/local/Cellar/python3/3.6.0/Frameworks/Python.framework/Versions/3.6/lib/python3.6/contextlib.py", line 89, in __exit__
    next(self.gen)
  File "/usr/local/lib/python3.6/site-packages/tensorflow/python/framework/errors_impl.py", line 469, in raise_exception_on_not_ok_status
    pywrap_tensorflow.TF_GetCode(status))
tensorflow.python.framework.errors_impl.InternalError: Blas SGEMM launch failed : a.shape=(20, 400), b.shape=(400, 2), m=20, n=2, k=400
     [[Node: MatMul = MatMul[T=DT_FLOAT, transpose_a=false, transpose_b=false, _device="/job:localhost/replica:0/task:0/gpu:0"](Flatten/Reshape, Variable_4/read)]]

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "issue.py", line 52, in <module>
    sess.run(training_operation, feed_dict={x: X, y: Y})
  File "/usr/local/lib/python3.6/site-packages/tensorflow/python/client/session.py", line 766, in run
    run_metadata_ptr)
  File "/usr/local/lib/python3.6/site-packages/tensorflow/python/client/session.py", line 964, in _run
    feed_dict_string, options, run_metadata)
  File "/usr/local/lib/python3.6/site-packages/tensorflow/python/client/session.py", line 1014, in _do_run
    target_list, options, run_metadata)
  File "/usr/local/lib/python3.6/site-packages/tensorflow/python/client/session.py", line 1034, in _do_call
    raise type(e)(node_def, op, message)
tensorflow.python.framework.errors_impl.InternalError: Blas SGEMM launch failed : a.shape=(20, 400), b.shape=(400, 2), m=20, n=2, k=400
     [[Node: MatMul = MatMul[T=DT_FLOAT, transpose_a=false, transpose_b=false, _device="/job:localhost/replica:0/task:0/gpu:0"](Flatten/Reshape, Variable_4/read)]]

Caused by op 'MatMul', defined at:
  File "issue.py", line 43, in <module>
    logits = SimpleNet(x)
  File "issue.py", line 34, in SimpleNet
    logits = tf.matmul(fc1, fc1_W) + fc1_b
  File "/usr/local/lib/python3.6/site-packages/tensorflow/python/ops/math_ops.py", line 1729, in matmul
    a, b, transpose_a=transpose_a, transpose_b=transpose_b, name=name)
  File "/usr/local/lib/python3.6/site-packages/tensorflow/python/ops/gen_math_ops.py", line 1442, in _mat_mul
    transpose_b=transpose_b, name=name)
  File "/usr/local/lib/python3.6/site-packages/tensorflow/python/framework/op_def_library.py", line 759, in apply_op
    op_def=op_def)
  File "/usr/local/lib/python3.6/site-packages/tensorflow/python/framework/ops.py", line 2240, in create_op
    original_op=self._default_original_op, op_def=op_def)
  File "/usr/local/lib/python3.6/site-packages/tensorflow/python/framework/ops.py", line 1128, in __init__
    self._traceback = _extract_stack()

InternalError (see above for traceback): Blas SGEMM launch failed : a.shape=(20, 400), b.shape=(400, 2), m=20, n=2, k=400
     [[Node: MatMul = MatMul[T=DT_FLOAT, transpose_a=false, transpose_b=false, _device="/job:localhost/replica:0/task:0/gpu:0"](Flatten/Reshape, Variable_4/read)]]

рдЙрддреНрддреАрд░реНрдг

I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcublas.dylib locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcudnn.dylib locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcufft.dylib locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcuda.1.dylib locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcurand.dylib locally
I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:901] OS X does not support NUMA - returning NUMA node zero
I tensorflow/core/common_runtime/gpu/gpu_device.cc:885] Found device 0 with properties: 
name: GeForce GT 750M
major: 3 minor: 0 memoryClockRate (GHz) 0.9255
pciBusID 0000:01:00.0
Total memory: 2.00GiB
Free memory: 1.71GiB
I tensorflow/core/common_runtime/gpu/gpu_device.cc:906] DMA: 0 
I tensorflow/core/common_runtime/gpu/gpu_device.cc:916] 0:   Y 
I tensorflow/core/common_runtime/gpu/gpu_device.cc:975] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GT 750M, pci bus id: 0000:01:00.0)
Training...
Training complete!

рд╣рд╛рд▓ рдХреА рдЧрддрд┐рд╡рд┐рдзрд┐ рдХреА рдХрдореА рдХреЗ рдХрд╛рд░рдг рд╕реНрд╡рдЪрд╛рд▓рд┐рдд рд░реВрдк рд╕реЗ рдмрдВрдж рд╣реЛ рд░рд╣рд╛ рд╣реИред рдирдИ рдЬрд╛рдирдХрд╛рд░реА рдЙрдкрд▓рдмреНрдз рд╣реЛрдиреЗ рдкрд░ рдХреГрдкрдпрд╛ рд╕рдорд╕реНрдпрд╛ рдХреЛ рдЕрдкрдбреЗрдЯ рдХрд░реЗрдВ, рдФрд░ рд╣рдо рдЗрд╕ рдореБрджреНрджреЗ рдХреЛ рдлрд┐рд░ рд╕реЗ рдЦреЛрд▓реЗрдВрдЧреЗред рдзрдиреНрдпрд╡рд╛рдж!

рдЗрддрдиреА рдЬрд▓реНрджреА рдирд╣реАрдВ, рдореИрдВ рднреА рдЗрд╕ рджреБрд░реНрдШрдЯрдирд╛ рдХреЛ рджреЗрдЦрддрд╛ рд╣реВрдВред рдореИрдХрдмреБрдХ рдкреНрд░реЛ, geforce 650. TF v1. рдЬреНрдпреВрдкрд┐рдЯрд░ рдХрд░реНрдиреЗрд▓ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдЪрд▓ рд░рд╣рд╛ рд╣реИ, рдЬрд┐рд╕реЗ рдореБрдЭреЗ рдмрд╛рд░-рдмрд╛рд░ рдкреБрдирд░рд╛рд░рдВрдн рдХрд░рдирд╛ рдкрдбрд╝рддрд╛ рд╣реИред рд╣реЛ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдЧреНрд░рд╛рдлрд┐рдХреНрд╕ рдХрд╛рд░реНрдб рдмрд╣реБрдд рдХрдордЬреЛрд░ рд╣реЛ? рдпрд╣ рджреЗрдЦрддреЗ рд╣реБрдП рдХрд┐ рдСрдк рдПрдХ рд╣реА рдХрд╛рд░реНрдб рдХрд╛ рдЙрдкрдпреЛрдЧ рдХреИрд╕реЗ рдХрд░рддрд╛ рд╣реИ: рд╕рдВрднрд╛рд╡рдирд╛ рд╣реИред

I tensorflow/stream_executor/dso_loader.cc:135] successfully opened CUDA library libcublas.8.0.dylib locally
I tensorflow/stream_executor/dso_loader.cc:135] successfully opened CUDA library libcudnn.5.dylib locally
I tensorflow/stream_executor/dso_loader.cc:135] successfully opened CUDA library libcufft.8.0.dylib locally
I tensorflow/stream_executor/dso_loader.cc:135] successfully opened CUDA library libcuda.1.dylib locally
I tensorflow/stream_executor/dso_loader.cc:135] successfully opened CUDA library libcurand.8.0.dylib locally
...
I tensorflow/core/common_runtime/gpu/gpu_device.cc:885] Found device 0 with properties: 
name: GeForce GT 650M
major: 3 minor: 0 memoryClockRate (GHz) 0.9
pciBusID 0000:01:00.0
Total memory: 1023.69MiB
Free memory: 870.46MiB
I tensorflow/core/common_runtime/gpu/gpu_device.cc:906] DMA: 0 
I tensorflow/core/common_runtime/gpu/gpu_device.cc:916] 0:   Y 
I tensorflow/core/common_runtime/gpu/gpu_device.cc:975] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GT 650M, pci bus id: 0000:01:00.0)
E tensorflow/stream_executor/cuda/cuda_dnn.cc:397] could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR
E tensorflow/stream_executor/cuda/cuda_dnn.cc:364] could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM
F tensorflow/core/kernels/conv_ops.cc:605] Check failed: stream->parent()->GetConvolveAlgorithms(&algorithms) 

рдореБрдЭреЗ GTX 960m, cudnn5.1.5 рдФрд░ cuda-8.0.44 рдХреЗ рд╕рд╛рде рднреА рдпрд╣реА рд╕рдорд╕реНрдпрд╛ рд╣реИред

рд╕реЗрдВрдЯреЛрд╕, рдЯрд╛рдЗрдЯрди рдПрдХреНрд╕ рдХреЗ рд╕рд╛рде рднреА рдпрд╣реА рд╕рдорд╕реНрдпрд╛ рд╣реИ

ubuntu (14.04) рдФрд░ GRID K520 (aws g2.2) рдХреЗ рд╕рд╛рде рднреА рдпрд╣реА рд╕рдорд╕реНрдпрд╛ рд╣реИ

рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛ рд╣реИ windows 10 cudnn 5.1 cuda 8 gtx 1060ред рдкреНрд░реЛрдЧреНрд░рд╛рдо рдЯреЗрдВрд╕рд░ рдлреНрд▓реЛ рдХреЗ cpu рд╕рдВрд╕реНрдХрд░рдг рдкрд░ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ рд▓реЗрдХрд┐рди gpu рд╕рдВрд╕реНрдХрд░рдг рдХреЗ рд╕рд╛рде рдпрд╣реА рддреНрд░реБрдЯрд┐рдпрд╛рдВ рдкреНрд░рд╛рдкреНрдд рдХрд░рддрд╛ рд╣реИред

рдореЗрд░реЗ рдкрд╛рд╕ gtx1060, win8.1, cuda8.0.60, cudnn5.0 рдХреЗ рд╕рд╛рде рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛ рдереАред рдирд╡реАрдирддрдо рд╕реНрдерд┐рд░ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ-рдЬреАрдкреАрдпреВ рдирд╛рдЗрдЯрд▓реА рдмрд┐рд▓реНрдб (рд╡рд░реНрддрдорд╛рди рдореЗрдВ http://ci.tensorflow.org/job/nightly-win/133/) рдФрд░ cudnn5.1 рдореЗрдВ рдЕрдкрдЧреНрд░реЗрдб рдХрд┐рдпрд╛ рдЧрдпрд╛ред рд╕рдорд╕реНрдпрд╛ рд╣рд▓ рд╣реЛ рдЧрдИред

рдпрд╣рд╛рдБ рд╡рд╣реА рдореБрджреНрджрд╛ред

рдореИрдВ рдиреАрдЪреЗ рд╕реВрдЪреАрдмрджреНрдз рд╕реЙрдлрд╝реНрдЯрд╡реЗрдпрд░ рд╕рдВрд╕реНрдХрд░рдгреЛрдВ рдХреЗ рд╕рд╛рде рдЗрд╕ рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░ рд░рд╣рд╛ рдерд╛, рд╕рд┐рд╡рд╛рдп TF рд╕рдВрд╕реНрдХрд░рдг 1.0.0 рдерд╛ред рдореИрдВрдиреЗ рдлрд┐рд░ TF 1.0.1 рдореЗрдВ рдЕрдкрдЧреНрд░реЗрдб рдХрд┐рдпрд╛ред рдореИрдВрдиреЗ рдПрдХ рд╣реА рдХрд╛рд░реНрдпрдХреНрд░рдо рдХреЛ рдПрдХ рдмрд╛рд░ рдЪрд▓рд╛рдпрд╛ рдФрд░ рдпрд╣ рдХрд╛рдо рдХрд┐рдпрд╛ ред рдореИрдВрдиреЗ рдлрд┐рд░ рдЗрд╕реЗ рдлрд┐рд░ рд╕реЗ рдЪрд▓рд╛рдпрд╛ рдФрд░ рдпрд╣ рдХрд╛рдо рдирд╣реАрдВ рдХрд┐рдпрд╛ - рдЗрд╕рдиреЗ рдкрд╣рд▓реЗ рдХреА рддрд░рд╣ рд╣реА рддреНрд░реБрдЯрд┐ рдЙрддреНрдкрдиреНрди рдХреАред

рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ-рдЬреАрдкреАрдпреВ 1.0.1
рдореИрдХ рдУрдПрд╕ рдПрдХреНрд╕ 10.12.3
рдХреБрдбрд╛ 8.0.61
рдХреНрдпреВрдбреАрдПрдирдПрди 5.1
GeForce GT 750M

gtx650, ubuntu 16.04, CUDA рд╕рдВрд╕реНрдХрд░рдг 8.0.61, TF рд╕рдВрд╕реНрдХрд░рдг 1.0.0 рдХреЗ рд╕рд╛рде рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛ рд╣реИ
рдпрд╣ рдЕрднреА рдХрд╛рдо рдХрд░ рд░рд╣рд╛ рдерд╛, рд▓реЗрдХрд┐рди рдХреБрдЫ рдХрдо рд╕реНрдореГрддрд┐ рдЪреЗрддрд╛рд╡рдиреА рджреЗ рд░рд╣рд╛ рдерд╛ред рд╣рд╛рд▓рд╛рдБрдХрд┐, рдпрд╣ рдЪрд▓ рд░рд╣рд╛ рдерд╛
рдЕрдм рдпрд╣ рдмрд┐рд▓реНрдХреБрд▓ рднреА рдирд╣реАрдВ рдЪрд▓рддрд╛ рд╣реИ, рдореБрдЭреЗ рд╡рд╣реА рдЪреЗрдХ рджреЗ рд░рд╣рд╛ рд╣реИ: рд╕реНрдЯреНрд░реАрдо-> рдкреИрд░реЗрдВрдЯ () -> GetConvolveAlgorithms (& рдПрд▓реНрдЧреЛрд░рд┐рджрдо) рддреНрд░реБрдЯрд┐

рдЬреАрдЯреАрдПрдХреНрд╕ 1080 рдЯреАрдЖрдИ, рд╡рд┐рдВрдбреЛрдЬрд╝ 10, рд╕реАрдпреВрдбреАрдП рд╕рдВрд╕реНрдХрд░рдг 8.0.61, рдЯреАрдПрдл рд╕рдВрд╕реНрдХрд░рдг 1.0.1, 5.1 рдХреБрдбрд╛рди, рдХреНрдпреВрдбрд╛ 8.0.61 рдХреЗ рд╕рд╛рде рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛ рд╣реИред

рдореИрдВ GPU рдХреЗ рдЙрдкрдпреЛрдЧ рдХреЛ рд╕реАрдорд┐рдд рдХрд░рдХреЗ рдХрд╛рдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдкреНрд░реЛрдЧреНрд░рд╛рдо рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдерд╛ред рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ рдЙрдмрдВрдЯреВ 16.04 рдкрд░ 3 рдЬреАрдмреА рдЬреАрдЯреАрдПрдХреНрд╕ 1060 рдХреЗ рд╕рд╛рде, рдЕрдЧрд░ рдореИрдВ gpu рд╡рд┐рдХрд▓реНрдк per_process_gpu_memory_fraction рдХреЛ .7 рдкрд░ рд╕реЗрдЯ рдХрд░рддрд╛ рд╣реВрдВ рддреЛ рдпрд╣ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред рдХреБрдЫ рднреА рдЕрдзрд┐рдХ, рдореБрдЭреЗ рдпреЗ рддреНрд░реБрдЯрд┐рдпрд╛рдВ рдорд┐рд▓рддреА рд╣реИрдВ

E tensorflow/stream_executor/cuda/cuda_dnn.cc:397] cudnn рд╣реИрдВрдбрд▓ рдирд╣реАрдВ рдмрдирд╛ рд╕рдХрд╛: CUDNN_STATUS_INTERNAL_ERROR
E tensorflow/stream_executor/cuda/cuda_dnn.cc:364] cudnn рд╣реИрдВрдбрд▓ рдХреЛ рдирд╖реНрдЯ рдирд╣реАрдВ рдХрд░ рд╕рдХрд╛: CUDNN_STATUS_BAD_PARAM
F tensorflow/core/kernels/conv_ops.cc:605] рдЬрд╛рдБрдЪ рд╡рд┐рдлрд▓: рд╕реНрдЯреНрд░реАрдо-> рдкреИрд░реЗрдВрдЯ () -> GetConvolveAlgorithms(&algorithms)

рдпрд╣ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рджреНрд╡рд╛рд░рд╛ рдЦрд░рд╛рдм рддреНрд░реБрдЯрд┐ рд░рд┐рдкреЛрд░реНрдЯрд┐рдВрдЧ рдХрд╛ рдорд╛рдорд▓рд╛ рд╣реЛ рд╕рдХрддрд╛ рд╣реИред рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдЕрд╕рдВрдмрдВрдзрд┐рдд рд▓рдЧрддрд╛ рд╣реИред рд╢рд╛рдпрдж рдпрд╣ рдЗрд╕реЗ рдмреЗрд╣рддрд░ рддрд░реАрдХреЗ рд╕реЗ рд╣рд▓ рдХрд░рдиреЗ рдХрд╛ рдПрдХ рд╕реБрд░рд╛рдЧ рд╣реИ?

@ рдЭреЗрдВрдЧ-рдПрдХреНрд╕рдХреНрдпреВ рдХреНрдпрд╛ рдХреЛрдИ рд╕реНрдкрд╖реНрдЯ рд╕реЗрдЯрдЕрдк рд╕рдорд╕реНрдпрд╛ рд╣реИ?

рд╡рд╣реА рдореБрджреНрджрд╛ рднреАред рдореИрдВ рд╡рд┐рдВрдбреЛрдЬ 10, GTX1070, CUDA 8.0, cuDNN 5.1 рдкрд░ рд╣реВрдВред

E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\cuda\cuda_dnn.cc:359] cudnn рд╣реИрдВрдбрд▓ рдирд╣реАрдВ рдмрдирд╛ рд╕рдХрд╛: CUDNN_STATUS_NOT_INITIALIZED
E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\cuda\cuda_dnn.cc:366] рдбреНрд░рд╛рдЗрд╡рд░ рд╕рдВрд╕реНрдХрд░рдг рдХреЛ рдкреБрдирд░реНрдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдореЗрдВ рддреНрд░реБрдЯрд┐: рд▓рд╛рдЧреВ рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛: рдХрд░реНрдиреЗрд▓ рд░рд┐рдкреЛрд░реНрдЯ рдХрд┐рдП рдЧрдП рдбреНрд░рд╛рдЗрд╡рд░ рд╕рдВрд╕реНрдХрд░рдг рдХреЛ рд╡рд┐рдВрдбреЛрдЬрд╝ рдкрд░ рд▓рд╛рдЧреВ рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛
E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\cuda\cuda_dnn.cc:326] cudnn рд╣реИрдВрдбрд▓ рдХреЛ рдирд╖реНрдЯ рдирд╣реАрдВ рдХрд░ рд╕рдХрд╛: CUDNN_STATUS_BAD_PARAM
F c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\kernels\conv_ops.cc:659] рдЪреЗрдХ рдлреЗрд▓: рд╕реНрдЯреНрд░реАрдо-> рдкреИрд░реЗрдВрдЯ ()-> GetConvolveAlgorithms(&algorithms)

рдЕрдЧрд░ рдпрд╣ рдХрд┐рд╕реА рдХреА рдорджрдж рдХрд░рддрд╛ рд╣реИ, рддреЛ рдРрд╕рд╛ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдХрднреА-рдХрднреА рдЬрд╝реЛрдВрдмреА рдкреНрд░рдХреНрд░рд┐рдпрд╛рдПрдВ рд╢реЗрд╖ рд╣реЛрддреА рд╣реИрдВ рдЬреЛ рдЯреАрдПрдл рдХреЛ рдлрд┐рд░ рд╕реЗ рдареАрдХ рд╕реЗ рд╢реБрд░реВ рдХрд░рдиреЗ рд╕реЗ рд░реЛрдХрддреА рд╣реИрдВ рдФрд░ рдореБрдЭреЗ рдпрд╣ рддреНрд░реБрдЯрд┐ рджреЗрддреА рд╣реИред рдЙрдиреНрд╣реЗрдВ рдорд╛рд░рдирд╛ рдЗрд╕ рдореБрджреНрджреЗ рдХреЗ рдЖрд╕рдкрд╛рд╕ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред

рдпрд╣рд╛рдВ рдХреБрдЫ рдФрд░ рдЬрд╛рдирдХрд╛рд░реА рджреА рдЧрдИ рд╣реИ рдХрд┐ рдореИрдВрдиреЗ рдЗрд╕реЗ рдЕрд╕реНрдерд╛рдпреА рд░реВрдк рд╕реЗ рдХреИрд╕реЗ рд╣рд▓ рдХрд┐рдпрд╛ред рдореЗрд░рд╛ рдорд╛рдирдирд╛ тАЛтАЛтАЛтАЛрд╣реИ рдХрд┐ рдпреЗ рд╕рднреА рдореБрджреНрджреЗ GPU рдореЗрдореЛрд░реА рдЖрд╡рдВрдЯрди рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИрдВ рдФрд░ рдЗрдирдХрд╛ рд░рд┐рдкреЛрд░реНрдЯ рдХреА рдЬрд╛ рд░рд╣реА рддреНрд░реБрдЯрд┐рдпреЛрдВ рд╕реЗ рдХреЛрдИ рд▓реЗрдирд╛-рджреЗрдирд╛ рдирд╣реАрдВ рд╣реИред рдЗрд╕рд╕реЗ рдкрд╣рд▓реЗ рдЕрдиреНрдп рддреНрд░реБрдЯрд┐рдпрд╛рдВ рдереАрдВ рдЬреЛ рдХрд┐рд╕реА рдкреНрд░рдХрд╛рд░ рдХреА рдореЗрдореЛрд░реА рдЖрд╡рдВрдЯрди рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рдВрдХреЗрдд рджреЗрддреА рдереАрдВ, рд▓реЗрдХрд┐рди рдХрд╛рд░реНрдпрдХреНрд░рдо рдЖрдЧреЗ рдмрдврд╝рддрд╛ рд░рд╣рд╛, рдЕрдВрддрддрдГ рд╕рднреА рдХреЛ рдорд┐рд▓рдиреЗ рд╡рд╛рд▓реА рдХреБрдбрди рддреНрд░реБрдЯрд┐рдпрд╛рдВ рджреЗ рд░рд╣рд╛ рдерд╛ред рдореЗрд░рд╛ рдорд╛рдирдирд╛ тАЛтАЛтАЛтАЛрд╣реИ рдХрд┐ рдпрд╣ рдХрднреА-рдХрднреА рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ, рдЗрд╕рдХрд╛ рдХрд╛рд░рдг рдпрд╣ рд╣реИ рдХрд┐ рдпрджрд┐ рдЖрдк рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдХреЗ рдЕрд▓рд╛рд╡рд╛ рдЕрдиреНрдп рдЪреАрдЬреЛрдВ рдХреЗ рд▓рд┐рдП рдЬреАрдкреАрдпреВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВ рдЬреИрд╕реЗ рдХрд┐ рдЖрдкрдХрд╛ рдкреНрд░рд╛рдердорд┐рдХ рдкреНрд░рджрд░реНрд╢рди, рдЙрдкрд▓рдмреНрдз рдореЗрдореЛрд░реА рдореЗрдВ рдЙрддрд╛рд░-рдЪрдврд╝рд╛рд╡ рд╣реЛрддрд╛ рд╣реИред рдХрднреА-рдХрднреА рдЖрдк рдЬреЛ рдЪрд╛рд╣рддреЗ рд╣реИрдВ рдЙрд╕реЗ рдЖрд╡рдВрдЯрд┐рдд рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ рдФрд░ рджреВрд╕рд░реА рдмрд╛рд░ рдпрд╣ рдирд╣реАрдВ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред

рдПрдкреАрдЖрдИ рд╕реЗ
https://www.tensorflow.org/versions/r0.12/how_tos/using_gpu/
"рдбрд┐рдлрд╝реЙрд▓реНрдЯ рд░реВрдк рд╕реЗ, TensorFlow рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдХреЗ рд▓рд┐рдП рджреГрд╢реНрдпрдорд╛рди рд╕рднреА GPU (CUDA_VISIBLE_DEVICES рдХреЗ рдЕрдзреАрди) рдХреА рд▓рдЧрднрдЧ рд╕рднреА GPU рдореЗрдореЛрд░реА рдХреЛ рдореИрдк рдХрд░рддрд╛ рд╣реИред рдпрд╣ рдореЗрдореЛрд░реА рд╡рд┐рдЦрдВрдбрди рдХреЛ рдХрдо рдХрд░рдХреЗ рдбрд┐рд╡рд╛рдЗрд╕ рдкрд░ рдЕрдкреЗрдХреНрд╖рд╛рдХреГрдд рдХреАрдорддреА GPU рдореЗрдореЛрд░реА рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдХрд╛ рдЕрдзрд┐рдХ рдХреБрд╢рд▓рддрд╛ рд╕реЗ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред"

рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдбрд┐рдлрд╝реЙрд▓реНрдЯ рдЖрд╡рдВрдЯрди рдХрд┐рд╕реА рддрд░рд╣ рд╕реЗ рдЯреВрдЯрд╛ рд╣реБрдЖ рд╣реИ рдЬреЛ рдЗрд╕ рдЕрдирд┐рд╢реНрдЪрд┐рдд рд╡реНрдпрд╡рд╣рд╛рд░ рдФрд░ рдХреБрдЫ рд╕реНрдерд┐рддрд┐рдпреЛрдВ рдХреЛ рдХрд╛рдо рдХрд░рдиреЗ рдФрд░ рджреВрд╕рд░реЛрдВ рдХреЛ рд╡рд┐рдлрд▓ рдХрд░рдиреЗ рдХрд╛ рдХрд╛рд░рдг рдмрдирддрд╛ рд╣реИред

рдореИрдВрдиреЗ рдиреНрдпреВрдирддрдо рдорд╛рддреНрд░рд╛ рдореЗрдВ рдореЗрдореЛрд░реА рдЖрд╡рдВрдЯрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП TF рдХреЗ рдбрд┐рдлрд╝реЙрд▓реНрдЯ рд╡реНрдпрд╡рд╣рд╛рд░ рдХреЛ рдмрджрд▓рдХрд░ рдФрд░ рд╡реЗрдмрдкреЗрдЬ рдореЗрдВ рд╡рд┐рд╕реНрддреГрдд рд░реВрдк рд╕реЗ рдЖрд╡рд╢реНрдпрдХрддрд╛рдиреБрд╕рд╛рд░ рдмрдврд╝рдиреЗ рдХреЗ рджреНрд╡рд╛рд░рд╛ рдЗрд╕ рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рдорд╛рдзрд╛рди рдХрд┐рдпрд╛ рд╣реИред
рдХреЙрдиреНрдлрд┐рдЧ = tf.ConfigProto ()
config.gpu_options.allow_growth = рд╕рд╣реА
рд╕рддреНрд░ = tf. рд╕рддреНрд░ (рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди = рдХреЙрдиреНрдлрд╝рд┐рдЧ, ...)

рдореИрдВрдиреЗ рд╡реИрдХрд▓реНрдкрд┐рдХ рддрд░реАрдХреЗ рд╕реЗ рднреА рдХреЛрд╢рд┐рд╢ рдХреА рд╣реИ рдФрд░ рдЗрд╕реЗ рдХрд╛рдо рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдерд╛ рдФрд░ рдкреНрд░рдпреЛрдЧрд╛рддреНрдордХ рд░реВрдк рд╕реЗ рдХрд╛рдо рдХрд░рдиреЗ рд╡рд╛рд▓реЗ рдкреНрд░рддрд┐рд╢рдд рдХреЛ рдЪреБрдирдиреЗ рдореЗрдВ рдЕрд╕рдлрд▓ рд░рд╣рд╛ред рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ рдпрд╣ рд▓рдЧрднрдЧ .7 рд╣реЛ рдЧрдпрд╛ред

рдХреЙрдиреНрдлрд┐рдЧ = tf.ConfigProto ()
config.gpu_options.per_process_gpu_memory_fraction = 0.4
рд╕рддреНрд░ = tf. рд╕рддреНрд░ (рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди = рдХреЙрдиреНрдлрд╝рд┐рдЧ, ...)

рдЕрднреА рднреА рдЯреАрдПрдл рдЯреАрдо рдХреЗ рдХрд┐рд╕реА рднреА рд╡реНрдпрдХреНрддрд┐ рдиреЗ рдЗрд╕рдХреА рдкреБрд╖реНрдЯрд┐ рдирд╣реАрдВ рдХреА рд╣реИ, рд▓реЗрдХрд┐рди рдпрд╣ рджреЗрдЦрдиреЗ рдХреЗ рд▓рд╛рдпрдХ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рдЕрдиреНрдп рд╕рдорд╛рди рд╡реНрдпрд╡рд╣рд╛рд░ рдХреА рдкреБрд╖реНрдЯрд┐ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред

рдореБрдЭреЗ CUDNN_STATUS_NOT_INITIALIZED рддреНрд░реБрдЯрд┐ рднреА рдорд┐рд▓ рд░рд╣реА рд╣реИред рдпрд╣рд╛рдБ рдкреВрд░реНрдг рддреНрд░реБрдЯрд┐ рд▓реЙрдЧ рд╣реИ:

2017-04-26 00:08:57.526234: I c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\gpu\gpu_device.cc:977] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GTX 1080, pci bus id: 0000:01:00.0)
2017-04-26 00:09:01.111706: E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\cuda\cuda_dnn.cc:359] could not create cudnn handle: CUDNN_STATUS_NOT_INITIALIZED
2017-04-26 00:09:01.111805: E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\cuda\cuda_dnn.cc:366] error retrieving driver version: Unimplemented: kernel reported driver version not implemented on Windows
2017-04-26 00:09:01.114040: E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\cuda\cuda_dnn.cc:326] could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM
2017-04-26 00:09:01.114232: F c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\kernels\conv_ops.cc:659] Check failed: stream->parent()->GetConvolveAlgorithms(&algorithms)

рдореИрдВ рд╡рд┐рдВрдбреЛрдЬ 10, CUDA 8.0, cuDNN 5.1 рдкрд░ рд╣реВрдВред рдХреНрдпрд╛ рдЗрдирд╕реЗ рдмрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рдХреБрдЫ рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ? рдореИрдВ рдкрд╣рд▓реЗ рдХреБрдЫ рдЕрдиреНрдп рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдкрд░реАрдХреНрд╖рдг рдЪрд▓рд╛рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдерд╛ рдФрд░ рдЗрд╕рдиреЗ рдареАрдХ рдХрд╛рдо рдХрд┐рдпрд╛ (рд░реВрдкрд╛рдВрддрд░рдг рд╕рд╣рд┐рдд), рд▓реЗрдХрд┐рди рдЕрдм рдпрд╣ рдЗрд╕ рдирдП рдкрд░реАрдХреНрд╖рдг рдкрд░ рдХрд╛рдо рдирд╣реАрдВ рдХрд░рддрд╛ рд╣реИ ...

@ serans1 рдЖрдк рдХрд┐рд╕ рдЬрд╝реЛрдВрдмреА рдкреНрд░рдХреНрд░рд┐рдпрд╛рдУрдВ рдХрд╛ рдЬрд┐рдХреНрд░ рдХрд░ рд░рд╣реЗ рд╣реИрдВ?

рдХреГрдкрдпрд╛ рдореБрдЭреЗ рдмрддрд╛рдПрдВ рдХрд┐ рдХреНрдпрд╛ рдЗрд╕рдХрд╛ рдХреЛрдИ рдЙрдкрд╛рдп рд╣реИред рд╢реБрдХреНрд░рд┐рдпрд╛!

рд╕рдВрдкрд╛рджрд┐рдд рдХрд░реЗрдВ рдпрд╣ рдПрдХ рдиреМрд╕рд┐рдЦрд┐рдпрд╛ рдЧрд▓рддреА рд╣реЛ рд╕рдХрддреА рд╣реИ, рд▓реЗрдХрд┐рди рдореИрдВ рдпрд╣рд╛рдВ рдЗрд╕рдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд░реВрдВрдЧрд╛, рдЕрдЧрд░ рдХреЛрдИ рдФрд░ рдЙрд╕реА рдореБрджреНрджреЗ рдкрд░ рдЪрд▓рддрд╛ рд╣реИ:
рдореЗрд░реА рд╕рдорд╕реНрдпрд╛ рдпрд╣ рдереА рдХрд┐ рдореЗрд░реЗ рдкрд╛рд╕ рдкрд╣рд▓реЗ рд╕реЗ рд╣реА рдПрдХ рдЬреНрдпреВрдкрд┐рдЯрд░ рдкрд╛рдпрдерди рдиреЛрдЯрдмреБрдХ рдХрд╛ рдПрдХ рдЙрджрд╛рд╣рд░рдг рдЪрд▓ рд░рд╣рд╛ рдерд╛ (рдЬрд┐рд╕рдХреА рд╕рднреА рдХреЛрд╢рд┐рдХрд╛рдПрдВ рдкрд╣рд▓реЗ рд╕реЗ рд╣реА рдЪрд▓ рд░рд╣реА рдереАрдВ, рдЗрд╕рд▓рд┐рдП рдореЗрдореЛрд░реА рдореЗрдВ рднрд░реА рд╣реБрдИ рдереАрдВ), рдФрд░ рдХреБрдЫ рдЕрдиреНрдп рдкреНрд░рдХреНрд░рд┐рдпрд╛ рднреА рдЬреЛ GPU рдореЗрдореЛрд░реА (рдиреНрдпреВрдирддрдо рд╡реАрдбрд┐рдпреЛ рдЧреЗрдо) рд▓реЗ рд░рд╣реА рдереАред рдЗрд╕рд▓рд┐рдП, рдЬрдм рдореИрдВрдиреЗ рдЕрдкрдиреЗ GPU рдкрд░ рдореЗрдореЛрд░реА рдЙрдкрдпреЛрдЧ рдХреА рдЬрд╛рдБрдЪ рдХреА, рддреЛ рдпрд╣ рдкрд╣рд▓реЗ рд╕реЗ рд╣реА рд▓рдЧрднрдЧ 4+GB (50+%) рдерд╛ред рдореИрдВрдиреЗ рдЬреНрдпреВрдкрд┐рдЯрд░ рдиреЛрдЯрдмреБрдХ рдФрд░ рдЕрдиреНрдп рдПрдкреНрд▓рд┐рдХреЗрд╢рди рдХреЛ рдмрдВрдж рдХрд░ рджрд┐рдпрд╛, рдФрд░ рдЕрдкрдирд╛ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдкрд░реАрдХреНрд╖рдг рдлрд┐рд░ рд╕реЗ рдЪрд▓рд╛рдпрд╛ред рдЕрдм рд╕рдм рдХреБрдЫ рд╕реБрдЪрд╛рд░реВ рд░реВрдк рд╕реЗ рдЪрд▓рд╛ :) рд╕рд╛рде рд╣реА, рджреМрдбрд╝рддреЗ рд╕рдордп рдореИрдВрдиреЗ рджреЗрдЦрд╛ рдХрд┐ рдЪрд░рдо рдкрд░ рдпрд╣ рдореЗрд░реА GPU рдореЗрдореЛрд░реА рдХрд╛ 90% рддрдХ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИ, рдФрд░ рдЗрд╕ рдкреНрд░рдХрд╛рд░ рдпрд╣ рд╕рдордЭ рдореЗрдВ рдЖрддрд╛ рд╣реИ рдХрд┐ рдЬрдм рдпрд╣ рдореЗрд░реА рдкреНрд░рд╛рд░рдВрднрд┐рдХ рд╕реНрдерд┐рддрд┐ рдореЗрдВ 50% рд╕реЗ рдХрдо рдЙрдкрд▓рдмреНрдз рдерд╛, рддреЛ рдпрд╣ CUDNN рдХреЛ рдкреНрд░рд╛рд░рдВрдн рдХреНрдпреЛрдВ рдирд╣реАрдВ рдХрд░ рд╕рдХрд╛ .

рдореЗрд░реА рдЧрд▓рддреА рдХреЗ рд▓рд┐рдП рдлрд┐рд░ рд╕реЗ рдХреНрд╖рдорд╛ рдХрд░реЗрдВ! рдореИрдВ рдЗрд╕рдХреЗ рд╕рд╛рде рдЦреЗрд▓рдиреЗ рдХреА рд╢реБрд░реБрдЖрдд рдореЗрдВ рд╣реВрдВ :)

рд╡рд╣реА рд╕рдорд╕реНрдпрд╛, рдХреНрдпрд╛ рдЗрд╕рдХрд╛ рдХреЛрдИ рд╕рдорд╛рдзрд╛рди рд╣реИ?

рдореИрдВ c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\gpu\gpu_device.cc:885] рдЧреБрдгреЛрдВ рдХреЗ рд╕рд╛рде рдбрд┐рд╡рд╛рдЗрд╕ 0 рдорд┐рд▓рд╛:
рдирд╛рдо: GeForce GTX 960M
рдореЗрдЬрд░: 5 рдорд╛рдЗрдирд░: 0 рдореЗрдореЛрд░реАрдХреНрд▓реЙрдХрд░реЗрдЯ (рдЧреАрдЧрд╛рд╣рд░реНрдЯреНрдЬ) 1.176
рдкреАрд╕реАрдЖрдИрдмрд╕рдЖрдИрдбреА 0000:01:00.0
рдХреБрд▓ рдореЗрдореЛрд░реА: 4.00GiB
рдлреНрд░реА рдореЗрдореЛрд░реА: 3.35GiB
рдореИрдВ c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\gpu\gpu_device.cc:906] DMA: 0
рдореИрдВ c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\gpu\gpu_device.cc:916] 0: Y
рдореИрдВ c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\gpu\gpu_device.cc:975] TensorFlow рдбрд┐рд╡рд╛рдЗрд╕ рдмрдирд╛рдирд╛ (/gpu:0) -> (рдбрд┐рд╡рд╛рдЗрд╕: 0, рдирд╛рдо: GeForce GTX 960M, рдкреАрд╕реАрдЖрдИ рдмрд╕ рдЖрдИрдбреА: 0000:01:00.0)
E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\gpu\gpu_device.cc:586] NUMA рдиреЛрдб рдХреА рдкрд╣рдЪрд╛рди рдирд╣реАрдВ рдХрд░ рд╕рдХрд╛ /job:localhost/рдкреНрд░рддрд┐рдХреГрддрд┐:0 /task:0/gpu:0, рдбрд┐рдлрд╝реЙрд▓реНрдЯ рд░реВрдк рд╕реЗ 0. рд╣реЛ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ рдЖрдкрдХрд╛ рдХрд░реНрдиреЗрд▓ NUMA рд╕рдорд░реНрдерди рдХреЗ рд╕рд╛рде рдирд╣реАрдВ рдмрдирд╛рдпрд╛ рдЧрдпрд╛ рд╣реЛред
E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\cuda\cuda_dnn.cc:385] cudnn рд╣реИрдВрдбрд▓ рдирд╣реАрдВ рдмрдирд╛ рд╕рдХрд╛: CUDNN_STATUS_NOT_INITIALIZED
E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\cuda\cuda_dnn.cc:392] рдбреНрд░рд╛рдЗрд╡рд░ рд╕рдВрд╕реНрдХрд░рдг рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдореЗрдВ рддреНрд░реБрдЯрд┐: рдЕрдиреБрдорддрд┐ рдЕрд╕реНрд╡реАрдХреГрдд: рдкрдврд╝рдиреЗ рдХреЗ рд▓рд┐рдП рдбреНрд░рд╛рдЗрд╡рд░ рд╕рдВрд╕реНрдХрд░рдг рдкрде рдирд╣реАрдВ рдЦреЛрд▓ рд╕рдХрд╛ : / рдЦрд░реАрдж / рдЪрд╛рд▓рдХ / рдПрдирд╡реАрдбрд┐рдпрд╛ / рд╕рдВрд╕реНрдХрд░рдг
E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\cuda\cuda_dnn.cc:352] cudnn рд╣реИрдВрдбрд▓ рдХреЛ рдирд╖реНрдЯ рдирд╣реАрдВ рдХрд░ рд╕рдХрд╛: CUDNN_STATUS_BAD_PARAM
F c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\kernels\conv_ops.cc:532] рдЪреЗрдХ рдлреЗрд▓: рд╕реНрдЯреНрд░реАрдо-> рдкреИрд░реЗрдВрдЯ ()-> GetConvolveAlgorithms(&algorithms)

рдореЗрд░реЗ рдкрд╛рд╕ рдмрд┐рд▓реНрдХреБрд▓ рд╡рд╣реА рдореБрджреНрджрд╛ рд╣реИред
рд▓реЗрдХрд┐рди рдореИрдВ рдЕрдкрдиреЗ рдХреЛрдб рд░реВрдЯ рдПрдХреНрд╕реЗрд╕ (рд╕реВрдбреЛ рдХреЗ рд╕рд╛рде) рдХреЗ рд╕рд╛рде рдЪрд▓рд╛ рд╕рдХрддрд╛ рд╣реВрдВред
рд╡рд░реНрддрдорд╛рди рдореЗрдВ рдореИрдВ GTX 960 рдХреЗ рд╕рд╛рде Ubuntu 16.04 рдкрд░ рдХрд╛рдо рдХрд░ рд░рд╣рд╛ рд╣реВрдВред
рдореЗрд░рд╛ CUDA рд╕рдВрд╕реНрдХрд░рдг 8.0 рд╣реИ рдФрд░ рдореИрдВ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ 1.01 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рд╣реВрдБ

рд╡рд┐рдВрдбреЛрдЬ 10 / рдЯреЗрдВрд╕рд░рдлреНрд▓реЛ 1.01
рдореИрдВ рдЗрд╕реЗ рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдЗрд╕реНрддреЗрдорд╛рд▓ рдХрд░ рд░рд╣рд╛ рдерд╛ рд▓реЗрдХрд┐рди рдЕрдм рдЧрд▓рддреА рд╕реЗ рдореЗрд░реЗ рд╕рд╛рде рднреА рдпрд╣реА рддреНрд░реБрдЯрд┐ рд╣реЛ рд░рд╣реА рд╣реИ

рдирд╛рдо: GeForce GTX 1070
рдореЗрдЬрд░: 6 рдорд╛рдЗрдирд░: 1 рдореЗрдореЛрд░реАрдХреНрд▓реЙрдХ рд░реЗрдЯ (GHz) 1.7715
рдкреАрд╕реАрдЖрдИрдмрд╕рдЖрдИрдбреА 0000:03:00.0
рдХреБрд▓ рдореЗрдореЛрд░реА: 8.00GiB
рдлреНрд░реА рдореЗрдореЛрд░реА: 6.68GiB
2017-05-08 21:12:16.103654: рдореИрдВ c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\gpu\gpu_device.cc:908] DMA: 0
2017-05-08 21:12:16.105184: рдореИрдВ c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\gpu\gpu_device.cc:918] 0: Y
2017-05-08 21:12:16.106710: I c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\gpu\gpu_device.cc:977] TensorFlow рдбрд┐рд╡рд╛рдЗрд╕ рдмрдирд╛рдирд╛ (/gpu:0) -> (рдбрд┐рд╡рд╛рдЗрд╕: 0, рдирд╛рдо: GeForce GTX 1070, рдкреАрд╕реАрдЖрдИ рдмрд╕ рдЖрдИрдбреА: 0000:03:00.0)
2017-05-08 21:12:24.395060: E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\cuda\cuda_dnn.cc:359] cudnn рд╣реИрдВрдбрд▓ рдирд╣реАрдВ рдмрдирд╛ рд╕рдХрд╛ : CUDNN_STATUS_NOT_INITIALIZED
2017-05-08 21:12:24.395177: E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\cuda\cuda_dnn.cc:366] рдбреНрд░рд╛рдЗрд╡рд░ рд╕рдВрд╕реНрдХрд░рдг рдХреЛ рдкреБрдирд░реНрдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдореЗрдВ рддреНрд░реБрдЯрд┐: рд▓рд╛рдЧреВ рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛: рдХрд░реНрдиреЗрд▓ рдиреЗ рд░рд┐рдкреЛрд░реНрдЯ рдХрд┐рдпрд╛ рдХрд┐ рдбреНрд░рд╛рдЗрд╡рд░ рд╕рдВрд╕реНрдХрд░рдг рд╡рд┐рдВрдбреЛрдЬрд╝ рдкрд░ рд▓рд╛рдЧреВ рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ
2017-05-08 21:12:24.396636: E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\cuda\cuda_dnn.cc:326] cudnn рд╣реИрдВрдбрд▓ рдХреЛ рдирд╖реНрдЯ рдирд╣реАрдВ рдХрд░ рд╕рдХрд╛ : CUDNN_STATUS_BAD_PARAM
2017-05-08 21:12:24.396846: F c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\kernels\conv_ops.cc:659] рдЪреЗрдХ рдлреЗрд▓: рд╕реНрдЯреНрд░реАрдо- > рдкреИрд░реЗрдВрдЯ () -> GetConvolveAlgorithms(&algorithms)

@strickon рдХреА рд╡рд┐рдзрд┐ рдиреЗ рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рдХрд┐рдпрд╛ред рдРрд╕рд╛ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдПрдХ рд╕рд╛рде рдмрд╣реБрдд рд╕рд╛рд░реЗ рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдХреЛ рд╣реЙрдЧ рдХрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░ рд░рд╣рд╛ рд╣реИ рдФрд░ рдЬреЛ рдСрдкрд░реЗрд╢рди рдХреЛ рдХреНрд░реИрд╢ рдирд╣реАрдВ рдХрд░ рд╕рдХрддрд╛ рд╣реИред рдореИрдВрдиреЗ рд╡рд┐рд╢реЗрд╖ рд░реВрдк рд╕реЗ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛:

config.gpu_options.allow_growth = рд╕рд╣реА

@strickon рдХреЗ рд╕реБрдЭрд╛рд╡ рдХреА рдкреБрд╖реНрдЯрд┐

рдореИрдВ https://github.com/awjuliani/DeepRL-Agents/blob/master/Double-Dueling-DQN.ipynb рдЪрд▓рд╛ рд░рд╣рд╛ рд╣реВрдВ рдФрд░ рдЕрдкрдбреЗрдЯ рдмреНрд▓реЙрдХ рдХреЗ рднреАрддрд░ sess.run рдХреЛ рдкрд╣рд▓реА рдХреЙрд▓ рдкрд░ рдЗрд╕ рдереНрд░реЗрдб рдореЗрдВ рдЙрд▓реНрд▓рд┐рдЦрд┐рдд рд╡рд┐рдлрд▓рддрд╛рдУрдВ рдХреЛ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣рд╛ рдерд╛ ( The рд▓рд╛рдЗрди: Q1 = sess.run(mainQN.predict,feed_dict={mainQN.scalarInput:np.vstack(trainBatch[:,3])}) ред

allow_growth рдзреНрд╡рдЬ (рдиреАрдЪреЗ рдХреЗ рдЕрдиреБрд╕рд╛рд░) рдЬреЛрдбрд╝рдиреЗ рд╕реЗ рдореБрдЭреЗ рдпрд╣ рдЯрдХреНрдХрд░ рдорд┐рд▓реА - рдХреЛрдб рд╡рд░реНрддрдорд╛рди рдореЗрдВ рдкреГрд╖реНрдарднреВрдорд┐ рдореЗрдВ рдЪрд▓ рд░рд╣рд╛ рд╣реИ, рд╣рдо рджреЗрдЦреЗрдВрдЧреЗ рдХрд┐ рдпрд╣ рдХрд┐рддрдиреА рджреВрд░ рдЬрд╛рддрд╛ рд╣реИред

config = tf.ConfigProto()
config.gpu_options.allow_growth = True
sess = tf.Session(config=config)

рдвреЗрд░:

  • рдореИрдХрдмреБрдХ рдкреНрд░реЛ, рд╕рд┐рдПрд░рд╛ 10.12.4 рдкрд░ рдЪрд▓ рд░рд╣рд╛ рд╣реИ, рдЬрд┐рд╕рдореЗрдВ рдПрдирд╡реАрдЖрдИрдбреАрдЖрдИрдП рдЬреЗрдлрдлреЛрд░реНрд╕ рдЬреАрдЯреА 750 рдПрдо 2048 рдПрдордмреА рд╣реИред рдЖрдорддреМрд░ рдкрд░ рдХреЗрд╡рд▓ 1.7GB рдореБрдлреНрдд рд╣реЛрддрд╛ рд╣реИред
  • TensorFlow 1.1 рдПрдирд╛рдХреЛрдВрдбрд╛ рд╕рдВрд╕реНрдерд╛рдкрди рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ред
  • рдкрд╛рдпрдерди 3.6, рдЖрднрд╛рд╕реА рдирд╣реАрдВ (рдПрдирд╛рдХреЛрдВрдбрд╛)
  • CUDA 8 / cuDNN 5

рдореИрдВ рдЕрдиреБрд░реЛрдз рдкрд░ рдЕрдзрд┐рдХ рдЖрдБрдХрдбрд╝реЗ рдбрдВрдк рдХрд░рдиреЗ рдХреЗ рд╕рд╛рде рдареАрдХ рд╣реВрдБред

рдореИрдВ рдПрдХ рд╣реА рд╕рдордп рдореЗрдВ рджреЛ рдЯрд░реНрдорд┐рдирд▓реЛрдВ рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░ рд░рд╣рд╛ рдерд╛ рдФрд░ рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛ рдереАред рдЗрд╕реЗ рдПрдХ рдЯрд░реНрдорд┐рдирд▓ рдмрдВрдж рдХрд░рдХреЗ рд╣рд▓ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред

рд╣рд╛рд▓ рдХреА рдЧрддрд┐рд╡рд┐рдзрд┐ рдХреА рдХрдореА рдХреЗ рдХрд╛рд░рдг рд╕реНрд╡рдЪрд╛рд▓рд┐рдд рд░реВрдк рд╕реЗ рдмрдВрдж рд╣реЛ рд░рд╣рд╛ рд╣реИред рдирдИ рдЬрд╛рдирдХрд╛рд░реА рдЙрдкрд▓рдмреНрдз рд╣реЛрдиреЗ рдкрд░ рдХреГрдкрдпрд╛ рд╕рдорд╕реНрдпрд╛ рдХреЛ рдЕрдкрдбреЗрдЯ рдХрд░реЗрдВ, рдФрд░ рд╣рдо рдЗрд╕ рдореБрджреНрджреЗ рдХреЛ рдлрд┐рд░ рд╕реЗ рдЦреЛрд▓реЗрдВрдЧреЗред рдзрдиреНрдпрд╡рд╛рдж!

@strickon рджреНрд╡рд╛рд░рд╛ рд╕реБрдЭрд╛рдП рдЧрдП рдкрд░рд┐рд╡рд░реНрддрдиреЛрдВ рдХреЛ рд▓рд╛рдЧреВ рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж, рдореБрдЭреЗ рдЬрд╛рдирдХрд╛рд░реА рд▓реЙрдЧ рдХрд╛ рдПрдХ рдирдпрд╛ рд╕реЗрдЯ рджрд┐рдЦрд╛рдИ рджреЗрдиреЗ рд▓рдЧрд╛:

2017-06-23 04:45:57.156787: I c:\tf_jenkins\home\workspace\release-win\m\windows-gpu\py\35\tensorflow\core\common_runtime\gpu\pool_allocator.cc:247] PoolAllocator: After 3205 get requests, put_count=2333 evicted_count=1000 eviction_rate=0.428633 and unsatisfied allocation rate=0.615289
2017-06-23 04:45:57.156880: I c:\tf_jenkins\home\workspace\release-win\m\windows-gpu\py\35\tensorflow\core\common_runtime\gpu\pool_allocator.cc:259] Raising pool_size_limit_ from 100 to 110
step 0 - loss = 5.632, (19.351 sec/step)

рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдирд╣реАрдВ рд╣реИ рдХрд┐ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИред

рдпрд╣рд╛рдБ рд╡рд╣реА рддреНрд░реБрдЯрд┐ред

Windows 10 x86_64, GeForce GTX 970, рдбреНрд░рд╛рдЗрд╡рд░ 376.53, Cuda 8.0, cuDNN 5.1., tensorflow-gpu 1.2.0 рдкрд╛рдЗрдк рд╕реЗ, рдЕрдЬрдЧрд░ 3.6

рдореИрдВ рд╡реЗрдмрд╕рд╛рдЗрдЯ рдХреЗ рдЯреНрдпреВрдЯреЛрд░рд┐рдпрд▓ рдЕрдиреБрднрд╛рдЧ рд╕реЗ рдбрд┐рдлрд╝реЙрд▓реНрдЯ рдЙрджрд╛рд╣рд░рдг рдЪрд▓рд╛рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░ рд░рд╣рд╛ рд╣реВрдВ:

https://www.tensorflow.org/tutorials/image_рд░рд┐рдХрдЧреНрдирд┐рд╢рди

python classify_image.py

рдореЗрд░реЗ рдкрд╛рд╕ рдПрдХ рд╣реА рддреНрд░реБрдЯрд┐ рд╣реИ:

`
```
(C:\ProgramData\Anaconda3) C:\Users\Locky\Google ╨╕╤Б╨║\MachineLearning\Tensorflow-Tutorials\Repo\models\tutorials\image\imagenet>python classify_image.py
2017-06-25 18:36:32.318287: W c:\tf_jenkins\home\workspace\release-win\m\windows-gpu\py\36\tensorflow\core\platform\cpu_feature_guard.cc:45] TensorFlow рд▓рд╛рдЗрдмреНрд░реЗрд░реА SSE рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдВрдХрд▓рд┐рдд рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛, рд▓реЗрдХрд┐рди рдпреЗ рдЖрдкрдХреА рдорд╢реАрди рдкрд░ рдЙрдкрд▓рдмреНрдз рд╣реИрдВ рдФрд░ CPU рд╕рдВрдЧрдгрдирд╛рдУрдВ рдХреЛ рдЧрддрд┐ рджреЗ рд╕рдХрддреЗ рд╣реИрдВред
2017-06-25 18:36:32.318514: W c:\tf_jenkins\home\workspace\release-win\m\windows-gpu\py\36\tensorflow\core\platform\cpu_feature_guard.cc:45] TensorFlow рд▓рд╛рдЗрдмреНрд░реЗрд░реА SSE2 рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдВрдХрд▓рд┐рдд рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛, рд▓реЗрдХрд┐рди рдпреЗ рдЖрдкрдХреА рдорд╢реАрди рдкрд░ рдЙрдкрд▓рдмреНрдз рд╣реИрдВ рдФрд░ CPU рд╕рдВрдЧрдгрдирд╛рдУрдВ рдХреЛ рдЧрддрд┐ рджреЗ рд╕рдХрддреЗ рд╣реИрдВред
2017-06-25 18:36:32.323556: W c:\tf_jenkins\home\workspace\release-win\m\windows-gpu\py\36\tensorflow\core\platform\cpu_feature_guard.cc:45] TensorFlow рд▓рд╛рдЗрдмреНрд░реЗрд░реА SSE3 рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдВрдХрд▓рд┐рдд рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛, рд▓реЗрдХрд┐рди рдпреЗ рдЖрдкрдХреА рдорд╢реАрди рдкрд░ рдЙрдкрд▓рдмреНрдз рд╣реИрдВ рдФрд░ CPU рд╕рдВрдЧрдгрдирд╛рдУрдВ рдХреЛ рдЧрддрд┐ рджреЗ рд╕рдХрддреЗ рд╣реИрдВред
2017-06-25 18:36:32.323719: W c:\tf_jenkins\home\workspace\release-win\m\windows-gpu\py\36\tensorflow\core\platform\cpu_feature_guard.cc:45] TensorFlow рд▓рд╛рдЗрдмреНрд░реЗрд░реА SSE4.1 рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдВрдХрд▓рд┐рдд рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛, рд▓реЗрдХрд┐рди рдпреЗ рдЖрдкрдХреА рдорд╢реАрди рдкрд░ рдЙрдкрд▓рдмреНрдз рд╣реИрдВ рдФрд░ CPU рд╕рдВрдЧрдгрдирд╛рдУрдВ рдХреЛ рдЧрддрд┐ рджреЗ рд╕рдХрддреЗ рд╣реИрдВред
2017-06-25 18:36:32.323834: W c:\tf_jenkins\home\workspace\release-win\m\windows-gpu\py\36\tensorflow\core\platform\cpu_feature_guard.cc:45] TensorFlow рд▓рд╛рдЗрдмреНрд░реЗрд░реА SSE4.2 рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдВрдХрд▓рд┐рдд рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛, рд▓реЗрдХрд┐рди рдпреЗ рдЖрдкрдХреА рдорд╢реАрди рдкрд░ рдЙрдкрд▓рдмреНрдз рд╣реИрдВ рдФрд░ CPU рд╕рдВрдЧрдгрдирд╛рдУрдВ рдХреЛ рдЧрддрд┐ рджреЗ рд╕рдХрддреЗ рд╣реИрдВред
2017-06-25 18:36:32.323930: W c:\tf_jenkins\home\workspace\release-win\m\windows-gpu\py\36\tensorflow\core\platform\cpu_feature_guard.cc:45] TensorFlow рд▓рд╛рдЗрдмреНрд░реЗрд░реА AVX рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдВрдХрд▓рд┐рдд рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛, рд▓реЗрдХрд┐рди рдпреЗ рдЖрдкрдХреА рдорд╢реАрди рдкрд░ рдЙрдкрд▓рдмреНрдз рд╣реИрдВ рдФрд░ CPU рд╕рдВрдЧрдгрдирд╛рдУрдВ рдХреЛ рдЧрддрд┐ рджреЗ рд╕рдХрддреЗ рд╣реИрдВред
2017-06-25 18:36:32.324205: W c:\tf_jenkins\home\workspace\release-win\m\windows-gpu\py\36\tensorflow\core\platform\cpu_feature_guard.cc:45] TensorFlow рд▓рд╛рдЗрдмреНрд░реЗрд░реА AVX2 рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдВрдХрд▓рд┐рдд рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛, рд▓реЗрдХрд┐рди рдпреЗ рдЖрдкрдХреА рдорд╢реАрди рдкрд░ рдЙрдкрд▓рдмреНрдз рд╣реИрдВ рдФрд░ CPU рд╕рдВрдЧрдгрдирд╛рдУрдВ рдХреЛ рдЧрддрд┐ рджреЗ рд╕рдХрддреЗ рд╣реИрдВред
2017-06-25 18:36:32.324351: W c:\tf_jenkins\home\workspace\release-win\m\windows-gpu\py\36\tensorflow\core\platform\cpu_feature_guard.cc:45] TensorFlow рд▓рд╛рдЗрдмреНрд░реЗрд░реА FMA рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдВрдХрд▓рд┐рдд рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛, рд▓реЗрдХрд┐рди рдпреЗ рдЖрдкрдХреА рдорд╢реАрди рдкрд░ рдЙрдкрд▓рдмреНрдз рд╣реИрдВ рдФрд░ CPU рд╕рдВрдЧрдгрдирд╛рдУрдВ рдХреЛ рдЧрддрд┐ рджреЗ рд╕рдХрддреЗ рд╣реИрдВред
2017-06-25 18: 36: 32.707933: I c:\tf_jenkins\home\workspace\release-win\m\windows-gpu\py\36\tensorflow\core\common_runtime\gpu\gpu_device.cc:940] рдорд┐рд▓рд╛ рдбрд┐рд╡рд╛рдЗрд╕ 0 рдЧреБрдгреЛрдВ рдХреЗ рд╕рд╛рде:
рдирд╛рдо: GeForce GTX 970
рдореЗрдЬрд░: 5 рдорд╛рдЗрдирд░: 2 рдореЗрдореЛрд░реАрдХреНрд▓реЙрдХрд░реЗрдЯ (рдЧреАрдЧрд╛рд╣рд░реНрдЯреНрдЬ) 1.253
рдкреАрд╕реАрдЖрдИрдмрд╕рдЖрдИрдбреА 0000:01:00.0
рдХреБрд▓ рдореЗрдореЛрд░реА: 4.00GiB
рдлреНрд░реА рдореЗрдореЛрд░реА: 3.31GiB
2017-06-25 18:36:32.708332: рдореИрдВ c:\tf_jenkins\home\workspace\release-win\m\windows-gpu\py\36\tensorflow\core\common_runtime\gpu\gpu_device.cc:961] DMA : 0
2017-06-25 18:36:32.713764: рдореИрдВ c:\tf_jenkins\home\workspace\release-win\m\windows-gpu\py\36\tensorflow\core\common_runtime\gpu\gpu_device.cc:971] 0 : рдЖрдк
2017-06-25 18:36:32.713991: рдореИрдВ c:\tf_jenkins\home\workspace\release-win\m\windows-gpu\py\36\tensorflow\core\common_runtime\gpu\gpu_device.cc:1030] рдмрдирд╛рдирд╛ TensorFlow рдбрд┐рд╡рд╛рдЗрд╕ (/gpu:0) -> (рдбрд┐рд╡рд╛рдЗрд╕: 0, рдирд╛рдо: GeForce GTX 970, pci рдмрд╕ рдЖрдИрдбреА: 0000:01:00.0)
2017-06-25 18:36:34.854555: W c:\tf_jenkins\home\workspace\release-win\m\windows-gpu\py\36\tensorflow\core\framework\op_def_util.cc:332] Op BatchNormWithGlobalNormalization рд╣реИ рдкрджрд╛рд╡рдирддред рдпрд╣ GraphDef рд╕рдВрд╕реНрдХрд░рдг 9 рдореЗрдВ рдХрд╛рдо рдХрд░рдирд╛ рдмрдВрдж рдХрд░ рджреЗрдЧрд╛ред tf.nn.batch_normalization() рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░реЗрдВред
2017-06-25 18:36:35.836895: E c:\tf_jenkins\home\workspace\release-win\m\windows-gpu\py\36\tensorflow\stream_executor\cuda\cuda_dnn.cc:359] рдирд╣реАрдВ рдмрдирд╛ рд╕рдХрд╛ рдХреБрдбрди рд╣реИрдВрдбрд▓: CUDNN_STATUS_NOT_INITIALIZED
2017-06-25 18: 36: 35.837068: E c:\tf_jenkins\home\workspace\release-win\m\windows-gpu\py\36\tensorflow\stream_executor\cuda\cuda_dnn.cc:366] рдбреНрд░рд╛рдЗрд╡рд░ рдХреЛ рдкреБрдирд░реНрдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдореЗрдВ рддреНрд░реБрдЯрд┐ рд╕рдВрд╕реНрдХрд░рдг: рд▓рд╛рдЧреВ рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛: рдХрд░реНрдиреЗрд▓ рдиреЗ рд░рд┐рдкреЛрд░реНрдЯ рдХрд┐рдпрд╛ рдХрд┐ рдбреНрд░рд╛рдЗрд╡рд░ рд╕рдВрд╕реНрдХрд░рдг рд╡рд┐рдВрдбреЛрдЬрд╝ рдкрд░ рд▓рд╛рдЧреВ рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ
2017-06-25 18: 36: 35.841593: E c:\tf_jenkins\home\workspace\release-win\m\windows-gpu\py\36\tensorflow\stream_executor\cuda\cuda_dnn.cc:326] рдирд╖реНрдЯ рдирд╣реАрдВ рдХрд░ рд╕рдХрд╛ рдХреБрдбрди рд╣реИрдВрдбрд▓: CUDNN_STATUS_BAD_PARAM
2017-06-25 18:36:35.841690: F c:\tf_jenkins\home\workspace\release-win\m\windows-gpu\py\36\tensorflow\core\kernels\conv_ops.cc:671] рдЬрд╛рдВрдЪ рд╡рд┐рдлрд▓: рд╕реНрдЯреНрд░реАрдо-> рдкреИрд░реЗрдВрдЯ ()-> GetConvolveAlgorithms (& рдПрд▓реНрдЧреЛрд░рд┐рджрдо)

(C:\ProgramData\Anaconda3) C:\Users\Locky\Google ╨╕╤Б╨║\MachineLearning\Tensorflow-Tutorials\Repo\models\tutorials\image\imagenet>

````

рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ, рдРрд╕рд╛ рдЗрд╕рд▓рд┐рдП рд╣реБрдЖ рдХреНрдпреЛрдВрдХрд┐ рдЕрдиреНрдп рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдЗрдВрд╕реНрдЯреЗрдВрд╕ рдореЗрдВ GPU рдерд╛ред (рдЕрдиреНрдп рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдЪрд▓ рд░рд╣реА рд╣реИрдВред)

рдХреНрдпрд╛ рдореИрдВ рдПрдХ рдмреЗрд╣рддрд░ рддреНрд░реБрдЯрд┐ рд╕рдВрджреЗрд╢ рдкреНрд░рд╕реНрддрд╛рд╡рд┐рдд рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ? рдХрд╣реЗрдВ, "рддреНрд░реБрдЯрд┐: рдЕрдиреНрдп рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдЗрдВрд╕реНрдЯреЗрдВрд╕ рдЪрд▓ рд░рд╣реЗ рд╣реИрдВ, рдЬрдмрдХрд┐ рдХреЗрд╡рд▓ рдПрдХ рд╣реА рд╕рдорд░реНрдерд┐рдд рд╣реИред"

рдореЗрд░реЗ рд╕рд╛рде рднреА рд╡рд╣реА рджрд┐рдХреНрдХрдд рд╣реИред macOS 10.12.5 GT 750M 2GB рдЪрд▓ рд░рд╣рд╛ рд╣реИ

python neural_style.py --content /Users/qinyuhang/Pictures/0.jpeg  --styles IMG_1105.JPG --output 1.out.jpg --iterations 500
2017-07-05 22:16:54.531699: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:857] OS X does not support NUMA - returning NUMA node zero
2017-07-05 22:16:54.532257: I tensorflow/core/common_runtime/gpu/gpu_device.cc:940] Found device 0 with properties: 
name: GeForce GT 750M
major: 3 minor: 0 memoryClockRate (GHz) 0.9255
pciBusID 0000:01:00.0
Total memory: 2.00GiB
Free memory: 1.54GiB
2017-07-05 22:16:54.532435: I tensorflow/core/common_runtime/gpu/gpu_device.cc:961] DMA: 0 
2017-07-05 22:16:54.532461: I tensorflow/core/common_runtime/gpu/gpu_device.cc:971] 0:   Y 
2017-07-05 22:16:54.532471: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1030] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GT 750M, pci bus id: 0000:01:00.0)
2017-07-05 22:17:07.284016: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1030] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GT 750M, pci bus id: 0000:01:00.0)
2017-07-05 22:17:44.973549: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1030] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GT 750M, pci bus id: 0000:01:00.0)
Optimization started...
Iteration    1/ 500
2017-07-05 22:17:47.485948: E tensorflow/stream_executor/cuda/cuda_dnn.cc:359] could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR
2017-07-05 22:17:47.485977: E tensorflow/stream_executor/cuda/cuda_dnn.cc:326] could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM
2017-07-05 22:17:47.485983: F tensorflow/core/kernels/conv_ops.cc:671] Check failed: stream->parent()->GetConvolveAlgorithms(&algorithms) 
[1]    66448 abort      python neural_style.py --content /Users/qinyuhang/Pictures/0.jpeg --styles   

рдЗрд╕реЗ рд╣рд▓ рдХрд┐рдпрд╛ (рдХрдо рд╕реЗ рдХрдо рдореЗрд░реЗ рд▓рд┐рдП)ред рддреНрд░реБрдЯрд┐ рд╕рдВрджреЗрд╢ рдЖрдкрдХреЛ рд╕рд╣реА рд╕рдорд╕реНрдпрд╛ рдХреА рдУрд░ рдирд╣реАрдВ рд▓реЗ рдЬрд╛рддрд╛ рд╣реИред рдореБрдЭреЗ рдпрд╣ рддреНрд░реБрдЯрд┐ 2 рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╕реНрд░реЛрддреЛрдВ рд╕реЗ рдорд┐рд▓реА рдереА:

рдкрд╣рд▓реЗ (рдЬреИрд╕реЗ @lockywolf рдиреЗ рдХрд╣рд╛):
рдореИрдВ рдЬреНрдпреВрдкрд┐рдЯрд░ рдиреЛрдЯрдмреБрдХ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реВрдВ рдФрд░ рдХрднреА-рдХрднреА рдЯреАрдПрдл рдХрд░реНрдиреЗрд▓ GPU рдореЗрдореЛрд░реА рдХреЛ рдореБрдХреНрдд рдирд╣реАрдВ рдХрд░рддрд╛ рд╣реИ рдФрд░ рдЖрдкрдХреЛ рдЗрд╕реЗ рдлрд┐рд░ рд╕реЗ рдХрд╛рдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЬреНрдпреВрдкрд┐рдЯрд░ рдХреЛ рдкреБрдирд░рд╛рд░рдВрдн рдХрд░рдирд╛ рд╣реЛрдЧрд╛ ред рдпрд╣ рдЖрдорддреМрд░ рдкрд░ рд░рди-рдЯрд╛рдЗрдо рддреНрд░реБрдЯрд┐рдпреЛрдВ рдпрд╛ рдЕрдиреБрдЪрд┐рдд рдХрд░реНрдиреЗрд▓ рдкреБрдирд░рд╛рд░рдВрдн рд╣реЛрдиреЗ рдХреЗ рдмрд╛рдж рд╣реЛрддрд╛ рд╣реИ ...

рджреВрд╕рд░рд╛:
рдХрднреА-рдХрднреА рдЖрдк GPU рдореЗрдореЛрд░реА рдХреЗ рд╕рд╛рде рд▓рд╛рд▓рдЪреА рд╣реЛ рдЬрд╛рддреЗ рд╣реИрдВ рдФрд░ рдЗрд╕ рддрд░рд╣ рдХреА рдЪреАрдЬреЛрдВ рдХреЛ рдЖрдЬрдорд╛рддреЗ рд╣реИрдВ:

gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.9)
sess = tf.InteractiveSession(config=tf.ConfigProto(gpu_options=gpu_options))

рдпрд╣ рдореЗрд░реЗ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди рдХреЗ рд▓рд┐рдП рдШрд╛рддрдХ рдерд╛ рдФрд░ рдпрд╣ рддреНрд░реБрдЯрд┐ рдкреНрд░рд╛рдкреНрдд рдХрд░рдирд╛ рд╢реБрд░реВ рдХрд░ рджрд┐рдпрд╛ред рд╕рдорд╛рдзрд╛рди рдЗрдВрдЯрд░реИрдХреНрдЯрд┐рд╡ рд╕рддреНрд░ рд╢реБрд░реВ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдбрд┐рдлрд╝реЙрд▓реНрдЯ рддрд░реАрдХреЗ рдХрд╛
sess = tf.InteractiveSession()

рдкреНрд░рдгрд╛рд▓реА:

рдЙрдмрдВрдЯреВ 14.04
GeForce GTX 780
CUDA рдбреНрд░рд╛рдЗрд╡рд░ рд╕рдВрд╕реНрдХрд░рдг = 8.0
рд╕реАрдпреВрдбреАрдПрдирдПрди рд╕рдВрд╕реНрдХрд░рдг = 5.1
TensorFlow рд╕рдВрд╕реНрдХрд░рдг = 1.2.1

рдореБрдЭреЗ рдЕрдм рдЕрдкрдиреА рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдЪрд▓рд╛рдиреЗ рдореЗрдВ рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛ рд╣реИред
рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рд╡рд╣реА рдХрд╛рд░рдг рд╣реИ рдЬреИрд╕реЗ @lockywolf рд╡рд░реНрдгрд┐рдд рд╣реИ:

рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ, рдРрд╕рд╛ рдЗрд╕рд▓рд┐рдП рд╣реБрдЖ рдХреНрдпреЛрдВрдХрд┐ рдЕрдиреНрдп рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдЗрдВрд╕реНрдЯреЗрдВрд╕ рдореЗрдВ GPU рдерд╛ред (рдЕрдиреНрдп рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдЪрд▓ рд░рд╣реА рд╣реИрдВред)

рдореБрдЭреЗ рдпрд╣ рддреНрд░реБрдЯрд┐ рдмрд╣реБрдд рдмрд╛рд░ рд╣реБрдИ рд▓реЗрдХрд┐рди рдЕрдирд┐рдпрдорд┐рдд рдереА, рдлрд┐рд░ рдореИрдВрдиреЗ @RawthiL рдХреЗ рдиреЗрддреГрддреНрд╡ рдХрд╛ рдЕрдиреБрд╕рд░рдг рдХрд┐рдпрд╛ рдФрд░ рдЕрдкрдиреА рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдореЗрдВ рдПрдХ рд╕рддреНрд░ рдЬреЛрдбрд╝рд╛ред рд╣рд╛рд▓рд╛рдБрдХрд┐, рдореИрдВрдиреЗ рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдХреЛ рд╕рдлрд▓рддрд╛рдкреВрд░реНрд╡рдХ рдирд┐рд╖реНрдкрд╛рджрд┐рдд рдХрд┐рдпрд╛ рдФрд░ рдХрд░реНрдиреЗрд▓ рдХреЛ рдлрд┐рд░ рд╕реЗ рд╢реБрд░реВ рдХрд┐рдпрд╛ рдФрд░ рдлрд┐рд░ рд╕реЗ рд╡рд╣реА рддреНрд░реБрдЯрд┐ рд╕рдВрджреЗрд╢ рдорд┐рд▓рд╛ред рдХреНрдпрд╛ рд╕рддреНрд░ рдХреЛ рдЦреЛрд▓рдиреЗ, GPU рдкрд░ рджрд╛рд╡рд╛ рдХрд░рдиреЗ рдФрд░ рдЧрдгрдирд╛ рдкреВрд░реА рд╣реЛрдиреЗ рдХреЗ рдмрд╛рдж рдЗрд╕реЗ рдмрдВрдж рдХрд░рдиреЗ рдХрд╛ рдХреЛрдИ рд╕рдорд╛рдзрд╛рди рд╣реИ?

рдЪреАрдпрд░реНрд╕!

рд╕рдВрдкрд╛рджрд┐рдд рдХрд░реЗрдВ:
@RawthiL рдХреЗ рд╕рдорд╛рдзрд╛рди рдХреЗ рдЕрд▓рд╛рд╡рд╛ рдЯреАрдПрдл рдкрд░рд┐рдЪрдп рдХрд╛ рдкрд╛рд▓рди

рд╣рдореЗрдВ рдПрдХ TensorFlow рд╕рддреНрд░ рдмрдирд╛рдХрд░ рдФрд░ рдЗрд╕реЗ Keras рдХреЗ рд╕рд╛рде рдкрдВрдЬреАрдХреГрдд рдХрд░рдХреЗ рд╢реБрд░реВ рдХрд░рдирд╛ рдЪрд╛рд╣рд┐рдПред рдЗрд╕рдХрд╛ рдорддрд▓рдм рдпрд╣ рд╣реИ рдХрд┐ рдХреЗрд░рд╕ рд╣рдорд╛рд░реЗ рджреНрд╡рд╛рд░рд╛ рдкрдВрдЬреАрдХреГрдд рд╕рддреНрд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдЙрди рд╕рднреА рдЪрд░реЛрдВ рдХреЛ рдЖрд░рдВрдн рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд░реЗрдЧрд╛ рдЬреЛ рдпрд╣ рдЖрдВрддрд░рд┐рдХ рд░реВрдк рд╕реЗ рдмрдирд╛рддрд╛ рд╣реИред

tf . рдХреЗ рд░реВрдк рдореЗрдВ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдЖрдпрд╛рдд рдХрд░реЗрдВ
рд╕рддреНрд░ = tf.рд╕рддреНрд░ ()

рдХреЗрд░рд╕ рдЖрдпрд╛рдд рдмреИрдХрдПрдВрдб рд╕реЗ K . рдХреЗ рд░реВрдк рдореЗрдВ
рдХреЗ.рд╕реЗрдЯ_рд╕реЗрд╢рди(рд╕рддреНрд░)

рд╕рдорд╛рди рд╕рдорд╕реНрдпрд╛ред рджрд┐рди рднрд░ рдЗрд╕ рдХрд╛рдо рдХреЛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЪрдврд╛рдИ рдХрд░рддреЗ рд░рд╣реЗред

$ ~/neural-style$ python neural_style.py --content ~/Documents/8UhFDcjT.jpg --styles ~/Documents/9odz6-jbngd.png --output ./Documents/Scott.png
2017-07-26 20:57:08.373361: W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use SSE4.1 instructions, but these are available on your machine and could speed up CPU computations.
2017-07-26 20:57:08.373397: W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use SSE4.2 instructions, but these are available on your machine and could speed up CPU computations.
2017-07-26 20:57:08.373413: W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use AVX instructions, but these are available on your machine and could speed up CPU computations.
2017-07-26 20:57:08.373417: W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use AVX2 instructions, but these are available on your machine and could speed up CPU computations.
2017-07-26 20:57:08.373421: W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use FMA instructions, but these are available on your machine and could speed up CPU computations.
2017-07-26 20:57:08.431319: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:893] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero
2017-07-26 20:57:08.431630: I tensorflow/core/common_runtime/gpu/gpu_device.cc:940] Found device 0 with properties: 
name: GeForce GTX 870M
major: 3 minor: 0 memoryClockRate (GHz) 0.967
pciBusID 0000:01:00.0
Total memory: 2.95GiB
Free memory: 2.53GiB
2017-07-26 20:57:08.431664: I tensorflow/core/common_runtime/gpu/gpu_device.cc:961] DMA: 0 
2017-07-26 20:57:08.431674: I tensorflow/core/common_runtime/gpu/gpu_device.cc:971] 0:   Y 
2017-07-26 20:57:08.431690: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1030] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GTX 870M, pci bus id: 0000:01:00.0)
2017-07-26 20:57:11.692616: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1030] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GTX 870M, pci bus id: 0000:01:00.0)
2017-07-26 20:57:19.800938: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1030] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GTX 870M, pci bus id: 0000:01:00.0)
Optimization started...
Iteration    1/1000
2017-07-26 20:57:20.535515: E tensorflow/stream_executor/cuda/cuda_dnn.cc:359] could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR
2017-07-26 20:57:20.535573: E tensorflow/stream_executor/cuda/cuda_dnn.cc:326] could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM
2017-07-26 20:57:20.535588: F tensorflow/core/kernels/conv_ops.cc:671] Check failed: stream->parent()->GetConvolveAlgorithms(&algorithms) 

рдореИрдВрдиреЗ рдкрд╛рдпрд╛ рдХрд┐ рдХреБрдЫ рдорд╛рдорд▓реЛрдВ рдореЗрдВ рдЬреНрдпреВрдкрд┐рдЯрд░ рдХрд░реНрдиреЗрд▓ рдХреЛ рд░реАрд╕реЗрдЯ рдХрд░рдиреЗ рд╕реЗ рдХрд╛рдо рдирд╣реАрдВ рдЪрд▓реЗрдЧрд╛ред рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдпрд╣ рдореЗрд░реЗ рд╕рд╛рде jupyterhub рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╕рдордп рд╣реБрдЖ рдерд╛ред
рдореИрдВрдиреЗ рдХрд░реНрдиреЗрд▓ рдХреЛ рдкреБрдирд░рд╛рд░рдВрдн рдХрд┐рдпрд╛, рдореЗрд░реЗ рд╡рд░реНрдЪреБрдЕрд▓рдПрдиреНрд╡ рдХреЛ рдирд┐рд╖реНрдХреНрд░рд┐рдп рдХрд░ рджрд┐рдпрд╛ рдФрд░ GPU рдореЗрдореЛрд░реА рдЕрднреА рднреА рдХрд┐рд╕реА рдкреНрд░рдХреНрд░рд┐рдпрд╛ рджреНрд╡рд╛рд░рд╛ рдЖрдпреЛрдЬрд┐рдд рдХреА рдЬрд╛ рд░рд╣реА рдереАред nvidia-smi рдХрдорд╛рдВрдб рдиреЗ рдХрд╣рд╛ рдХрд┐ GPU рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреА рдХреЛрдИ рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдирд╣реАрдВ рдереА рдФрд░ рдЬрдм рдореИрдВрдиреЗ рдЗрд╕реЗ sudo nvidia-smi --gpu-reset -i 0 (0 gpu рдХреЛрд░ рдХреЗ рд▓рд┐рдП) рдХреЗ рд╕рд╛рде рд░реАрд╕реЗрдЯ рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд┐рдпрд╛ рддреЛ рдЗрд╕рдиреЗ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдХрд╣рд╛:

рдЗрд╕ GPU рдХреЛ рд░реАрд╕реЗрдЯ рдХрд░рдиреЗ рдореЗрдВ рдЕрд╕рдорд░реНрде рдХреНрдпреЛрдВрдХрд┐ рдЗрд╕рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рд╕реА рдЕрдиреНрдп рдкреНрд░рдХреНрд░рд┐рдпрд╛ рджреНрд╡рд╛рд░рд╛ рдХрд┐рдпрд╛ рдЬрд╛ рд░рд╣рд╛ рд╣реИ (рдЬреИрд╕реЗ CUDA рдПрдкреНрд▓рд┐рдХреЗрд╢рди, X рд╕рд░реНрд╡рд░ рдЬреИрд╕реЗ рдЧреНрд░рд╛рдлрд┐рдХреНрд╕ рдПрдкреНрд▓рд┐рдХреЗрд╢рди, nvidia-smi рдХреЗ рдЕрдиреНрдп рдЙрджрд╛рд╣рд░рдг рдХреА рддрд░рд╣ рдореЙрдирд┐рдЯрд░рд┐рдВрдЧ рдПрдкреНрд▓рд┐рдХреЗрд╢рди)ред рдХреГрдкрдпрд╛ рдкрд╣рд▓реЗ рдЗрд╕ GPU рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рд╕рднреА рдкреНрд░рдХреНрд░рд┐рдпрд╛рдУрдВ рдХреЛ рд╕рдорд╛рдкреНрдд рдХрд░реЗрдВ рдФрд░ рд╕рд┐рд╕реНрдЯрдо рдореЗрдВ рдЪрд▓ рд░рд╣реЗ рд╕рднреА рдХрдВрдкреНрдпреВрдЯ рдПрдкреНрд▓рд┐рдХреЗрд╢рди (рднрд▓реЗ рд╣реА рд╡реЗ рдЕрдиреНрдп GPU рдкрд░ рдЪрд▓ рд░рд╣реЗ рд╣реЛрдВ) рдФрд░ рдлрд┐рд░ GPU рдХреЛ рдлрд┐рд░ рд╕реЗ рд░реАрд╕реЗрдЯ рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░реЗрдВред
рдкрд┐рдЫрд▓реА рддреНрд░реБрдЯрд┐рдпреЛрдВ рдХреЗ рдХрд╛рд░рдг рдЬрд▓реНрджреА рд╕рдорд╛рдкреНрдд рдХрд░рдирд╛ред

рддреЛ GPU рдХреЛ рдкрдХрдбрд╝реЗ рд╣реБрдП рдХреБрдЫ рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдереА, рдФрд░ рдореИрдВрдиреЗ sudo fuser -v /dev/nvidia* рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдЙрдирдХреА рддрд▓рд╛рд╢ рдХреА, рдЬрд┐рд╕рдореЗрдВ рдХрд╣рд╛ рдЧрдпрд╛ рдерд╛ рдХрд┐ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ GPU рдХреЛ рдкрдХрдбрд╝реЗ рд╣реБрдП рдХреБрдЫ рдерд╛ ... рдЕрдЬрдЧрд░ рд╣реА ... рдЗрд╕реЗ рдорд╛рд░рдирд╛ рдФрд░ virtualenv рдФрд░ jupyter рдХреЛ рдлрд┐рд░ рд╕реЗ рд▓реЙрдиреНрдЪ рдХрд░рдирд╛ рдерд╛ рдЫрд▓ред
рдореИрдВ рдЗрд╕реЗ рд╣рд▓ рдХрд░рдиреЗ рдХрд╛ рд╕рдмрд╕реЗ рдЕрдЪреНрдЫрд╛ рддрд░реАрдХрд╛ рдирд╣реАрдВ рд╣реЛ рд╕рдХрддрд╛, рд▓реЗрдХрд┐рди рдЕрдиреНрдп рд╕рднреА рд╡рд┐рдХрд▓реНрдк рд╡рд┐рдлрд▓ рд╣реЛрдиреЗ рдкрд░ рдХрдВрдкреНрдпреВрдЯрд░ рдХреЛ рд░реАрд╕реЗрдЯ рдХрд░рдиреЗ рд╕реЗ рдмреЗрд╣рддрд░ рд╣реИред

рдПрдХ рд╣реА рдореБрджреНрджрд╛ рд╣реЛред CUDA 8.0 рдХреЗ рд▓рд┐рдП GPU GTX 1070 рдФрд░ CUDA 8.0 рдФрд░ CUDNN 5.1 рд╣реИред

рд╕рдорд╕реНрдпрд╛ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдХреЛрдб рдкрд░ рдирд┐рд░реНрднрд░ рдирд╣реАрдВ рдХрд░рддреА рд╣реИ, рдпрд╣ рд╣рд╛рд░реНрдбрд╡реЗрдпрд░ рдпрд╛ рдПрдирд╡реАрдбрд┐рдпрд╛ рдпрд╛ Google рд╕реЙрдлрд╝реНрдЯрд╡реЗрдпрд░ рд╕реНрдерд┐рддрд┐ рдкрд░ рдирд┐рд░реНрднрд░ рдХрд░рддреА рд╣реИред рдпрд╣ рддреНрд░реБрдЯрд┐ рдХрд┐рд╕реА рднреА рд╕рдордп рдмрдврд╝рдирд╛ рд╢реБрд░реВ рд╣реЛ рд╕рдХрддреА рд╣реИ рдФрд░ рд░рд┐рдмреВрдЯ рдЗрд╕реЗ рдЙрд╕реА рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдХреЛрдб рд╕реЗ рдареАрдХ рдХрд░ рд╕рдХрддрд╛ рд╣реИред

рд╡рд┐рдВрдбреЛрдЬ 10, GTX770, CUDA 8.0, CUDNN 5.1, TF-GPU 1.1.0 рдХреЗ рд╕рд╛рде рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛, рдпрд╣ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдирд╣реАрдВ рд╣реИ рдХрд┐ рдбрд┐рд╡рд╛рдЗрд╕ рдбреНрд░рд╛рдЗрд╡рд░ рд╕рдВрд╕реНрдХрд░рдг рдХрд╣рд╛рдВ рд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░реЗрдВ, рд▓реЗрдХрд┐рди рд╡рд┐рдВрдбреЛрдЬ рдбрд┐рд╡рд╛рдЗрд╕ рдореИрдиреЗрдЬрд░ рдбрд┐рд╕реНрдкреНрд▓реЗ рдбреНрд░рд╛рдЗрд╡рд░ рдХреЗ рд▓рд┐рдП 21.21.13.7651 рдХреА рд░рд┐рдкреЛрд░реНрдЯ рдХрд░рддрд╛ рд╣реИред

connect  84557d348c06492e80ff0304d516367b
2017-08-11 15:51:41.974028: E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\cuda\cuda_dnn.cc:359] could not create cudnn handle: CUDNN_STATUS_NOT_INITIALIZED
2017-08-11 15:51:41.974536: E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\cuda\cuda_dnn.cc:366] error retrieving driver version: Unimplemented: kernel reported driver version not implemented on Windows
2017-08-11 15:51:41.974923: E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\cuda\cuda_dnn.cc:326] could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM
2017-08-11 15:51:41.975194: F c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\kernels\conv_ops.cc:659] Check failed: stream->parent()->GetConvolveAlgorithms(&algorithms)

рд╡рд┐рдВрдбреЛрдЬ 10, GTX770, CUDA 8.0, CUDNN 5.1, TF-GPU 1.1.0 рдХреЗ рд╕рд╛рде рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛, рдпрд╣ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдирд╣реАрдВ рд╣реИ рдХрд┐ рдбрд┐рд╡рд╛рдЗрд╕ рдбреНрд░рд╛рдЗрд╡рд░ рд╕рдВрд╕реНрдХрд░рдг рдХрд╣рд╛рдВ рд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░реЗрдВ, рд▓реЗрдХрд┐рди рд╡рд┐рдВрдбреЛрдЬ рдбрд┐рд╡рд╛рдЗрд╕ рдореИрдиреЗрдЬрд░ рдбрд┐рд╕реНрдкреНрд▓реЗ рдбреНрд░рд╛рдЗрд╡рд░ рдХреЗ рд▓рд┐рдП 21.21.13.7651 рдХреА рд░рд┐рдкреЛрд░реНрдЯ рдХрд░рддрд╛ рд╣реИред

connect  84557d348c06492e80ff0304d516367b
2017-08-11 15:51:41.974028: E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\cuda\cuda_dnn.cc:359] could not create cudnn handle: CUDNN_STATUS_NOT_INITIALIZED
2017-08-11 15:51:41.974536: E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\cuda\cuda_dnn.cc:366] error retrieving driver version: Unimplemented: kernel reported driver version not implemented on Windows
2017-08-11 15:51:41.974923: E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\cuda\cuda_dnn.cc:326] could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM
2017-08-11 15:51:41.975194: F c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\kernels\conv_ops.cc:659] Check failed: stream->parent()->GetConvolveAlgorithms(&algorithms)

@ggranum рдХреЗ рдлрд┐рдХреНрд╕ рдиреЗ рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рдХрд┐рдпрд╛:

config = tf.ConfigProto()
config.gpu_options.allow_growth = True
sess = tf.Session(config=config)

рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ NVIDIA gpu рдбреНрд░рд╛рдЗрд╡рд░ рдХреЛ рдЕрдкрдбреЗрдЯ рдХрд░рдХреЗ рдЙрд╕реА рдореБрджреНрджреЗ рдХреЛ рд╣рд▓ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред

рдХреНрдпрд╛ рдпрд╣ рд╕рдорд╕реНрдпрд╛ рдкреВрд░реА рддрд░рд╣ рд╕реЗ рд╣рд▓ рд╣реЛ рдЧрдИ рд╣реИред рдореИрдВ CUDA 8.0 рдФрд░ cuDNN 5.1 рдХреЗ рд╕рд╛рде Ubuntu 16.04 рдкрд░ TF 1.3.0 рдЪрд▓рд╛ рд░рд╣рд╛ рд╣реВрдВред рдореИрдВрдиреЗ рдЕрдкрдиреЗ рдкреИрдХреЗрдЬреЛрдВ рдХреЛ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдирд╛рдХреЛрдВрдбрд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ред рдпрд╛рджреГрдЪреНрдЫрд┐рдХ рд░реВрдк рд╕реЗ 4 рджрд┐рди рдкрд╣рд▓реЗ, рдореБрдЭреЗ рднреА рдЗрд╕ рддреНрд░реБрдЯрд┐ рдХрд╛ рдЕрдиреБрднрд╡ рд╣реБрдЖ рдерд╛

name: GeForce GTX 1080 Ti major: 6 minor: 1 memoryClockRate (GHz) 1.582 pciBusID 0000:05:00.0 Total memory: 10.91GiB Free memory: 10.30GiB 2017-09-05 07:47:05.397839: W tensorflow/stream_executor/cuda/cuda_driver.cc:523] A non-primary context 0x30028e0 exists before initializing the StreamExecutor. We haven't verified StreamExecutor works with that. 2017-09-05 07:47:05.401343: I tensorflow/core/common_runtime/gpu/gpu_device.cc:955] Found device 1 with properties: name: GeForce GTX 1080 Ti major: 6 minor: 1 memoryClockRate (GHz) 1.582 pciBusID 0000:06:00.0 Total memory: 10.91GiB Free memory: 10.75GiB 2017-09-05 07:47:05.658932: W tensorflow/stream_executor/cuda/cuda_driver.cc:523] A non-primary context 0x2ffe910 exists before initializing the StreamExecutor. We haven't verified StreamExecutor works with that. 2017-09-05 07:47:05.659690: I tensorflow/core/common_runtime/gpu/gpu_device.cc:955] Found device 2 with properties: name: GeForce GTX 1080 Ti major: 6 minor: 1 memoryClockRate (GHz) 1.582 pciBusID 0000:09:00.0 Total memory: 10.91GiB Free memory: 10.75GiB 2017-09-05 07:47:05.898536: W tensorflow/stream_executor/cuda/cuda_driver.cc:523] A non-primary context 0x2ffa940 exists before initializing the StreamExecutor. We haven't verified StreamExecutor works with that. 2017-09-05 07:47:05.899294: I tensorflow/core/common_runtime/gpu/gpu_device.cc:955] Found device 3 with properties: name: GeForce GTX 1080 Ti major: 6 minor: 1 memoryClockRate (GHz) 1.582 pciBusID 0000:0a:00.0 Total memory: 10.91GiB Free memory: 10.75GiB 2017-09-05 07:47:05.903197: I tensorflow/core/common_runtime/gpu/gpu_device.cc:976] DMA: 0 1 2 3 2017-09-05 07:47:05.903209: I tensorflow/core/common_runtime/gpu/gpu_device.cc:986] 0: Y Y Y Y 2017-09-05 07:47:05.903215: I tensorflow/core/common_runtime/gpu/gpu_device.cc:986] 1: Y Y Y Y 2017-09-05 07:47:05.903218: I tensorflow/core/common_runtime/gpu/gpu_device.cc:986] 2: Y Y Y Y 2017-09-05 07:47:05.903223: I tensorflow/core/common_runtime/gpu/gpu_device.cc:986] 3: Y Y Y Y 2017-09-05 07:47:05.903236: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1045] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GTX 1080 Ti, pci bus id: 0000:05:00.0) 2017-09-05 07:47:05.903242: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1045] Creating TensorFlow device (/gpu:1) -> (device: 1, name: GeForce GTX 1080 Ti, pci bus id: 0000:06:00.0) 2017-09-05 07:47:05.903248: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1045] Creating TensorFlow device (/gpu:2) -> (device: 2, name: GeForce GTX 1080 Ti, pci bus id: 0000:09:00.0) 2017-09-05 07:47:05.903252: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1045] Creating TensorFlow device (/gpu:3) -> (device: 3, name: GeForce GTX 1080 Ti, pci bus id: 0000:0a:00.0) 2017-09-05 07:47:20.297138: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1045] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GTX 1080 Ti, pci bus id: 0000:05:00.0) 2017-09-05 07:47:20.297190: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1045] Creating TensorFlow device (/gpu:1) -> (device: 1, name: GeForce GTX 1080 Ti, pci bus id: 0000:06:00.0) 2017-09-05 07:47:20.297206: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1045] Creating TensorFlow device (/gpu:2) -> (device: 2, name: GeForce GTX 1080 Ti, pci bus id: 0000:09:00.0) 2017-09-05 07:47:20.297220: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1045] Creating TensorFlow device (/gpu:3) -> (device: 3, name: GeForce GTX 1080 Ti, pci bus id: 0000:0a:00.0) 2017-09-05 07:47:24.845499: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1045] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GTX 1080 Ti, pci bus id: 0000:05:00.0) 2017-09-05 07:47:24.845534: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1045] Creating TensorFlow device (/gpu:1) -> (device: 1, name: GeForce GTX 1080 Ti, pci bus id: 0000:06:00.0) 2017-09-05 07:47:24.845542: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1045] Creating TensorFlow device (/gpu:2) -> (device: 2, name: GeForce GTX 1080 Ti, pci bus id: 0000:09:00.0) 2017-09-05 07:47:24.845548: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1045] Creating TensorFlow device (/gpu:3) -> (device: 3, name: GeForce GTX 1080 Ti, pci bus id: 0000:0a:00.0) 2017-09-05 07:47:34.884524: E tensorflow/stream_executor/cuda/cuda_dnn.cc:371] could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR 2017-09-05 07:47:34.884597: E tensorflow/stream_executor/cuda/cuda_dnn.cc:338] could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM 2017-09-05 07:47:34.884616: F tensorflow/core/kernels/conv_ops.cc:672] Check failed: stream->parent()->GetConvolveAlgorithms( conv_parameters.ShouldIncludeWinogradNonfusedAlgo<T>(), &algorithms)

рдореЗрд░реЗ рдкрд╛рд╕ 4 1080ti GPU рд╣реИрдВред рдЕрдкрдиреЗ рдореЙрдбрд▓ рдХреЗ рдЪрд▓рдиреЗ рдХреЗ рджреМрд░рд╛рди рдореИрдВрдиреЗ рдПрдирд╡реАрдбрд┐рдпрд╛-рдПрд╕рдПрдордЖрдИ рдХреА рдирд┐рдЧрд░рд╛рдиреА рдХреА рдФрд░ рдорд┐рд▓ рдЧрдпрд╛

-------------------------------------------------- ---------------------------+
| рдкреНрд░рдХреНрд░рд┐рдпрд╛рдПрдВ: рдЬреАрдкреАрдпреВ рдореЗрдореЛрд░реА |
| GPU PID рдкреНрд░рдХрд╛рд░ рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдХрд╛ рдирд╛рдо рдЙрдкрдпреЛрдЧ |
|============================================ ===========================|
| 0 1422 рдЬреА /usr/lib/xorg/Xorg 279MiB |
| 0 3530 рдЬреА рдХрдВрдкрд┐рдЬрд╝ 195MiB |
| 0 11249 рд╕реА /рд╣реЛрдо/рд╕рд╛рдЗрдорди/рдПрдирд╛рдХреЛрдВрдбрд╛3/рдмрд┐рди/рдкрд╛рдпрдерди 10157MiB |
| 1 11249 рд╕реА /рд╣реЛрдо/рд╕рд╛рдЗрдорди/рдПрдирд╛рдХреЛрдВрдбрд╛3/рдмрд┐рди/рдкрд╛рдпрдерди 10611рдПрдордЖрдИрдмреА |
| 2 11249 рд╕реА /рд╣реЛрдо/рд╕рд╛рдЗрдорди/рдПрдирд╛рдХреЛрдВрдбрд╛3/рдмрд┐рди/рдкрд╛рдпрдерди 10611рдПрдордЖрдИрдмреА |
| 3 11249 рд╕реА /рд╣реЛрдо/рд╕рд╛рдЗрдорди/рдПрдирд╛рдХреЛрдВрдбрд╛3/рдмрд┐рди/рдкрд╛рдпрдерди 10611рдПрдордЖрдИрдмреА |
+-------------------------------------------------------- -----------------------------+

рддреЛ рдХрд┐рд╕реА рдХрд╛рд░рдг рд╕реЗ рдкрд╛рдпрдерди рд╕реНрдореГрддрд┐ рдХреЛ рд╣реЙрдЧрд┐рдВрдЧ рдХрд░ рд░рд╣рд╛ рд╣реИред рдмреЗрд╢рдХ рдЕрдЧрд░ рдореИрдВ рдЗрд╕реЗ рдорд╛рд░рддрд╛ рд╣реВрдВ, рддреЛ рдпрд╣ рдореЗрд░реА рдЬреНрдпреВрдкрд┐рдЯрд░ рдиреЛрдЯрдмреБрдХ рдХреЛ рдорд╛рд░ рджреЗрддрд╛ рд╣реИред рдореЗрд░реЗ рдкрд╛рд╕ рдХреЛрдИ рдЬрд╝реЛрдВрдмреА рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдирд╣реАрдВ рдЪрд▓ рд░рд╣реА рд╣реИред рдореИрдВ рдкреНрд░рдпрд╛рд╕ рдХрд░ рдЪреБрдХрд╛ рд╣реВрдВред

gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.1) sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))

рдЬреЛ GPU рдЙрдкрдпреЛрдЧ рдХреЛ рдХрдо рдХрд░рддрд╛ рд╣реИ рд▓реЗрдХрд┐рди рдореБрдЭреЗ рдЕрднреА рднреА рд╡рд╣реА cuDDN рд╣реИрдВрдбрд▓ рддреНрд░реБрдЯрд┐ рдорд┐рд▓рддреА рд╣реИред рдореИрдВрдиреЗ рдЯреАрдПрдл рдХреЛ рдлрд┐рд░ рд╕реЗ рд╕реНрдерд╛рдкрд┐рдд рдХрд┐рдпрд╛ рд╣реИред CUDA, cuDNN, рдПрдирд╛рдХреЛрдВрдбрд╛ рд╕рдорд╕реНрдпрд╛ рдкрд░ рдХреЛрдИ рдкреНрд░рднрд╛рд╡ рдирд╣реАрдВред

рдпрд╣ рддреНрд░реБрдЯрд┐ рдЕрдЪрд╛рдирдХ рдХреНрдпреЛрдВ рд╣реЛрддреА рд╣реИ рдФрд░ рдЗрд╕реЗ рдХреИрд╕реЗ рд╣рд▓ рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред

TensorFlow 1.3 рдХреЛ cuDNN 6 рдХреЗ рд╡рд┐рд░реБрджреНрдз рдмрдирд╛рдпрд╛ рдЧрдпрд╛ рд╣реИред
рдХреГрдкрдпрд╛ рдЕрдкрдиреЗ cuDNN рдЗрдВрд╕реНрдЯреЙрд▓реЗрд╢рди рдХреЛ рдЕрдкрдЧреНрд░реЗрдб рдХрд░реЗрдВред

рдзрдиреНрдпрд╡рд╛рдж, рдЧреБрдирд╛рди - рдЗрд╕рд╕реЗ рдХреЛрдИ рдлрд░реНрдХ рдирд╣реАрдВ рдкрдбрд╝рддрд╛, рджреБрд░реНрднрд╛рдЧреНрдп рд╕реЗред рдпрд╣рд╛рдВ рддрдХ тАЛтАЛтАЛтАЛрдХрд┐ cuDNN 6 рдХреЗ рд╕рд╛рде, рдореБрдЭреЗ рдЕрднреА рднреА cuDNN рд╣реИрдВрдбрд▓ рддреНрд░реБрдЯрд┐ рдирд╣реАрдВ рдмрдирд╛ рд╕рдХрддрд╛ рд╣реИред рдпрд╣рд╛рдВ рддрдХ тАЛтАЛрдХрд┐ GPUptions рдХреЛ рд╕реАрдзреЗ рд╕реЗрдЯ рдХрд░рдирд╛ рднреА рддреНрд░реБрдЯрд┐ рдХреЛ рдирд╣реАрдВ рд░реЛрдХрддрд╛ рд╣реИ, рд╣рд╛рд▓рд╛рдВрдХрд┐ рдпрд╣ рдЙрдкрдпреЛрдЧ рдХреА рдЧрдИ GPU рдореЗрдореЛрд░реА рдХреА рдорд╛рддреНрд░рд╛ рдХреЛ рдХрдо рдХрд░рддрд╛ рд╣реИред GPU рдореЗрдореЛрд░реА рдХреЛ Python рджреНрд╡рд╛рд░рд╛ рд▓рд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рдЗрд╕рд▓рд┐рдП рдпрджрд┐ рдореИрдВ рдЗрд╕реЗ рдмрдВрдж рдХрд░рддрд╛ рд╣реВрдБ, рддреЛ рдпрд╣ рдореЗрд░реА Jupyter рдиреЛрдЯрдмреБрдХ рдХреЛ рдмрдВрдж рдХрд░ рджреЗрддрд╛ рд╣реИред рдореИрдВ рд▓рдЧрднрдЧ 4 рджрд┐рдиреЛрдВ рд╕реЗ рдЗрд╕ рдкрд░ рдЕрдЯрдХрд╛ рд╣реБрдЖ рд╣реВрдВ рдФрд░ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдореИрдВрдиреЗ рдСрдирд▓рд╛рдЗрди рджреЗрдЦреЗ рдЧрдП рд╕рднреА рд╕реБрдЭрд╛рд╡реЛрдВ рдХреЛ рд╕рдорд╛рдкреНрдд рдХрд░ рджрд┐рдпрд╛ рд╣реИред рдХреНрдпрд╛ рдпрд╣ TF 1.3 рдореБрджреНрджрд╛ рд╣реЛ рд╕рдХрддрд╛ рд╣реИ?

рд╕рд┐рд░реНрдл рдЙрдирдХреЗ рд▓рд┐рдП рдЬреЛ рдЗрд╕рд╕реЗ рдкрд╛рдЧрд▓ рд╣реЛ рдЧрдП рд╣реИрдВ:

рдореБрдЭреЗ рдХрднреА-рдХрднреА CUBLAS рддреНрд░реБрдЯрд┐ рднреА рдорд┐рд▓реАред рддреЛ рдореИрдВрдиреЗ рдпрд╣ рдХрд┐рдпрд╛:

cd /usr/local/cuda/samples/7_CUDALibraries/simpleCUBLAS
make
./simpleCUBLAS

рдФрд░ рдкрддрд╛ рдЪрд▓рд╛ рдХрд┐ рдореИрдВ CUBLAS рдХреЛ рдкреНрд░рд╛рд░рдВрдн рдирд╣реАрдВ рдХрд░ рд╕рдХрд╛

рддреЛ рдЖрдЧреЗ рдореИрдВрдиреЗ рдпрд╣ рдХрд┐рдпрд╛ (рд╕рд▓рд╛рд╣ рдХреЗ рдЖрдзрд╛рд░ рдкрд░)

sudo rm -f ~/.nv

рдФрд░ рдпрд╣ рдХрд╛рдо рдХрд┐рдпрд╛ред рдЪреАрдпрд░реНрд╕ ..... 4 рджрд┐рди рдмрд░реНрдмрд╛рдж рд╣реЛ рдЧрдПред рдЖрд╢рд╛ рд╣реИ рдХрд┐ рдпрд╣ рдХрд┐рд╕реА рдФрд░ рдХреЛ рдмрдЪрд╛рддрд╛ рд╣реИ

@ рд╕рд╛рдЗрдордирд╡реЙрд▓реНрд╢ 1000 рд╡рд╣ рдХрд╛рдо рдХрд┐рдпрд╛ !! рдзрдиреНрдпрд╡рд╛рдж

рдЕрдкрдиреЗ рд╣реЛрдо рдкрд╛рде (рдпрджрд┐ рдЙрдмрдВрдЯреВ) рдореЗрдВ рдЕрдкрдиреЗ .theanorc рдХреА рдЬрд╛рдБрдЪ рдХрд░реЗрдВ, рдФрд░ cnmem рдХреЛ рдЫреЛрдЯрд╛ рд╕реЗрдЯ рдХрд░реЗрдВ .... рд╢рд╛рдпрдж cnmem = 0.8, рдФрд░ рдпрд╣ рдЕрдм рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рдХрд░ рдЧрдпрд╛ рд╣реИ

рдореБрдЭреЗ рдпрд╣ рд╡рд┐рдВрдбреЛрдЬ 10 рдХреЗ рддрд╣рдд рдЬреАрдЯреАрдПрдХреНрд╕ 1070 рдХреЗ рд╕рд╛рде рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдХрд╛рдо рдХрд░ рд░рд╣рд╛ рд╣реИред
рдореИрдВ cudnn 7.0.2 . рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рдерд╛
рдмрдирд╛рдо 6.0 рдореЗрдВ рдЕрдкрдЧреНрд░реЗрдб рдХрд░рдиреЗ рд╕реЗ рдореБрдЭреЗ рд╕рдорд╕реНрдпрд╛рдПрдВ рд╣рд▓ рд╣реБрдИрдВ:

cuda_8.0.61_win10.exe
cudnn-8.0-windows10-x64-v6.0.zip
python-3.6.2-amd64.exe

рдкреВрд░реА рд╕реНрдерд╛рдкрдирд╛ рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдпрд╣рд╛рдВ рдкреЛрд╕реНрдЯ рдХреА:
http://klaatuveratanecto.com/installing-tensorflow-gpu-windows-10-running-image_retraining/

рд╣рд╛рдп, рдореБрдЭреЗ рд╡рд╣реА рд╕рд╡рд╛рд▓ рдорд┐рд▓рд╛ред рд╣рд╛рд▓рд╛рдБрдХрд┐, рдореИрдВрдиреЗ рдкрд╛рдпрд╛ рдХрд┐ рдЗрд╕рдХрд╛ рдХрд╛рд░рдг рдпрд╣ рд╣реИ рдХрд┐ рдореИрдВрдиреЗ рдПрдХ рд╣реА рд╕рдордп рдореЗрдВ рджреЛ рдмрд╛рд░ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ред

рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдореИрдВ рдЖрдорддреМрд░ рдкрд░ рд╕рд░рд▓ рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдХреЗ рд▓рд┐рдП рдЬреБрдкрд┐рдЯрд░ рдиреЛрдЯрдмреБрдХ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рдерд╛ рдФрд░ рдкреНрд░реЛрдЬреЗрдХреНрдЯ рдХреЗ рд▓рд┐рдП PyCharm рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рдерд╛ред рдЕрдЧрд░ рдореИрдВрдиреЗ рдЬреНрдпреВрдкрд┐рдЯрд░ рдиреЛрдЯрдмреБрдХ рдХреЛ рдмрдВрдж рдирд╣реАрдВ рдХрд┐рдпрд╛, рддреЛ рдореИрдВ Pycharm рдореЗрдВ рдЗрд╕ рддреНрд░реБрдЯрд┐ рдХреЛ рдкреВрд░рд╛ рдХрд░ рд╕рдХрддрд╛ рдерд╛ред

рдХрд╛рд╢ рдпрд╣ рдорджрдж рдХрд░ рд╕рдХреЗред


рд╡рд┐рдВрдбреЛрдЬ 10 64,
рдПрдирд╡реАрдбрд┐рдпрд╛ рдЯрд╛рдЗрдЯрдирдПрдХреНрд╕,
рдЪрд╛рд▓рдХ 385.41,
рдХреБрдбрд╛ 8.0.60
рдХреБрдбрди 6.0
рдкрд╛рдпрдерди 3.5.2
рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ 1.3

рдореИрдВ @strickon рд╕реЗ рд╕рд╣рдордд
рдореЗрд░реЗ рдкрд╛рд╕ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдкреНрд░реЛрдЧреНрд░рд╛рдо рдХреЗ рд╕рд╛рде рдПрдХ рдиреЛрдЯрдмреБрдХ рдЪрд▓ рд░рд╣реА рдереА рдФрд░ рдореИрдВрдиреЗ рджреВрд╕рд░реЗ рд╡рд┐рдВрдбреЛрдЬ рдЯрд░реНрдорд┐рдирд▓ рдореЗрдВ рдПрдХ рдЕрдЬрдЧрд░ + рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдЪрд▓рд╛рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХреА рдФрд░ рддреНрд░реБрдЯрд┐ рдорд┐рд▓реАред рдлрд┐рд░ рдореИрдВрдиреЗ рдЕрдкрдиреА рдиреЛрдЯрдмреБрдХ рдХреЛ рдлрд┐рд░ рд╕реЗ рд╢реБрд░реВ рдХрд┐рдпрд╛ (GPU рдореЗрдореЛрд░реА рдЬрд╛рд░реА рдХрд░реЗрдВ) рдФрд░ рдлрд┐рд░ рд╕реЗ рд╡рд┐рдВрдбреЛрдЬ рдЯрд░реНрдорд┐рдирд▓ рдкрд░ рдЕрдЬрдЧрд░ рдХреЛ рдЪрд▓рд╛рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХреА рдФрд░ рдпрд╣ рдХрд╛рдо рдХрд░ рдЧрдпрд╛! рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдХреЛ рдЕрдзрд┐рдХ рд╡рд┐рд╕реНрддреГрдд рд╡рд┐рд╡рд░рдг рдХреЗ рд╕рд╛рде рд╕рд▓рд╛рд╣ рджреЗрдиреЗ рдХреЗ рд▓рд┐рдП рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдХреЛ рдПрдХ рдмреЗрд╣рддрд░ рддреНрд░реБрдЯрд┐ рд╕рдВрджреЗрд╢ рдкреНрд░рджрд╛рди рдХрд░рдирд╛ рдЪрд╛рд╣рд┐рдПред

рдореИрдВ рд╡рд┐рдВрдбреЛрдЬрд╝ 10, рдХреВрдбрд╛ 8 рдФрд░ рдХреБрдбрди 6 рдкрд░ рд╣реВрдБ:

рдирд╛рдо: рдХреНрд╡рд╛рдбреНрд░реЛ K620
рдореЗрдЬрд░: 5 рдорд╛рдЗрдирд░: 0 рдореЗрдореЛрд░реАрдХреНрд▓реЙрдХрд░реЗрдЯ (рдЧреАрдЧрд╛рд╣рд░реНрдЯреНрдЬ) 1.124
рдкреАрд╕реАрдЖрдИрдмрд╕рдЖрдИрдбреА 0000:01:00.0
рдХреБрд▓ рдореЗрдореЛрд░реА: 2.00GiB
рдлреНрд░реА рдореЗрдореЛрд░реА: 1.66GiB

рдореЗрд░реЗ рд▓рд┐рдП рднреА рдмрд╣реБрдд рд╣реА рд╕рдорд╛рди рдХрджрдореЛрдВ рдиреЗ рдХрд╛рдо рдХрд┐рдпрд╛, рдореБрдЭреЗ рдпрд╣ рд╕рдордЭ рдореЗрдВ рдирд╣реАрдВ рдЖрдпрд╛ рдХрд┐ рдпрд╣ рдХреИрд╕реЗ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред рдореИрдВ рдмрд╕ рд╕рднреА рдЦрд┐рдбрд╝рдХрд┐рдпрд╛рдВ рдмрдВрдж рдХрд░ рджреЗрддрд╛ рд╣реВрдВ, pycharm рдкрд░ рдЦреЛрд▓реЗ рдЧрдП рдЕрдЬрдЧрд░ рдЯрд░реНрдорд┐рдирд▓ рдХреЛ рдмрдВрдж рдХрд░ рджреЗрддрд╛ рд╣реВрдВ - рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдореЗрдВ рдкреНрд░рдЧрддрд┐ рдХреА рд╕рд╛рдЬрд┐рд╢ рд░рдЪрдиреЗ рдФрд░ рдлрд┐рд░ рд╕реЗ рдЦреЛрд▓рдиреЗ рдФрд░ рдЪрд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдЙрд╕реА рдХрд╛рд░реНрдпрдХреНрд░рдо рдХреЗ рдкрд╣рд▓реЗ рдирд┐рд╖реНрдкрд╛рджрди рджреНрд╡рд╛рд░рд╛ рдЦреЛрд▓реА рдЧрдИ рдЦрд┐рдбрд╝рдХрд┐рдпреЛрдВ рдХреЛ рд╢рд╛рдорд┐рд▓ рдХрд░рддреЗ рд╣реБрдП - рдпрд╣ рдмрд┐рдирд╛ рдХрд┐рд╕реА рддреНрд░реБрдЯрд┐ рдХреЗ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред рдкрд╣рд▓реЗ рдмрддрд╛рдИ рдЧрдИ рддреНрд░реБрдЯрд┐рдпрд╛рдВ рдХреЛрдИ рдкреНрд░рддреНрдпрдХреНрд╖ рд╕реБрд░рд╛рдЧ рдирд╣реАрдВ рджреЗрддреА рд╣реИрдВ ---

рдирдорд╕реНрддреЗ,
рдореБрдЭреЗ рднреА рдпрд╣реА рд╕рдорд╕реНрдпрд╛ рдереА, рд╕реВрдбреЛ рдХреЗ рд╕рд╛рде рдЕрдЬрдЧрд░ рдЪрд▓рд╛рдиреЗ рд╕реЗ рдореЗрд░реА рд╕рдорд╕реНрдпрд╛ рд╣рд▓ рд╣реЛ рдЧрдИред

@SimonWalsh1000 рддреБрдо рдореЗрд░реЗ рд╣реАрд░реЛ рд╣реЛ !! рдпрд╣ рдореЗрд░реЗ рд▓рд┐рдП рднреА рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ!

@hesamaraghi sudo рд╕рд╛рде рдЪрд▓рдиреЗ рд╕реЗ рднреА рд╣рдореЗрдВ рдорджрдж рдорд┐рд▓реАред рд╣рдо рдЕрдкрдиреЗ рдЧреИрд░-рд░реВрдЯ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдХреЛ nvidia-persistenced рд╕рдореВрд╣ рдореЗрдВ рдЬреЛрдбрд╝рдХрд░ рдЧреИрд░-рд░реВрдЯ рдХреЗ рд░реВрдк рдореЗрдВ рдЪрд▓рд╛рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдереЗред рдореЗрд░реА рдореВрд▓ рдЯрд┐рдкреНрдкрдгреА рджреЗрдЦреЗрдВ: https://github.com/tensorflow/tensorflow/issues/14048#issuecomment -340898847

рдореБрдЭреЗ Ubuntu 16.04 рдФрд░ cuda-8.0 (GTX1080Ti рдХреЗ рд╕рд╛рде) рдореЗрдВ рднреА рдпрд╣реА рд╕рдорд╕реНрдпрд╛ рдереАред рдореИрдВ рдЖрдк рдореЗрдВ рд╕реЗ рдХрд┐рд╕реА рдХреЛ рднреА рдЗрд╕реА рд╕рдорд╕реНрдпрд╛ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рд╕реВрдЪрд┐рдд рдХрд░рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реВрдВ рдХрд┐ @SimonWalsh1000 рджреНрд╡рд╛рд░рд╛ рджрд┐рдП рдЧрдП рд╕рдорд╛рдзрд╛рди рдиреЗ рдореЗрд░реЗ рд▓рд┐рдП рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдХрд╛рдо рдХрд┐рдпрд╛ (рдпрд╛рдиреА, CUBLAS рдкреНрд░рд╛рд░рдВрднрд┐рдХ рд╕рдорд╕реНрдпрд╛ sudo rm -rf ~/.nv/ рджреНрд╡рд╛рд░рд╛ рд╣рд▓ рдХреА рдЧрдИ рдереА)ред рддреЛ, рдмрд╣реБрдд рдзрдиреНрдпрд╡рд╛рдж @ рд╕рд╛рдЗрдорди рд╡реЙрд▓реНрд╢ 1000 , рдЗрд╕рдиреЗ рдореБрдЭреЗ рдХреБрдЫ рдШрдВрдЯреЗ рдЦрд░реНрдЪ рдХрд┐рдП ...

@ рд╕рд╛рдЗрдордирд╡реЙрд▓реНрд╢ 1000 рдпрд╣ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред рдмрд╣реБрдд рдмрд╣реБрдд рдзрдиреНрдпрд╡рд╛рдж!

@ рд╕рд╛рдЗрдорди рд╡реЙрд▓реНрд╢ 1000 рдпрд╣ рдПрдХ рдЖрдХрд░реНрд╖рдг рдХреА рддрд░рд╣ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ, рдзрдиреНрдпрд╡рд╛рдж !!!!

рдореБрдЭреЗ рд╡рд┐рдВрдбреЛрдЬ 10, CUDA 8.0, cuDNN 6.1 рдкрд░ GTX1070Ti рдХреЗ рд╕рд╛рде рднреА рдпрд╣реА рд╕рдорд╕реНрдпрд╛ рдереАред
рдореБрдЭреЗ рдХрд╛рд░рдг рдорд┐рд▓ рдЧрдпрд╛ рд╣реИ: рдореИрдВрдиреЗ рдПрдирд╛рдХреЛрдВрдбрд╛ рд╕реНрдкрд╛рдЗрдбрд░ рдЖрдИрдбреАрдИ рдореЗрдВ рдЯреЗрдВрд╕рд░рдлреНрд▓реЛ рдХреЛрдб рдЪрд▓рд╛рдпрд╛ рд╣реИ, рдЙрд╕рдХреЗ рдмрд╛рдж рдореИрдВ рдПрдирд╛рдХреЛрдВрдбрд╛ рдкреНрд░реЙрдореНрдкреНрдЯ рдореЗрдВ рдПрдХ рдФрд░ рдЯреЗрдВрд╕рд░рдлреНрд▓реЛ рдХреЛрдб рдЪрд▓рд╛рддрд╛ рд╣реВрдВред
рд╕реНрдкрд╛рдЗрдбрд░ рдЖрдИрдбреАрдИ рдХреЛ рдмрдВрдж рдХрд░рдХреЗ рдЗрд╕реЗ рд╣рд▓ рдХрд░реЗрдВ
@lockywolf рд╕рд╣реА рд╣реИ

рдореБрдЭреЗ рднреА рдпрд╣реА рд╕рдорд╕реНрдпрд╛ рдереАред рдореИрдВ @strickon рдХреА рд╡рд┐рдзрд┐ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░рддрд╛ рдПрдирд╡реАрдбрд┐рдпрд╛-рдПрд╕рдПрдордЖрдИ " рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдкрддрд╛ рдирд╣реАрдВ рд╣реИ, рд╢рд╛рдпрдж рдпрд╣ рд▓рд┐рдирдХреНрд╕ рдкрд░ рдПрдХ рдХрдорд╛рдВрдб рд╣реИред рдореИрдВрдиреЗ CUDA8.0 рдХреЗ рд▓рд┐рдП cuDNN 7.0 рдореЗрдВ рдЕрдкрдбреЗрдЯ рдХрд░рдХреЗ рдЗрд╕ рд╕рдорд╕реНрдпрд╛ рдХреЛ рд╣рд▓ рдХрд┐рдпрд╛

рд╢реБрд░реБрдЖрдд рдореЗрдВ рд╕рд┐рд╕реНрдЯрдо:

  • рд╡рд┐рдВрдбреЛрдЬ 10
  • CUDA8.0
  • рд╕реАрдпреВрдбреАрдПрдирдПрди6.0
  • рдПрдирд╛рдХреЛрдВрдбрд╛ 3.5 (рдкрд╛рдпрдерди 3.5)
  • GeForce 840M рдореЗрдЬрд░: 5 рдорд╛рдЗрдирд░: 0 рдореЗрдореЛрд░реАрдХреНрд▓реЙрдХрд░реЗрдЯ (GHz): 1.124
  • 2.00GiB рдореБрдХреНрддрдореЗрдореЛрд░реА: 1.66GiB

рд╕рд┐рд╕реНрдЯрдо рд╣рд▓ рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж:

  • рд╡рд┐рдВрдбреЛрдЬ 10
  • CUDA8.0
  • рд╕реАрдпреВрдбреАрдПрдирдПрди7.0
  • рдПрдирд╛рдХреЛрдВрдбрд╛ 3.5 (рдкрд╛рдпрдерди 3.5)
  • GeForce 840M рдореЗрдЬрд░: 5 рдорд╛рдЗрдирд░: 0 рдореЗрдореЛрд░реАрдХреНрд▓реЙрдХрд░реЗрдЯ (GHz): 1.124
  • 2.00GiB рдореБрдХреНрддрдореЗрдореЛрд░реА: 1.66GiB

рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рд╕рдорд╕реНрдпрд╛ рдкреБрд╕реНрддрдХрд╛рд▓рдп рдФрд░ рд╣рд╛рд░реНрдбрд╡реЗрдпрд░ рдХреЗ рд╕рдВрд╕реНрдХрд░рдг рдХреЗ рдореЗрд▓ рди рдЦрд╛рдиреЗ рдХреЗ рдХрд╛рд░рдг рд╣реЛ рд╕рдХрддреА рд╣реИред @chleibig рднреА рдЗрд╕реЗ GPU рдбреНрд░рд╛рдЗрд╡рд░ рдЕрдкрдбреЗрдЯ рдХрд░рдХреЗ рд╣рд▓ рдХрд░реЗрдВред рдЖрд╢рд╛ рд╣реИ рдХрд┐ рдпрд╣ рдорджрджрдЧрд╛рд░ рд╣реЛ рд╕рдХрддрд╛ рд╣реИред

рдореЗрд░реЗ рд▓рд┐рдП рдбрд╛рд▓рдиреЗ рдХреЗ рд▓рд┐рдП: config.gpu_options.allow_growth = True рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рд╕рддреНрд░ рдореЗрдВ рд╕рдорд╕реНрдпрд╛ рдХреЛ рдареАрдХ рдХрд┐рдпрд╛ред
рдХреБрдбрд╛ 8, рдЯреАрдПрдл 1.4, рдХреБрдбрди 6

рдЗрд╕реЗ рдЪрд▓рд╛рдПрдВ рдЗрд╕ рдореБрджреНрджреЗ рдХреЛ рдареАрдХ рдХрд░реЗрдВред

рд╕реБрдбреЛ рдЖрд░рдПрдо-рдЖрд░рдПрдл ~/.nv

рд╕рдорд╛рди рдкреНрд░рд╢рдиред рдХреНрдпрд╛ рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рдорд╛рдзрд╛рди рдХрд░рдиреЗ рдХрд╛ рдХреЛрдИ рдЙрдкрд╛рдп рд╣реИ?
рдореЗрд░реА рд╕реНрдерд┐рддрд┐ рд╣реИ:
рдирд╛рдо: GeForce GTX 1080
рдЯреЛрдЯрд▓рдореЗрдореЛрд░реА: 7.92GiB рдлреНрд░реАрдореЗрдореЛрд░реА: 2.50GiB
рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ: gpu-1.4.0

рдореИрдВ рдПрдХ рдЬреАрдкреАрдпреВ рдХрд╛ рдкрд░реАрдХреНрд╖рдг рдХрд░ рд░рд╣рд╛ рд╣реВрдВ рд▓реЗрдХрд┐рди рддреАрди рдЯреЗрдВрд╕рд░рдлреНрд▓реЛ рдЗрдВрд╕реНрдЯреЗрдВрд╕ рдЪрд▓рд╛ рд░рд╣рд╛ рд╣реВрдВред
рдореЗрд░реЗ рдХреЛрдб рдореЗрдВ рдЗрд╕ рддрд░рд╣:
gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.3)
sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))

рдЕрдиреНрдп рджреЛ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдЗрдВрд╕реНрдЯреЗрдВрд╕ рдареАрдХ рдЪрд▓ рд░рд╣реЗ рд╣реИрдВ, рд▓реЗрдХрд┐рди рдХреЗрд╡рд▓ рдЕрдВрддрд┐рдо рдПрдХ рд░рди рддреНрд░реБрдЯрд┐ рдЗрд╕ рддрд░рд╣ рд╣реИ:

E tensorflow/stream_executor/cuda/cuda_dnn.cc:371] cudnn рд╣реИрдВрдбрд▓ рдирд╣реАрдВ рдмрдирд╛ рд╕рдХрд╛: CUDNN_STATUS_INTERNAL_ERROR
E tensorflow/stream_executor/cuda/cuda_dnn.cc:338] cudnn рд╣реИрдВрдбрд▓ рдХреЛ рдирд╖реНрдЯ рдирд╣реАрдВ рдХрд░ рд╕рдХрд╛: CUDNN_STATUS_BAD_PARAM
F tensorflow/core/kernels/conv_ops.cc:672] рдЬрд╛рдБрдЪ рд╡рд┐рдлрд▓: рд╕реНрдЯреНрд░реАрдо-> рдкреЗрд░реЗрдВрдЯ ()->GetConvolveAlgorithms(conv_parameters.ShouldIncludeWinogradNonfuseAlgo(), рдФрд░ рдПрд▓реНрдЧреЛрд░рд┐рджрдо)

рдХреНрдпреЛрдВ? рдХреНрдпрд╛ GPU рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди рдмрд╣реБрдд рдЫреЛрдЯрд╛ рд╣реИ: gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.3)
рдореБрдЭреЗ рдпрдХреАрди рдирд╣реАрдВ рд╣реИред рдХреБрдЫ рд╕реБрдЭрд╛рд╡ рдЪрд╛рд╣рддреЗ рд╣реИрдВред рдореИ рдХреЛрд╢рд┐рд╢ рдХрд░реБреЕрдЧрд╛ред

рдореЗрд░реЗ рд╕рдорд╛рдзрд╛рди рдХреА рдЬрд╛рдБрдЪ рдХрд░реЗрдВ ....

рдкрд░ 19 08:20 рджрд┐рд╕рдВрдмрд░ 2017, tbchj [email protected] рд▓рд┐рдЦрд╛ рд╣реИ:

рд╕рдорд╛рди рдкреНрд░рд╢рдиред рдХреНрдпрд╛ рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рдорд╛рдзрд╛рди рдХрд░рдиреЗ рдХрд╛ рдХреЛрдИ рдЙрдкрд╛рдп рд╣реИ?
рдореЗрд░реА рд╕реНрдерд┐рддрд┐ рд╣реИ:
рдирд╛рдо: GeForce GTX 1080
рдЯреЛрдЯрд▓рдореЗрдореЛрд░реА: 7.92GiB рдлреНрд░реАрдореЗрдореЛрд░реА: 2.50GiB
рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ: gpu-1.4.0

рдореИрдВ рдПрдХ рдЬреАрдкреАрдпреВ рдХрд╛ рдкрд░реАрдХреНрд╖рдг рдХрд░ рд░рд╣рд╛ рд╣реВрдВ рд▓реЗрдХрд┐рди рддреАрди рдЯреЗрдВрд╕рд░рдлреНрд▓реЛ рдЗрдВрд╕реНрдЯреЗрдВрд╕ рдЪрд▓рд╛ рд░рд╣рд╛ рд╣реВрдВред
рдореЗрд░реЗ рдХреЛрдб рдореЗрдВ рдЗрд╕ рддрд░рд╣:
gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.3)
sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))

рдЕрдиреНрдп рджреЛ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдЗрдВрд╕реНрдЯреЗрдВрд╕ рдареАрдХ рдЪрд▓ рд░рд╣реЗ рд╣реИрдВ, рд▓реЗрдХрд┐рди рдХреЗрд╡рд▓ рдЕрдВрддрд┐рдо рдПрдХ рд░рди
рдЗрд╕ рддрд░рд╣ рддреНрд░реБрдЯрд┐:

рдИ tensorflow/stream_executor/cuda/cuda_dnn.cc:371] cudnn рдирд╣реАрдВ рдмрдирд╛ рд╕рдХрд╛
рд╣реИрдВрдбрд▓: CUDNN_STATUS_INTERNAL_ERROR
рдИ tensorflow/stream_executor/cuda/cuda_dnn.cc:338] рдирд╖реНрдЯ рдирд╣реАрдВ рдХрд░ рд╕рдХрд╛
рдХреБрдбрди рд╣реИрдВрдбрд▓: CUDNN_STATUS_BAD_PARAM
F tensorflow/core/kernels/conv_ops.cc:672] рдЬрд╛рдБрдЪ рд╡рд┐рдлрд▓:
рд╕реНрдЯреНрд░реАрдо-> рдкреИрд░реЗрдВрдЯ ()-> GetConvolveAlgorithms (conv_parameters.
shouldIncludeWinogradNonfuseAlgo(), &рдПрд▓реНрдЧреЛрд░рд┐рджрдо)

рдХреНрдпреЛрдВ? рдХреНрдпрд╛ GPU рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди рдмрд╣реБрдд рдЫреЛрдЯрд╛ рд╣реИ: gpu_options = tf.GPUOptions(per_process_gpu_
рдореЗрдореЛрд░реА_рдлрд╝реНрд░реИрдХреНрд╢рди = 0.3)
рдореБрдЭреЗ рдпрдХреАрди рдирд╣реАрдВ рд╣реИред рдХреБрдЫ рд╕реБрдЭрд╛рд╡ рдЪрд╛рд╣рддреЗ рд╣реИрдВред рдореИ рдХреЛрд╢рд┐рд╢ рдХрд░реБреЕрдЧрд╛ред

-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/tensorflow/tensorflow/issues/6698#issuecomment-352670885 ,
рдпрд╛ рдереНрд░реЗрдб рдХреЛ рдореНрдпреВрдЯ рдХрд░реЗрдВ
https://github.com/notifications/unsubscribe-auth/AJq-HpINYs1Uae6ghIW3qKCD56SUDhFeks5tB3HZgaJpZM4Lc7S1
.

--
рд╢реНрд░реЗрд╖реНрда
рд╕рд╛рдЗрдорди

SLFWalsh рдПрдордбреА MRCP FFRRCSI
[email protected]

рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ, рдореИрдВ рдПрдХ рдкреГрд╖реНрдарднреВрдорд┐ рдкрд░ рдорд╢рд╛рд▓ рдЪрд▓рд╛ рд░рд╣рд╛ рдерд╛ рдФрд░ рдореБрдЭреЗ рднреА рдпрд╣реА рд╕рдорд╕реНрдпрд╛ рд╣реИред
рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ... CUDNN_STATUS_INTERNAL_ERROR рддрдм рд╣реЛ рд╕рдХрддрд╛ рд╣реИ рдЬрдм рдЕрдиреНрдп рдкреНрд░реЛрдЧреНрд░рд╛рдо cudnn рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣реЗ рд╣реЛрдВ

рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ, рдореИрдВ ipython рд╡рд╛рддрд╛рд╡рд░рдг рдореЗрдВ cudnn рдЪрд▓рд╛ рд╕рдХрддрд╛ рд╣реВрдВ, рд╣рд╛рд▓рд╛рдВрдХрд┐, рдореБрдЭреЗ рд╡рд╣реА рддреНрд░реБрдЯрд┐ рд╕рдВрджреЗрд╢ рдорд┐рд▓реЗ рдЬрдм рдореИрдВрдиреЗ рдЬреНрдпреВрдкрд┐рдЯрд░ рдиреЛрдЯрдмреБрдХ рдореЗрдВ рдХреЛрдб рдЪрд▓рд╛рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд┐рдпрд╛

рдирдорд╕реНрддреЗ, рдореБрдЭреЗ рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛ рд╣реЛ рд░рд╣реА рд╣реИ рдФрд░ рдЕрдм рддрдХ рдХрд┐рд╕реА рднреА рд╕реБрдЭрд╛рд╡ рдиреЗ рдореБрдЭреЗ рдЗрд╕реЗ рд╣рд▓ рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдирд╣реАрдВ рдХреА рд╣реИред
рдореИрдВ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╕реНрдкреЗрдХреНрд╕ рдХреЗ рд╕рд╛рде рд╡рд┐рдВрдбреЛрдЬ 10 рдХреЗ рд╕рд╛рде рдПрдХ Asus Zenbook Pro рд▓реИрдкрдЯреЙрдк рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рд╣реВрдВ:

imagen

рдореЗрд░реЗ GPU рдЪрд╢реНрдорд╛ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╣реИрдВ:

imagen

рдореИрдВ рдЗрд╕ рдЯреНрдпреВрдЯреЛрд░рд┐рдпрд▓ рдХрд╛ рдЕрдиреБрд╕рд░рдг рдХрд░ рд░рд╣рд╛ рд╣реВрдВ: https://www.tensorflow.org/get_started/mnist/pros, рдЬрд┐рд╕рдореЗрдВ рдЖрдкрдХреЛ рд▓рд╛рдЧреВ рдХрд░рдирд╛ рдФрд░ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд░рдирд╛ рд╣реИ 1) рдПрдХ рд╕реЙрдлреНрдЯрдореИрдХреНрд╕ рд░рд┐рдЧреНрд░реЗрд╢рди рдФрд░ 2) MNIST рдбреЗрдЯрд╛рд╕реЗрдЯ рдХреЗ рд╕рд╛рде рдПрдХ рдмрд╣реБрдкрд░рдд CNNред

рдпреЗ рдореЗрд░реЗ рдХреЛрдб рд╣реИрдВ: MNIST_Tutorial.zip ред рдЬрд╝рд┐рдк рдореЗрдВ 2 рдлрд╝рд╛рдЗрд▓реЗрдВ рд╣реИрдВ: MNIST_softmax_regression.py рдФрд░ MNIST_multilayer_CNN.pyред

1) рдЬрдм рдореИрдВ MNIST_softmax_regression.py рдЪрд▓рд╛рддрд╛ рд╣реВрдВ, рддреЛ рдпрд╣ рдареАрдХ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ:
imagen
рдЬреИрд╕рд╛ рдХрд┐ рдЖрдк рджреЗрдЦ рд╕рдХрддреЗ рд╣реИрдВ, GPU рдХрд╛ рдЙрдкрдпреЛрдЧ рд╣реЛ рд░рд╣рд╛ рд╣реИ рдФрд░ рдЯреНрдпреВрдЯреЛрд░рд┐рдпрд▓ рдХреЗ рдЕрдиреБрд╕рд╛рд░ рдЕрдВрддрд┐рдо рд╕рдЯреАрдХрддрд╛ рд▓рдЧрднрдЧ 92% рд╣реИред

2) рд╣рд╛рд▓рд╛рдВрдХрд┐, рдЬрдм рдореИрдВ MNIST_multilayer_CNN.py рдЪрд▓рд╛рддрд╛ рд╣реВрдВ, рддреЛ рдкрд╛рдпрдерди рдХреНрд░реИрд╢ рд╣реЛ рдЬрд╛рддрд╛ рд╣реИ:
imagen

рдореИрдВрдиреЗ рдкрд┐рдЫрд▓реЗ рд╕реБрдЭрд╛рд╡реЛрдВ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ 2 рд╡рд░реНрдХрдЕрд░рд╛рдЙрдВрдб рдХреА рдХреЛрд╢рд┐рд╢ рдХреА:

config = tf.ConfigProto()
config.gpu_options.allow_growth = True
with tf.Session(config=config) as sess:

рддрдерд╛

config = tf.ConfigProto()
config.gpu_options.per_process_gpu_memory_fraction = 0.8
with tf.Session(config=config) as sess:

рдЙрдирдореЗрдВ рд╕реЗ рдХрд┐рд╕реА рдиреЗ рднреА рдХрд╛рдо рдирд╣реАрдВ рдХрд┐рдпрд╛, рд╣рд╛рд▓рд╛рдВрдХрд┐ рджреВрд╕рд░рд╛ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдЖрдЙрдЯрдкреБрдЯ рджреЗрддрд╛ рд╣реИ:

imagen

рдЬреИрд╕рд╛ рдХрд┐ рдЖрдк рджреЗрдЦ рд╕рдХрддреЗ рд╣реИрдВ, рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдкрд╣рд▓реЗ рдореЗрдореЛрд░реА рдХреЛ рдХрдИ рдмрд╛рд░ рдЖрд╡рдВрдЯрд┐рдд рдХрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░рддрд╛ рд╣реИ (CUBLAS_STATUS_ALLOC_FAILED) рдЬрдм рддрдХ рдХрд┐ рдпрд╣ рд╕реНрдкрд╖реНрдЯ рд░реВрдк рд╕реЗ рд╕рдлрд▓ рди рд╣реЛ рдЬрд╛рдП рд▓реЗрдХрд┐рди рдлрд┐рд░ CUDNN_STATUS_NOT_INITIALIZED рддреНрд░реБрдЯрд┐ рдкреНрд░рдХрдЯ рд╣реЛрддреА рд╣реИ рдФрд░ рд╕рдм рдХреБрдЫ рдлрд┐рд░ рд╕реЗ рд╡рд┐рдлрд▓ рд╣реЛ рдЬрд╛рддрд╛ рд╣реИред

рдмреАрдЯреАрдбрдмреНрд▓реНрдпреВ, рдореИрдВрдиреЗ рдЗрди рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХреЗ рдЕрдВрдд рдореЗрдВ рд╡реИрдХрд▓реНрдкрд┐рдХ рджреГрд╖реНрдЯрд┐рдХреЛрдг рдХреЗ рдЕрдиреБрд╕рд╛рд░ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рд╕реНрдерд╛рдкрд┐рдд рдХрд┐рдпрд╛: http://www.python36.com/install-tensorflow-gpu-windows/
imagen

рдореИрдВрдиреЗ рдЗрд╕ CUDA рдЗрдВрд╕реНрдЯреЙрд▓рд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛:
imagen
imagen

рдФрд░ tensorflow рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЗрд╕ .whl рдлрд╝рд╛рдЗрд▓ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛:
imagen

рдпрд╣рд╛рдБ рдЕрдЬрдЧрд░, рдкрд╛рдЗрдк рдФрд░ рдХреЛрдВрдбрд╛ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдХреБрдЫ рдФрд░ рдЬрд╛рдирдХрд╛рд░реА:
imagen

рдХрд┐рд╕реА рднреА рдорджрдж рдХреА рдЧрд╣рд░рд╛рдИ рд╕реЗ рд╕рд░рд╛рд╣рдирд╛ рдХреА рдЬрд╛рдПрдЧреАред
рдЕрдЧреНрд░рд┐рдо рдореЗрдВ рдзрдиреНрдпрд╡рд╛рджред

рдирдорд╕реНрддреЗ,
рдореБрдЭреЗ рджреЛ рдЕрд▓рдЧ-рдЕрд▓рдЧ рдорд╢реАрдиреЛрдВ рдкрд░ рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝ рд░рд╣рд╛ рд╣реИ:

рд╕реЗрдЯрдЕрдк 1:
рд╡рд┐рдВрдбреЛрдЬ 10 рдкреНрд░реЛ 64 рдмрд┐рдЯ
рдЬреАрдкреАрдпреВ рдЬрд╛рдирдХрд╛рд░реА
рдХреБрдбрд╛ 8.0
рдХреБрдбрди 6.0
рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ 1.4
рдкрд╛рдпрдерди 3.6.4

рд╕реЗрдЯрдЕрдк2:
рд╡рд┐рдВрдбреЛрдЬ 10 рдкреНрд░реЛ 64 рдмрд┐рдЯ
рдЬреАрдкреАрдпреВ рдЬрд╛рдирдХрд╛рд░реА
CUDA 8.0
рдХреБрдбрди 6.0
рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ 1.4
рдкрд╛рдпрдерди 3.6.2

рдХреЛрдИ рдЕрдкрдбреЗрдЯреНрд╕?

рдКрдкрд░ рд╕реЗ рдмрд╣реБрдд рд╕рдорд╛рди рд╕реЗрдЯ рдЕрдк рдХрд░реЗрдВ, рдЗрд╕ рдкрд░ рдЪрд▓ рд░рд╣рд╛ рд╣реИ:

рд╡рд┐рдВрдбреЛрдЬ 10
рдЬреАрдкреАрдпреВ
рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ 1.5
CUDA 9.0.176
рдХреБрдбрди 7
рдЕрдЬрдЧрд░ 3.6.4, рдПрдирд╛рдХреЛрдВрдбрд╛

рдореИрдВрдиреЗ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди рдкрд░рд┐рд╡рд░реНрддрдиреЛрдВ рдХреА рдХреЛрд╢рд┐рд╢ рдХреА рдФрд░ рдореБрдЭреЗ рдЕрднреА рднреА рддреНрд░реБрдЯрд┐рдпреЛрдВ рдХрд╛ "CUDNN_STATUS_NOT_INITIALIZED" рд╕реЗрдЯ рдорд┐рд▓ рд░рд╣рд╛ рд╣реИред

рдореБрдЭреЗ рдпрдХреАрди рдирд╣реАрдВ рд╣реИ рдХрд┐ рд╡рд┐рдВрдбреЛрдЬрд╝ рдкрд░ .nv рдлрд╝реЛрд▓реНрдбрд░ рдХреЗ рдмрд░рд╛рдмрд░ рдХрд╣рд╛рдБ рд░рд╣рддрд╛ рд╣реИ, рдЗрд╕рд▓рд┐рдП рдореИрдВ @SimonWalsh1000 рд╕рдорд╛рдзрд╛рди рдЪрд▓рд╛рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдирд╣реАрдВ рдерд╛ред

@ рд╣реЗрдВрдЬ рдмреЗрдВрдЬрд╛рдорд┐рди , рдХреЛрдИ рд╕рдлрд▓рддрд╛?

рд╕рдВрдкрд╛рджрд┐рдд рдХрд░реЗрдВ: рдЕрднреА рднреА рд╕реНрдЯрдореНрдкреНрдб, рдХреНрдпрд╛ рдРрд╕рд╛ рдЗрд╕рд▓рд┐рдП рд╣реЛ рд╕рдХрддрд╛ рд╣реИ рдХреНрдпреЛрдВрдХрд┐ рдореИрдВ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ 1.5 рдФрд░ CUDA 9 рдкрд░ рд╣реВрдВ?

рдореИрдВ рдПрдХ рд╣реА рдореБрджреНрджреЗ рд╕реЗ рдорд┐рд▓рд╛ рд╣реВрдВред
рд╣рд╛рд▓рд╛рдБрдХрд┐, рдореИрдВрдиреЗ рдкрд╛рдпрд╛ рдХрд┐ CUDA 9.0 рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж, рдореЗрд░рд╛ рдбреНрд░рд╛рдЗрд╡рд░ рдирд╡реАрдирддрдо рд╕рдВрд╕реНрдХрд░рдг рдирд╣реАрдВ рд╣реЛрдЧрд╛ред
рдЗрд╕рд▓рд┐рдП, рдЕрдкрдиреЗ Nvdia рдбреНрд░рд╛рдЗрд╡рд░ рдХреЛ рдирд╡реАрдирддрдо рд╕рдВрд╕реНрдХрд░рдг рдореЗрдВ рдЕрдкрдбреЗрдЯ рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░реЗрдВ рдФрд░ рдЕрдкрдиреЗ рдкреАрд╕реА рдХреЛ рдкреБрдирд░рд╛рд░рдВрдн рдХрд░реЗрдВред рдЗрд╕рд╕реЗ рдореЗрд░рд╛ рдХрд╛рдо рдмрдирддрд╛ рд╣реИ!

рдХрд▓ рдореЗрд░рд╛ рдХреЛрдб рдареАрдХ рдХрд╛рдо рдХрд░ рд░рд╣рд╛ рдерд╛, рдЖрдЬ рд╕реБрдмрд╣ рдЙрдмрдВрдЯреВ рдХреЗ рд▓рд┐рдП рдПрдХ рдЕрдкрдбреЗрдЯ рдерд╛ рдФрд░ рдЕрдм рдореЗрд░рд╛ рдХреЛрдб рдЗрд╕реЗ рдЙрддреНрдкрдиреНрди рдХрд░рддрд╛ рд╣реИред рдФрд░ рдХреБрдЫ рдирд╣реАрдВ рдмрджрд▓рд╛ рд╣реИред

2018-02-11 07:54:57.097712: E tensorflow/stream_executor/cuda/cuda_dnn.cc:385] cudnn рд╣реИрдВрдбрд▓ рдирд╣реАрдВ рдмрдирд╛ рд╕рдХрд╛: CUDNN_STATUS_INTERNAL_ERROR
2018-02-11 07:54:57.097756: E tensorflow/stream_executor/cuda/cuda_dnn.cc:352] cudnn рд╣реИрдВрдбрд▓ рдХреЛ рдирд╖реНрдЯ рдирд╣реАрдВ рдХрд░ рд╕рдХрд╛: CUDNN_STATUS_BAD_PARAM
2018-02-11 07: 54: 57.097767: F tensorflow/core/kernels/conv_ops.cc:667] рдЪреЗрдХ рд╡рд┐рдлрд▓: рд╕реНрдЯреНрд░реАрдо-> рдкреИрд░реЗрдВрдЯ ()-> GetConvolveAlgorithms (conv_parameters.ShouldIncludeWinogradNonfuseAlgo(), &algorithms)

рдореИрдВрдиреЗ рд╕рд┐рд╕реНрдЯрдо рдХреЛ рдПрдХ рджрд░реНрдЬрди рдмрд╛рд░ рд░рд┐рдмреВрдЯ рдХрд┐рдпрд╛ рд╣реИред
рдХреБрдЫ рд░рд┐рдмреВрдЯ рдХреЗ рдмрд╛рдж, рддреНрд░реБрдЯрд┐ рдмрджрд▓ рдЧрдИ

2018-02-11 07:19:33.487404: I tensorflow/stream_executor/cuda/cuda_dnn.cc:393] рд╕рдВрднрд╡рддрдГ рдЕрдкрд░реНрдпрд╛рдкреНрдд рдбреНрд░рд╛рдЗрд╡рд░ рд╕рдВрд╕реНрдХрд░рдг: 384.111.0 2018-02-11 07:19: 33.487423: E tensorflow/stream_executor/cuda/ cuda_dnn.cc:352] cudnn рд╣реИрдВрдбрд▓ рдХреЛ рдирд╖реНрдЯ рдирд╣реАрдВ рдХрд░ рд╕рдХрд╛: CUDNN_STATUS_BAD_PARAM 2018-02-11 07:19:33.487439: F tensorflow/core/kernels/conv_ops.cc:667] рдЪреЗрдХ рдлреЗрд▓: рд╕реНрдЯреНрд░реАрдо-> рдкреИрд░реЗрдВрдЯ()->GetConvolveAlgorithms( conv_parameters.ShowdIncludeWinogradNonfuseAlgo(), &рдПрд▓реНрдЧреЛрд░рд┐рджрдо)

рд▓реЗрдХрд┐рди 390.25 рдореЗрдВ рдЕрдкрдЧреНрд░реЗрдб рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж рдЕрдм рдпрд╣ рдлрд┐рд░ рд╕реЗ рдкрд╣рд▓реА рддреНрд░реБрдЯрд┐ рдЙрддреНрдкрдиреНрди рдХрд░рддрд╛ рд╣реИред

рдореЗрд░рд╛ рдЕрдиреНрдп рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдХреЛрдб рдареАрдХ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред

рдореИрдВрдиреЗ nv рдирд┐рд░реНрджреЗрд╢рд┐рдХрд╛ рдХреЛ рд╣рдЯрд╛рдиреЗ рдХрд╛ рднреА рдкреНрд░рдпрд╛рд╕ рдХрд┐рдпрд╛ рд▓реЗрдХрд┐рди рдЗрд╕рдХрд╛ рдХреЛрдИ рдкреНрд░рднрд╛рд╡ рдирд╣реАрдВ рдкрдбрд╝рд╛

рдЙрдмрдВрдЯреВ 17.10, рдЬреАрдЯреАрдПрдХреНрд╕ 1060 6 рдЬреАрдмреА

рдореБрдЭреЗ рдпрд╣ рддреНрд░реБрдЯрд┐ рд╡рд┐рдВрдбреЛрдЬ 10 рдкрд░ CUDA 9.0 рдФрд░ GT 750M рдХреЗ рд╕рд╛рде рдорд┐рд▓реА, рдореИрдВрдиреЗ рдЗрд╕реЗ GPU рдХреЗ рдЙрдкрдпреЛрдЧ рдХреЛ 0.7 рддрдХ рд╕реАрдорд┐рдд рдХрд░рдХреЗ рд╣рд▓ рдХрд┐рдпрд╛: config.gpu_options.per_process_gpu_memory_fraction = 0.7

рдЬреИрд╕рд╛ рдХрд┐ рдХрд┐рд╕реА рдФрд░ рдиреЗ рдкреЛрд╕реНрдЯ рдХрд┐рдпрд╛ рд╣реИ, 0.7 рд╕реЗ рдЕрдзрд┐рдХ рдХреБрдЫ рднреА рдкрд╛рдпрдерди рдХреЛ рдХреНрд░реИрд╢ рдХрд░рддрд╛ рд╣реИред

рддреНрд░реБрдЯрд┐рдпреЛрдВ рдХреА рддреНрд░рд┐рдореВрд░реНрддрд┐ рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж рднреА:

CUDNN_STATUS_NOT_INITIALIZED
conv_parameters.ShouldIncludeWinogradNonfusedAlgo(), &algorithms)

@zzhang68 рдХреЗ рд╕рдорд╛рдзрд╛рди рдХреА рдХреЛрд╢рд┐рд╢ рдХреА ... 9.0 рд╕реНрдерд╛рдкрд┐рдд рдкреБрд░рд╛рдиреЗ рдбреНрд░рд╛рдЗрд╡рд░реЛрдВ рдХреЗ рдмрд╛рдж рдЕрдкрдбреЗрдЯ рдХрд┐рдП рдЧрдП рдбреНрд░рд╛рдЗрд╡рд░ред
_рдФрд░ рдпрд╣ рдХрд╛рдо рдХрд░ рдЧрдпрд╛!_

рд╡рд┐рдВрдбреЛрдЬ 10 | GTX 980 Ti
CUDA 9.0 (рдЬреЛ рдкреБрд░рд╛рдиреЗ рдбреНрд░рд╛рдЗрд╡рд░реЛрдВ рдХреЗ рд╕рд╛рде рдЖрдпрд╛ рдерд╛ !!!!)
\cudnn-9.0-windows10-x64-v7\cuda\bin (cudann64_7.dll) рдкрде рдореЗрдВ

рдЕрдЬрдЧрд░ 3.6 рдорд┐рдирд┐рдХреЛрдВрдбрд╛
рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ-рдЬреАрдкреАрдпреВ 1.5.0

рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рд╛рдордирд╛ред tf1.5 py2.7 рдЯрд╛рдЗрдЯрди x cuda8.
config.gpu_options.allow_growth = True
рдирд╣реАрдВ рдХрд╛рд░реНрдп

рдореБрдЭреЗ рдпрд╣ рддреНрд░реБрдЯрд┐ рд╡рд┐рдВрдбреЛрдЬрд╝ 10 рдкрд░ CUDA 9.0 рдФрд░ GTX 1060 рдХреЗ рд╕рд╛рде рдорд┐рд▓реА рд╣реИред
рдЕрдЬрдЧрд░ 3.5
рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ-рдЬреАрдкреАрдпреВ 1.5.0
рдореБрдЭреЗ рдЗрд╕реЗ рд╣рд▓ рдХрд░рдиреЗ рдХрд╛ рдПрдХ рдЖрд╕рд╛рди рддрд░реАрдХрд╛ рдорд┐рд▓ рдЧрдпрд╛ рд╣реИ: рдореЗрд░реЗ NVIDIA рдбрд┐рд╕реНрдкреНрд▓реЗ рдбреНрд░рд╛рдЗрд╡рд░ рдХреЛ рдирд╡реАрдирддрдо рд╕рдВрд╕реНрдХрд░рдг рдореЗрдВ рдЕрдкрдбреЗрдЯ рдХрд░реЗрдВ, рдкреАрд╕реА рдХреЛ рд░рд┐рдмреВрдЯ рдХрд░реЗрдВ
рддрдм рдпрд╣ рдХрд╛рдо рдХрд┐рдпрд╛!

@ рд╕рд╛рдЗрдордирд╡реЙрд▓реНрд╢ 1000 , рдпрд╣ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ, рдмрд╣реБрдд рдмрд╣реБрдд рдзрдиреНрдпрд╡рд╛рдж!

@strickon рдФрд░ @ggranum рдкреНрд▓рд╕ рдбреНрд░рд╛рдЗрд╡рд░ рдЕрдкрдбреЗрдЯ рдХреЗ рд╕рдорд╛рдзрд╛рди рдиреЗ рдореЗрд░реЗ рд▓рд┐рдП рдЗрд╕реЗ рд╣рд▓ рдХрд░ рджрд┐рдпрд╛ред рдореЗрд░рд╛ рдЕрдиреБрдорд╛рди рд╣реИ рдХрд┐ рдХреБрдЫ рд▓реЛрдЧреЛрдВ рдиреЗ рдкрд╛рд╡рд░ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди рдХреЛ рдЕрдиреБрдХреВрд▓рд┐рдд рдХрд┐рдпрд╛ рд╣реИ рдЬреЛ рдХреБрдЫ рдХрд╛рд░реНрдпрдХреНрд╖рдорддрд╛ рдХреЛ рддрдм рддрдХ рдбрд┐рдлреНрд▓реЗрдЯ рдХрд░рддреЗ рд╣реИрдВ рдЬрдм рддрдХ рдХрд┐ рдЗрд╕рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рди рд╣реЛред

рдореЗрд░реЗ GPU рдбреНрд░рд╛рдЗрд╡рд░ рдХреЛ рдЕрдкрдбреЗрдЯ рдХрд░рдиреЗ рд╕реЗ рдореЗрд░реЗ рд▓рд┐рдП рдпрд╣ рд╕рдорд╕реНрдпрд╛ рд╣рд▓ рд╣реЛ рдЧрдИред рдореЗрд░рд╛ рдЬреАрдкреАрдпреВ рдбреНрд░рд╛рдЗрд╡рд░ рджрд┐рд╕рдВрдмрд░ 2017 рдерд╛ рдФрд░ рдирд╡реАрдирддрдо 26 рдлрд░рд╡рд░реА 2018 рдерд╛ред

рдЗрд╕ рд╕рдорд╕реНрдпрд╛ рд╕реЗ рдмрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рдЖрдкрдХреЗ рдкрд╛рд╕ рд╕рд╣реА рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ, CUDA рд╕рдВрд╕реНрдХрд░рдг, cuDNN рд╕рдВрд╕реНрдХрд░рдг рдФрд░ GPU рдбреНрд░рд╛рдЗрд╡рд░ рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдП

рдореЗрд░реА рдХрд▓реНрдкрдирд╛:
рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ 1.6
cuDNN v7.0.4 (рдирд╡рдВрдмрд░ 13, 2017), CUDA 9.0 рдХреЗ рд▓рд┐рдП (рдореБрдЭреЗ рдЕрдкрдиреЗ TF рдХреЗ рдХрд╛рдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЗрд╕ рд╕рдВрд╕реНрдХрд░рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ рдкрдбрд╝рд╛)

рдпрд╣рд╛рдВ рдмрддрд╛рдпрд╛ рдЧрдпрд╛ рд╣реИ рдХрд┐ рдореИрдВрдиреЗ рдЗрд╕реЗ рдХреИрд╕реЗ рдареАрдХ рдХрд┐рдпрд╛ред рдореЗрд░реЗ рдкрд╛рд╕ CUDA 9.1 рдФрд░ CUDA 9.0 рджреЛрдиреЛрдВ рд╕реНрдерд╛рдкрд┐рдд рдереЗред рджреВрд╕рд░реЛрдВ рдХреА рддрд░рд╣, рдореБрдЭреЗ CUDA (Geforce рдЕрдиреБрднрд╡ рдХрд╛рд░реНрдпрдХреНрд░рдо рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ) рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж рдЕрдкрдиреЗ GPU рдбреНрд░рд╛рдЗрд╡рд░реЛрдВ рдХреЛ рдлрд┐рд░ рд╕реЗ рдЕрдкрдЧреНрд░реЗрдб рдХрд░рдирд╛ рдкрдбрд╝рд╛ред рдХреЗрд░рд╕ рдХрд╛ рдмреИрдХрдПрдВрдб TensorFlow рдЖрдЬ рдХреА рддрд╛рд░реАрдЦ рдХреЗ рдЕрдиреБрд╕рд╛рд░ CUDA 9.0 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рд╣реИ, рдЗрд╕рд▓рд┐рдП рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░реЗрдВ рдХрд┐ рдЖрдкрдиреЗ рдЗрд╕реЗ рдЗрдВрд╕реНрдЯреЙрд▓ рдХрд░ рд▓рд┐рдпрд╛ рд╣реИред рдлрд┐рд░, https://developer.nvidia.com/rdp/cudnn-download рд╕реЗ cuDNN 7.0.5 (рдирд╡реАрдирддрдо 7.1 рд╕рдВрд╕реНрдХрд░рдг рдирд╣реАрдВ) рдбрд╛рдЙрдирд▓реЛрдб

рдЗрд╕ рд╕рд╛рд░реА рдорджрдж рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж рдФрд░ рдЬрдм рдореИрдВ рдЕрдкрдиреЗ cuCNN рдХреЛ cnDNN-9.1 рд╕реЗ cnDNN-9.0 рдореЗрдВ рдмрджрд▓рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░рддрд╛ рд╣реВрдВ рдФрд░ рдпрд╣ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред
рдореЗрд░рд╛ рд╡рд╛рддрд╛рд╡рд░рдг Centos7 + CUDA 9.0 + Tensorflow 1.6 . рд╣реИ

Python3.5, ubuntu 16.04, tf1.5 . рдкрд░ рд╕рдорд╛рди рддреНрд░реБрдЯрд┐
GPU рдбреНрд░рд╛рдЗрд╡рд░ рдХреЛ 390.42 рдХреЗ рд╕рдВрд╕реНрдХрд░рдг рдореЗрдВ рдЕрдкрдбреЗрдЯ рдХрд░рдиреЗ рд╕реЗ рдореЗрд░реЗ рд▓рд┐рдП рдпрд╣ рд╕рдорд╕реНрдпрд╛ рд╣рд▓ рд╣реЛ рдЧрдИред

рд╣рд╛рдп рджреЛрд╕реНрддреЛрдВ,

рдореБрдЭреЗ рдмрд╕ рдпрд╣реА рд╕рдорд╕реНрдпрд╛ рд╣реИ
"E tensorflow/stream_executor/cuda/cuda_dnn.cc:385] cudnn рд╣реИрдВрдбрд▓ рдирд╣реАрдВ рдмрдирд╛ рд╕рдХрд╛: CUDNN_STATUS_INTERNAL_ERRORE tensorflow/stream_executor/cuda/cuda_dnn.cc:352] cudnn рд╣реИрдВрдбрд▓ рдХреЛ рдирд╖реНрдЯ рдирд╣реАрдВ рдХрд░ рд╕рдХрд╛: CUDNN_STATUS_BAD_PARAMF tensorflow/core/kernels/conv_ops.cc:605] рдЬрд╛рдБрдЪ рд╡рд┐рдлрд▓: рд╕реНрдЯреНрд░реАрдо-> рдкреИрд░реЗрдВрдЯ ()-> GetConvolveAlgorithms(&algorithms) "

рдФрд░ рдЗрд╕рдХреЗ рджреНрд╡рд╛рд░рд╛ рд╣рд▓ рдХрд┐рдпрд╛ рдЧрдпрд╛:
1- NVIDIA Geforce920M рдХреЗ рдбреНрд░рд╛рдЗрд╡рд░ рдХреЛ рдЕрдкрдбреЗрдЯ рдХрд░рдирд╛
2- tf рд╕рддреНрд░ рдХреЛ рдЗрд╕ рдкреНрд░рдХрд╛рд░ рдареАрдХ рд╕реЗ рд╕реЗрдЯ рдХрд░рдирд╛:
рдХреЙрдиреНрдлрд┐рдЧ = tf.ConfigProto ()
config.gpu_options.allow_growth = рд╕рд╣реА
рд╕рддреНрд░ = tf. рд╕рддреНрд░ (рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди = рдХреЙрдиреНрдлрд╝рд┐рдЧ)
3- рдкреАрд╕реА . рдХреЛ рдлрд┐рд░ рд╕реЗ рд╢реБрд░реВ рдХрд░рдирд╛

рдЙрд╕рдХреЗ рдмрд╛рдж рдореБрдЭреЗ рдПрдХ рдФрд░ рд╕рдЯреАрдХ рддреНрд░реБрдЯрд┐ рд╕рдВрджреЗрд╢ рдорд┐рд▓рд╛:
"cuDNN7.1 рдорд┐рд▓рд╛, рд▓реЗрдХрд┐рди cuDNN7.0 рдЕрдкреЗрдХреНрд╖рд┐рдд рд╣реИред рдЕрдкрдЧреНрд░реЗрдб рдХрд░реЗрдВ"

рдФрд░ рдЗрд╕рдХреЗ рджреНрд╡рд╛рд░рд╛ рд╣рд▓ рдХрд┐рдпрд╛ рдЧрдпрд╛:
cuDNN рд╕реЗ рдорд┐рд▓рдиреЗ рдХреЗ рд▓рд┐рдП рдмрд╛рдХреА (tf, cuda, ..) рдХреЛ рдЕрдкрдЧреНрд░реЗрдб рдХрд░рдиреЗ рдХреЗ рдмрдЬрд╛рдп, рдореИрдВрдиреЗ рдмрд╛рдХреА рдХреЛ рдкреВрд░рд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП cuDNN7.0 рдХреЛ рдбрд╛рдЙрдирдЧреНрд░реЗрдб рдХрд┐рдпрд╛ред
(cuDNN рдХреЛ 7.1 рд╕реЗ 7.0.4 рддрдХ рдбрд╛рдЙрдирдЧреНрд░реЗрдб рдХрд░рдирд╛) рдФрд░ рдЗрд╕рдиреЗ рдЕрдЪреНрдЫрд╛ рдХрд╛рдо рдХрд┐рдпрд╛ред

рдЬрдм рдореИрдВ Cnn_Mnist.py . рдЪрд▓рд╛ рд░рд╣рд╛ рдерд╛ рддрдм рднреА рдореБрдЭреЗ рдЗрд╕ рддреНрд░реБрдЯрд┐ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝рд╛

рдкрд░реНрдпрд╛рд╡рд░рдг рдЬрд╛рдирдХрд╛рд░реАя╝Ъ

  • Window10 + tensorflow_gpuV1.6 + cudav9.0я╝М cudnnv7.0 + Python3.5я╝ИрдПрдирд╛рдХреЛрдВрдбрд╛я╝Й+ GeForce 920MX
| NVIDIA-SMI 385.54                 Driver Version: 385.54                    |
|-------------------------------+----------------------+----------------------+
| GPU  Name            TCC/WDDM | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce 920MX      WDDM  | 00000000:01:00.0 Off |                  N/A |
| N/A   37C    P0    N/A /  N/A |     84MiB /  2048MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0     11988      C   ...naconda3\envs\tensorflow_GPU\python.exe N/A      |
+-----------------------------------------------------------------------------+

рддреНрд░реБрдЯрд┐ рдЬрд╛рдирдХрд╛рд░реА:

2018-03-20 13:38:27.439071: E C:\tf_jenkins\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\stream_executor\cuda\cuda_dnn.cc:385] could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR
2018-03-20 13:38:27.443473: E C:\tf_jenkins\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\stream_executor\cuda\cuda_dnn.cc:352] could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM
2018-03-20 13:38:27.449591: F C:\tf_jenkins\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\kernels\conv_ops.cc:717] Check failed: stream->parent()->GetConvolveAlgorithms( conv_parameters.ShouldIncludeWinogradNonfusedAlgo<T>(), &algorithms)

рд╕рднреА рдХреЗ рд╕рд╣рдпреЛрдЧ рдХреА рдЖрд╢рд╛ рдХрд░рддрд╛ рд╣реВрдБ :D

рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ (рд╡рд┐рдВрдбреЛрдЬ 10), рдпрд╣ рд╕рдорд╕реНрдпрд╛ cuDNN рдХреЗ рдЧрд▓рдд рд╕рдВрд╕реНрдХрд░рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХрд╛рд░рдг рд╣реБрдИ рдереАред рд╣рд╛рд▓рд╛рдВрдХрд┐ рдореИрдВрдиреЗ TensorFlow рдХреЗ рдЖрдзрд┐рдХрд╛рд░рд┐рдХ рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рдмрд╛рд░реАрдХреА рд╕реЗ рдкрд╛рд▓рди рдХрд┐рдпрд╛, рдореИрдВрдиреЗ рдЧрд▓рддреА рд╕реЗ CUDA 9.1 рдХреЗ рд▓рд┐рдП рд╕рдВрд╕реНрдХрд░рдг 7.0.5 рдбрд╛рдЙрдирд▓реЛрдб рдХрд░ рд▓рд┐рдпрд╛ рдерд╛, рдЬрдмрдХрд┐ TF рд╕реНрдкрд╖реНрдЯ рд░реВрдк рд╕реЗ CUDA 9.0 рдХреЗ рд▓рд┐рдП рдХреЙрд▓ рдХрд░рддрд╛ рд╣реИред

рдЬреИрд╕реЗ рд╣реА рдореИрдВрдиреЗ cuDNN рдЧрд▓рддреА рдХреЛ рд╕реБрдзрд╛рд░рд╛, рдореЗрд░реЗ рдХрдиреНрд╡рдиреЗрдЯ рдиреЗ рдХрд╛рдо рдХрд░рдирд╛ рд╢реБрд░реВ рдХрд░ рджрд┐рдпрд╛ ЁЯТп ЁЯСН :)

рд╡рд╣реА рдореБрджреНрджрд╛ tf 1.2, cuda 8.0, cudnn 5.1
рдПрдирд╡реАрдбрд┐рдпрд╛ рдЕрдкрдбреЗрдЯреЗрдб рдбреНрд░рд╛рдЗрд╡рд░

рдЦреИрд░, рдореИрдВ рдПрдирд╡реАрдбрд┐рдпрд╛ рдбреНрд░рд╛рдЗрд╡рд░ рдХреЛ рдХреНрдпреВрдбрд╛ рдХреЗ рдЕрдиреБрд╕рд╛рд░ рдЕрдВрддрд┐рдо рд╕рдВрд╕реНрдХрд░рдг рдореЗрдВ рдЕрдкрдбреЗрдЯ рдХрд░рдиреЗ рдореЗрдВ рдХрд╛рдордпрд╛рдм рд░рд╣рд╛, рдФрд░ рдпрд╣ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред рддреЛ рдЖрдк рдЗрд╕ рддрд░реАрдХреЗ рдХреЛ рдЖрдЬрдорд╛ рд╕рдХрддреЗ рд╣реИрдВред

рдЕрдЪреНрдЫрд╛ рдЕрдЪреНрдЫрд╛ред рдпрд╣ рдареАрдХ рд╕реЗ рдХрд╛рдо рдирд╣реАрдВ рдХрд░ рд╕рдХрддрд╛ред рд╕рдорд╕реНрдпрд╛ рдлрд┐рд░ рд╣реЛрддреА рд╣реИ

рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛: cudnn-9.0-windows10-x64-v7 рдФрд░ tensorflow-gpu==1.7.0

рдЯреНрдпреВрдЯреЛрд░рд┐рдпрд▓\рдЫрд╡рд┐\рдЗрдореЗрдЬрдиреЗрдЯ>рдкрд╛рдпрдерди classify_image.py
рддреНрд░реБрдЯрд┐ рдХреЗ рд╕рд╛рде рд╡рд┐рдлрд▓: рдХреБрдбрди рд╣реИрдВрдбрд▓ рдирд╣реАрдВ рдмрдирд╛ рд╕рдХрд╛: CUDNN_STATUS_INTERNAL_ERROR

рдЙрдкрд░реЛрдХреНрдд ggranum рд╕реЗ рдХреЛрдб рдХреА рддреАрди рдкрдВрдХреНрддрд┐рдпреЛрдВ рдХреЛ рдЬреЛрдбрд╝рдиреЗ рд╕реЗ рд╕рдорд╕реНрдпрд╛ рд╣рд▓ рд╣реЛ рдЬрд╛рддреА рд╣реИ

рдореЗрд░реЗ рд▓рд┐рдП рд╕рдорд╕реНрдпрд╛ рдЧрд▓рдд cudnn lib рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣реА рдереА
рдореИрдВрдиреЗ cuda 9.1 рдХреЗ рд▓рд┐рдП cudnn рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдерд╛ рдЬрдм рдореЗрд░реЗ рдкрд╛рд╕ cuda 9.0 рдерд╛ред рдЗрд╕рд▓рд┐рдП рдореИрдВрдиреЗ cuda 9.0 рдХреЗ рд▓рд┐рдП cudnn рдХреЛ рдлрд┐рд░ рд╕реЗ рдЗрдВрд╕реНрдЯреЙрд▓ рдХрд┐рдпрд╛ рдФрд░ рд╕рдм рдХреБрдЫ рдХрд╛рдо рдХрд░ рдЧрдпрд╛ред

Win10/Anaconda3/tf-1.3/keras-2.1.3 . рдХреЗ рд╕рд╛рде рднреА рдпрд╣реА рд╕рдорд╕реНрдпрд╛ рд╣реИ
рдирд┐рдореНрди рдХреЛрдб рдХреЛ .py рдлрд╝рд╛рдЗрд▓ рдХреА рд╢реБрд░реБрдЖрдд рдореЗрдВ рдЬреЛрдбрд╝реЗрдВ, рдЬреЛ рдореЗрд░реА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рдорд╛рдзрд╛рди рдХрд░рддрд╛ рд╣реИред

from __future__ import print_function, division
import tensorflow as tf
from keras.backend.tensorflow_backend import set_session  
config = tf.ConfigProto()  
config.gpu_options.allow_growth = True  
set_session(tf.Session(config=config)) 

@ рд╕реЗрд░рд╛рдиреНрд╕1
рдпрд╣ рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ :)

рдзрдиреНрдпрд╡рд╛рдж @ zzhang68 ред рдЖрдкрдХрд╛ рд╕рдорд╛рдзрд╛рди рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рдХрд┐рдпрд╛ред

рдлрд╝рд╛рдЗрд▓ рдХреА рд╢реБрд░реБрдЖрдд рдореЗрдВ рдЗрд╕реЗ рдЬреЛрдбрд╝рдиреЗ рд╕реЗ рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рд╣реБрдЖ:

рдХреЙрдиреНрдлрд┐рдЧ = tf.ConfigProto ()
config.gpu_options.allow_growth = рд╕рд╣реА
рд╕рддреНрд░ = tf. рд╕рддреНрд░ (рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди = рдХреЙрдиреНрдлрд╝рд┐рдЧ)

GTX 1070. рдХреЛ рдпрд╣ рдЗрд╢реНрдпреВ рдорд┐рд▓ рд░рд╣рд╛ рдерд╛ред рдореЗрд░реЗ рдбреНрд░рд╛рдЗрд╡рд░ рдХреЛ рдЖрдЦрд┐рд░реА рдмрд╛рд░ 2017 рдореЗрдВ рдЕрдкрдбреЗрдЯ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред рдЗрд╕реЗ рдирд╡реАрдирддрдо рдбреНрд░рд╛рдЗрд╡рд░ (рдордИ 2018) рдореЗрдВ рдЕрдкрдбреЗрдЯ рдХрд┐рдпрд╛ рдЧрдпрд╛, рдореЗрд░реЗ рдХрдВрдкреНрдпреВрдЯрд░ рдХреЛ рд░реАрд╕реЗрдЯ рдХрд░ рджрд┐рдпрд╛ рдФрд░ рд╕рдорд╕реНрдпрд╛ рдХреЛ рд░реЛрдХрдирд╛ рдмрдВрдж рдХрд░ рджрд┐рдпрд╛ред рдЙрдореНрдореАрдж рд╣реИ рдпреЗ рдорджрдж рдХрд░реЗрдЧрд╛

рдореЗрд░реЗ рд▓рд┐рдП рднреА @ zzhang68 рд╕рдорд╛рдзрд╛рди рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред
Ubuntu16.04, tensorflow1.7, nvidia1080, cuda9.0, cudnn7.05.
рдбреНрд░рд╛рдЗрд╡рд░ рдХреЛ 390.59 рдкрд░ рдЕрдкрдбреЗрдЯ рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж, рд╕рдорд╕реНрдпрд╛ рдЧрд╛рдпрдм рд╣реЛ рдЧрдИред

tensorflow cpu рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ win10 рдХреЗ рд▓рд┐рдП рдПрдХ рдЕрдиреНрдп рд╡рд┐рдХрд▓реНрдк...рдХреЛрд╢рд┐рд╢ рдХрд░реЗрдВ

def run_inference_for_single_image (рдЫрд╡рд┐, рдЧреНрд░рд╛рдл):
рдЧреНрд░рд╛рдл рдХреЗ рд╕рд╛рдеред as_default ():
рдХреЙрдиреНрдлрд┐рдЧ = tf.ConfigProto (
рдбрд┐рд╡рд╛рдЗрд╕_рдХрд╛рдЙрдВрдЯ = {'рдЬреАрдкреАрдпреВ': 0}
)
рд╕рддреНрд░ рдХреЗ рд░реВрдк рдореЗрдВ tf.Session(config=config) рдХреЗ рд╕рд╛рде:

@ lwd1132438569 рдХреНрдпрд╛ рдореИрдВ рдкреВрдЫ рд╕рдХрддрд╛ рд╣реВрдВ рдХрд┐ рдЖрдкрдХрд╛ рдХреМрди рд╕рд╛ "рдирд╡реАрдирддрдо рд╕рдВрд╕реНрдХрд░рдг" рд╣реИ? рдореИрдВ рдЕрдкрдиреЗ рдЙрдмрдВрдЯреВ рдХреЗ рд╕рд╛рде рднреА рдЗрд╕ рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рддрд╛ рд╣реВрдВ, рдФрд░ рдореЗрд░реЗ рдкрд╛рд╕ рдЕрдЬрдЧрд░ 3.5.2, CUDA 9.0, рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ-рдЬреАрдкреАрдпреВ 1.9.0 рд╣реИ, рдбреНрд░рд╛рдЗрд╡рд░ рдЕрднреА 390.48 рд╣реИред
рдореИрдВ рдХреЛрд╢рд┐рд╢ рдХрд░рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реВрдВ, рд▓реЗрдХрд┐рди рдореБрдЭреЗ рдбрд░ рд╣реИ рдХрд┐ рдЯреЗрдВрд╕рд░рдлреНрд▓реЛ рдЕрдм 'рдирд╡реАрдирддрдо' рд╕рдВрд╕реНрдХрд░рдг рдХрд╛ рд╕рдорд░реНрдерди рдирд╣реАрдВ рдХрд░реЗрдЧрд╛ ....
рдзрдиреНрдпрд╡рд╛рдж1

@vburca рдмрд╣реБрдд рдмрд╣реБрдд рдзрдиреНрдпрд╡рд╛рджред рдореБрдЭреЗ рдирд╣реАрдВ рдкрддрд╛ рдерд╛ рдХрд┐ рдПрдХ рдФрд░ рдЬреНрдпреВрдкрд┐рдЯрд░ рдиреЛрдЯрдмреБрдХ рд╣реЛрдиреЗ рд╕реЗ GPU рдореЗрдореЛрд░реА рдХрд╛ рдЙрдкрдпреЛрдЧ рд╣реЛрдЧрд╛ред рдмрд╣реБрдд - рдмрд╣реБрдд рдзрдиреНрдпрд╡рд╛рдж!!!

рдореБрдЭреЗ рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝рд╛ред рдореИрдВ рдЕрдкрдиреЗ рдорд╛рдорд▓реЗ рдореЗрдВ рдореИрдВрдиреЗ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдХреЗ рд╕рдВрд╕реНрдХрд░рдг рдХреЛ рдбрд╛рдЙрдирдЧреНрд░реЗрдб рдХрд┐рдпрд╛ рдФрд░ рдпрд╣ рдореЗрд░реЗ рдЖрд╡реЗрджрди рдХреЗ рд▓рд┐рдП рдХрд╛рдо рдХрд┐рдпрд╛ред

рдореБрдЭреЗ рд╡рд╣реА рд╕рдорд╕реНрдпрд╛ рдорд┐рд▓реАред рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ, рд╡рд╣ рдХрд╛рд░рдг рд╕рд┐рд╕реНрдЯрдо рдореЗрдореЛрд░реА рдХреА рдХрдореА рдереАред рдЬрдм рдореИрдВрдиреЗ рдЕрдиреНрдп рдРрдк рдЪрд▓рд╛рдирд╛ рд╕рдорд╛рдкреНрдд рдХрд┐рдпрд╛, рддреЛ рд╡рд╣ рд╕рдорд╕реНрдпрд╛ рджреВрд░ рд╣реЛ рдЧрдИ рдереАред

2018-09-03 22:50:26.576765: E tensorflow/stream_executor/cuda/cuda_dnn.cc:352] Could not create cudnn handle: CUDNN_STATUS_NOT_INITIALIZED
2018-09-03 22:50:26.576831: E tensorflow/stream_executor/cuda/cuda_dnn.cc:360] Possibly insufficient driver version: 390.77.0
[1]    8515 segmentation fault (core dumped)  python3 training.py

рдЬреАрдЯреАрдПрдХреНрд╕1070
CUDA9.0
CUDA9.0 . рдХреЗ рд▓рд┐рдП CUDNN7.1
рдЯреЗрдВрд╕рд░рдлреНрд▓реЛ 1.10.1
рдмрд┐рдирд╛ рдХрд┐рд╕реА рд╕рдорд╕реНрдпрд╛ рдХреЗ рд╣реИрд▓реЛ рд╡рд░реНрд▓реНрдб рдХреА рддрд░рд╣ рдПрдХ рд╕рд╛рдзрд╛рд░рдг рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдЪрд▓рд╛рдирд╛ред
рдРрд╕рд╛ рдХреНрдпреЛрдВ рд╣реЛрддрд╛ рд╣реИ рдХрд╣реАрдВ рдкрддрд╛ рдирд╣реАрдВ..................

рдирд┐рд╢реНрдЪрд┐рдд рд░реВрдк рд╕реЗ cuda рд╕рдВрдмрдВрдзрд┐рдд рд╕реНрдореГрддрд┐ рд╕рдорд╕реНрдпрд╛, рдЕрдиреНрдп рд╕рднреА cuda рд╕рдВрдмрдВрдзрд┐рдд рдкреНрд░рдХреНрд░рд┐рдпрд╛рдУрдВ рдХреЛ рдорд╛рд░реЗрдВ рдФрд░ рдЕрдкрдиреЗ рдореЙрдбрд▓ рдХреЛ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд/рдкрд░реАрдХреНрд╖рдг рдХрд░реЗрдВ, рдЬрд┐рд╕рд╕реЗ рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рдорд╛рдзрд╛рди рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдП

@ drproy2k рд╕рдорд╛рдзрд╛рди рдореЗрд░реЗ рд▓рд┐рдП рднреА рдкреНрд░рднрд╛рд╡реА рд▓рдЧрддрд╛ рд╣реИред рд╕рдорд╕реНрдпрд╛ рдпрд╣ рдереА рдХрд┐ рдореИрдВ рдХреЗрд░рд╕ рдХреЗ рд╕рд╛рде рдПрдХ рдФрд░ рдЬреНрдпреВрдкрд┐рдЯрд░ рдиреЛрдЯрдмреБрдХ рдЙрджрд╛рд╣рд░рдг рдЪрд▓рд╛ рд░рд╣рд╛ рдерд╛, рдФрд░ рдореИрдВ рдкрд┐рдЪрд░реНрдо рдореЗрдВ рдХреЗрд░рд╕ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдЪрд▓рд╛рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░ рд░рд╣рд╛ рдерд╛ред рддреЛ рдмрд╕ рдЬреНрдпреВрдкрд┐рдЯрд░ рдиреЛрдЯрдмреБрдХ рдХреЛ рдмрдВрдж рдХрд░рдиреЗ рдФрд░ рдЗрд╕ рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдХреЛ рд╕рдорд╛рдкреНрдд рдХрд░рдиреЗ рд╕реЗ рдпрд╣ рд╕рдорд╕реНрдпрд╛ рд╣рд▓ рд╣реЛ рдЧрдИред

[рд╣рд▓] рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ, рдореИрдВрдиреЗ CUDA v9.2 рдФрд░ рд╕рдВрдмрдВрдзрд┐рдд cuDNN рд╕реНрдерд╛рдкрд┐рдд рдХрд┐рдпрд╛ рдерд╛, рд▓реЗрдХрд┐рди CUDA v9.0 рдХреЗ рд▓рд┐рдП рд╡рд┐рд╢рд┐рд╖реНрдЯ cuDNN рдХреЛ рд╕рд╣реА рдврдВрдЧ рд╕реЗ рд╕реНрдерд╛рдкрд┐рдд рдирд╣реАрдВ рдХрд┐рдпрд╛ рдерд╛, рдЬрд┐рд╕рдХреЗ рд▓рд┐рдП рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрддреА рд╣реИред

рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░реЗрдВ рдХрд┐ рдЖрдк рдпрд╣рд╛рдВ рд╕реЗ cuDNN рдХрд╛ рд╕рд╣реА рд╕рдВрд╕реНрдХрд░рдг рдбрд╛рдЙрдирд▓реЛрдб рдХрд░рддреЗ рд╣реИрдВ: https://developer.nvidia.com/rdp/cudnn-archive

рдФрд░ рдпрд╣рд╛рдБ рд╕реЗ рдирд╣реАрдВ рдПрдХ: https://developer.nvidia.com/cudnn

рдЧреЛрд▓реНрдбрди рдЯреНрд░рд┐рдХ, рд╕рдм рдХреБрдЫ рдкреБрдирд░рд╛рд░рдВрдн рдХрд░реЗрдВ, рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рдХрд┐рдпрд╛ред

рдкреБрдирд░рд╛рд░рдВрдн рдиреЗ рдореЗрд░реЗ рд▓рд┐рдП рднреА рдЪрд╛рд▓ рдЪрд▓реА ЁЯСН
(рд▓реЗрдХрд┐рди рдПрдХ рд╕реНрдкрд╖реНрдЯреАрдХрд░рдг рдРрд╕рд╛ рдХреНрдпреЛрдВ рд╣реЛрддрд╛ рд╣реИ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдЕрдЪреНрдЫрд╛ рд╣реЛрдЧрд╛)

рд╕реАрдпреВрдбреАрдПрдирдПрди

рдореИрдВ рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░ рд░рд╣рд╛ рдерд╛ред рдХрдирд╡рд▓реНрд╢рди рд▓реЗрдпрд░ рд╡рд╛рд▓реЗ рдореЙрдбрд▓ рдХрд╛рдо рдирд╣реАрдВ рдХрд░реЗрдВрдЧреЗред
рдореИрдВрдиреЗ CUDA 9.0 рдХреЗ рд▓рд┐рдП cuDNN рд╕рдВрд╕реНрдХрд░рдг 7.0 рдбрд╛рдЙрдирд▓реЛрдб рдХрд┐рдпрд╛ред cudnn64_7.dll рдлрд╝рд╛рдЗрд▓ рдХреЛ рдмрджрд▓рдиреЗ рдХреЗ рдмрд╛рдж, рдореИрдВ рдмрд┐рдирд╛ рдХрд┐рд╕реА рдкрд░реЗрд╢рд╛рдиреА рдХреЗ convnets рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВред

рдбреАрдПрд▓рдПрд▓ рдХрд╛ рд╕рдВрд╕реНрдХрд░рдг рд╕рдорд╕реНрдпрд╛рдПрдВ рдкреИрджрд╛ рдХрд░ рд░рд╣рд╛ рд╣реИ => 6.14.11.9020
DLL рдХрд╛ рд╕рдВрд╕реНрдХрд░рдг рдЬрд┐рд╕рдиреЗ рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рдорд╛рдзрд╛рди рдХрд┐рдпрд╛ => 6.14.11.9000
Tensorflow GPU рд╕рдВрд╕реНрдХрд░рдг => 1.11.00
CUDA рд╕рдВрд╕реНрдХрд░рдг => 9.0
рдкрд╛рдпрдерди рд╕рдВрд╕реНрдХрд░рдг => 3.5
рдУрдПрд╕ => рд╡рд┐рдВрдбреЛрдЬ 10
рдЕрдиреНрдп рдЪрд░рдг => PATH рдЪрд░ рдореЗрдВ рдЬреЛрдбрд╝рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ BAT рдлрд╝рд╛рдЗрд▓ рдмрдирд╛рдПрдБ рдФрд░ рдлрд┐рд░ /k рд╡рд┐рдХрд▓реНрдк рдХреЗ рд╕рд╛рде CMD.EXE рд▓реЙрдиреНрдЪ рдХрд░реЗрдВ
рд╕рднреА рдХреЛ рдзрдиреНрдпрд╡рд╛рджред

рдореИрдВ GPU рдХреЗ рдЙрдкрдпреЛрдЧ рдХреЛ рд╕реАрдорд┐рдд рдХрд░рдХреЗ рдХрд╛рдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдкреНрд░реЛрдЧреНрд░рд╛рдо рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдерд╛ред рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ рдЙрдмрдВрдЯреВ 16.04 рдкрд░ 3 рдЬреАрдмреА рдЬреАрдЯреАрдПрдХреНрд╕ 1060 рдХреЗ рд╕рд╛рде, рдЕрдЧрд░ рдореИрдВ gpu рд╡рд┐рдХрд▓реНрдк per_process_gpu_memory_fraction рдХреЛ .7 рдкрд░ рд╕реЗрдЯ рдХрд░рддрд╛ рд╣реВрдВ рддреЛ рдпрд╣ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред рдХреБрдЫ рднреА рдЕрдзрд┐рдХ, рдореБрдЭреЗ рдпреЗ рддреНрд░реБрдЯрд┐рдпрд╛рдВ рдорд┐рд▓рддреА рд╣реИрдВ

E tensorflow/stream_executor/cuda/cuda_dnn.cc:397] cudnn рд╣реИрдВрдбрд▓ рдирд╣реАрдВ рдмрдирд╛ рд╕рдХрд╛: CUDNN_STATUS_INTERNAL_ERROR
E tensorflow/stream_executor/cuda/cuda_dnn.cc:364] cudnn рд╣реИрдВрдбрд▓ рдХреЛ рдирд╖реНрдЯ рдирд╣реАрдВ рдХрд░ рд╕рдХрд╛: CUDNN_STATUS_BAD_PARAM
F tensorflow/core/kernels/conv_ops.cc:605] рдЬрд╛рдБрдЪ рд╡рд┐рдлрд▓: рд╕реНрдЯреНрд░реАрдо-> рдкреИрд░реЗрдВрдЯ () -> GetConvolveAlgorithms(&algorithms)

рдпрд╣ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рджреНрд╡рд╛рд░рд╛ рдЦрд░рд╛рдм рддреНрд░реБрдЯрд┐ рд░рд┐рдкреЛрд░реНрдЯрд┐рдВрдЧ рдХрд╛ рдорд╛рдорд▓рд╛ рд╣реЛ рд╕рдХрддрд╛ рд╣реИред рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдЕрд╕рдВрдмрдВрдзрд┐рдд рд▓рдЧрддрд╛ рд╣реИред рд╢рд╛рдпрдж рдпрд╣ рдЗрд╕реЗ рдмреЗрд╣рддрд░ рддрд░реАрдХреЗ рд╕реЗ рд╣рд▓ рдХрд░рдиреЗ рдХрд╛ рдПрдХ рд╕реБрд░рд╛рдЧ рд╣реИ?

рдмрдврд╝рд┐рдпрд╛, рдЬрдм рдореИрдВ gpu_memory_fraction рдХреЛ 0.8 рд╕реЗ рдШрдЯрд╛рдХрд░ 0.7 рдХрд░ рджреЗрддрд╛ рд╣реВрдВ, рддреЛ рдпрд╣ рдХрд╛рдо рдХрд░рдирд╛ рд╢реБрд░реВ рдХрд░ рджреЗрддрд╛ рд╣реИ!

рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ-рдЬреАрдкреАрдпреВ рдХреЛ рдЕрдкрдЧреНрд░реЗрдб рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж рдореБрдЭреЗ рдЗрд╕ рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝рд╛ред рдЗрд╕рдиреЗ CUDA рдФрд░ cuDNN рджреЛрдиреЛрдВ рд╕рдВрд╕реНрдХрд░рдгреЛрдВ рдХреЗ рдХрд╛рд░рдг рдЕрд╕реНрдерд┐рд░рддрд╛ рдкреИрджрд╛ рдХреАред рд╕рдорд╛рдзрд╛рди рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ-рдЬреАрдкреАрдпреВ 1.6.0 рдкрд░ рд╡рд╛рдкрд╕ рдЖ рд░рд╣рд╛ рдерд╛ред

рдпрд╣ рдореЗрд░реА рд╕рдорд╕реНрдпрд╛рдУрдВ рдХрд╛ рд╕рдорд╛рдзрд╛рди рдерд╛:

https://stackoverflow.com/questions/50622525/who-tensorflow-and-cuda-version-combinations-are-рд╕рдВрдЧрдд

рдЬрдм рднреА рдЖрдк рдЗрд╕ рддрд░рд╣ рдХреЗ рдореБрджреНрджреЛрдВ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рд╢реБрд░реВ рдХрд░рддреЗ рд╣реИрдВ, рддреЛ рдЕрдкрдиреА NVIDIA рдирд┐рд░реНрднрд░рддрд╛ рдХреЛ рдЕрдкрдЧреНрд░реЗрдб рдХрд░рдиреЗ рд╕реЗ рдкрд╣рд▓реЗ, рд╣рдореЗрд╢рд╛ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдХреЗ рд╕рдВрд╕реНрдХрд░рдгреЛрдВ рдХреА рд╕реНрдерд╛рдкрдирд╛ рд░рджреНрдж рдХрд░рдХреЗ рдФрд░ рдЕрдкрдиреЗ CUDA рдирд┐рд░реНрднрд░рддрд╛ рдХреЗ рд╕рд╛рде рд╕рдВрдЧрдд рд╕рдВрд╕реНрдХрд░рдг рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдХреЗ рд╕рдорд╕реНрдпрд╛ рдХреЛ рд╣рд▓ рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░реЗрдВред

рдЪрд░рдг 1: рдЕрдкрдиреЗ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдкреИрдХреЗрдЬ рд╕рдВрд╕реНрдХрд░рдгреЛрдВ рдХреА рдЬрд╛рдБрдЪ рдХрд░реЗрдВред рдпрджрд┐ рдЖрдкрдХреЗ рдкрд╛рд╕ GPU рд╣реИ, рддреЛ рдореИрдВ рдЯрдХрд░рд╛рд╡ рд╕реЗ рдмрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдХреЗ рд╕реАрдкреАрдпреВ-рд╕рдВрд╕реНрдХрд░рдг рдХреЛ рдЕрдирдЗрдВрд╕реНрдЯреЙрд▓ рдХрд░рдиреЗ рдХреА рд╕рд▓рд╛рд╣ рджреЗрддрд╛ рд╣реВрдВред

pip list | grep tensorflow

рдЪрд░рдг 2: рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ-рдЬреАрдкреАрдпреВ рдХреЛ рдЕрдирдЗрдВрд╕реНрдЯреЙрд▓ рдХрд░рдирд╛ред

pip uninstall tensorflow

рдЪрд░рдг 3: рдЕрдкрдиреЗ CUDA рдФрд░ cuDNN рд╕рдВрд╕реНрдХрд░рдгреЛрдВ рдХреА рдЬрд╛рдБрдЪ рдХрд░реЗрдВред рдЖрдкрдХреЛ рдЗрди рд░рд╛рд╕реНрддреЛрдВ рдХреЛ рд╕рдорд╛рдпреЛрдЬрд┐рдд рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛ рд╕рдХрддреА рд╣реИред

-- рдХреВрдбрд╛
cat /usr/local/cuda/version.txt
рдпрджрд┐ рдпрд╣ рд╡рд┐рдлрд▓ рд╣реЛ рдЬрд╛рддрд╛ рд╣реИ, рддреЛ рдЕрдкрдиреА рдХреНрдпреВрдбрд╛ рд╕рдВрд╕реНрдХрд░рдг рдЯреЗрдХреНрд╕реНрдЯ рдлрд╝рд╛рдЗрд▓ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдЦреЛрдЬреЗрдВ:
sudo find / -name version.txt

-- рд╕реАрдпреВрдбреАрдПрдирдПрди
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
рдпрджрд┐ рдпрд╣ рд╡рд┐рдлрд▓ рд╣реЛ рдЬрд╛рддрд╛ рд╣реИ, рддреЛ рдЕрдкрдиреА рдХреНрдпреВрдбрд╛ рд╕рдВрд╕реНрдХрд░рдг рдЯреЗрдХреНрд╕реНрдЯ рдлрд╝рд╛рдЗрд▓ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдЦреЛрдЬреЗрдВ:
sudo find / -name cudnn.h

рдЪрд░рдг 4: рдЬрд╛рдВрдЪреЗрдВ рдХрд┐ рдХреНрдпрд╛ рдЖрдкрдХреЗ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ-рдЬреАрдкреАрдпреВ, рдХреНрдпреВрдбрд╛ рдФрд░ рдХреБрдбрди рд╕рдВрд╕реНрдХрд░рдг рдЗрд╕ рддрд╛рд▓рд┐рдХрд╛ рд╕реЗ рдореЗрд▓ рдЦрд╛рддреЗ рд╣реИрдВред
image

рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ, рдореБрдЭреЗ рдЕрдиреНрдп рдЖрд╡рд╢реНрдпрдХрддрд╛рдУрдВ рд╕реЗ рдореЗрд▓ рдЦрд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ-рдЬреАрдкреАрдпреВ 1.6.0 рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рдереАред

рдЗрд╕рд▓рд┐рдП рдореИрдВрдиреЗ рдЗрд╕ рд╕рдВрд╕реНрдХрд░рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рд╕реНрдерд╛рдкрд┐рдд рдХрд┐рдпрд╛:
pip install tensorflow-gpu==1.6.0
рдпреЗ рд╡рд┐рдирд┐рд░реНрджреЗрд╢ рд╣реИрдВ рдЬреЛ рдХрд╛рдо рдХрд░рддреЗ рд╣реИрдВ!

рдУрдПрд╕: рдЙрдмрдВрдЯреВ 16.04
CUDA рд╕рдВрд╕реНрдХрд░рдг: 9.0, V9.0.176
рд╕реАрдпреВрдбреАрдПрдирдПрди рд╕рдВрд╕реНрдХрд░рдг: 7.0
Tensorflow-gpu рд╕рдВрд╕реНрдХрд░рдг: 1.6.0
рдкрд╛рдпрдерди рд╕рдВрд╕реНрдХрд░рдг: 3.5.0

рдЖрдкрдХреЛ рдХрд╛рдордпрд╛рдмреА рдорд┐рд▓реЗ!

рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ, рдЬрдм рдореИрдВрдиреЗ рд╡реАрдПрд╕ рдХреЛрдб рдореЗрдВ рдХреЛрдб рдХрд╛ рдПрдХ рдФрд░ рдЯреБрдХрдбрд╝рд╛ рдЪрд▓рд╛рдирд╛ рд╢реБрд░реВ рдХрд┐рдпрд╛, рддреЛ рдореИрдВ рдЬреНрдпреВрдкрд┐рдЯрд░ рдиреЛрдЯрдмреБрдХ рдХреЛ рдмрдВрдж рдХрд░рдирд╛ рднреВрд▓ рдЧрдпрд╛, рдХреНрд▓реЛрдЬ рдЬреНрдпреВрдкрд┐рдЯрд░ рдиреЛрдЯрдмреБрдХ рдиреЗ рд╕рдорд╕реНрдпрд╛ рдХреЛ рдареАрдХ рдХрд░ рджрд┐рдпрд╛ред

рдореБрдЭреЗ рдЗрд╕реА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝рд╛ред
рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ рдореИрдВ рдЕрдкрдиреЗ рдиреЗрдЯрд╡рд░реНрдХ рдХреЛ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд░рддреЗ рд╕рдордп рдЬреБрдкрд┐рдЯрд░ рдиреЛрдЯрдмреБрдХ рдЪрд▓рд╛ рд░рд╣рд╛ рдерд╛ред
рдЬреБрдкрд┐рдЯрд░ рдиреЛрдЯрдмреБрдХ рдХреЛ рдмрдВрдж рдХрд░рдиреЗ рд╕реЗ рдореЗрд░реА рд╕рдорд╕реНрдпрд╛ рдареАрдХ рд╣реЛ рдЧрдИред

(рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдЗрд╕реЗ рдореЗрд░реЗ GPU рдХреА рдмрд╣реБрдд рдЕрдзрд┐рдХ рдорд╛рдВрдЧреЛрдВ рдХреЗ рд╕рд╛рде рдХреБрдЫ рдХрд░рдирд╛ рдкрдбрд╝ рд╕рдХрддрд╛ рд╣реИ)

рдЖрд╢рд╛ рд╣реИ рдХрд┐ рдЗрд╕рд╕реЗ рдорджрдж рдорд┐рд▓реА!

рд╣рд╛рдп, рджреЛрд╕реНрддреЛрдВ, рдореБрдЭреЗ рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝рд╛ред рдореИрдВ win10 tensorflow-gpu1.8.0 cuda 9.0 NVIDA gtx1050Ti рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рд╣реВрдВ, рдЬрдм рдореИрдВ cudann рдХреЗ рд╕рдВрд╕реНрдХрд░рдг рдХреЛ 7.0 рд╕реЗ 7.1 рдореЗрдВ рдмрджрд▓рддрд╛ рд╣реВрдВ, рддреЛ рд╕рдорд╕реНрдпрд╛ рд╣рд▓ рд╣реЛ рдЬрд╛рддреА рд╣реИ

рдореБрдЭреЗ рдЖрдЬ рднреА рдЗрд╕реА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝рд╛ (gtx1080, cuda 9.2, tfversion = 1.12.0)ред рддреЛ рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ, рдореИрдВ рдЬреБрдкрд┐рдЯрд░ рдиреЛрдЯрдмреБрдХ рдЪрд▓рд╛ рд░рд╣рд╛ рдерд╛, рдФрд░ рдлрд┐рд░ рдореИрдВрдиреЗ рдЕрдкрдиреА рджреВрд╕рд░реА рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдЪрд▓рд╛рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХреА, рд╡рд╣ рддрдм рд╣реБрдЖ рдЬрдм рддреНрд░реБрдЯрд┐ рдлреЗрдВрдХ рджреА рдЧрдИред рдХреНрдпрд╛ рд╣рд▓ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ, рдЬреИрд╕реЗ @RoytenBerge рдиреЗ рдХрд╣рд╛,

рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдХреА рд╢реБрд░реБрдЖрдд рдореЗрдВ рдХреЛрдб рдХреА рдЗрди рдкрдВрдХреНрддрд┐рдпреЛрдВ рдХреЛ рдЬреЛрдбрд╝рддреЗ рд╕рдордп рдЗрд╕рдиреЗ рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рдХрд┐рдпрд╛ @Codersadis

рдирд┐рдореНрди рдХреЛрдб рдХреЛ .py рдлрд╝рд╛рдЗрд▓ рдХреА рд╢реБрд░реБрдЖрдд рдореЗрдВ рдЬреЛрдбрд╝реЗрдВ, рдЬреЛ рдореЗрд░реА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рдорд╛рдзрд╛рди рдХрд░рддрд╛ рд╣реИред

__рднрд╡рд┐рд╖реНрдп__ рд╕реЗ рдкреНрд░рд┐рдВрдЯ_рдлрдВрдХреНрд╢рди, рдбрд┐рд╡реАрдЬрди рдЖрдпрд╛рдд рдХрд░реЗрдВ
tf . рдХреЗ рд░реВрдк рдореЗрдВ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдЖрдпрд╛рдд рдХрд░реЗрдВ
keras.backend.tensorflow_backend рд╕реЗ рдЖрдпрд╛рдд set_session
рдХреЙрдиреНрдлрд┐рдЧ = tf.ConfigProto ()
config.gpu_options.allow_growth = рд╕рд╣реА
set_session(tf.Session(config=config))

@ drproy2k рдзрдиреНрдпрд╡рд╛рдж, рдЗрд╕рдиреЗ рдореЗрд░реЗ рд▓рд┐рдП рднреА рдХрд╛рдо рдХрд┐рдпрд╛ред рдЬрдм рд╕реНрдкрд╛рдИрдбрд░ рдЪрд▓ рд░рд╣рд╛ рдерд╛ рддрдм рдореИрдВ рдПрдирд╛рдХреЛрдВрдбрд╛ рдкреНрд░рд╛рдВрдкреНрдЯ рдЪрд▓рд╛ рд░рд╣рд╛ рдерд╛ред рдореИрдВрдиреЗ рд╕реНрдкрд╛рдЗрдбрд░ рдХреЛ рдмрдВрдж рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж, рдЗрд╕рдиреЗ рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдХрд╛рдо рдХрд┐рдпрд╛!

рдпрд╣ рддреНрд░реБрдЯрд┐ RAM рдореЗрдореЛрд░реА рд╕рдорд╕реНрдпрд╛ рдХреЗ рдХрд╛рд░рдг рд╣реИред рд╕реБрдЭрд╛рд╡ рд╣реИ рдХрд┐ рдЖрдк 32GB рдпрд╛ 64GB DDR3 рдпрд╛ DDR4 RAM рддрдХ рдмрдврд╝рд╛рдПрдБред
рдЕрдиреБрдорд╛рди рд▓рдЧрд╛рдП рдЬрд╛ рд░рд╣реЗ рдбреЗрдЯрд╛ рдХреА рдорд╛рддреНрд░рд╛/рдЖрдХрд╛рд░ рдХреЛ рднреА рдХрдо рдХрд░реЗрдВред

рдпрд╣ рдЬреАрдкреАрдпреВ рдирд╣реАрдВ рд╣реИред рдореЗрд░реЗ рдкрд╛рд╕ SLI рдореЗрдВ 2 X 1080Ti рдХрд╛рд░реНрдб рд╣реИрдВред

рдореИрдВрдиреЗ рдЗрд╕реЗ рд╣рд▓ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдВрд╕реНрдХрд░рдг рд╕реНрдерд╛рдкрдирд╛ рдорд╛рд░реНрдЧрджрд░реНрд╢рд┐рдХрд╛ рдХрд╛ рдкрд╛рд▓рди рдХрд┐рдпрд╛-
https://www.tensorflow.org/install/source#tested_source_configurationsред рд╕рдВрдЧрдд рдХреЙрдиреНрдлрд┐рдЧрд░реЗрд╢рди:-
рдЯреАрдПрдл 1.12
рдЯреАрдПрдл-рдЬреАрдкреАрдпреВ 1.9
CUDA 8

GeForce GTX 970, CUDNN 7.4.1, CUDA 9.0.176, TF-gpu 1.12.0 рдХреЗ рд╕рд╛рде рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛

рдПрдХ рдХреЛрдВрдбрд╛ рд╡рд╛рддрд╛рд╡рд░рдг рдХреЗ рдЕрдВрджрд░ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдХреЗ рд╕рдореБрджрд╛рдп рд╕рдорд░реНрдерд┐рдд рд╕рдВрд╕реНрдХрд░рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╕рдордп рдореБрдЭреЗ рдЙрд╕реА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝ рд░рд╣рд╛ рдерд╛ (рдпрд╛рдиреА > conda install tensorflow-gpu рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ)

рдкрддрд╛ рдЪрд▓рддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рд╕рдВрд╕реНрдХрд░рдг рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рд╕рднреА рд╕реНрдерд┐рддрд┐рдпреЛрдВ рдореЗрдВ рдЕрдЪреНрдЫрд╛ рдирд╣реАрдВ рд╣реИ (рднрд▓реЗ рд╣реА рдореИрдВ рдЗрд╕реЗ рдЕрдиреНрдп рдорд╢реАрдиреЛрдВ рдкрд░ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рд╣реВрдВ)ред рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдмрд╕реЗ рдЕрдЪреНрдЫрд╛ рд╕рдВрд╕реНрдХрд░рдг рдкрд╛рдЗрдк рдЗрдВрд╕реНрдЯрд╛рд▓ рдХрд░рдиреЗ рдпреЛрдЧреНрдп рд╕рдВрд╕реНрдХрд░рдг рд╣реИ https://www.tensorflow.org/install/pip рдПрдХ conda рд╡рд╛рддрд╛рд╡рд░рдг рдХреЗ рдЕрдВрджрд░ред рдЬрдм рдореИрдВрдиреЗ рдРрд╕рд╛ рдХрд┐рдпрд╛ рддреЛ рд╕рдм рдХреБрдЫ рдХрд╛рдо рдХрд░ рдЧрдпрд╛ред

рдореБрдЭреЗ рдПрд╣рд╕рд╛рд╕ рдирд╣реАрдВ рд╣реБрдЖ рдХрд┐ рдореЗрд░реЗ рдкрд╛рд╕ CUDA 9.0 рдХреЗ рд╕рд╛рде CUDNN рд▓рд┐рдм рдХрд╛ рдХреВрдбрд╛ 10.0 рд╕рдВрд╕реНрдХрд░рдг рд╕реНрдерд╛рдкрд┐рдд рд╣реИ рдЬрд┐рд╕реЗ рдореИрдВрдиреЗ рд╡рд░реНрддрдорд╛рди рдореЗрдВ рд╕реНрдерд╛рдкрд┐рдд рдХрд┐рдпрд╛ рдерд╛ред рдПрдХ рдмрд╛рд░ рдЬрдм рдореИрдВрдиреЗ V10 CUDNN рдХреЛ V9.0 CUDNN рд╕реЗ рдбрд╛рдЙрдирд▓реЛрдб рдФрд░ рдмрджрд▓ рджрд┐рдпрд╛ рддреЛ рд╕рдм рдХреБрдЫ рдареАрдХ рдХрд╛рдо рдХрд░ рдЧрдпрд╛!
рдЪреАрдЬреЛрдВ рдХреЛ рд╕рд╣реА рдврдВрдЧ рд╕реЗ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдореЗрдВ рд╡рд┐рдлрд▓ рд╣реЛрдиреЗ рд╕реЗ рдпрд╣ рдПрдХ рдЕрдирджреЗрдЦреА рдереА, рдФрд░ рдкреАрдЫреЗ рдореБрдбрд╝рдХрд░ рджреЗрдЦрдиреЗ рдкрд░ рдореИрдВ рджреЗрдЦ рд╕рдХрддрд╛ рд╣реВрдВ рдХрд┐ рдХреНрдпреЛрдВ... рдпрджрд┐ рдЖрдкрдиреЗ рдЗрд╕реЗ рдЗрддрдирд╛ рдЖрдЧреЗ рдмрдврд╝рд╛рдпрд╛ рд╣реИ рдФрд░ рдкреНрд░рдпреЛрдЧ рдХрд░рддреЗ-рдХрд░рддреЗ рдердХ рдЧрдП рд╣реИрдВ, рддреЛ рдореИрдВрдиреЗ .com/2019/03/the-ultimate-guide-to-installing.html рдЬреЛ рдЖрдкрдХреЛ рд╢реБрд░реВ рд╕реЗ рдЕрдВрдд рддрдХ рдХрд╛рдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдФрд░ рдЙрд╕рдХреА рд╕рднреА рдирд┐рд░реНрднрд░рддрд╛рдУрдВ рдХреЛ рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдХреА рдкреВрд░реА рдкреНрд░рдХреНрд░рд┐рдпрд╛ рд╕реЗ рдкрд░рд┐рдЪрд┐рдд рдХрд░рд╛рдПрдЧрд╛

@kheffah рдХреЛрдВрдбрд╛ рдХреЗ рднреАрддрд░ рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛ рд╣реИред рдЯреАрдПрдл рдФрд░ рдХреЗрд░рд╕ рдХреЛ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкрд╣рд▓реЗ рд╕реЗ рд╣реА рдкреАрдЖрдИрдкреА рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣реЗ рд╣реИрдВред
GPU GT 840M, рд╕рдВрдЧрдд 5.0, CUDA 9, cuDNN 7.4.2, TF 1.12.0 рдХреА рдЧрдгрдирд╛ рдХрд░реЗрдВред рд╡рд┐рдВрдбреЛрдЬ 8 x64

рдкрд░реАрдХреНрд╖рдг рдХреЛрдб рдареАрдХ рдЪрд▓рддрд╛ рд╣реИ

a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')
b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b')
c = tf.matmul(a, b)

рд╕реНрдкрд╛рдЗрдбрд░ рдореЗрдВ рдпрд╣ рддреНрд░реБрдЯрд┐ рд╣реИред рдкрд╣рд▓реЗ рд╕реЗ рд╣реА рдореЗрдореЛрд░реА 0.7 рдФрд░ рдЧреНрд░реЛрде рдЯреНрд░рд┐рдХ рдЖрдЬрд╝рдорд╛рдПрдВред рдХреЛрдИ рднрд╛рдЧреНрдп рдирд╣реАрдВ

classifier.fit_generator(training_set,
                    steps_per_epoch=32,
                    epochs=25,
                    verbose=1,
                    validation_data=test_set,
                    validation_steps=6.25)
Epoch 1/25
Traceback (most recent call last):

  File "<ipython-input-4-6d704090deaf>", line 11, in <module>
    validation_steps=6.25)

  File "c:\Users\maxi.wu\AppData\Local\conda\conda\envs\tfgpu\lib\site-packages\keras\legacy\interfaces.py", line 91, in wrapper
    return func(*args, **kwargs)

  File "c:\Users\maxi.wu\AppData\Local\conda\conda\envs\tfgpu\lib\site-packages\keras\engine\training.py", line 1418, in fit_generator
    initial_epoch=initial_epoch)

  File "c:\Users\maxi.wu\AppData\Local\conda\conda\envs\tfgpu\lib\site-packages\keras\engine\training_generator.py", line 217, in fit_generator
    class_weight=class_weight)

  File "c:\Users\maxi.wu\AppData\Local\conda\conda\envs\tfgpu\lib\site-packages\keras\engine\training.py", line 1217, in train_on_batch
    outputs = self.train_function(ins)

  File "c:\Users\maxi.wu\AppData\Local\conda\conda\envs\tfgpu\lib\site-packages\keras\backend\tensorflow_backend.py", line 2715, in __call__
    return self._call(inputs)

  File "c:\Users\maxi.wu\AppData\Local\conda\conda\envs\tfgpu\lib\site-packages\keras\backend\tensorflow_backend.py", line 2675, in _call
    fetched = self._callable_fn(*array_vals)

  File "c:\Users\maxi.wu\AppData\Local\conda\conda\envs\tfgpu\lib\site-packages\tensorflow\python\client\session.py", line 1439, in __call__
    run_metadata_ptr)

  File "c:\Users\maxi.wu\AppData\Local\conda\conda\envs\tfgpu\lib\site-packages\tensorflow\python\framework\errors_impl.py", line 528, in __exit__
    c_api.TF_GetCode(self.status.status))

UnknownError: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
     [[{{node conv2d_1/convolution}} = Conv2D[T=DT_FLOAT, _class=["loc:@training/Adam/gradients/conv2d_1/convolution_grad/Conv2DBackpropFilter"], data_format="NCHW", dilations=[1, 1, 1, 1], padding="VALID", strides=[1, 1, 1, 1], use_cudnn_on_gpu=true, _device="/job:localhost/replica:0/task:0/device:GPU:0"](training/Adam/gradients/conv2d_1/convolution_grad/Conv2DBackpropFilter-0-TransposeNHWCToNCHW-LayoutOptimizer, conv2d_1/kernel/read)]]
     [[{{node loss/mul/_91}} = _Recv[client_terminated=false, recv_device="/job:localhost/replica:0/task:0/device:CPU:0", send_device="/job:localhost/replica:0/task:0/device:GPU:0", send_device_incarnation=1, tensor_name="edge_609_loss/mul", tensor_type=DT_FLOAT, _device="/job:localhost/replica:0/task:0/device:CPU:0"]()]]

рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ 1.7 . рдкрд░ рд╕реНрд╡рд┐рдЪ рдХрд░реЗрдВ

рдЧреБрд░реБ, 3 рдЬрдирд╡рд░реА 2019, 19:29 maxi.wu рдкрд░ < рдиреЛрдЯрд┐рдлрд┐рдХреЗрд╢рди @github.com рдиреЗ рд▓рд┐рдЦрд╛:

@kheffah https://github.com/kheffah рдХреЛрдВрдбрд╛ рдХреЗ рднреАрддрд░ рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛ рд╣реИред
рдЯреАрдПрдл рдФрд░ рдХреЗрд░рд╕ рдХреЛ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкрд╣рд▓реЗ рд╕реЗ рд╣реА рдкреАрдЖрдИрдкреА рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣реЗ рд╣реИрдВред
GPU GT 840M, рд╕рдВрдЧрдд 5.0, CUDA 9, cuDNN 7.4.2, TF 1.12.0 рдХреА рдЧрдгрдирд╛ рдХрд░реЗрдВред
рд╡рд┐рдВрдбреЛрдЬ 8 x64

рдкрд░реАрдХреНрд╖рдг рдХреЛрдб рдареАрдХ рдЪрд▓рддрд╛ рд╣реИ

a = tf.constant ([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], рдЖрдХрд╛рд░ = [2, 3], рдирд╛рдо = 'рдП')
b = tf.constant ([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], рдЖрдХрд╛рд░ = [3, 2], рдирд╛рдо = 'рдмреА')
рд╕реА = tf.matmul (рдП, рдмреА)

рд╕реНрдкрд╛рдЗрдбрд░ рдореЗрдВ рдпрд╣ рддреНрд░реБрдЯрд┐ рд╣реИред рдкрд╣рд▓реЗ рд╕реЗ рд╣реА рдореЗрдореЛрд░реА 0.7 рдФрд░ рдЧреНрд░реЛрде рдЯреНрд░рд┐рдХ рдЖрдЬрд╝рдорд╛рдПрдВред
рдХреЛрдИ рднрд╛рдЧреНрдп рдирд╣реАрдВ

classifier.fit_generator(training_set,
steps_per_epoch=32,
рдпреБрдЧ = 25,
рдХреНрд░рд┐рдпрд╛ = 1,
рд╕рддреНрдпрд╛рдкрди_рдбреЗрдЯрд╛ = рдкрд░реАрдХреНрд╖рдг_рд╕реЗрдЯ,
рд╕рддреНрдпрд╛рдкрди_рдЪрд░рдг=6.25)
рдпреБрдЧ 1/25
рдЯреНрд░реЗрд╕рдмреИрдХ (рд╕рдмрд╕реЗ рд╣рд╛рд▓рд┐рдпрд╛ рдХреЙрд▓ рдЕрдВрддрд┐рдо):

рдлрд╝рд╛рдЗрд▓ "", рд▓рд╛рдЗрди 11, рдЗрдВрдЪ
рд╕рддреНрдпрд╛рдкрди_рдЪрд░рдг=6.25)

рдлрд╝рд╛рдЗрд▓ "c:\Users\maxi.wu\AppData\Local\conda\conda\envs\tfgpu\lib\site-packages\keras\legacy\interfaces.py", рдкрдВрдХреНрддрд┐ 91, рдЖрд╡рд░рдг рдореЗрдВ
рд╡рд╛рдкрд╕реА func ( рддрд░реНрдХ, * kwargs)

рдлрд╝рд╛рдЗрд▓ "c:\Users\maxi.wu\AppData\Local\conda\conda\envs\tfgpu\lib\site-packages\keras\engine\training.py", рд▓рд╛рдЗрди 1418, fit_generator рдореЗрдВ
рдкреНрд░рд╛рд░рдВрднрд┐рдХ_рдпреБрдЧ = рдкреНрд░рд╛рд░рдВрднрд┐рдХ_рдпреБрдЧ)

рдлрд╝рд╛рдЗрд▓ "c:\Users\maxi.wu\AppData\Local\conda\conda\envs\tfgpu\lib\site-packages\keras\engine\training_generator.py", рд▓рд╛рдЗрди 217, fit_generator рдореЗрдВ
рдХреНрд▓рд╛рд╕_рд╡реЗрдЯ = рдХреНрд▓рд╛рд╕_рд╡реЗрдЯ)

рдлрд╝рд╛рдЗрд▓ "c:\Users\maxi.wu\AppData\Local\conda\conda\envs\tfgpu\lib\site-packages\keras\engine\training.py", рд▓рд╛рдЗрди 1217, train_on_batch рдореЗрдВ
рдЖрдЙрдЯрдкреБрдЯ = self.train_function (ins)

рдлрд╝рд╛рдЗрд▓ "c:\Users\maxi.wu\AppData\Local\conda\conda\envs\tfgpu\lib\site-packages\keras\backend\tensorflow_backend.py", рд▓рд╛рдЗрди 2715, __call__ рдореЗрдВ
рд╕реНрд╡._рдХреЙрд▓ (рдЗрдирдкреБрдЯ) рд╡рд╛рдкрд╕ рдХрд░реЗрдВ

рдлрд╝рд╛рдЗрд▓ "c:\Users\maxi.wu\AppData\Local\conda\conda\envs\tfgpu\lib\site-packages\keras\backend\tensorflow_backend.py", рд▓рд╛рдЗрди 2675, _call рдореЗрдВ
рдкреНрд░рд╛рдкреНрдд рдХрд┐рдпрд╛ рдЧрдпрд╛ = рд╕реНрд╡рдпрдВред_рдХреЙрд▓ рдХрд░рдиреЗ рдпреЛрдЧреНрдп_рдПрдлрдПрди (* array_vals)

рдлрд╝рд╛рдЗрд▓ "c:\Users\maxi.wu\AppData\Local\conda\conda\envs\tfgpu\lib\site-packages\tensorflow\python\client\session.py", рд▓рд╛рдЗрди 1439, __call__ рдореЗрдВ
run_metadata_ptr)

рдлрд╝рд╛рдЗрд▓ "c:\Users\maxi.wu\AppData\Local\conda\conda\envs\tfgpu\lib\site-packages\tensorflow\python\framework\errors_impl.py", рд▓рд╛рдЗрди 528, __exit__ рдореЗрдВ
c_api.TF_GetCode(self.status.status))

рдЕрдЬреНрдЮрд╛рдд рддреНрд░реБрдЯрд┐: рдХрдирд╡рд▓реНрд╢рди рдПрд▓реНрдЧреЛрд░рд┐рдердо рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдореЗрдВ рд╡рд┐рдлрд▓ред рдпрд╣ рд╢рд╛рдпрдж рдЗрд╕рд▓рд┐рдП рд╣реИ рдХреНрдпреЛрдВрдХрд┐ cuDNN рдкреНрд░рд╛рд░рдВрдн рдХрд░рдиреЗ рдореЗрдВ рд╡рд┐рдлрд▓ рд░рд╣рд╛, рдЗрд╕рд▓рд┐рдП рдпрд╣ рджреЗрдЦрдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░реЗрдВ рдХрд┐ рдХреНрдпрд╛ рдКрдкрд░ рдЪреЗрддрд╛рд╡рдиреА рд▓реЙрдЧ рд╕рдВрджреЗрд╢ рдореБрджреНрд░рд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред
[[{{рдиреЛрдб conv2d_1/convolution}} = Conv2D[T=DT_FLOAT, _class=[" loc:@training/adam/gradients/conv2d_1/convolution_grad/Conv2DBackpropFilter "], data_format="NCHW", dilations=[1, 1 , 1, 1], рдкреИрдбрд┐рдВрдЧ = "VALID", рд╕реНрдЯреНрд░рд╛рдЗрдбреНрд╕ = [1, 1, 1, 1], use_cudnn_on_gpu=true, _device="/ job:localhost/replica :0/ task:0/device : GPU:0 " ](рдкреНрд░рд╢рд┐рдХреНрд╖рдг/рдПрдбрдо/рдЧреНрд░реЗрдбрд┐рдПрдВрдЯреНрд╕/conv2d_1/convolution_grad/Conv2DBackpropFilter-0-TransposeNHWCToNCHW-LayoutOptimizer, conv2d_1/рдХрд░реНрдиреЗрд▓/рд░реАрдб)]]
[[{{рдиреЛрдб рд╣рд╛рдирд┐/рдореВрд▓/_91}} = _Recv[client_terminate=false, recv_device="/ job:localhost/replica :0/ task:0/device : CPU:0 ", send_device="/ job:localhost/ рдкреНрд░рддрд┐рдХреГрддрд┐ :0/ рдХрд╛рд░реНрдп:0/рдбрд┐рд╡рд╛рдЗрд╕ : GPU:0 ", send_device_incarnation=1, tensor_name="edge_609_loss/mul", tensor_type=DT_FLOAT, _device="/ job:localhost/replica :0/ рдХрд╛рд░реНрдп:0/рдбрд┐рд╡рд╛рдЗрд╕ : CPU :0 "]()]]

-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдиреЗ рдЯрд┐рдкреНрдкрдгреА рдХреА рдереАред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/tensorflow/tensorflow/issues/6698#issuecomment-451079405 ,
рдпрд╛ рдереНрд░реЗрдб рдХреЛ рдореНрдпреВрдЯ рдХрд░реЗрдВ
https://github.com/notifications/unsubscribe-auth/ABE215xY0OhbFjA_GhVtEIDl_IB4qQGmks5u_b9NgaJpZM4Lc7S1
.

рдореБрдЭреЗ win10 рд╕рд┐рд╕реНрдЯрдо рдкрд░ рднреА рдпрд╣реА рд╕рдорд╕реНрдпрд╛ рдереАред рд▓реЗрдХрд┐рди рдпрд╣ рд╕реНрдореГрддрд┐ рд╕рдорд╕реНрдпрд╛ рдкрд╛рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рдЕрдиреНрдп рдЪрд▓ рд░рд╣реЗ рдРрдк рдХреЛ рдорд╛рд░реЗрдВ рдЬреЛ рд╡рд┐рд╢рд╛рд▓ рдореЗрдореЛрд░реА рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдХрд╛ рдЙрдкрднреЛрдЧ рдХрд░рддрд╛ рд╣реИ рдФрд░ рдХреЛрд╢рд┐рд╢ рдХрд░рддрд╛ рд╣реИред

рдореБрдЭреЗ рд╡рд┐рдВрдбреЛрдЬрд╝ 10 NVIDIA GEFORCE GTX 1050 рдкрд░ рднреА рдЗрд╕реА рддрд░рд╣ рдХреА рд╕рдорд╕реНрдпрд╛ рдереА рдФрд░ рдЬреИрд╕реЗ рд╣реА рдореИрдВрдиреЗ рдЕрдиреНрдп рд╕рднреА рдЪрд▓ рд░рд╣реЗ рдХрд╛рд░реНрдпреЛрдВ рдХреЛ рдмрдВрдж рдХрд░ рджрд┐рдпрд╛, рдФрд░ рдКрдкрд░ @ xhm1014 рджреНрд╡рд╛рд░рд╛ рдкреБрдирдГ рдкреНрд░рдпрд╛рд╕ рдХрд┐рдпрд╛, рдореЗрд░рд╛ рдХреЛрдб рдмрд╕ рдЙрд╕реА рддрд░рд╣ рдЪрд▓рдиреЗ рд▓рдЧрд╛ред рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдПрдХ рд╕реНрдореГрддрд┐ рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рдореБрджреНрджрд╛ рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдПред

рдирд┐рд╢реНрдЪрд┐рдд рд░реВрдк рд╕реЗ рд╕реНрдореГрддрд┐ рд╕реЗ рд╕рдВрдмрдВрдзрд┐рддред рдЖрдкрдХреЛ рдЕрдкрдиреА рд░реИрдо рдХреЛ 64GB рддрдХ рдЕрдкрдЧреНрд░реЗрдб рдХрд░рдирд╛ рдЪрд╛рд╣рд┐рдПред

рд╢реБрдХреНрд░, 18 рдЬрдирд╡рд░реА, 2019 рдХреЛ рд╢рд╛рдо 5:30 рдмрдЬреЗ рд╕реИрдореБрдЕрд▓ рдиреЗрдбреЗ рдиреЛрдЯрд┐рдлрд┐рдХреЗрд╢рди @github.com рдиреЗ рд▓рд┐рдЦрд╛:

рдореБрдЭреЗ рд╡рд┐рдВрдбреЛрдЬрд╝ 10 NVIDIA GEFORCE GTX 1050 рдФрд░ рдЬреИрд╕реЗ рд╣реА рдПрдХ рд╕рдорд╛рди рд╕рдорд╕реНрдпрд╛ рдереА
рдЬреИрд╕рд╛ рдХрд┐ рдореИрдВрдиреЗ рдЕрдиреНрдп рд╕рднреА рдЪрд▓ рд░рд╣реЗ рдХрд╛рд░реНрдпреЛрдВ рдХреЛ рдмрдВрдж рдХрд░ рджрд┐рдпрд╛, рдФрд░ @ xhm1014 . рджреНрд╡рд╛рд░рд╛ рд╕реБрдЭрд╛рдП рдЧрдП рдЕрдиреБрд╕рд╛рд░ рдкреБрдирдГ рдкреНрд░рдпрд╛рд╕ рдХрд┐рдпрд╛
https://github.com/xhm1014 рдКрдкрд░, рдореЗрд░рд╛ рдХреЛрдб рдмрд╕ рдХреА рддрд░рд╣ рдЪрд▓рдиреЗ рд▓рдЧрд╛
рд╡рд╣ред рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдПрдХ рд╕реНрдореГрддрд┐ рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рдореБрджреНрджрд╛ рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдПред

-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдиреЗ рдЯрд┐рдкреНрдкрдгреА рдХреА рдереАред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/tensorflow/tensorflow/issues/6698#issuecomment-455441208 ,
рдпрд╛ рдереНрд░реЗрдб рдХреЛ рдореНрдпреВрдЯ рдХрд░реЗрдВ
https://github.com/notifications/unsubscribe-auth/ABE217cdDKUuRtdD9jJ_eh2tJWrm2fjeks5vEWnwgaJpZM4Lc7S1
.

рдореЗрд░реЗ рдкрд╛рд╕ рддреНрд░реБрдЯрд┐ рдереА рдФрд░ рдореИрдВрдиреЗ рдЬреБрдкрд┐рдЯрд░ рдХреЗ рдЕрдкрдиреЗ рдХрдИ рдЙрджрд╛рд╣рд░рдгреЛрдВ рдХреЛ рдмрдВрдж рдХрд░рдХреЗ рдФрд░ рдЕрдиреНрдп рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рдХреЛ рдмрдВрдж рдХрд░рдХреЗ рдЗрд╕реЗ 'рдареАрдХ' рдХрд░ рджрд┐рдпрд╛ред рдореИрдВ рд╕рд╛рдорд╛рдиреНрдп рд░реВрдк рд╕реЗ tensorflow рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдирдпрд╛ рд╣реВрдБ, рдЗрд╕рд▓рд┐рдП рдпрд╣ рд╕рдВрднрд╡ рд╣реИ рдХрд┐ рдпрд╣ рдХреЗрд╡рд▓ рдореЗрд░реА рд╕рдорд╕реНрдпрд╛ рдХреЛ рдареАрдХ рдХрд░ рджреЗред

E tensorflow/stream_executor/cuda/cuda_dnn.cc:353] cudnn рд╣реИрдВрдбрд▓ рдирд╣реАрдВ рдмрдирд╛ рд╕рдХрд╛: CUDNN_STATUS_INTERNAL_ERROR

рдореЗрд░реЗ рдкрд╛рд╕ 10.1 Cuda + cuDNN7.5 рдФрд░ TF 1.11 рдХреЗ рд╕рд╛рде рд╕реНрд░реЛрдд рд╕реЗ рд╕рдВрдХрд▓рд┐рдд cuda рдХреЗ рд╕рд╛рде рдпрд╣ рд╕рдорд╕реНрдпрд╛ рдереАред рдореИрдВ рдЬрд┐рд╕ рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░ рд░рд╣рд╛ рдерд╛, рдЙрд╕реЗ рдЗрди рдкрдВрдХреНрддрд┐рдпреЛрдВ рдХреЛ рдХрд╣реАрдВ рдбрд╛рд▓рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рдереА:
config = tf.ConfigProto() config.gpu_options.allow_growth = True

рдФрд░ рдлрд┐рд░ рдмрд╛рдж рдореЗрдВ:
sess = tf.Session(graph=detection_graph,config=config)

рдпрд╣ рдХрд┐рдпрд╛, "рдореЗрдореЛрд░реА рддреНрд░реБрдЯрд┐рдпреЛрдВ рд╕реЗ рдмрд╛рд╣рд░ рдЬреАрдкреАрдпреВ" - рд▓реЗрдХрд┐рди рдкрддрд╛ рд▓рдЧрд╛рдирд╛ рдмрд╣реБрдд рдЬрд▓реНрджреА рд╣реЛ рдЬрд╛рддрд╛ рд╣реИ рдЬреИрд╕рд╛ рдХрд┐ рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдЬрдм рд╣рдо рдЬреАрдкреАрдпреВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣реЗ рд╣реЛрдВ рддреЛ рдЗрд╕реЗ рдХрд░рдирд╛ рдЪрд╛рд╣рд┐рдПред рд╕рд╛рдЭрд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж!

рдореБрдЭреЗ рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝рд╛ред рдФрд░ рдиреАрдЪреЗ рджреА рдЧрдИ рд░реЗрдЦрд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ рдЗрд╕реЗ рдареАрдХ рдХрд░рддрд╛ рд╣реИред рдпрд╣рд╛рдВ рдЬрд╛рдВрдЪреЗрдВ рд╡рд┐рд╡рд░рдг рдкреНрд░рд╛рдкреНрдд
рдирд┐рд░реНрдпрд╛рдд LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/рд╕реНрдерд╛рдиреАрдп/рдХреНрдпреВрдбрд╛/рдЕрддрд┐рд░рд┐рдХреНрдд/CUPTI/lib64

@EncodeTS рдореИрдВрдиреЗ рдЕрднреА рдЕрдкрдиреА рдкрд╣рд▓реА рдкреЛрд╕реНрдЯ рдореЗрдВ рдПрдХ рдиреНрдпреВрдирддрдо рдкреНрд░рддрд┐рд▓рд┐рдкрд┐ рдкреНрд░рд╕реНрддреБрдд рдХрд░рдиреЗ рдпреЛрдЧреНрдп рдЙрджрд╛рд╣рд░рдг рдЬреЛрдбрд╝рд╛ рд╣реИред рдХреНрдпрд╛ рдЖрдк рдЬрд╛рдВрдЪ рд╕рдХрддреЗ рд╣реИрдВ рдХрд┐ рдпрд╣ рдЖрдкрдХреА рдорд╢реАрди рдкрд░ рд╕рдорд╕реНрдпрд╛ рдХреЛ рдкреБрди: рдЙрддреНрдкрдиреНрди рдХрд░рддрд╛ рд╣реИ рдпрд╛ рдирд╣реАрдВ? рдореЗрд░реА рдорд╢реАрди рдкрд░, рдПрдХ рдХрдирд╡рд▓реНрд╢рдирд▓ рд▓реЗрдпрд░ рдХрд╛рдо рдХрд░рддреА рд╣реИ, рд▓реЗрдХрд┐рди рджреЛ рдХрдирд╡рд▓реНрд╢рдирд▓ рд▓реЗрдпрд░ рдирд╣реАрдВ, рдЬрд┐рд╕рд╕реЗ рдореБрдЭреЗ рд▓рдЧрд╛ рдХрд┐ рд╕рдорд╕реНрдпрд╛ рдХреБрдЫ рд╕рдВрд╕рд╛рдзрди рд╕реАрдорд╛рдУрдВ рдХреЗ рдХрд╛рд░рдг рд╣реЛ рд╕рдХрддреА рд╣реИред

рджрд░рдЕрд╕рд▓, рдореИрдВ рдЙрдмрдВрдЯреВ 18.04 рдкрд░ рдХрд╛рдо рдХрд░ рд░рд╣рд╛ рд╣реВрдВ, рдореИрдХрдУрдПрд╕ рдкрд░ рдирд╣реАрдВ, рд▓реЗрдХрд┐рди рдпрд╣ рд╕рдордЭ рдореЗрдВ рдЖрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдХреБрдЫ рд╕рдВрд╕рд╛рдзрди рд╕реАрдорд╛рдУрдВ рдХреЗ рдХрд╛рд░рдг рд╣реЛ рд╕рдХрддрд╛ рд╣реИред рдореБрдЭреЗ рдпрд╛ рддреЛ рдЬреАрдЯреАрдПрдХреНрд╕ 1050 рдЯреАрдЖрдИ (4 рдЬреАрдмреА) рдкрд░ рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝рд╛, рд▓реЗрдХрд┐рди рдЬрдм рдореИрдВ рдЬреАрдЯреАрдПрдХреНрд╕ 1080 рдЯреАрдЖрдИ (11 рдЬреАрдмреА) рдкрд░ рдПрдХ рд╣реА рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░ рдЪрд▓рд╛рддрд╛ рд╣реВрдВ рддреЛ рдпрд╣ рд╕рдорд╕реНрдпрд╛ рджреВрд░ рд╣реЛ рдЧрдИ рд╣реИред рд╣рд╛рд▓рд╛рдВрдХрд┐ рджреЛрдиреЛрдВ рдкреНрд░рдгрд╛рд▓рд┐рдпреЛрдВ рдХреЗ рдмреАрдЪ рд╕рднреА рд╡рд╛рддрд╛рд╡рд░рдг рд╕рдорд╛рди рдирд╣реАрдВ рд╣реИрдВ, рдореИрдВрдиреЗ рдбреЙрдХрдЯрд░ рдХрдВрдЯреЗрдирд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдЕрдкрдиреА рдкреВрд░реА рдХреЛрд╢рд┐рд╢ рдХреАред

рдпрд╣ рд╕рдорд╕реНрдпрд╛ рдЖрдо рддреМрд░ рдкрд░ рдХреНрдпреВрдбрд╛ рдФрд░ рдЬреАрдкреАрдпреВ рдореЗрдореЛрд░реА рдХреЗ рд╕рдВрд╕реНрдХрд░рдг рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИ, рдпрджрд┐ рдкреВрд░реНрд╡ рдореЗрдВ, рдПрдирд╛рдХреЛрдВрдбрд╛ рджреНрд╡рд╛рд░рд╛ рдЕрдкрдиреЗ рдХреНрдпреВрдбрд╛ рд╕рдВрд╕реНрдХрд░рдг рдХреЛ рдмрджрд▓рдиреЗ рдХрд╛ рд╕рдмрд╕реЗ рдЖрд╕рд╛рди рддрд░реАрдХрд╛ рд╣реИ! рдпрджрд┐ рдмрд╛рдж рдореЗрдВ, рдЖрдк рдЕрдиреНрдп рдЙрддреНрддрд░реЛрдВ рдореЗрдВ рд╣рд▓ рдХрд░рдиреЗ рдХреЗ рдХреБрдЫ рддрд░реАрдХреЗ рдЦреЛрдЬ рд╕рдХрддреЗ рд╣реИрдВред
рдпрд╣ рд╕рдорд╕реНрдпрд╛ рдЖрдо рддреМрд░ рдкрд░ рд╡реАрдбрд┐рдпреЛ рдореЗрдореЛрд░реА рдФрд░ рдХреНрдпреВрдбрд╛ рд╕рдВрд╕реНрдХрд░рдг рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рд╣реЛрддреА рд╣реИред рдпрджрд┐ GPU рдореЗрдореЛрд░реА рдХреЛ рдмрджрд▓рдиреЗ рдХреА рдЙрдкрд░реЛрдХреНрдд рд╡рд┐рдзрд┐ рдЕрдорд╛рдиреНрдп рд╣реИ, рддреЛ cuda рд╕рдВрд╕реНрдХрд░рдг рдХреЛ рдмрджрд▓рдиреЗ рдкрд░ рд╡рд┐рдЪрд╛рд░ рдХрд░реЗрдВред рд╕рдмрд╕реЗ рдЖрд╕рд╛рди рддрд░реАрдХрд╛ рдпрд╣ рд╣реИ рдХрд┐ рд╕рд┐рд╕реНрдЯрдо рдореЗрдВ рдХреМрди рд╕рд╛ cuda рд╕рдВрд╕реНрдХрд░рдг рд╕реНрдерд╛рдкрд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ, рдЗрд╕рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рд╕реАрдзреЗ рдЪрд┐рдВрддрд╛ рди рдХрд░реЗрдВ рдПрдирд╛рдХреЛрдВрдбрд╛ рдореЗрдВ рдкрд░рд┐рдпреЛрдЬрдирд╛ рдХрд╛ рд╡рд╛рддрд╛рд╡рд░рдг рдмрд╕ рдХреНрдпреВрдбрд╛ рд╕рдВрд╕реНрдХрд░рдг рдХреЛ рд╕рдВрд╢реЛрдзрд┐рдд рдХрд░реЗрдВ, рдФрд░ рдкреНрд░реЛ-рдЯреЗрд╕реНрдЯ рдорд╛рдиреНрдп рд╣реИред

рдпрджрд┐ рдЖрдкрдХреЛ рдЕрднреА рднреА рдпрд╣ рд╕рдорд╕реНрдпрд╛ рд╣реЛ рд░рд╣реА рд╣реИ, рддреЛ рдирд┐рдореНрди рдкреНрд░рдпрд╛рд╕ рдХрд░реЗрдВред рдпрд╣ рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рдХрд┐рдпрд╛
tf.config.gpu.set_per_process_memory_growth(True); tf.config.gpu.set_per_process_memory_fraction(0.4);

рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ 2 рдЕрд▓реНрдлрд╛
рдХреВрдбрд╛ 10.0
рдЬреАрдЯреАрдПрдХреНрд╕ 1650

рдореЗрд░реЗ рдкрд╛рд╕ рд╕рдорд╛рди рд╕рдорд╕реНрдпрд╛ рд╣реИ: CUDNN_STATUS_ALLOC_FAILEDред
рдореИрдВрдиреЗ рдЕрдкрдирд╛ рд╕рд┐рд░ 3-4 рдШрдВрдЯреЗ рддрдХ рддреЛрдбрд╝рд╛ред рдЕрдВрдд рдореЗрдВ рддрдпред
рдпрд╣ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ, рдЬреИрд╕рд╛ рдХрд┐ рдХрдИ рд▓реЛрдЧреЛрдВ рдиреЗ рдКрдкрд░ рдмрддрд╛рдпрд╛ рд╣реИ:
рдХреЙрдиреНрдлрд┐рдЧ = tf.ConfigProto ()
config.gpu_options.allow_growth = рд╕рд╣реА
рд╕рддреНрд░ = tf. рд╕рддреНрд░ (рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди = рдХреЙрдиреНрдлрд╝рд┐рдЧ)

рд▓реЗрдХрд┐рди рдХреБрдВрдЬреА рдЗрд╕реЗ "tf рдХреЗ рд░реВрдк рдореЗрдВ рдЖрдпрд╛рдд рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ" рдХреЗ рдареАрдХ рдиреАрдЪреЗ рд▓рд┐рдЦрдирд╛ рд╣реИ рдЬреЛ рдореИрдВ рдирд╣реАрдВ рдХрд░ рд░рд╣рд╛ рдерд╛ред рдореИрдВрдиреЗ рдЗрд╕реЗ рд╕рднреА рдЖрдпрд╛рддреЛрдВ рдХреЗ рдмрд╛рдж рд▓рд┐рдЦрд╛ рдерд╛ред

рд╣реЛ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ-рдЬреАрдкреАрдпреВ рд╕рдВрд╕реНрдХрд░рдг рдореЗрдВ рд╕рдорд╕реНрдпрд╛рдПрдБ рд╣реЛрдВ, рдЖрдкрдХреЛ рдЕрдкрдиреЗ рд╕реНрд╡рдпрдВ рдХреЗ рд╕рдВрд╕реНрдХрд░рдгреЛрдВ рдХреА рдмрд╛рд░-рдмрд╛рд░ рдЬрд╛рдБрдЪ рдХрд░рдиреА рдЪрд╛рд╣рд┐рдП, рд╕реНрдерд╛рдкрдирд╛ рд░рджреНрдж рдХрд░реЗрдВ рдФрд░ рд╕реНрдерд╛рдкрд┐рдд рдХрд░реЗрдВ ... tensorflow-gpu рд╕рдВрдмрдВрдзрд┐рдд рд╕рдВрд╕реНрдХрд░рдг рд╕рдВрдЦреНрдпрд╛ рдЦреЛрдЬреЗрдВ рдФрд░ рдлрд┐рд░ рдЕрдирдЗрдВрд╕реНрдЯреЙрд▓ рдХрд░реЗрдВ рдФрд░ рдкреБрдирд░реНрд╕реНрдерд╛рдкрд┐рдд рдХрд░реЗрдВ

рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдХреА рд╢реБрд░реБрдЖрдд рдореЗрдВ рдХреЛрдб рдХреА рдЗрди рдкрдВрдХреНрддрд┐рдпреЛрдВ рдХреЛ рдЬреЛрдбрд╝рддреЗ рд╕рдордп рдЗрд╕рдиреЗ рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рдХрд┐рдпрд╛ @Codersadis

рдирд┐рдореНрди рдХреЛрдб рдХреЛ .py рдлрд╝рд╛рдЗрд▓ рдХреА рд╢реБрд░реБрдЖрдд рдореЗрдВ рдЬреЛрдбрд╝реЗрдВ, рдЬреЛ рдореЗрд░реА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рдорд╛рдзрд╛рди рдХрд░рддрд╛ рд╣реИред

рднрд╡рд┐рд╖реНрдп рдХреЗ рдЖрдпрд╛рдд рд╕реЗ рдкреНрд░рд┐рдВрдЯ_рдлрдВрдХреНрд╢рди, рдбрд┐рд╡реАрдЬрди
tf . рдХреЗ рд░реВрдк рдореЗрдВ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдЖрдпрд╛рдд рдХрд░реЗрдВ
keras.backend.tensorflow_backend рд╕реЗ рдЖрдпрд╛рдд set_session
рдХреЙрдиреНрдлрд┐рдЧ = tf.ConfigProto ()
config.gpu_options.allow_growth = рд╕рд╣реА
set_session(tf.Session(config=config))

рдореБрдЭреЗ tensorflow-gpu == 1.8.0 , cudnn version = 7.0.5 рдФрд░ cuda 9.1.85 рд╕рд╛рде рдПрдХ рд╣реА рддреНрд░реБрдЯрд┐ рдорд┐рд▓ рд░рд╣реА рд╣реИ
, ubuntu 16.04 рдореЗрд░реЗ рджреНрд╡рд╛рд░рд╛ рдЙрдкрд░реЛрдХреНрдд рд╕реБрдЭрд╛рдП рдЧрдП рд╕рдорд╛рдзрд╛рди рдХреЛ рдЬреЛрдбрд╝рдиреЗ рдХреЗ рдмрд╛рдж рднреАред
рд╕реНрдЯреИрдХ-рдЯреНрд░реЗрд╕ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╣реИ:

INFO - Waveunet Training - Running command 'run'
INFO - Waveunet Training - Started
SCRIPT START
EPOCH: 0
Dataset ready!
Training...
Sep_Vars: 10265550
Num of variables65
2019-07-25 05:10:09.872823: I tensorflow/core/platform/cpu_feature_guard.cc:140] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA
2019-07-25 05:10:10.286584: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:898] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero
2019-07-25 05:10:10.286914: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1356] Found device 0 with properties: 
name: Quadro P4000 major: 6 minor: 1 memoryClockRate(GHz): 1.48
pciBusID: 0000:00:05.0
totalMemory: 7.92GiB freeMemory: 7.83GiB
2019-07-25 05:10:10.286964: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1435] Adding visible gpu devices: 0
2019-07-25 05:10:10.640890: I tensorflow/core/common_runtime/gpu/gpu_device.cc:923] Device interconnect StreamExecutor with strength 1 edge matrix:
2019-07-25 05:10:10.640952: I tensorflow/core/common_runtime/gpu/gpu_device.cc:929]      0 
2019-07-25 05:10:10.640968: I tensorflow/core/common_runtime/gpu/gpu_device.cc:942] 0:   N 
2019-07-25 05:10:10.641194: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1053] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 7566 MB memory) -> physical GPU (device: 0, name: Quadro P4000, pci bus id: 0000:00:05.0, compute capability: 6.1)
2019-07-25 05:10:27.643833: I tensorflow/core/kernels/data/shuffle_dataset_op.cc:94] Filling up shuffle buffer (this may take a while): 2054 of 4000
2019-07-25 05:10:35.917445: I tensorflow/core/kernels/data/shuffle_dataset_op.cc:129] Shuffle buffer filled.
2019-07-25 05:10:36.175698: E tensorflow/stream_executor/cuda/cuda_dnn.cc:455] could not create cudnn handle: CUDNN_STATUS_NOT_INITIALIZED
2019-07-25 05:10:36.175820: E tensorflow/stream_executor/cuda/cuda_dnn.cc:463] possibly insufficient driver version: 384.183.0
2019-07-25 05:10:36.175842: E tensorflow/stream_executor/cuda/cuda_dnn.cc:427] could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM
2019-07-25 05:10:36.175859: F tensorflow/core/kernels/conv_ops.cc:713] Check failed: stream->parent()->GetConvolveAlgorithms( conv_parameters.ShouldIncludeWinogradNonfusedAlgo<T>(), &algorithms) 
Aborted (core dumped)

рдХреГрдкрдпрд╛ рд╕рд╣рд╛рдпрддрд╛ рдХреАрдЬрд┐рдП

рдореЗрд░реЗ рдкрд╛рд╕ рд╕рдорд╛рди рд╕рдорд╕реНрдпрд╛ рд╣реИ: CUDNN_STATUS_ALLOC_FAILEDред
рдореИрдВрдиреЗ рдЕрдкрдирд╛ рд╕рд┐рд░ 3-4 рдШрдВрдЯреЗ рддрдХ рддреЛрдбрд╝рд╛ред рдЕрдВрдд рдореЗрдВ рддрдпред
рдпрд╣ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ, рдЬреИрд╕рд╛ рдХрд┐ рдХрдИ рд▓реЛрдЧреЛрдВ рдиреЗ рдКрдкрд░ рдмрддрд╛рдпрд╛ рд╣реИ:
рдХреЙрдиреНрдлрд┐рдЧ = tf.ConfigProto ()
config.gpu_options.allow_growth = рд╕рд╣реА
рд╕рддреНрд░ = tf. рд╕рддреНрд░ (рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди = рдХреЙрдиреНрдлрд╝рд┐рдЧ)

рд▓реЗрдХрд┐рди рдХреБрдВрдЬреА рдЗрд╕реЗ "tf рдХреЗ рд░реВрдк рдореЗрдВ рдЖрдпрд╛рдд рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ" рдХреЗ рдареАрдХ рдиреАрдЪреЗ рд▓рд┐рдЦрдирд╛ рд╣реИ рдЬреЛ рдореИрдВ рдирд╣реАрдВ рдХрд░ рд░рд╣рд╛ рдерд╛ред рдореИрдВрдиреЗ рдЗрд╕реЗ рд╕рднреА рдЖрдпрд╛рддреЛрдВ рдХреЗ рдмрд╛рдж рд▓рд┐рдЦрд╛ рдерд╛ред

рдЕрдЪреНрдЫрд╛ рдЬрд╡рд╛рдм, рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рдХрд┐рдпрд╛ !!

рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдХреА рд╢реБрд░реБрдЖрдд рдореЗрдВ рдХреЛрдб рдХреА рдЗрди рдкрдВрдХреНрддрд┐рдпреЛрдВ рдХреЛ рдЬреЛрдбрд╝рддреЗ рд╕рдордп рдЗрд╕рдиреЗ рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рдХрд┐рдпрд╛ @Codersadis
рдирд┐рдореНрди рдХреЛрдб рдХреЛ .py рдлрд╝рд╛рдЗрд▓ рдХреА рд╢реБрд░реБрдЖрдд рдореЗрдВ рдЬреЛрдбрд╝реЗрдВ, рдЬреЛ рдореЗрд░реА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рдорд╛рдзрд╛рди рдХрд░рддрд╛ рд╣реИред
рднрд╡рд┐рд╖реНрдп рдХреЗ рдЖрдпрд╛рдд рд╕реЗ рдкреНрд░рд┐рдВрдЯ_рдлрдВрдХреНрд╢рди, рдбрд┐рд╡реАрдЬрди
tf . рдХреЗ рд░реВрдк рдореЗрдВ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдЖрдпрд╛рдд рдХрд░реЗрдВ
keras.backend.tensorflow_backend рд╕реЗ рдЖрдпрд╛рдд set_session
рдХреЙрдиреНрдлрд┐рдЧ = tf.ConfigProto ()
config.gpu_options.allow_growth = рд╕рд╣реА
set_session(tf.Session(config=config))

рдореБрдЭреЗ tensorflow-gpu == 1.8.0 , cudnn version = 7.0.5 рдФрд░ cuda 9.1.85 рд╕рд╛рде рдПрдХ рд╣реА рддреНрд░реБрдЯрд┐ рдорд┐рд▓ рд░рд╣реА рд╣реИ
, ubuntu 16.04 рдореЗрд░реЗ рджреНрд╡рд╛рд░рд╛ рдЙрдкрд░реЛрдХреНрдд рд╕реБрдЭрд╛рдП рдЧрдП рд╕рдорд╛рдзрд╛рди рдХреЛ рдЬреЛрдбрд╝рдиреЗ рдХреЗ рдмрд╛рдж рднреАред
рд╕реНрдЯреИрдХ-рдЯреНрд░реЗрд╕ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╣реИ:

INFO - Waveunet Training - Running command 'run'
INFO - Waveunet Training - Started
SCRIPT START
EPOCH: 0
Dataset ready!
Training...
Sep_Vars: 10265550
Num of variables65
2019-07-25 05:10:09.872823: I tensorflow/core/platform/cpu_feature_guard.cc:140] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA
2019-07-25 05:10:10.286584: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:898] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero
2019-07-25 05:10:10.286914: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1356] Found device 0 with properties: 
name: Quadro P4000 major: 6 minor: 1 memoryClockRate(GHz): 1.48
pciBusID: 0000:00:05.0
totalMemory: 7.92GiB freeMemory: 7.83GiB
2019-07-25 05:10:10.286964: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1435] Adding visible gpu devices: 0
2019-07-25 05:10:10.640890: I tensorflow/core/common_runtime/gpu/gpu_device.cc:923] Device interconnect StreamExecutor with strength 1 edge matrix:
2019-07-25 05:10:10.640952: I tensorflow/core/common_runtime/gpu/gpu_device.cc:929]      0 
2019-07-25 05:10:10.640968: I tensorflow/core/common_runtime/gpu/gpu_device.cc:942] 0:   N 
2019-07-25 05:10:10.641194: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1053] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 7566 MB memory) -> physical GPU (device: 0, name: Quadro P4000, pci bus id: 0000:00:05.0, compute capability: 6.1)
2019-07-25 05:10:27.643833: I tensorflow/core/kernels/data/shuffle_dataset_op.cc:94] Filling up shuffle buffer (this may take a while): 2054 of 4000
2019-07-25 05:10:35.917445: I tensorflow/core/kernels/data/shuffle_dataset_op.cc:129] Shuffle buffer filled.
2019-07-25 05:10:36.175698: E tensorflow/stream_executor/cuda/cuda_dnn.cc:455] could not create cudnn handle: CUDNN_STATUS_NOT_INITIALIZED
2019-07-25 05:10:36.175820: E tensorflow/stream_executor/cuda/cuda_dnn.cc:463] possibly insufficient driver version: 384.183.0
2019-07-25 05:10:36.175842: E tensorflow/stream_executor/cuda/cuda_dnn.cc:427] could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM
2019-07-25 05:10:36.175859: F tensorflow/core/kernels/conv_ops.cc:713] Check failed: stream->parent()->GetConvolveAlgorithms( conv_parameters.ShouldIncludeWinogradNonfusedAlgo<T>(), &algorithms) 
Aborted (core dumped)

рдХреГрдкрдпрд╛ рд╕рд╣рд╛рдпрддрд╛ рдХреАрдЬрд┐рдП

рдПрдирд╡реАрдбрд┐рдпрд╛ рдбреНрд░рд╛рдЗрд╡рд░ рдХреЛ 396+ рдореЗрдВ рдмрджрд▓рдиреЗ рд╕реЗ рдореЗрд░реЗ рд▓рд┐рдП рд╕рдорд╕реНрдпрд╛ рд╣рд▓ рд╣реЛ рдЧрдИред

рдпрд╣ cudnn рд╣реИрдВрдбрд▓ рдмрдирд╛рдиреЗ рдХреЗ рд▓рд┐рдП GPU рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдХреЛ рд▓реЛрдб рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЙрдкрд▓рдмреНрдз рдореЗрдореЛрд░реА рдЕрдВрд╢ рдХреЗ рд╕рд╛рде рдХрд░рдирд╛ рд╣реИ, рдЬрд┐рд╕реЗ per_process_gpu_memory_fraction рднреА рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИред
рдЗрд╕ рд╕реНрдореГрддрд┐ рдЕрдВрд╢ рдХреЛ рдЕрдкрдиреЗ рдЖрдк рдХрдо рдХрд░рдиреЗ рд╕реЗ рддреНрд░реБрдЯрд┐ рдХрд╛ рд╕рдорд╛рдзрд╛рди рд╣реЛ рдЬрд╛рдПрдЧрд╛ред

> sess_config = tf.ConfigProto(gpu_options =
> tf.GPUOptions(per_process_gpu_memory_fraction=0.7),
> allow_soft_placement = True)
> 
> with tf.Session(config=sess_config) as sess:
>      sess.run([whatever])

рдЕрдкрдиреА рд╕реНрдореГрддрд┐ рдореЗрдВ рдЬрд┐рддрдирд╛ рдлрд┐рдЯ рд╣реЛ рд╕рдХреЗ рдЙрддрдиреЗ рдЫреЛрдЯреЗ рдЕрдВрд╢ рдХрд╛ рдкреНрд░рдпреЛрдЧ рдХрд░реЗрдВред (рдХреЛрдб рдореЗрдВ, рдореИрдВ 0.7 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реВрдВ, рдЖрдк 0.3 рдпрд╛ рдЙрд╕рд╕реЗ рднреА рдЫреЛрдЯреЗ рд╕реЗ рд╢реБрд░реВ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ, рдлрд┐рд░ рддрдм рддрдХ рдмрдврд╝рд╛ рд╕рдХрддреЗ рд╣реИрдВ рдЬрдм рддрдХ рдЖрдкрдХреЛ рд╡рд╣реА рддреНрд░реБрдЯрд┐ рди рдорд┐рд▓ рдЬрд╛рдП, рдпрд╣ рдЖрдкрдХреА рд╕реАрдорд╛ рд╣реИред)
рдЗрд╕реЗ рдЕрдкрдиреЗ tf.Session() рдпрд╛ tf.train.MonitoredTrainingSession() рдпрд╛ рдкрд░реНрдпрд╡реЗрдХреНрд╖рдХ рдХреЗ sv.managed_session() рдХреЛ config рдХреЗ рд░реВрдк рдореЗрдВ рдкрд╛рд╕ рдХрд░реЗрдВред

рдпрд╣ рдЖрдкрдХреЗ GPU рдХреЛ рдЖрдкрдХреЗ TensorFlow рдХреЛрдб рдХреЗ рд▓рд┐рдП рдПрдХ cudnn рд╣реИрдВрдбрд▓ рдмрдирд╛рдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рджреЗрдЧрд╛ред

рдореИрдВ рдЕрдкрдиреЗ conda рд╡рд╛рддрд╛рд╡рд░рдг рдореЗрдВ tensorflow 2.0 рдХреЗ рд╕рд╛рде рдирд┐рдореНрди рддреНрд░реБрдЯрд┐ рд╣реЛ рд░рд╣реА рдереАред

``2019-12-03 23:48:29.888625: рдореИрдВ tensorflow/stream_executor/platform/default/dso_loader.cc:44] рд╕рдлрд▓рддрд╛рдкреВрд░реНрд╡рдХ рдЧрддрд┐рд╢реАрд▓ рдкреБрд╕реНрддрдХрд╛рд▓рдп cudart64_100.dll рдЦреЛрд▓рд╛
2019-12-03 23:49:06.381259: рдореИрдВ tensorflow/stream_executor/platform/default/dso_loader.cc:44] рдбрд╛рдпрдиреЗрдорд┐рдХ рд▓рд╛рдЗрдмреНрд░реЗрд░реА nvcuda.dll рдХреЛ рд╕рдлрд▓рддрд╛рдкреВрд░реНрд╡рдХ рдЦреЛрд▓рд╛ рдЧрдпрд╛
2019-12-03 23:49:07.220066: рдореИрдВ tensorflow/core/common_runtime/gpu/gpu_device.cc:1618] рдЧреБрдгреЛрдВ рдХреЗ рд╕рд╛рде рдбрд┐рд╡рд╛рдЗрд╕ 0 рдорд┐рд▓рд╛:
рдирд╛рдо: GeForce GTX 1660 Ti рдореЗрдЬрд░: 7 рдорд╛рдЗрдирд░: 5 рдореЗрдореЛрд░реАрдХреНрд▓реЙрдХ рд░реЗрдЯ (GHz): 1.59
рдкреАрд╕реАрдЖрдИрдмрд╕рдЖрдИрдбреА: 0000:01:00.0
2019-12-03 23:49:07.236411: рдореИрдВ tensorflow/stream_executor/platform/default/dlopen_checker_stub.cc:25] GPU рдкреБрд╕реНрддрдХрд╛рд▓рдп рд╕реНрдерд┐рд░ рд░реВрдк рд╕реЗ рдЬреБрдбрд╝реЗ рд╣реБрдП рд╣реИрдВ, dlopen рдЬрд╛рдБрдЪ рдЫреЛрдбрд╝реЗрдВред
2019-12-03 23:49:07.247476: рдореИрдВ tensorflow/core/common_runtime/gpu/gpu_device.cc:1746] рджреГрд╢реНрдпрдорд╛рди GPU рдбрд┐рд╡рд╛рдЗрд╕ рдЬреЛрдбрд╝рдирд╛: 0
2019-12-03 23:49:07.256881: I tensorflow/core/platform/cpu_feature_guard.cc:142] рдЖрдкрдХрд╛ CPU рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рд╕рдорд░реНрдерди рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдЗрд╕ TensorFlow рдмрд╛рдЗрдирд░реА рдХреЛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдВрдХрд▓рд┐рдд рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛: AVX2
2019-12-03 23:49:07.269536: рдореИрдВ tensorflow/core/common_runtime/gpu/gpu_device.cc:1618] рдЧреБрдгреЛрдВ рдХреЗ рд╕рд╛рде рдбрд┐рд╡рд╛рдЗрд╕ 0 рдорд┐рд▓рд╛:
рдирд╛рдо: GeForce GTX 1660 Ti рдореЗрдЬрд░: 7 рдорд╛рдЗрдирд░: 5 рдореЗрдореЛрд░реАрдХреНрд▓реЙрдХ рд░реЗрдЯ (GHz): 1.59
рдкреАрд╕реАрдЖрдИрдмрд╕рдЖрдИрдбреА: 0000:01:00.0
2019-12-03 23:49:07.281954: рдореИрдВ tensorflow/stream_executor/platform/default/dlopen_checker_stub.cc:25] GPU рдкреБрд╕реНрддрдХрд╛рд▓рдп рд╕реНрдерд┐рд░ рд░реВрдк рд╕реЗ рдЬреБрдбрд╝реЗ рд╣реБрдП рд╣реИрдВ, dlopen рдЬрд╛рдБрдЪ рдЫреЛрдбрд╝реЗрдВред
2019-12-03 23:49:07.295302: рдореИрдВ tensorflow/core/common_runtime/gpu/gpu_device.cc:1746] рджреГрд╢реНрдпрдорд╛рди GPU рдбрд┐рд╡рд╛рдЗрд╕ рдЬреЛрдбрд╝рдирд╛: 0
2019-12-03 23:49:08.589865: рдореИрдВ tensorflow/core/common_runtime/gpu/gpu_device.cc:1159] рдбрд┐рд╡рд╛рдЗрд╕ рдЗрдВрдЯрд░рдХрдиреЗрдХреНрдЯ StreamExecutor рд╢рдХреНрддрд┐ 1 рдмрдврд╝рдд рдореИрдЯреНрд░рд┐рдХреНрд╕ рдХреЗ рд╕рд╛рде:
2019-12-03 23:49:08.599121: рдореИрдВ tensorflow/core/common_runtime/gpu/gpu_device.cc:1165] 0
2019-12-03 23:49:08.610543: рдореИрдВ tensorflow/core/common_runtime/gpu/gpu_device.cc:1178] 0: N
2019-12-03 23:49:08.616005: рдореИрдВ tensorflow/core/common_runtime/gpu/gpu_device.cc:1304] TensorFlow рдбрд┐рд╡рд╛рдЗрд╕ рдмрдирд╛рдпрд╛ (/job:localhost/рдкреНрд░рддрд┐рдХреГрддрд┐:0/рдХрд╛рд░реНрдп:0/рдбрд┐рд╡рд╛рдЗрд╕:GPU:0 4627 рдХреЗ рд╕рд╛рде MB рдореЗрдореЛрд░реА) -> рднреМрддрд┐рдХ GPU (рдбрд┐рд╡рд╛рдЗрд╕: 0, рдирд╛рдо: GeForce GTX 1660 Ti, pci рдмрд╕ рдЖрдИрдбреА: 0000:01:00.0, рдЧрдгрдирд╛ рдХреНрд╖рдорддрд╛: 7.5)
2019-12-03 23:49:58.521484: рдореИрдВ tensorflow/stream_executor/platform/default/dso_loader.cc:44] рд╕рдлрд▓рддрд╛рдкреВрд░реНрд╡рдХ рдЧрддрд┐рд╢реАрд▓ рдкреБрд╕реНрддрдХрд╛рд▓рдп cublas64_100.dll рдЦреЛрд▓рд╛
2019-12-03 23:49:59.604517: рдореИрдВ tensorflow/stream_executor/platform/default/dso_loader.cc:44] рд╕рдлрд▓рддрд╛рдкреВрд░реНрд╡рдХ рдЧрддрд┐рд╢реАрд▓ рдкреБрд╕реНрддрдХрд╛рд▓рдп cudnn64_7.dll рдЦреЛрд▓рд╛
2019-12-03 23:50:04.209110: E tensorflow/stream_executor/cuda/cuda_dnn.cc:329] cudnn рд╣реИрдВрдбрд▓ рдирд╣реАрдВ рдмрдирд╛ рд╕рдХрд╛: CUDNN_STATUS_NOT_INITIALIZED
2019-12-03 23:50:04.216670: E tensorflow/stream_executor/cuda/cuda_dnn.cc:333] рдбреНрд░рд╛рдЗрд╡рд░ рд╕рдВрд╕реНрдХрд░рдг рдХреЛ рдкреБрдирд░реНрдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдореЗрдВ рддреНрд░реБрдЯрд┐: рд▓рд╛рдЧреВ рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛: рдХрд░реНрдиреЗрд▓ рдиреЗ рдбреНрд░рд╛рдЗрд╡рд░ рд╕рдВрд╕реНрдХрд░рдг рдХреЛ рд╡рд┐рдВрдбреЛрдЬрд╝ рдкрд░ рд▓рд╛рдЧреВ рдирд╣реАрдВ рдХрд┐рдпрд╛
2019-12-03 23:50:04.226172: E tensorflow/stream_executor/cuda/cuda_dnn.cc:329] cudnn рд╣реИрдВрдбрд▓ рдирд╣реАрдВ рдмрдирд╛ рд╕рдХрд╛: CUDNN_STATUS_NOT_INITIALIZED
2019-12-03 23:50:04.234741: E tensorflow/stream_executor/cuda/cuda_dnn.cc:333] рдбреНрд░рд╛рдЗрд╡рд░ рд╕рдВрд╕реНрдХрд░рдг рдХреЛ рдкреБрдирд░реНрдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдореЗрдВ рддреНрд░реБрдЯрд┐: рд▓рд╛рдЧреВ рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛: рдХрд░реНрдиреЗрд▓ рдиреЗ рдбреНрд░рд╛рдЗрд╡рд░ рд╕рдВрд╕реНрдХрд░рдг рдХреЛ рд╡рд┐рдВрдбреЛрдЬрд╝ рдкрд░ рд▓рд╛рдЧреВ рдирд╣реАрдВ рдХрд┐рдпрд╛
2019-12-03 23:50:04.244958: W tensorflow/core/common_runtime/base_collective_executor.cc:216] BaseCollectiveExecutor::StartAbort рдЕрдЬреНрдЮрд╛рдд: рдХрдирд╡рд▓реНрд╢рди рдПрд▓реНрдЧреЛрд░рд┐рдердо рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдореЗрдВ рд╡рд┐рдлрд▓ред рдпрд╣ рд╢рд╛рдпрдж рдЗрд╕рд▓рд┐рдП рд╣реИ рдХреНрдпреЛрдВрдХрд┐ cuDNN рдкреНрд░рд╛рд░рдВрдн рдХрд░рдиреЗ рдореЗрдВ рд╡рд┐рдлрд▓ рд░рд╣рд╛, рдЗрд╕рд▓рд┐рдП рдпрд╣ рджреЗрдЦрдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░реЗрдВ рдХрд┐ рдХреНрдпрд╛ рдКрдкрд░ рдЪреЗрддрд╛рд╡рдиреА рд▓реЙрдЧ рд╕рдВрджреЗрд╢ рдореБрджреНрд░рд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред
[[{{рдиреЛрдб рдЕрдиреБрдХреНрд░рдорд┐рдХ/conv2d/Conv2D}}]]

so i added the following code to my CNN

gpus = tf.config.experimental.list_physical_devices('GPU')
tf.config.experimental.set_memory_growth(gpus[0], True)

My output is now

2019-12-04 00:10:07.708573: рдореИрдВ tensorflow/stream_executor/platform/default/dso_loader.cc:44] рд╕рдлрд▓рддрд╛рдкреВрд░реНрд╡рдХ рдЧрддрд┐рд╢реАрд▓ рдкреБрд╕реНрддрдХрд╛рд▓рдп cudart64_100.dll рдЦреЛрд▓рд╛
2019-12-04 00:10:11.643304: рдореИрдВ tensorflow/stream_executor/platform/default/dso_loader.cc:44] рд╕рдлрд▓рддрд╛рдкреВрд░реНрд╡рдХ рдЧрддрд┐рд╢реАрд▓ рдкреБрд╕реНрддрдХрд╛рд▓рдп nvcuda.dll рдЦреЛрд▓рд╛ рдЧрдпрд╛
2019-12-04 00:10:12.753615: рдореИрдВ tensorflow/core/common_runtime/gpu/gpu_device.cc:1618] рдЧреБрдгреЛрдВ рдХреЗ рд╕рд╛рде рдбрд┐рд╡рд╛рдЗрд╕ 0 рдорд┐рд▓рд╛:
рдирд╛рдо: GeForce GTX 1660 Ti рдореЗрдЬрд░: 7 рдорд╛рдЗрдирд░: 5 рдореЗрдореЛрд░реАрдХреНрд▓реЙрдХ рд░реЗрдЯ (GHz): 1.59
рдкреАрд╕реАрдЖрдИрдмрд╕рдЖрдИрдбреА: 0000:01:00.0
2019-12-04 00:10:12.769498: рдореИрдВ tensorflow/stream_executor/platform/default/dlopen_checker_stub.cc:25] GPU рдкреБрд╕реНрддрдХрд╛рд▓рдп рд╕реНрдерд┐рд░ рд░реВрдк рд╕реЗ рдЬреБрдбрд╝реЗ рд╣реБрдП рд╣реИрдВ, dlopen рдЬрд╛рдБрдЪ рдЫреЛрдбрд╝реЗрдВред
2019-12-04 00:10:12.783900: рдореИрдВ tensorflow/core/common_runtime/gpu/gpu_device.cc:1746] рджреГрд╢реНрдпрдорд╛рди GPU рдЙрдкрдХрд░рдгреЛрдВ рдХреЛ рдЬреЛрдбрд╝рдирд╛: 0
2019-12-04 00:10:54.941468: I tensorflow/core/platform/cpu_feature_guard.cc:142] рдЖрдкрдХрд╛ CPU рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рд╕рдорд░реНрдерди рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдЗрд╕ TensorFlow рдмрд╛рдЗрдирд░реА рдХреЛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдВрдХрд▓рд┐рдд рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛: AVX2
2019-12-04 00:10:55.372516: рдореИрдВ tensorflow/core/common_runtime/gpu/gpu_device.cc:1618] рдЧреБрдгреЛрдВ рдХреЗ рд╕рд╛рде рдбрд┐рд╡рд╛рдЗрд╕ 0 рдорд┐рд▓рд╛:
рдирд╛рдо: GeForce GTX 1660 Ti рдореЗрдЬрд░: 7 рдорд╛рдЗрдирд░: 5 рдореЗрдореЛрд░реАрдХреНрд▓реЙрдХ рд░реЗрдЯ (GHz): 1.59
рдкреАрд╕реАрдЖрдИрдмрд╕рдЖрдИрдбреА: 0000:01:00.0
2019-12-04 00:10:55.383385: рдореИрдВ tensorflow/stream_executor/platform/default/dlopen_checker_stub.cc:25] GPU рдкреБрд╕реНрддрдХрд╛рд▓рдп рд╕реНрдерд┐рд░ рд░реВрдк рд╕реЗ рдЬреБрдбрд╝реЗ рд╣реБрдП рд╣реИрдВ, dlopen check рдЫреЛрдбрд╝реЗрдВред
2019-12-04 00:10:55.406053: рдореИрдВ tensorflow/core/common_runtime/gpu/gpu_device.cc:1746] рджреГрд╢реНрдпрдорд╛рди GPU рдЙрдкрдХрд░рдгреЛрдВ рдХреЛ рдЬреЛрдбрд╝рдирд╛: 0
2019-12-04 00:10:56.741665: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1159] рдбрд┐рд╡рд╛рдЗрд╕ StreamExecutor рдХреЛ рд╕реНрдЯреНрд░реЗрдВрде 1 рдПрдЬ рдореИрдЯреНрд░рд┐рдХреНрд╕ рдХреЗ рд╕рд╛рде рдЗрдВрдЯрд░рдХрдиреЗрдХреНрдЯ рдХрд░рддрд╛ рд╣реИ:
2019-12-04 00:10:56.747255: рдореИрдВ tensorflow/core/common_runtime/gpu/gpu_device.cc:1165] 0
2019-12-04 00:10:56.752302: рдореИрдВ tensorflow/core/common_runtime/gpu/gpu_device.cc:1178] 0: N
2019-12-04 00:10:56.756861: рдореИрдВ tensorflow/core/common_runtime/gpu/gpu_device.cc:1304] TensorFlow рдбрд┐рд╡рд╛рдЗрд╕ рдмрдирд╛рдпрд╛ (/job:localhost/рдкреНрд░рддрд┐рдХреГрддрд┐:0/рдХрд╛рд░реНрдп:0/рдбрд┐рд╡рд╛рдЗрд╕:GPU:0 4627 рдХреЗ рд╕рд╛рде рдПрдордмреА рдореЗрдореЛрд░реА) -> рднреМрддрд┐рдХ GPU (рдбрд┐рд╡рд╛рдЗрд╕: 0, рдирд╛рдо: GeForce GTX 1660 Ti, pci рдмрд╕ рдЖрдИрдбреА: 0000:01:00.0, рдЧрдгрдирд╛ рдХреНрд╖рдорддрд╛: 7.5)
2019-12-04 00:11:08.281356: рдореИрдВ tensorflow/stream_executor/platform/default/dso_loader.cc:44] рд╕рдлрд▓рддрд╛рдкреВрд░реНрд╡рдХ рдЧрддрд┐рд╢реАрд▓ рдкреБрд╕реНрддрдХрд╛рд▓рдп cublas64_100.dll рдЦреЛрд▓рд╛
2019-12-04 00: 11: 08.934804: рдореИрдВ tensorflow/stream_executor/platform/default/dso_loader.cc:44] рд╕рдлрд▓рддрд╛рдкреВрд░реНрд╡рдХ рдЧрддрд┐рд╢реАрд▓ рдкреБрд╕реНрддрдХрд╛рд▓рдп cudnn64_7.dll рдЦреЛрд▓рд╛
2019-12-04 00:11:11.870237: W tensorflow/stream_executor/cuda/redzone_allocator.cc:312] рдЖрдВрддрд░рд┐рдХ: рд╡рд┐рдВрдбреЛрдЬрд╝ рдкрд░ рд╕рдорд░реНрдерд┐рдд рдирд╣реАрдВ ptxas рдХреЛ рдЖрдордВрддреНрд░рд┐рдд рдХрд░рдирд╛
рдкреАрдЯреАрдПрдХреНрд╕ рд╕рдВрдХрд▓рди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдбреНрд░рд╛рдЗрд╡рд░ рдкрд░ рдирд┐рд░реНрднрд░ред рдпрд╣ рд╕рдВрджреЗрд╢ рдХреЗрд╡рд▓ рдПрдХ рдмрд╛рд░ рд▓реЙрдЧ рдХрд┐рдпрд╛ рдЬрд╛рдПрдЧрд╛ред
```

рдЬреИрд╕рд╛ рдХрд┐ рд╕рднреА рдиреЗ рд╕реБрдЭрд╛рд╡ рджрд┐рдпрд╛ рд╣реИ рдХрд┐ рдпрд╣ рд╕рднреА GPU/GPU рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рд╡рд╛рд▓реЗ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдХреЗ рдХрд╛рд░рдг рд╣реИред рдореЗрд░рд╛ рд╕реАрдПрдирдПрди рдЕрдм рдмрд┐рдирд╛ рдХрд┐рд╕реА рддреНрд░реБрдЯрд┐ рдХреЗ рдЯреНрд░реЗрди рдХрд░рддрд╛ рд╣реИред

рдПрдХ рдХреЛрдВрдбрд╛ рд╡рд╛рддрд╛рд╡рд░рдг рдХреЗ рдЕрдВрджрд░ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдХреЗ рд╕рдореБрджрд╛рдп рд╕рдорд░реНрдерд┐рдд рд╕рдВрд╕реНрдХрд░рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╕рдордп рдореБрдЭреЗ рдЙрд╕реА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝ рд░рд╣рд╛ рдерд╛ (рдпрд╛рдиреА > conda install tensorflow-gpu рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ)

рдкрддрд╛ рдЪрд▓рддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рд╕рдВрд╕реНрдХрд░рдг рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рд╕рднреА рд╕реНрдерд┐рддрд┐рдпреЛрдВ рдореЗрдВ рдЕрдЪреНрдЫрд╛ рдирд╣реАрдВ рд╣реИ (рднрд▓реЗ рд╣реА рдореИрдВ рдЗрд╕реЗ рдЕрдиреНрдп рдорд╢реАрдиреЛрдВ рдкрд░ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рд╣реВрдВ)ред рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдмрд╕реЗ рдЕрдЪреНрдЫрд╛ рд╕рдВрд╕реНрдХрд░рдг рдкрд╛рдЗрдк рдЗрдВрд╕реНрдЯрд╛рд▓ рдХрд░рдиреЗ рдпреЛрдЧреНрдп рд╕рдВрд╕реНрдХрд░рдг рд╣реИ https://www.tensorflow.org/install/pip рдПрдХ conda рд╡рд╛рддрд╛рд╡рд░рдг рдХреЗ рдЕрдВрджрд░ред рдЬрдм рдореИрдВрдиреЗ рдРрд╕рд╛ рдХрд┐рдпрд╛ рддреЛ рд╕рдм рдХреБрдЫ рдХрд╛рдо рдХрд░ рдЧрдпрд╛ред

рдпрд╣ рдореЗрд░реЗ рд▓рд┐рдП рд╣рд▓ рд╣реЛ рдЧрдпрд╛, рдзрдиреНрдпрд╡рд╛рдж!

рдЗрд╕рдиреЗ рдореЗрд░реЗ рд▓рд┐рдП рдЗрд╕ рдореБрджреНрджреЗ рдХреЛ рднреА рд╣рд▓ рдХрд░ рджрд┐рдпрд╛ред

GeForce GTX 1050, CUDA 10.0

рдиреЛрдЯ: рдпрд╣ рдПрдХрдорд╛рддреНрд░ рдЪреАрдЬ рд╣реИ рдЬреЛ рдореБрдЭреЗ рдорд┐рд▓ рд╕рдХрддреА рд╣реИ рдЬреЛ рдЕрднреА рдХреЗ рд▓рд┐рдП рдЯреАрдПрдл 2.0 рдореЗрдВ рдХрд╛рдо рдХрд░рддреА рд╣реИред рдзрдиреНрдпрд╡рд╛рдж!

gpus = tf.config.experimental.list_physical_devices('GPU')
tf.config.experimental.set_memory_growth(gpus[0], True)

рдЗрд╕рдиреЗ рдореЗрд░реЗ рд▓рд┐рдП рдЗрд╕ рдореБрджреНрджреЗ рдХреЛ рднреА рд╣рд▓ рдХрд░ рджрд┐рдпрд╛ред

GeForce GTX 1050, CUDA 10.0

рдиреЛрдЯ: рдпрд╣ рдПрдХрдорд╛рддреНрд░ рдЪреАрдЬ рд╣реИ рдЬреЛ рдореБрдЭреЗ рдорд┐рд▓ рд╕рдХрддреА рд╣реИ рдЬреЛ рдЕрднреА рдХреЗ рд▓рд┐рдП рдЯреАрдПрдл 2.0 рдореЗрдВ рдХрд╛рдо рдХрд░рддреА рд╣реИред рдзрдиреНрдпрд╡рд╛рдж!

gpus = tf.config.experimental.list_physical_devices('GPU')
tf.config.experimental.set_memory_growth(gpus[0], True)

рдЗрд╕рд╕реЗ рдореБрдЭреЗ рдХреЛрдИ рдлрд░реНрдХ рдирд╣реАрдВ рдкрдбрд╝рд╛... TF 2.0, RTX 2060, CUDA 10.1, CuDNN 7.6

рдпрд╣ 16 рдЬреАрдмреА рд░реИрдо, 6 рдЬреАрдмреА рд╡реАрдбрд┐рдпреЛ рдореЗрдореЛрд░реА рдФрд░ рдПрдХ рд░реВрдкрд╛рдВрддрд░рдг рдкрд░рдд рдХреЗ рд╕рд╛рде рдПрдХ рдмреБрдирд┐рдпрд╛рджреА рдПрдордПрдирдЖрдИрдПрд╕рдЯреА рдЦрд┐рд▓реМрдирд╛ рдореЙрдбрд▓ рдХреЗ рд╕рд╛рде рд╣реИред рдХреЛрдИ рд╕реНрдореГрддрд┐ рд╕рдорд╕реНрдпрд╛ рдирд╣реАрдВ, рдмрд╕ рдПрдХ рд╕реНрдЯреИрдХ рдЯреНрд░реЗрд╕ред

рд╣рдореЗрд╢рд╛ рдХреА рддрд░рд╣, Pytorch рдХреЗ рд╕рд╛рде рдХреЛрдИ GPU рд╕рдорд╕реНрдпрд╛ рдирд╣реАрдВ рд╣реИ

рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ, рдореЗрд░реЗ рдкрд╛рд╕ рджреЛ рдорд╢реАрдиреЗрдВ рд╣реИрдВ, рджреЛрдиреЛрдВ RTX 2080Ti, TF 2.1, CUDA 10.1, CuDNN 7.6 рдХреЗ рд╕рд╛рдеред рдПрдХ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ, рджреВрд╕рд░рд╛ рдЙрдкрд░реЛрдХреНрдд рддреНрд░реБрдЯрд┐ рдЙрдард╛рддрд╛ рд╣реИред рджреЛрдиреЛрдВ рдорд╢реАрдиреЛрдВ рдореЗрдВ рд╕рдорд╛рди рдорд╛рддреНрд░рд╛ рдореЗрдВ RAM, 16GB рд╣реИред рд╣рд╛рд▓рд╛рдБрдХрд┐, CPU рдХреА рддрд░рд╣ рд╣рд╛рд░реНрдбрд╡реЗрдпрд░ рднрд┐рдиреНрди рд╣реИрдВред рд▓реЗрдХрд┐рди рд╕рдорд╕реНрдпрд╛ рдХреЗрд╡рд▓ GPU рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╕рдордп рд╣реЛ рд░рд╣реА рд╣реИред

рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ, рдореЗрд░реЗ рдкрд╛рд╕ рджреЛ рдорд╢реАрдиреЗрдВ рд╣реИрдВ, рджреЛрдиреЛрдВ RTX 2080Ti, TF 2.1, CUDA 10.1, CuDNN 7.6 рдХреЗ рд╕рд╛рдеред рдПрдХ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ, рджреВрд╕рд░рд╛ рдЙрдкрд░реЛрдХреНрдд рддреНрд░реБрдЯрд┐ рдЙрдард╛рддрд╛ рд╣реИред рджреЛрдиреЛрдВ рдорд╢реАрдиреЛрдВ рдореЗрдВ рд╕рдорд╛рди рдорд╛рддреНрд░рд╛ рдореЗрдВ RAM, 16GB рд╣реИред рд╣рд╛рд▓рд╛рдБрдХрд┐, CPU рдХреА рддрд░рд╣ рд╣рд╛рд░реНрдбрд╡реЗрдпрд░ рднрд┐рдиреНрди рд╣реИрдВред рд▓реЗрдХрд┐рди рд╕рдорд╕реНрдпрд╛ рдХреЗрд╡рд▓ GPU рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╕рдордп рд╣реЛ рд░рд╣реА рд╣реИред

рд╡рд╣реА рдордВрдЪ, рд╡рд╣реА рд╕рдорд╕реНрдпрд╛

рдпрджрд┐ рдЖрдк рдирд╡реАрдирддрдо рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдФрд░ рдХреЗрд░рд╕ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣реЗ рд╣реИрдВред рдЗрд╕реЗ рдпрд╣рд╛рдБ рд╕реЗ рдЖрдЬрд╝рдорд╛рдПрдБ, рдЗрд╕рдиреЗ рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рдХрд┐рдпрд╛:

gpus = tf.config.experimental.list_physical_devices('GPU')
if gpus:
  try:
    # Currently, memory growth needs to be the same across GPUs
    for gpu in gpus:
      tf.config.experimental.set_memory_growth(gpu, True)
    logical_gpus = tf.config.experimental.list_logical_devices('GPU')
    print(len(gpus), "Physical GPUs,", len(logical_gpus), "Logical GPUs")
  except RuntimeError as e:
    # Memory growth must be set before GPUs have been initialized
    print(e)

рдпрд╣ рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред
Physical_devices = tf.config.list_ Physical_devices('GPU')
tf.config.experimental.set_memory_growth( Physical_devices[0], True)

рдпрд╣ рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред
Physical_devices = tf.config.list_ Physical_devices('GPU')
tf.config.experimental.set_memory_growth( Physical_devices[0], True)

рдпрд╣ рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рдХрд┐рдпрд╛ред рдзрдиреНрдпрд╡рд╛рдж

@ Samaritan1011001 рдЖрдкрдХрд╛ рд╕рдорд╛рдзрд╛рди рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ рдмрд╣реБрдд рдмрд╣реБрдд рдзрдиреНрдпрд╡рд╛рджред

рдХреНрдпрд╛ рдпрд╣ рдкреГрд╖реНрда рдЙрдкрдпреЛрдЧреА рдерд╛?
0 / 5 - 0 рд░реЗрдЯрд┐рдВрдЧреНрд╕

рд╕рдВрдмрдВрдзрд┐рдд рдореБрджреНрджреЛрдВ

aerointern16 picture aerointern16  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

NHDaly picture NHDaly  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

Billy4195 picture Billy4195  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

jacobma-create picture jacobma-create  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

as1ndu picture as1ndu  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ