Tensorflow: рдЪрдорддреНрдХрд╛рд░ 3.0?

рдХреЛ рдирд┐рд░реНрдорд┐рдд 9 рдирд╡ре░ 2015  ┬╖  101рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ  ┬╖  рд╕реНрд░реЛрдд: tensorflow/tensorflow

рдХреНрдпрд╛ рдХреВрдбрд╛ рдХрдВрдкреНрдпреВрдЯ рдХреНрд╖рдорддрд╛ 3.0 рдХрд╛ рд╕рдорд░реНрдерди рдХрд░рдиреЗ рдХреА рдпреЛрдЬрдирд╛ рд╣реИ?

рд╕рдмрд╕реЗ рдЙрдкрдпреЛрдЧреА рдЯрд┐рдкреНрдкрдгреА

Cuda 3.0 рдбрд┐рд╡рд╛рдЗрд╕ рдХреЗ рдирд┐рд░реНрдорд╛рдг рдХреЗ рд▓рд┐рдП, рдпрджрд┐ рдЖрдк рдирд╡реАрдирддрдо TensorFlow рдХреЛрдб рдХреЛ рд╕рд┐рдВрдХ рдХрд░рддреЗ рд╣реИрдВ, рддреЛ рдЖрдк рдирд┐рдореНрди рдХрд╛рд░реНрдп рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред рдЖрдзрд┐рдХрд╛рд░рд┐рдХ рджрд╕реНрддрд╛рд╡реЗрдЬ рдЬрд▓реНрдж рд╣реА рдЕрдкрдбреЗрдЯ рд╣реЛ рдЬрд╛рдПрдЧрд╛ред рд▓реЗрдХрд┐рди рдпрд╣ рдРрд╕рд╛ рджрд┐рдЦрддрд╛ рд╣реИ:

$ TF_UNOFFICIAL_SETTING=1 ./configure

... рдКрдкрд░ рдХреА рдЖрдзрд┐рдХрд╛рд░рд┐рдХ рд╕реЗрдЯрд┐рдВрдЧреНрд╕ рдХреЗ рд╕рдорд╛рди

рдЪреЗрддрд╛рд╡рдиреА: рдЖрдк TensorFlow рдореЗрдВ рдЕрдиреМрдкрдЪрд╛рд░рд┐рдХ рд╕реЗрдЯрд┐рдВрдЧ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд░ рд░рд╣реЗ рд╣реИрдВред рдХреНрдпреЛрдВрдХрд┐ рдХреБрдЫ
рдмрд╛рд╣рд░реА рдкреБрд╕реНрддрдХрд╛рд▓рдп рдкрд┐рдЫрдбрд╝реЗ рд╕рдВрдЧрдд рдирд╣реАрдВ рд╣реИрдВ, рдпреЗ рд╕реЗрдЯрд┐рдВрдЧреНрд╕ рдХрд╛рдлреА рд╣рдж рддрдХ рд╣реИрдВ
рдкрд░реАрдХреНрд╖рдг рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдФрд░ рдЕрд╕рдорд░реНрдерд┐рддред

рдХреГрдкрдпрд╛ рдХреЙрдорд╛-рд╕реЗрдкрд░реЗрдЯреЗрдб рдХреВрдбрд╛ рдХрдВрдкреНрдпреВрдЯ рдХреНрд╖рдорддрд╛рдУрдВ рдХреА рдПрдХ рд╕реВрдЪреА рдирд┐рд░реНрджрд┐рд╖реНрдЯ рдХрд░реЗрдВ рдЬреЛ рдЖрдк рдХрд░рдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВ
рдХреЗ рд╕рд╛рде рдирд┐рд░реНрдорд╛рдгред рдЖрдк рдЕрдкрдиреЗ рдбрд┐рд╡рд╛рдЗрд╕ рдХреА рдЧрдгрдирд╛ рдХреНрд╖рдорддрд╛ рдпрд╣рд╛рдВ рдкрд╛ рд╕рдХрддреЗ рд╣реИрдВ:
https://developer.nvidia.com/cuda-gpusред
рдХреГрдкрдпрд╛ рдзреНрдпрд╛рди рджреЗрдВ рдХрд┐ рдкреНрд░рддреНрдпреЗрдХ рдЕрддрд┐рд░рд┐рдХреНрдд рдЧрдгрдирд╛ рдХреНрд╖рдорддрд╛ рдХрд╛рдлреА рдмрдврд╝ рдЬрд╛рддреА рд╣реИ
рдЖрдкрдХрд╛ рдирд┐рд░реНрдорд╛рдг рд╕рдордп рдФрд░ рдмрд╛рдЗрдирд░реА рдЖрдХрд╛рд░ред [рдбрд┐рдлрд╝реЙрд▓реНрдЯ рд╣реИ: "3.5,5.2"]: 3.0

рдХреБрдбрд╛ рдХреА рд╕реНрдерд╛рдкрдирд╛ рдореЗрдВ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ
рдХреБрдбрд╛ lib64 рдХреА рд╕реНрдерд╛рдкрдирд╛
рдХреБрдбрд╛ рдмрд┐рди рдХреА рд╕реНрдерд╛рдкрдирд╛
рдХреБрдбрд╛ nvvm . рдХреА рд╕реНрдерд╛рдкрдирд╛
рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди рд╕рдорд╛рдкреНрдд

рд╕рднреА 101 рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

рдЖрдзрд┐рдХрд╛рд░рд┐рдХ рддреМрд░ рдкрд░, рдХреНрдпреВрдбрд╛ рдХрдВрдкреНрдпреВрдЯ рдХреНрд╖рдорддрд╛ 3.5 рдФрд░ 5.2 рд╕рдорд░реНрдерд┐рдд рд╣реИрдВред рдЖрдк рдмрд┐рд▓реНрдб рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдХреЛ рд╕рдВрд╢реЛрдзрд┐рдд рдХрд░рдХреЗ рдЕрдиреНрдп рдЧрдгрдирд╛ рдХреНрд╖рдорддрд╛ рдХреЛ рд╕рдХреНрд╖рдо рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ:

https://github.com/tensorflow/tensorflow/blob/master/third_party/gpus/crosstool/clang/bin/crosstool_wrapper_driver_is_not_gcc#L236

рдзрдиреНрдпрд╡рд╛рдж! рдХреЛрд╢рд┐рд╢ рдХрд░реЗрдВрдЧреЗ рдФрд░ рдпрд╣рд╛рдВ рд░рд┐рдкреЛрд░реНрдЯ рдХрд░реЗрдВрдЧреЗред

рдпрд╣ рдЕрднреА рддрдХ рдЖрдзрд┐рдХрд╛рд░рд┐рдХ рддреМрд░ рдкрд░ рд╕рдорд░реНрдерд┐рдд рдирд╣реАрдВ рд╣реИред рд▓реЗрдХрд┐рди рдЕрдЧрд░ рдЖрдк рд╕реНрдерд╛рдиреАрдп рд░реВрдк рд╕реЗ Cuda 3.0 рдХреЛ рд╕рдХреНрд╖рдо рдХрд░рдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВ, рддреЛ рдпрд╣рд╛рдВ рдмрджрд▓рдиреЗ рдХреЗ рд▓рд┐рдП рдЕрддрд┐рд░рд┐рдХреНрдд рд╕реНрдерд╛рди рд╣реИрдВ:

https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/common_runtime/gpu/gpu_device.cc#L610
https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/common_runtime/gpu/gpu_device.cc#L629
рдЬрд╣рд╛рдВ рдЫреЛрдЯреЗ GPU рдбрд┐рд╡рд╛рдЗрд╕ рдХреЛ рдирдЬрд░рдЕрдВрджрд╛рдЬ рдХрд░ рджрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред

рдЖрдзрд┐рдХрд╛рд░рд┐рдХ рд╕рдорд░реНрдерди рдЕрдВрддрддрдГ рдПрдХ рдЕрд▓рдЧ рд░реВрдк рдореЗрдВ рдЖрдПрдЧрд╛, рдЬрд╣рд╛рдВ рд╣рдо рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░рддреЗ рд╣реИрдВ рдХрд┐ рдлрд┐рдХреНрд╕ рд╕рднреА рдЕрд▓рдЧ-рдЕрд▓рдЧ рдХрдореНрдкреНрдпреВрдЯреЗрд╢рдирд▓ рд╡рд╛рддрд╛рд╡рд░рдг рдкрд░ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред

рдореИрдВрдиреЗ рдКрдкрд░ рдХреА рдкрдВрдХреНрддрд┐рдпреЛрдВ рдореЗрдВ рдкрд░рд┐рд╡рд░реНрддрди рдХрд┐рдП рд╣реИрдВ, рдФрд░ рдЖрд░рдВрднрд┐рдХ рдкреГрд╖реНрда рдкрд░ рдореВрд▓ рдЙрджрд╛рд╣рд░рдг рдХреЛ рд╕рдВрдХрд▓рд┐рдд рдФрд░ рдЪрд▓рд╛рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдерд╛: http://tensorflow.org/get_started/os_setup.md#try_your_first_tensorflow_program - рдЗрд╕рдиреЗ рдЬреАрдкреАрдпреВ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рд╢рд┐рдХрд╛рдпрдд рдирд╣реАрдВ рдХреА, рд▓реЗрдХрд┐рди рдпрд╣ рдпрд╛ рддреЛ GPU рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рд░рд┐рдкреЛрд░реНрдЯ рдирд╣реАрдВ рдХреАред

рдореИрдВ рдЕрдЧрд▓реЗ рдЪрд░рдгреЛрдВ рдореЗрдВ рдХреИрд╕реЗ рдорджрдж рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ?

infojunkie@, рдХреНрдпрд╛ рдЖрдк рдЕрдкрдирд╛ рдХрджрдо рдкреЛрд╕реНрдЯ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ рдФрд░ рд▓реЙрдЧ рдЕрдкрд▓реЛрдб рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ?

рдпрджрд┐ рдЖрдк рдЗрд╕ рдЙрджрд╛рд╣рд░рдг рдХрд╛ рдЕрдиреБрд╕рд░рдг рдХрд░ рд░рд╣реЗ рдереЗ:

рдмреЗрдЬрд╝рд▓ рдмрд┐рд▓реНрдб-рд╕реА рдСрдкреНрдЯ --config=cuda //tensorflow/cc:tutorials_example_trainer
рдмреЗрдЬрд╝рд▓-рдмрд┐рди/рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ/рд╕реАрд╕реА/рдЯреНрдпреВрдЯреЛрд░рд┐рдпрд▓_рдЙрджрд╛рд╣рд░рдг_рдЯреНрд░реЗрдирд░ --use_gpu

рдпрджрд┐ рдЖрдк рдирд┐рдореНрди рдкрдВрдХреНрддрд┐ рджреЗрдЦрддреЗ рд╣реИрдВ, рддреЛ GPU рд▓реЙрдЬрд┐рдХ рдбрд┐рд╡рд╛рдЗрд╕ рдмрдирд╛рдпрд╛ рдЬрд╛ рд░рд╣рд╛ рд╣реИ:

TensorFlow рдбрд┐рд╡рд╛рдЗрд╕ рдмрдирд╛рдирд╛ (/gpu:0) -> (рдбрд┐рд╡рд╛рдЗрд╕: ..., рдирд╛рдо: ..., pci рдмрд╕ рдЖрдИрдбреА: ...)

рдпрджрд┐ рдЖрдк рдкреВрд░реА рддрд░рд╣ рд╕реЗ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рд╣реЛрдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВ рдХрд┐ GPU рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛, рддреЛ CUDA_PROFILE=1 рд╕реЗрдЯ рдХрд░реЗрдВ рдФрд░ Cuda рдкреНрд░реЛрдлрд╛рдЗрд▓рд░ рдХреЛ рд╕рдХреНрд╖рдо рдХрд░реЗрдВред рдпрджрд┐ рдХреБрдбрд╛ рдкреНрд░реЛрдлрд╛рдЗрд▓рд░ рд▓реЙрдЧ рдЙрддреНрдкрдиреНрди рдХрд┐рдП рдЧрдП рдереЗ, рддреЛ рдпрд╣ рдПрдХ рдирд┐рд╢реНрдЪрд┐рдд рд╕рдВрдХреЗрдд рдерд╛ рдХрд┐ GPU рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред

http://docs.nvidia.com/cuda/profiler-users-guide/#command -line-profiler-control

рдореБрдЭреЗ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд▓реЙрдЧ рдорд┐рд▓рд╛:

I tensorflow/core/common_runtime/local_device.cc:25] Local device intra op parallelism threads: 8
I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:888] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero
I tensorflow/core/common_runtime/gpu/gpu_init.cc:88] Found device 0 with properties: 
name: GeForce GT 750M
major: 3 minor: 0 memoryClockRate (GHz) 0.967
pciBusID 0000:02:00.0
Total memory: 2.00GiB
Free memory: 896.49MiB
I tensorflow/core/common_runtime/gpu/gpu_init.cc:112] DMA: 0 
I tensorflow/core/common_runtime/gpu/gpu_init.cc:122] 0:   Y 
I tensorflow/core/common_runtime/gpu/gpu_device.cc:643] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GT 750M, pci bus id: 0000:02:00.0)
I tensorflow/core/common_runtime/gpu/gpu_device.cc:643] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GT 750M, pci bus id: 0000:02:00.0)
I tensorflow/core/common_runtime/gpu/gpu_device.cc:643] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GT 750M, pci bus id: 0000:02:00.0)
I tensorflow/core/common_runtime/gpu/gpu_device.cc:643] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GT 750M, pci bus id: 0000:02:00.0)
I tensorflow/core/common_runtime/gpu/gpu_device.cc:643] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GT 750M, pci bus id: 0000:02:00.0)
I tensorflow/core/common_runtime/gpu/gpu_device.cc:643] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GT 750M, pci bus id: 0000:02:00.0)
I tensorflow/core/common_runtime/gpu/gpu_region_allocator.cc:47] Setting region size to 730324992
I tensorflow/core/common_runtime/gpu/gpu_device.cc:643] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GT 750M, pci bus id: 0000:02:00.0)
I tensorflow/core/common_runtime/gpu/gpu_device.cc:643] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GT 750M, pci bus id: 0000:02:00.0)
I tensorflow/core/common_runtime/gpu/gpu_device.cc:643] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GT 750M, pci bus id: 0000:02:00.0)
I tensorflow/core/common_runtime/gpu/gpu_device.cc:643] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GT 750M, pci bus id: 0000:02:00.0)
I tensorflow/core/common_runtime/local_session.cc:45] Local session inter op parallelism threads: 8

рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдЗрд╕рдХрд╛ рдорддрд▓рдм рд╣реИ рдХрд┐ GPU рдкрд╛рдпрд╛ рдФрд░ рдЗрд╕реНрддреЗрдорд╛рд▓ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред рдпрджрд┐ рдЖрдкрдХреЛ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдЙрдкрдпреЛрдЧреА рд╣реИ рддреЛ рдореИрдВ CUDA рдкреНрд░реЛрдлрд╛рдЗрд▓рд░ рдЖрдЬрд╝рдорд╛ рд╕рдХрддрд╛ рд╣реВрдБред

рдХреГрдкрдпрд╛ рдЗрд╕ рдореБрджреНрджреЗ рдХреЛ рдкреНрд░рд╛рдердорд┐рдХрддрд╛ рджреЗрдВред рдпрд╣ OSX рдФрд░ AWS рдХреЗ K520 рджреЛрдиреЛрдВ рдкрд░ gpu рдХреЗ рдЙрдкрдпреЛрдЧ рдХреЛ рд░реЛрдХ рд░рд╣рд╛ рд╣реИ рдФрд░ рдХрдИ рд▓реЛрдЧреЛрдВ рдХреЗ рд▓рд┐рдП рдпрд╣ рдПрдХрдорд╛рддреНрд░ рдЙрдкрд▓рдмреНрдз рд╡рд╛рддрд╛рд╡рд░рдг рд╣реИред
рдзрдиреНрдпрд╡рд╛рдж!

рд╕рдмрд╕реЗ рдЕрдЪреНрдЫрд╛ рдлрд┐рдХреНрд╕ рдирд╣реАрдВ рд╣реИ, рд▓реЗрдХрд┐рди _gpu_device.c_ рд▓рд╛рдЗрди 610 рд╕реЗ 616 рдкрд░ cuda рдХрдВрдкреНрдпреВрдЯ рд╕рдВрд╕реНрдХрд░рдг рдХреА рдЬрд╛рдБрдЪ рдХрд░реЗрдВ, рдлрд┐рд░ рд╕реЗ рд╕рдВрдХрд▓рд┐рдд рдХрд░реЗрдВ, рдФрд░ amazon g2 GPU рддреНрд╡рд░рдг рдареАрдХ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ:

example

рд╕рдВрджрд░реНрдн рдХреЗ рд▓рд┐рдП, рдпрд╣рд╛рдБ рдХреБрдбрд╛ 3.0 рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдореЗрд░рд╛ рдмрд╣реБрдд рд╣реА рдЖрджрд┐рдо рдкреИрдЪ рд╣реИ: https://gist.github.com/infojunkie/cb6d1a4e8bf674c6e38e

@infojunkie рдореИрдВрдиреЗ рдЖрдкрдХрд╛ рдлрд┐рдХреНрд╕ рд▓рд╛рдЧреВ рдХрд┐рдпрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдореБрдЭреЗ рдЧрдгрдирд╛ рдЖрдЙрдЯрдкреБрдЯ рдореЗрдВ рдмрд╣реБрдд рд╕рд╛рд░реЗ рдирд╛рди рдорд┐рд▓реЗ рд╣реИрдВ:

$ bazel-bin/tensorflow/cc/tutorials_example_trainer --use_gpu
000006/000003 lambda =     -nan x = [0.000000 0.000000] y = [0.000000 0.000000]
000004/000003 lambda = 2.000027 x = [79795.101562 -39896.468750] y = [159592.375000 -79795.101562]
000005/000006 lambda = 2.000054 x = [39896.468750 -19947.152344] y = [79795.101562 -39896.468750]
000001/000007 lambda =     -nan x = [0.000000 0.000000] y = [0.000000 0.000000]
000002/000003 lambda =     -nan x = [0.000000 0.000000] y = [0.000000 0.000000]
000009/000008 lambda =     -nan x = [0.000000 0.000000] y = [0.000000 0.000000]
000004/000004 lambda =     -nan x = [0.000000 0.000000] y = [0.000000 0.000000]
000001/000005 lambda =     -nan x = [0.000000 0.000000] y = [0.000000 0.000000]
000006/000007 lambda =     -nan x = [0.000000 0.000000] y = [0.000000 0.000000]
000003/000006 lambda =     -nan x = [0.000000 0.000000] y = [0.000000 0.000000]
000006/000006 lambda =     -nan x = [0.000000 0.000000] y = [0.000000 0.000000]

@markusdr , рдпрд╣ рдмрд╣реБрдд рдЕрдЬреАрдм рд╣реИред рдХреНрдпрд╛ рдЖрдк рдмрд╛рдЗрдирд░реА рдмрдирд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдХрджрдо рдкреЛрд╕реНрдЯ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ?

рдХреНрдпрд╛ рдЖрдк рдХрд┐рд╕ GPU рдФрд░ OS рдХреЗ рд╕рд╛рде рдЪрд▓ рд░рд╣реЗ рд╣реИрдВ? рдХреНрдпрд╛ рдЖрдк Cuda 7.0 рдФрд░ Cudnn 6.5 V2 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣реЗ рд╣реИрдВ?

рдПрдбрдмреНрд▓реНрдпреВрдПрд╕ рдкрд░ рдЗрд╕ рд╕рдорд╕реНрдпрд╛ рдХреЛ рдЬрд▓реНрдж рд╕реЗ рдЬрд▓реНрдж рдареАрдХ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдмрд╕ +1 рдХрд░реЗрдВред рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рд╣рдорд╛рд░реЗ рд╢реЛрдз рдХреЗ рд▓рд┐рдП рдХреЛрдИ рдЕрдиреНрдп GPU рдХрд╛рд░реНрдб рдирд╣реАрдВ рд╣реИред

рдирдорд╕реНрддреЗ, рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдирд╣реАрдВ рд╣реИ рдХрд┐ рдпрд╣ рдПрдХ рдЕрд▓рдЧ рдореБрджреНрджрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдореИрдВ рдПрдХ CUDA 3.0 GPU (Geforce 660 Ti) рдХреЗ рд╕рд╛рде рдирд┐рд░реНрдорд╛рдг рдХрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░ рд░рд╣рд╛ рд╣реВрдВ рдФрд░ рдореБрдЭреЗ --config=cuda рдХреЗ рд╕рд╛рде рдХрдИ рддреНрд░реБрдЯрд┐рдпрд╛рдВ рдорд┐рд▓ рд░рд╣реА рд╣реИрдВред рдиреАрдЪреЗ рд╕рдВрд▓рдЧреНрди рдлрд╛рдЗрд▓ рджреЗрдЦреЗрдВред рдпрд╣ рдКрдкрд░ рд╕реБрдЭрд╛рдП рдЧрдП рдкрд░рд┐рд╡рд░реНрддрдиреЛрдВ рд╕реЗ рдЕрд╕рдВрдмрдВрдзрд┐рдд рд▓рдЧрддрд╛ рд╣реИред рдореИрдВрдиреЗ рджреЗрдЦрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдПрдХ рдЕрд╕реНрдерд╛рдпреА рдХрдВрдкреНрдпреВрдЯ_52.cpp1.ii рдлрд╝рд╛рдЗрд▓ рдХреЛ рд╕рдВрдХрд▓рд┐рдд рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░рддрд╛ рд╣реИ рдЬреЛ рдореЗрд░реЗ GPU рдХреЗ рд▓рд┐рдП рдЧрд▓рдд рд╕рдВрд╕реНрдХрд░рдг рд╣реЛрдЧрд╛ред

рдореИрдВ рдЙрдмрдВрдЯреВ 15.10 рдкрд░ рд╣реВрдВред рдореИрдВрдиреЗ рдХреВрдбрд╛ рдореЗрдВ host_config.h рдХреЛ рд╕рдВрд╢реЛрдзрд┐рдд рдХрд┐рдпрд╛ рд╣реИ рдЬрд┐рд╕рдореЗрдВ рдЬреАрд╕реАрд╕реА рдкрд░ рд╕рдВрд╕реНрдХрд░рдг рдЬрд╛рдВрдЪ рдХреЛ рд╣рдЯрд╛рдирд╛ рд╢рд╛рдорд┐рд▓ рд╣реИред рдореИрдВ рдЕрдиреБрд╢рдВрд╕рд┐рдд рдХреЗ рд░реВрдк рдореЗрдВ Cuda 7.0 рдФрд░ cuDNN 6.5 v2 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рд╣реВрдВ, рд╣рд╛рд▓рд╛рдВрдХрд┐ рдореЗрд░реЗ рдкрд╛рд╕ рдирдП рд╕рдВрд╕реНрдХрд░рдг рднреА рд╕реНрдерд╛рдкрд┐рдд рд╣реИрдВред

cuda_build_fail.txt

рд╣рд╛рдБ, рдореИрдВ рдЗрд╕ AIM рдХреЗ рд╕рд╛рде EC2 g2.2xlarge рдЙрджрд╛рд╣рд░рдг рдкрд░ Cuda 7.0 рдФрд░ Cudnn 6.5 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рдерд╛:
cuda_7 - рдПрдореА-12fd8178
рдЙрдмрдВрдЯреВ 14.04, рдЬреАрд╕реАрд╕реА 4.8, рдХреНрдпреВрдбрд╛ 7.0, рдПрдЯрд▓рд╕, рдФрд░ рдУрдкрдирд╕реАрд╡реАред
рдирд┐рд░реНрдорд╛рдг рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рдореИрдВрдиреЗ tensorflow.org рдкрд░ рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рдкрд╛рд▓рди рдХрд┐рдпрд╛ред

рдРрд╕рд╛ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рд╣рдо рдХрдВрдкреНрдпреВрдЯ рдХреНрд╖рдорддрд╛ v3 рдФрд░ рдХрдВрдкреНрдпреВрдЯ рдХреНрд╖рдорддрд╛ v3.5 рдХреЗ рдмреАрдЪ рдПрдХ рдПрдкреАрдЖрдИ рдЕрд╕рдВрдЧрддрддрд╛ рджреЗрдЦ рд░рд╣реЗ рд╣реИрдВ; infojunkie рдХреЗ рдкреИрдЪ рдлрд┐рдХреНрд╕ рдХреЗ рдмрд╛рдж, рдореИрдВ рдЗрд╕ рдореБрджреНрджреЗ рдкрд░ рд╕реНрдЯрдореНрдкреНрдб рд╣реЛ рдЧрдпрд╛

рдореИрдВ tensorflow/core/common_runtime/gpu/gpu_device.cc:643] TensorFlow рдбрд┐рд╡рд╛рдЗрд╕ рдмрдирд╛рдирд╛ (/gpu:0) -> (рдбрд┐рд╡рд╛рдЗрд╕: 0, рдирд╛рдо: Quadro K2100M, pci рдмрд╕ рдЖрдИрдбреА: 0000:01:00.0)
рдореИрдВ tensorflow/core/common_runtime/local_session.cc:45] рд╕реНрдерд╛рдиреАрдп рд╕рддреНрд░ рдЗрдВрдЯрд░ рдСрдк рд╕рдорд╛рдирд╛рдВрддрд░рд╡рд╛рдж рдзрд╛рдЧреЗ: 8
F tensorflow/stream_executor/cuda/cuda_blas.cc:229] рдЬрд╛рдБрдЪ рд╡рд┐рдлрд▓: f != nullptr _cuBLAS DSO_ рдореЗрдВ cublasCreate_v2 рдирд╣реАрдВ рдвреВрдБрдв рд╕рдХрд╛; dlerror: bazel-bin/tensorflow/cc/tutorials_example_trainer: рдЕрдкрд░рд┐рднрд╛рд╖рд┐рдд рдкреНрд░рддреАрдХ: cublasCreate_v2

рдореИрдВ рдЙрдмрдВрдЯреВ 15.04, рдЬреАрд╕реАрд╕реА 4.9.2, рд╕реАрдпреВрдбреАрдП рдЯреВрд▓рдХрд┐рдЯ 7.5, рд╕реАрдпреВрдбреАрдПрди 6.5 рдкрд░ рдЪрд▓рддрд╛ рд╣реВрдВ;

рдЧрдгрдирд╛ рдХреНрд╖рдорддрд╛ v3 рд╕рдорд░реНрдерди рд░рдЦрдиреЗ рдХреЗ рд▓рд┐рдП +1

рдХреНрдпреВрдмрд╕ рд╕реНрдерд╛рдкрд┐рдд рд╣реИ? рдФрд░ рдпрд╣ рдХрд╣рд╛рдВ рд╕реЗ рдЬреБрдбрд╝рд╛ рд╣реИ
рдПрд▓рдПрд╕ -рд▓рд╛рд╣ /usr/рд╕реНрдерд╛рдиреАрдп/cuda/lib64/libcublas.so?

@allanzelener , рдЖрдкрдХреЗ рдкрд╛рд╕ рдХреМрди рд╕реЗ OS рдФрд░ GCC рд╕рдВрд╕реНрдХрд░рдг рд╣реИрдВ? рдЖрдкрдХреА рддреНрд░реБрдЯрд┐рдпрд╛рдБ рдЕрд╕рдВрдЧрдд C++ рдХрдВрдкрд╛рдЗрд▓рд░ рд╕реЗ рдЖрддреА рдкреНрд░рддреАрдд рд╣реЛрддреА рд╣реИрдВред

TensorFlow рдХреЗ рд╕рд╛рде Ubuntu 14.04 рдФрд░ GCC 4.8 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреА рдЕрдиреБрд╢рдВрд╕рд╛ рдХреА рдЬрд╛рддреА рд╣реИред

@vsrikarunyan , рдЕрдиреБрд╢рдВрд╕рд┐рдд рдХреЗ рд░реВрдк рдореЗрдВ CUDA рдЯреВрд▓рдХрд┐рдЯ 7.0 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ рдмреЗрд╣рддрд░ рд╣реИред рдЖрдк рдЕрдкрдиреЗ рдирдП рдЯреВрд▓рдХрд┐рдЯ рдХреЗ рд╕рд╛рде рдПрдХ рдкреБрд░рд╛рдирд╛ CUDA рдЯреВрд▓рдХрд┐рдЯ рд╕реНрдерд╛рдкрд┐рдд рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред рдЬрдм рдЖрдк TensorFlow рдЪрд▓рд╛рддреЗ рд╣реИрдВ, рддреЛ рдмрд╕ TensorFlow "рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд░реЗрдВ" рдФрд░ рд╢рд╛рдпрдж LD_LIBRARY_PATH рдХреЛ CUDA 7.0 рдкрд░ рдЗрдВрдЧрд┐рдд рдХрд░реЗрдВред

@avostryakov , @infojunkie рдХреЗ рд╢реБрд░реБрдЖрддреА рдкреИрдЪ рдХреЛ AWS рдкрд░ рдХрд╛рдо рдХрд░рдирд╛ рдЪрд╛рд╣рд┐рдПред

https://gist.github.com/infojunkie/cb6d1a4e8bf674c6e38e

рдПрдХ рдЖрдзрд┐рдХрд╛рд░рд┐рдХ рдкреИрдЪ рдкрд╛рдЗрдкрд▓рд╛рдЗрди рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдЕрдкрдирд╛ рдХрд╛рдо рдХрд░ рд░рд╣рд╛ рд╣реИред рдпрд╣ рдЖрдкрдХреЛ рдЕрдкрдирд╛ рдЧрдгрдирд╛ рд▓рдХреНрд╖реНрдп рдЪреБрдирдиреЗ рджреЗрдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди рд╡рд┐рдХрд▓реНрдк рдХреЛ рдЙрдЬрд╛рдЧрд░ рдХрд░реЗрдЧрд╛ред рд▓реЗрдХрд┐рди рдиреАрдЪреЗ, рдпрд╣ рд╕рдорд╛рди рдкрд░рд┐рд╡рд░реНрддрди рдХрд░рддрд╛ рд╣реИред рдореИрдВрдиреЗ рдЗрд╕реЗ AWS g2 рдкрд░ рдЖрдЬрд╝рдорд╛рдпрд╛ рд╣реИ, рдФрд░ рдЬрдм рдореИрдВ NVIDIA рдбреНрд░рд╛рдЗрд╡рд░ рдХреЛ рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдЕрдирдЗрдВрд╕реНрдЯреЙрд▓ рдХрд░ рджреВрдВ, рдФрд░ NVIDIA рд╕реЗ рдирд╡реАрдирддрдо GPU рдбреНрд░рд╛рдЗрд╡рд░ рдХреЛ рдкреБрдирд░реНрд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж рдкрддрд╛ рд▓рдЧрд╛рдКрдВрдЧрд╛ рдХрд┐ рдЪреАрдЬреЗрдВ рдХрд╛рдо рдХрд░реЗрдВрдЧреАред

рдПрдХ рдмрд╛рд░ рдлрд┐рд░, рдЗрд╕ рдмрд┐рдВрджреБ рдкрд░ AWS рдкрд░ рдЕрдиреБрд╢рдВрд╕рд┐рдд рд╕реЗрдЯрд┐рдВрдЧ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╣реИред
рдЙрдмрдВрдЯреВ 14.04, рдЬреАрд╕реАрд╕реА 4.8, CUDA рдЯреВрд▓рдХрд┐рдЯ 7.0 рдФрд░ CUDNN 6.5ред рдкрд┐рдЫрд▓реЗ рджреЛ рдХреЗ рд▓рд┐рдП, рдЕрдиреНрдп рд╕рдВрд╕реНрдХрд░рдгреЛрдВ рдХреА рдЖрдкрдХреА рдореМрдЬреВрджрд╛ рд╕реНрдерд╛рдкрдирд╛ рдХреЛ рдкреНрд░рднрд╛рд╡рд┐рдд рдХрд┐рдП рдмрд┐рдирд╛ рдЙрдиреНрд╣реЗрдВ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдирд╛ рдареАрдХ рд╣реИред рд╕рд╛рде рд╣реА рдЕрдВрддрд┐рдо рджреЛ рдХреЗ рд▓рд┐рдП рдЖрдзрд┐рдХрд╛рд░рд┐рдХ рдЕрдиреБрд╢рдВрд╕рд┐рдд рд╕рдВрд╕реНрдХрд░рдг рднреА рдЬрд▓реНрдж рд╣реА рдмрджрд▓ рд╕рдХрддреЗ рд╣реИрдВред

рдореИрдВрдиреЗ рдПрдХ рд╣реА рдкреИрдЪ рдХреЛ g2.2xlarge рдЗрдВрд╕реНрдЯреЗрдВрд╕ рдкрд░ рд▓рд╛рдЧреВ рдХрд┐рдпрд╛ рдФрд░ @markusdr... рдирд╛рди рдХрд╛ рдПрдХ рдЧреБрдЪреНрдЫрд╛ рдЬреИрд╕рд╛ рд╣реА рдкрд░рд┐рдгрд╛рдо рдорд┐рд▓рд╛ред

@ рдЭреЗрдВрдЧ-рдПрдХреНрд╕рдХреНрдпреВ рд╣рд╛рдВ, рдореИрдВ рдЙрдмрдВрдЯреВ 15.10 рдкрд░ рд╣реВрдВ рдФрд░ рдореИрдВ рдЬреАрд╕реАрд╕реА 5.2.1 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рдерд╛ред рдореБрджреНрджрд╛ рд╕рдВрдХрд▓рдХ рдерд╛ред рдореИрдВ рд╕рдордЭ рдирд╣реАрдВ рдкрд╛рдпрд╛ рдХрд┐ рдХрдВрдкрд╛рдЗрд▓рд░ рдХреЛ рдмреЗрдЬрд╝рд▓ рдХреЗ рд╕рд╛рде рдХреИрд╕реЗ рдмрджрд▓рд╛ рдЬрд╛рдП, рд▓реЗрдХрд┐рди рдмрд╕ gcc-4.8 рдЗрдВрд╕реНрдЯреЙрд▓ рдХрд░рдирд╛ рдФрд░ usr/bin рдореЗрдВ рд╕рд┐рдореНрд▓рд┐рдВрдХ рдмрджрд▓рдиреЗ рдХреЗ рд▓рд┐рдП рдЕрдкрдбреЗрдЯ-рд╡рд┐рдХрд▓реНрдк рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред (рдЕрдзрд┐рдХ рдЬрд╛рдирдХрд╛рд░реА: http://askubuntu.com/questions/26498/choose-gcc-and-g-version)ред рдорджрдж рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж, рдЕрдЧрд░ рдореБрдЭреЗ рдХреЛрдИ рдФрд░ рд╕рдорд╕реНрдпрд╛ рдЖрддреА рд╣реИ рддреЛ рдореИрдВ рд╡рд╛рдкрд╕ рд░рд┐рдкреЛрд░реНрдЯ рдХрд░реВрдВрдЧрд╛ред

рдореБрдЭреЗ рдпрд╣ g2.2xlarge рдЗрдВрд╕реНрдЯреЗрдВрд╕ рдкрд░ рдХрд╛рдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдорд┐рд▓рд╛ рдФрд░ рдЪрд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдЙрджрд╛рд╣рд░рдг рдорд┐рд▓рд╛, рдФрд░ рд╕рддреНрдпрд╛рдкрд┐рдд рдХрд┐рдпрд╛ рдХрд┐ gpu nvidia-smi рдЯреВрд▓ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рд╕рдХреНрд░рд┐рдп рдерд╛, рд▓реЗрдХрд┐рди mnist's convolutional.py рдЪрд▓рд╛рддреЗ рд╕рдордп, рдпрд╣ рд╕реНрдореГрддрд┐ рд╕реЗ рдмрд╛рд╣рд░ рд╣реЛ рдЧрдпрд╛ред рдореБрдЭреЗ рд╕рдВрджреЗрд╣ рд╣реИ рдХрд┐ рдпрд╣ рд╕рд┐рд░реНрдл рдмреИрдЪ рдЖрдХрд╛рд░ рдФрд░ рддрдереНрдп рдпрд╣ рд╣реИ рдХрд┐ aws gpus рдореЗрдВ рдмрд╣реБрдд рдЕрдзрд┐рдХ рдореЗрдореЛрд░реА рдирд╣реАрдВ рд╣реИ, рд▓реЗрдХрд┐рди рдпрд╣ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐ рдпрд╣ рд╕рд╣реА рд▓рдЧрддрд╛ рд╣реИ, рдЗрд╕реЗ рд╡рд╣рд╛рдВ рдлреЗрдВрдХрдирд╛ рдЪрд╛рд╣рддрд╛ рдерд╛ред рд╕реНрдкрд╖реНрдЯ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рдореИрдВрдиреЗ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдХреЛ рдЪрд▓рд╛рдпрд╛, рдФрд░ рдпрд╣ 15 рдорд┐рдирдЯ рддрдХ рдЪрд▓рд╛, рдФрд░ рдлрд┐рд░ рд╕реНрдореГрддрд┐ рд╕реЗ рдмрд╛рд╣рд░ рд╣реЛ рдЧрдпрд╛ред

рдЕрдЬрдЧрд░ tensorflow/рдореЙрдбрд▓/рдЫрд╡рд┐/mnist/convolutional.py

@nbenhaim , рдЗрд╕реЗ рдХрд╛рдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЖрдкрдХреЛ рдмрд╕ рдХреНрдпрд╛ рдХрд░рдирд╛ рд╣реИ?

@markusdr , @jbencook , NAN рдХрд╛рдлреА рдкрд░реЗрд╢рд╛рди рдХрд░рдиреЗ рд╡рд╛рд▓рд╛ рд╣реИред рдореИрдВрдиреЗ рдЦреБрдж рд╡рд╣реА рдХрд╛рдо рдЪрд▓рд╛рдпрд╛, рдФрд░ рдореБрдЭреЗ рдХреЛрдИ рд╕рдорд╕реНрдпрд╛ рдирд╣реАрдВ рд╣реБрдИред

рдпрджрд┐ рдЖрдк рдЕрдиреБрд╢рдВрд╕рд┐рдд рд╕реЙрдлрд╝реНрдЯрд╡реЗрдпрд░ рд╕реЗрдЯрд┐рдВрдЧ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВ: Ubuntu 14.04, GCC 4.8, Cuda 7.0 рдФрд░ Cudnn 6.5, рддреЛ рдореЗрд░рд╛ рдЕрдЧрд▓рд╛ рдЕрдиреБрдорд╛рди Cuda рдбреНрд░рд╛рдЗрд╡рд░ рд╣реИред рдХреНрдпрд╛ рдЖрдк рдирд╡реАрдирддрдо рдХреНрдпреВрдбрд╛ рдбреНрд░рд╛рдЗрд╡рд░ рдХреЛ рдЕрдирдЗрдВрд╕реНрдЯреЙрд▓ рдФрд░ рдкреБрдирд░реНрд╕реНрдерд╛рдкрд┐рдд рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред

рдпрд╣ рд╡рд╣ рдХреНрд░рдо рд╣реИ рдЬрд┐рд╕реЗ рдореИрдВрдиреЗ AWS рдкрд░ рдЖрдЬрд╝рдорд╛рдпрд╛ рдерд╛, рдЖрдкрдХрд╛ рдорд╛рдЗрд▓реЗрдЬ рднрд┐рдиреНрди рд╣реЛ рд╕рдХрддрд╛ рд╣реИ:

sudo apt-get remove --purge "nvidia*"
wget http://us.download.nvidia.com/XFree86/Linux-x86_64/352.55/NVIDIA-Linux-x86_64-352.55.run
sudo ./NVIDIA-Linux-x86_64-352.55.run --accept-license --no-x-check --no-recursion

@ рдЭреЗрдВрдЧ-рдПрдХреНрд╕рдХреНрдпреВ рдХрд╛ рдЕрдиреБрд╕рд░рдг рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж - рдореИрдВ рдЖрдЬ рдЗрд╕реЗ рдПрдХ рд╢реЙрдЯ рджреВрдВрдЧрд╛ред

рдкреНрд░реА-3.5 рдЬреАрдкреАрдпреВ рдХрд╛ рд╕рдорд░реНрдерди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдФрд░ +1, рдХрд┐рд╕реА рдФрд░ рдХреЗ рд░реВрдк рдореЗрдВ рдЬрд┐рд╕рдХрд╛ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдбреЗрдЯрд╛ рдкрд░ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХреЗ рд▓рд┐рдП рдПрдХрдорд╛рддреНрд░ рдпрдерд╛рд░реНрдерд╡рд╛рджреА рд╡рд┐рдХрд▓реНрдк рдПрдбрдмреНрд▓реНрдпреВрдПрд╕ рдЬреАрдкреАрдпреВ рдЗрдВрд╕реНрдЯреЗрдВрд╕ рд╣реИред

рд╕реНрдерд╛рдиреАрдп рдкрд░реАрдХреНрд╖рдг рдХреЗ рд▓рд┐рдП рднреА, рдореЗрд░реЗ (рд╣рд╛рд▓рд┐рдпрд╛, рдбреЗрд╡рд▓рдкрд░) рд▓реИрдкрдЯреЙрдк рдХрд╛ GPU 3.5 рдХрд╛ рд╕рдорд░реНрдерди рдирд╣реАрдВ рдХрд░рддрд╛ рд╣реИ :-(

@anjishnu рдореИрдВрдиреЗ рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рдкрд╛рд▓рди рдХрд░рдХреЗ рдХреНрд▓реАрди рдЗрдВрд╕реНрдЯрд╛рд▓ рдФрд░ рдмрд┐рд▓реНрдб рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж @infojunkie рдХреЗ рдкреИрдЪ https://gist.github.com/infojunkie/cb6d1a4e8bf674c6e38e рдХрд╛ рдЕрдиреБрд╕рд░рдг рдХрд┐рдпрд╛ред

рдХреБрдЫ рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ - рдореИрдВ рдЬрд┐рд╕ AMI рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рдерд╛ рдЙрд╕рдореЗрдВ NVIDIA cuda рдЯреВрд▓рдХрд┐рдЯ 6.5 рд╕реНрдерд╛рдкрд┐рдд рдерд╛, рдЗрд╕рд▓рд┐рдП рдЬрдм рдореИрдВрдиреЗ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдЧреЗрдЯрд┐рдВрдЧ рдЧрд╛рдЗрдб рдореЗрдВ рд▓рд┐рдВрдХ рдХрд╛ рдЕрдиреБрд╕рд░рдг рдХрд┐рдпрд╛, рддреЛ рдореИрдВрдиреЗ ubuntu 14.04 рдХреЗ рд▓рд┐рдП 7.0 .run рдлрд╝рд╛рдЗрд▓ рдбрд╛рдЙрдирд▓реЛрдб рдХреА, рдбреНрд░рд╛рдЗрд╡рд░ рдХреЛ рдЕрдкрдЧреНрд░реЗрдб рдХрд┐рдпрд╛, рдФрд░ cuda 7.0 рдХреЛ рдЗрдирд╕реНрдЯреЙрд▓ рдХрд┐рдпрд╛ред /usr/рд▓реЛрдХрд▓/рдХреНрдпреВрдбрд╛-7.0/usr/рд▓реЛрдХрд▓/рдХреНрдпреВрдбрд╛ рдХреЗ рд▓рд┐рдП рдПрдХ рд╕рд┐рдорд▓рд┐рдВрдХ рдмрдирд╛рдП рдмрд┐рдирд╛ рдХреНрдпреЛрдВрдХрд┐ рдореЗрд░реЗ рдкрд╛рд╕ рдкрд╣рд▓реЗ рд╕реЗ рд╣реА 6.5 рд╕реНрдерд╛рдкрд┐рдд рдерд╛ рдФрд░ рдореИрдВ рдЗрд╕реЗ рдорд╛рд░рдирд╛ рдирд╣реАрдВ рдЪрд╛рд╣рддрд╛ рдерд╛

рдлрд┐рд░, рдирд┐рд░реНрдорд╛рдг рдХрд░рддреЗ рд╕рдордп рдореИрдВрдиреЗ рдЕрднреА cuda 7.0 рдХрд╛ рд╕рд╣реА рд╕реНрдерд╛рди рдирд┐рд░реНрджрд┐рд╖реНрдЯ рдХрд┐рдпрд╛ рд╣реИред рдПрдХ рднреНрд░рдорд┐рдд рдХрд░рдиреЗ рд╡рд╛рд▓реА рдмрд╛рдд рдпрд╣ рд╣реИ рдХрд┐ рдЕрдЬрдЧрд░ рдкреБрд╕реНрддрдХрд╛рд▓рдп рдХрд╛ рдирд┐рд░реНрдорд╛рдг рдХрд░рддреЗ рд╕рдордп, рдЯреНрдпреВрдЯреЛрд░рд┐рдпрд▓ рдЖрдкрдХреЛ --config=cuda рдирд┐рд░реНрджрд┐рд╖реНрдЯ рдХрд░рдиреЗ рдХреА рдпрд╛рдж рдирд╣реАрдВ рджрд┐рд▓рд╛рддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдЖрдкрдХреЛ рдпрд╣ рдХрд░рдирд╛ рд╣реЛрдЧрд╛ рдХрд┐ рдпрджрд┐ рдЖрдк рдЪрд╛рд╣рддреЗ рд╣реИрдВ рдХрд┐ рдЕрдЬрдЧрд░ рдХрд╛ рдЙрдкрдпреЛрдЧ gpu

@markusdr , @jbencook , рдореБрдЭреЗ рдПрдХ NaN рдФрд░ рд╕рднреА рдкреНрд░рдХрд╛рд░ рдХреЗ рдЧрдбрд╝рдмрдбрд╝ рдореВрд▓реНрдп рдорд┐рд▓реЗ, рд╕рд╛рде рд╣реА рдЬрдм рдореИрдВрдиреЗ рд╢реБрд░реБрдЖрдд рдореЗрдВ рдкреИрдЪ рд▓рдЧрд╛рдпрд╛, рд▓реЗрдХрд┐рди рдХреНрдпрд╛ рддрдп рдХрд┐рдпрд╛ рдХрд┐ рдпрд╣ "рдмреЗрдЬрд╝рд▓ рдХреНрд▓реАрди" рдХрд░ рд░рд╣рд╛ рдерд╛ рдФрд░ рдкреНрд░рд╕реНрддрд╛рд╡рд┐рдд рдкрд░рд┐рд╡рд░реНрддрдиреЛрдВ рдХреЛ @infojunkie рдореЗрдВ рдЙрд▓реНрд▓рд┐рдЦрд┐рдд рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж рдЦрд░реЛрдВрдЪ рд╕реЗ рдкреБрдирд░реНрдирд┐рд░реНрдорд╛рдг рдХрд░ рд░рд╣рд╛ рдерд╛ред рдХрд╛ рдкреИрдЪред рдХреНрдпрд╛ рдЖрдкрдиреЗ рдпрд╣ рдХреЛрд╢рд┐рд╢ рдХреА?

рджрд┐рд▓рдЪрд╕реНрдк... рдирд╣реАрдВ, рдореБрдЭреЗ рдЕрднреА рддрдХ рдореМрдХрд╛ рдирд╣реАрдВ рдорд┐рд▓рд╛ рд╣реИред рдХреНрдпрд╛ рдЖрдкрдиреЗ CNN рдХреЛ рдЧреЗрдЯрд┐рдВрдЧ рд╕реНрдЯрд╛рд░реНрдЯреЗрдб рдЧрд╛рдЗрдб рд╕реЗ рдЪрд▓рд╛рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХреА?

python tensorflow/models/image/mnist/convolutional.py

рдпрд╣ рдЬрд╛рдирдиреЗ рдХреЗ рд▓рд┐рдП рдЙрддреНрд╕реБрдХ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рдпрд╣ рд╕рд╣реА рддрд░реАрдХреЗ рд╕реЗ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред

@jbencook рдЬреИрд╕рд╛ рдХрд┐ рдореИрдВрдиреЗ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рд╣реИ, convolutional.py рд╕рд╣реА рдврдВрдЧ рд╕реЗ рдЪрд▓рдиреЗ рд▓рдЧрддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди 15 рдорд┐рдирдЯ рдХреЗ рдмрд╛рдж рдпрд╣ рд╕реНрдореГрддрд┐ рд╕реЗ рдмрд╛рд╣рд░ рд╣реЛрдиреЗ рдХреЗ рдХрд╛рд░рдг рджреБрд░реНрдШрдЯрдирд╛рдЧреНрд░рд╕реНрдд рд╣реЛ рдЬрд╛рддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдЖрдЙрдЯрдкреБрдЯ рд╕рд╣реА рджрд┐рдЦрддрд╛ рд╣реИ рдФрд░ рдореИрдВрдиреЗ рдпрд╣ рд╕рддреНрдпрд╛рдкрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП nvidia-smi рдХреЗ рдЯреВрд▓ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рд╣реИ рдХрд┐ рдпрд╣ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ GPU рдкрд░ рдЪрд▓ рд░рд╣рд╛ рд╣реИ рдФрд░ рдпрд╣ рд╣реИред рдореБрдЭреЗ рд╕рдВрджреЗрд╣ рд╣реИ рдХрд┐ рдРрд╕рд╛ рдЗрд╕рд▓рд┐рдП рд╣реИ рдХреНрдпреЛрдВрдХрд┐ рдмреИрдЪ рдЖрдХрд╛рд░ ... рдореБрдЭреЗ рдкрддрд╛ рд╣реИ рдХрд┐ рдИрд╕реА 2 рдкрд░ рдЬреАрдкреАрдпреВ рдореЗрдВ рдЗрддрдиреА рдореЗрдореЛрд░реА рдирд╣реАрдВ рд╣реИ, рд▓реЗрдХрд┐рди рдореИрдВ рдЗрд╕ рд╕рдордп рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдЕрдирд┐рд╢реНрдЪрд┐рдд рд╣реВрдВ рдХрд┐ рдпрд╣ рд╕реНрдореГрддрд┐ рд╕реЗ рдмрд╛рд╣рд░ рдХреНрдпреЛрдВ рд╣реЛ рдЧрдпрд╛

рдПрдХ GeForce GTX 780 Ti рдкрд░, рдореЗрд░реЗ рд▓рд┐рдП рднреА Convolutional.py рдЙрджрд╛рд╣рд░рдг GPU рдореЗрдореЛрд░реА рд╕реЗ рдмрд╛рд╣рд░ рдЪрд▓рд╛ рдЧрдпрд╛ред

рдореИрдВ рдмрд╣реБрдд рджрд░реНрдж рдХреЗ рдмрд╛рдж рдЗрд╕реЗ рдПрдбрдмреНрд▓реНрдпреВрдПрд╕ рдкрд░ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдерд╛ред рджреЗрдЦреЗрдВ https://gist.github.com/erikbern/78ba519b97b440e10640 - рдореИрдВрдиреЗ рдПрдХ AMI рднреА рдмрдирд╛рдпрд╛: ami-cf5028a5 (рд╡рд░реНрдЬреАрдирд┐рдпрд╛ рдХреНрд╖реЗрддреНрд░ рдореЗрдВ)

рдпрд╣ g2.2xlarge рдФрд░ g2.8xlarge рдкрд░ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ рдФрд░ рдпрд╣ рдбрд┐рд╡рд╛рдЗрд╕ рдХреЛ рд╕рд╣реА рддрд░реАрдХреЗ рд╕реЗ рдбрд┐рдЯреЗрдХреНрдЯ рдХрд░рддрд╛ рд╣реИ (рдХреНрд░рдорд╢рдГ 1 рдФрд░ 4)ред рд╣рд╛рд▓рд╛рдБрдХрд┐ рдореБрдЭреЗ g2.8xlarge рдкрд░ 4 GPU рдХрд╛рд░реНрдб рд╕реЗ рдХреЛрдИ рд╕реНрдкреАрдбрдЕрдк рдирд╣реАрдВ рджрд┐рдЦ рд░рд╣рд╛ рд╣реИред рджреЛрдиреЛрдВ рдорд╢реАрдиреЗрдВ рдХрдИ GPU рдХреЗ рд╕рд╛рде CIFAR 10 рдЙрджрд╛рд╣рд░рдг рдЪрд▓рд╛рдиреЗ рд╡рд╛рд▓реЗ рд▓рдЧрднрдЧ 330 рдЙрджрд╛рд╣рд░рдг/рд╕реЗрдХрдВрдб рдХреА рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдХрд░рддреА рд╣реИрдВред рдПрдордПрдирдЖрдИрдПрд╕рдЯреА рджреГрдврд╝ рдЙрджрд╛рд╣рд░рдг рдкрд░ рднреА рдмрд╣реБрдд рд╕рдорд╛рди рдкреНрд░рджрд░реНрд╢рдиред рдпрд╣ рд▓рдЧрднрдЧ 15 рдорд┐рдирдЯ рдХреЗ рдмрд╛рдж "GPU рдореЗрдореЛрд░реА рд╕реЗ рдмрд╛рд╣рд░, рдореЗрдореЛрд░реА рд╕реНрдЯреЗрдЯ рдбрдВрдк рдКрдкрд░ рджреЗрдЦреЗрдВ" рдХреЗ рд╕рд╛рде рдХреНрд░реИрд╢ рд╣реЛ рдЬрд╛рддрд╛ рд╣реИ, рдЬреИрд╕рд╛ рдХрд┐ рдХреБрдЫ рдЕрдиреНрдп рд▓реЛрдЧреЛрдВ рдиреЗ рдКрдкрд░ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рд╣реИ

рдореИрдВрдиреЗ рд▓рдЧрднрдЧ рдПрдХ рдШрдВрдЯреЗ рдХреЗ рд▓рд┐рдП рд╕реАрдЖрдИрдПрдлрдПрдЖрд░ рдЙрджрд╛рд╣рд░рдг рдЪрд▓рд╛рдпрд╛ рд╣реИ рдФрд░ рдРрд╕рд╛ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдЕрдм рддрдХ рдХрд╛рдлреА рдЕрдЪреНрдЫреА рддрд░рд╣ рд╕реЗ рдЪрд┐рдкрдХ рдЧрдпрд╛ рд╣реИ

Cuda 3.0 рдбрд┐рд╡рд╛рдЗрд╕ рдХреЗ рдирд┐рд░реНрдорд╛рдг рдХреЗ рд▓рд┐рдП, рдпрджрд┐ рдЖрдк рдирд╡реАрдирддрдо TensorFlow рдХреЛрдб рдХреЛ рд╕рд┐рдВрдХ рдХрд░рддреЗ рд╣реИрдВ, рддреЛ рдЖрдк рдирд┐рдореНрди рдХрд╛рд░реНрдп рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред рдЖрдзрд┐рдХрд╛рд░рд┐рдХ рджрд╕реНрддрд╛рд╡реЗрдЬ рдЬрд▓реНрдж рд╣реА рдЕрдкрдбреЗрдЯ рд╣реЛ рдЬрд╛рдПрдЧрд╛ред рд▓реЗрдХрд┐рди рдпрд╣ рдРрд╕рд╛ рджрд┐рдЦрддрд╛ рд╣реИ:

$ TF_UNOFFICIAL_SETTING=1 ./configure

... рдКрдкрд░ рдХреА рдЖрдзрд┐рдХрд╛рд░рд┐рдХ рд╕реЗрдЯрд┐рдВрдЧреНрд╕ рдХреЗ рд╕рдорд╛рди

рдЪреЗрддрд╛рд╡рдиреА: рдЖрдк TensorFlow рдореЗрдВ рдЕрдиреМрдкрдЪрд╛рд░рд┐рдХ рд╕реЗрдЯрд┐рдВрдЧ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд░ рд░рд╣реЗ рд╣реИрдВред рдХреНрдпреЛрдВрдХрд┐ рдХреБрдЫ
рдмрд╛рд╣рд░реА рдкреБрд╕реНрддрдХрд╛рд▓рдп рдкрд┐рдЫрдбрд╝реЗ рд╕рдВрдЧрдд рдирд╣реАрдВ рд╣реИрдВ, рдпреЗ рд╕реЗрдЯрд┐рдВрдЧреНрд╕ рдХрд╛рдлреА рд╣рдж рддрдХ рд╣реИрдВ
рдкрд░реАрдХреНрд╖рдг рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдФрд░ рдЕрд╕рдорд░реНрдерд┐рддред

рдХреГрдкрдпрд╛ рдХреЙрдорд╛-рд╕реЗрдкрд░реЗрдЯреЗрдб рдХреВрдбрд╛ рдХрдВрдкреНрдпреВрдЯ рдХреНрд╖рдорддрд╛рдУрдВ рдХреА рдПрдХ рд╕реВрдЪреА рдирд┐рд░реНрджрд┐рд╖реНрдЯ рдХрд░реЗрдВ рдЬреЛ рдЖрдк рдХрд░рдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВ
рдХреЗ рд╕рд╛рде рдирд┐рд░реНрдорд╛рдгред рдЖрдк рдЕрдкрдиреЗ рдбрд┐рд╡рд╛рдЗрд╕ рдХреА рдЧрдгрдирд╛ рдХреНрд╖рдорддрд╛ рдпрд╣рд╛рдВ рдкрд╛ рд╕рдХрддреЗ рд╣реИрдВ:
https://developer.nvidia.com/cuda-gpusред
рдХреГрдкрдпрд╛ рдзреНрдпрд╛рди рджреЗрдВ рдХрд┐ рдкреНрд░рддреНрдпреЗрдХ рдЕрддрд┐рд░рд┐рдХреНрдд рдЧрдгрдирд╛ рдХреНрд╖рдорддрд╛ рдХрд╛рдлреА рдмрдврд╝ рдЬрд╛рддреА рд╣реИ
рдЖрдкрдХрд╛ рдирд┐рд░реНрдорд╛рдг рд╕рдордп рдФрд░ рдмрд╛рдЗрдирд░реА рдЖрдХрд╛рд░ред [рдбрд┐рдлрд╝реЙрд▓реНрдЯ рд╣реИ: "3.5,5.2"]: 3.0

рдХреБрдбрд╛ рдХреА рд╕реНрдерд╛рдкрдирд╛ рдореЗрдВ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ
рдХреБрдбрд╛ lib64 рдХреА рд╕реНрдерд╛рдкрдирд╛
рдХреБрдбрд╛ рдмрд┐рди рдХреА рд╕реНрдерд╛рдкрдирд╛
рдХреБрдбрд╛ nvvm . рдХреА рд╕реНрдерд╛рдкрдирд╛
рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди рд╕рдорд╛рдкреНрдд

@nbenhaim @markusdr

рд╕реНрдореГрддрд┐ рдХреА рд╕рдорд╕реНрдпрд╛ рдЗрд╕ рддрдереНрдп рдХреЗ рдХрд╛рд░рдг рд╣реЛ рд╕рдХрддреА рд╣реИ рдХрд┐ convolutional.py рдкреВрд░реЗ рдкрд░реАрдХреНрд╖рдг рдбреЗрдЯрд╛рд╕реЗрдЯ (10000) рдЙрджрд╛рд╣рд░рдгреЛрдВ рдкрд░ рдореВрд▓реНрдпрд╛рдВрдХрди рдЪрд▓рд╛рддрд╛ рд╣реИред рдпрд╣ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рд╕рдорд╛рдкреНрдд рд╣реЛрдиреЗ рдХреЗ рдмрд╛рдж рд╣реЛрддрд╛ рд╣реИ, рдЕрдВрддрд┐рдо рдЪрд░рдг рдХреЗ рд░реВрдк рдореЗрдВ:

https://github.com/tensorflow/tensorflow/blob/master/tensorflow/models/image/mnist/convolutional.py#L266

рдХреНрдпрд╛ рдЖрдк рдЫреЛрдЯрд╛ рдХрд░рдиреЗ рдХреЗ train_data рдФрд░ test_labels рдХреЛ рдЫреЛрдЯрд╛ рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ?

рдореИрдВ рдкреБрд╖реНрдЯрд┐ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ рдХрд┐ @erikbern рдХреА рдЗрдВрд╕реНрдЯреЙрд▓ рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдФрд░ рдирд╡реАрдирддрдо TensorFlow рдорд╛рд╕реНрдЯрд░ рд╢рд╛рдЦрд╛ рдХреЗ рд╕рд╛рде cifar10_multi_gpu_train.py GPU рдкрд░ рдЕрдкреЗрдХреНрд╖рд┐рдд рд░реВрдк рд╕реЗ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ:

step 100, loss = 4.49 (330.8 examples/sec; 0.387 sec/batch)

рд╣рд╛рд▓рд╛рдВрдХрд┐ рдХреЛрдб рдореЗрдВ рдмрджрд▓рд╛рд╡ рдХреЗ рдХрд╛рд░рдг рдпрд╣ рд▓рд╛рдЗрди рдЕрдм рдЯреВрдЯ рдЧрдИ рд╣реИред

рдЗрд╕рдХреЗ рдЕрд▓рд╛рд╡рд╛ рдЕрдЧрд░ рдореИрдВ 1000 рдкрд░реАрдХреНрд╖рдг рдирдореВрдиреЗ рд▓реЗрддрд╛ рд╣реВрдВ рддреЛ convolutional.py рдЙрджрд╛рд╣рд░рдг рднреА рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред

рд╕рдВрдкрд╛рджрд┐рдд рдХрд░реЗрдВ: bazel-bin/tensorflow/cc/tutorials_example_trainer --use_gpu рдЙрджрд╛рд╣рд░рдг рдореБрдЭреЗ рдиреИрди рдХрд╛ рдПрдХ рдЧреБрдЪреНрдЫрд╛ рджрд┐рдП рдмрд┐рдирд╛ рднреА рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред

рдореИрдВ рдкреБрд╖реНрдЯрд┐ рдХрд░рддрд╛ рд╣реВрдВ рдХрд┐ рдирд╡реАрдирддрдо рдмрд┐рд▓реНрдб рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдЧрдгрдирд╛ рдХреНрд╖рдорддрд╛ рдирд┐рд░реНрджрд┐рд╖реНрдЯ рдХрд░рдиреЗ рдХрд╛ рд╕рдорд░реНрдерди рдХрд░рддрд╛ рд╣реИ
$ TF_UNOFFICIAL_SETTING=1 ./configure
рдПрдХ рдкреИрдЪ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рдХреЗ рдмрд┐рдирд╛ред рдзрдиреНрдпрд╡рд╛рдж!

рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдЗрд╕ рдореБрджреНрджреЗ рдХреЛ рдмрдВрдж рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ, рдЬрдм рддрдХ рдХрд┐ рдХрд┐рд╕реА рдХреЛ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдХрд╛рд░реНрдп рдХрд╛ рд╕рд╛рдордирд╛ рдирд╣реАрдВ рдХрд░рдирд╛ рдкрдбрд╝рддрд╛ рд╣реИ рдЬреЛ рдХреБрдбрд╛ <3.5 рдХреЗ рд▓рд┐рдП рд╡рд┐рдлрд▓ рд░рд╣рддрд╛ рд╣реИред

рдЕрд╕рд▓ рдореЗрдВ, рдореБрдЭреЗ рдЗрд╕реЗ рд╡рд╛рдкрд╕ рд▓реЗрдиреЗ рджреЗрдВ :-) ./configure рд╕реНрдХреНрд░рд┐рдкреНрдЯ рд╣рд╛рде рд╕реЗ рдирд┐рд░реНрджрд┐рд╖реНрдЯ рдХреНрдпреВрдбрд╛ рд╕рдВрд╕реНрдХрд░рдгреЛрдВ рдХреЗ рд╕рд╛рде рдкреНрд░рд╛рд╕рдВрдЧрд┐рдХ рд▓рд╛рдЗрдиреЛрдВ рдХреЛ рдмрджрд▓рдХрд░ рд╕реНрд░реЛрдд рдХреЛрдб рдХреЛ рд╕рдВрд╢реЛрдзрд┐рдд рдХрд░рддреА рд╣реИред рдлрд┐рд░ рдЧрд┐рдЯ рдЕрдкреНрд░рддрд┐рдмрджреНрдз рдкрд░рд┐рд╡рд░реНрддрдиреЛрдВ рдХреА рд░рд┐рдкреЛрд░реНрдЯ рдХрд░рддрд╛ рд╣реИ рдФрд░ рдЗрд╕ рдХреЛрдбрдмреЗрд╕ рдХреЗ рд╕рд╛рде рдкрд░рд┐рд╡рд░реНрддрди рдХреЛ рд╡рд╛рдкрд╕ рдХрд┐рдП рдмрд┐рдирд╛ рдХрд╛рдо рдХрд░рдирд╛ рдмрд╣реБрдд рдореБрд╢реНрдХрд┐рд▓ рд╣реЛ рдЬрд╛рддрд╛ рд╣реИ, git pull рдЖрдИрдПрдирдЬреА, рдФрд░ рдлрд┐рд░ рд╕реЗ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд░рдирд╛, рдпреЛрдЧрджрд╛рди рдЬрдорд╛ рдХрд░рдиреЗ рдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдирд╣реАрдВ рдХрд░рдирд╛ред

рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди рдлрд╝рд╛рдЗрд▓ рд╕реЗ рдЙрди рд╕рдВрд╕реНрдХрд░рдг рд╕реЗрдЯрд┐рдВрдЧреНрд╕ рдХреЛ рдкрдврд╝рдиреЗ рдХрд╛ рдПрдХ рдмреЗрд╣рддрд░ рддрд░реАрдХрд╛ рд╣реЛрдЧрд╛ред

рдКрдкрд░ рдПрд░рд┐рдХрдмрд░реНрди рдФрд░ рдЙрд╕рдХрд╛ рдПрдПрдордЖрдИ рдореЗрд░реЗ рд▓рд┐рдП рд╕рд┐рдлрд░ рдХреЗ рд▓рд┐рдП рдХрд╛рдо рдХрд░ рд░рд╣рд╛ рд╣реИ - ami-cf5028a5

рдбреЙрдХрдЯрд░ рдкрд░ рдореЗрд░реЗ i7 рд╡рд┐рдВрдбреЛрдЬрд╝ рдмреЙрдХреНрд╕ рдмрдирд╛рдо ~ 320 рдирдореВрдиреЗ рдкреНрд░рддрд┐ рд╕реЗрдХрдВрдб рдкреНрд░рд╛рдкреНрдд рдХрд░рдирд╛ рдЬреЛ cifar10_train.py рдХреЗ рд▓рд┐рдП рдкреНрд░рддрд┐ рд╕реЗрдХрдВрдб ~ 105 рдирдореВрдиреЗ рдкреНрд░рд╛рдкреНрдд рдХрд░рддрд╛ рд╣реИ

@infojunkie : рд╣рд╛рдБ, рдпрд╣ рдЖрджрд░реНрд╢ рдирд╣реАрдВ рд╣реИ (@ рдЭреЗрдВрдЧ-рдПрдХреНрд╕рдХреНрдпреВ рдФрд░ рдореИрдВрдиреЗ рд╕рдореАрдХреНрд╖рд╛ рдХреЗ рджреМрд░рд╛рди рдЗрд╕ рдкрд░ рдереЛрдбрд╝реА рдЪрд░реНрдЪрд╛ рдХреА!)

рд╣рдо рдЗрд╕реЗ рд╕рдВрднрд╛рд▓рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдмреЗрд╣рддрд░ рддрд░реАрдХреЗ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рд╕реЛрдЪрдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░реЗрдВрдЧреЗ, рд╣рд╛рд▓рд╛рдВрдХрд┐ рд╣рдо рд░рдирдЯрд╛рдЗрдо рдбрд┐рд╡рд╛рдЗрд╕ рдлрд╝рд┐рд▓реНрдЯрд░рд┐рдВрдЧ рдХреА рдХреНрд╖рдорддрд╛ рдХреЛ рдмрд╛рдЗрдирд░реА рдХреЗ рдирд┐рд░реНрдорд╛рдг рдХреЗ рддрд░реАрдХреЗ рдХреЗ рд╕рд╛рде рд╕рд┐рдВрдХ рдореЗрдВ рд░рдЦрдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВ (рдЗрд╕рд▓рд┐рдП рд╕рдВрдХрд▓рди рдФрд░ рджреЛрдиреЛрдВ рдХреЗ рд▓рд┐рдП рд╕реНрд░реЛрдд рдХреЛрдб рдХреЛ рд╕рдВрдкрд╛рджрд┐рдд рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ) рд░рдирдЯрд╛рдЗрдо)ред рдЕрдиреНрдпрдерд╛ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рдХреЛ рд╣рд╛рд░реНрдб-рдЯреВ-рдбреАрдмрдЧ рддреНрд░реБрдЯрд┐рдпрд╛рдВ рдорд┐рд▓рддреА рд╣реИрдВред

рд╣рдо рдЗрд╕реЗ рдЖрд╕рд╛рди рдмрдирд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд╛рдо рдХрд░рдирд╛ рдЬрд╛рд░реА рд░рдЦреЗрдВрдЧреЗ, рд▓реЗрдХрд┐рди рдЙрдореНрдореАрдж рд╣реИ рдХрд┐ рдпрд╣ рдЖрдкрдХреЗ рд▓рд┐рдП рдХреБрдЫ рдЖрдЧреЗ рдХреА рдкреНрд░рдЧрддрд┐ рдХреА рдЕрдиреБрдорддрд┐ рджреЗрдЧрд╛ред

@vrv : рд╣рд╛рдБ, рдореИрдВ рдирд┐рд╢реНрдЪрд┐рдд рд░реВрдк рд╕реЗ рдЗрди рд╕реБрдзрд╛рд░реЛрдВ рдХреЗ рд╕рд╛рде рдЕрдкрдирд╛ рдХрд╛рдо рдЬрд╛рд░реА рд░рдЦ рд╕рдХрддрд╛ рд╣реВрдБред рд╕рд╣рд╛рдпрддрд╛ рдХрд╛ рд╢реБрдХреНрд░рд┐рдпрд╛!

рдмрд╕ рдЬрд┐рдЬреНрдЮрд╛рд╕реБ, рдЬреИрд╕рд╛ рдХрд┐ 16 vCpus рдХреЗ рд╕рд╛рде c4.4xlarge рд▓рдЧрднрдЧ .88 рдкреНрд░рддрд┐ рдШрдВрдЯрд╛ рдмрдирд╛рдо gpu рдЗрдВрд╕реНрдЯреЗрдВрд╕ рд╣реИ рдЬреЛ рдХрд┐ .65 рдкреНрд░рддрд┐ рдШрдВрдЯрд╛ рд╣реИ, рдХреНрдпрд╛ рдпрд╣ gpu рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдПрдХрд╛рдзрд┐рдХ cpu рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ рдмреЗрд╣рддрд░ рдирд╣реАрдВ рд╣реЛрдЧрд╛?

@timshefard рдореБрдЭреЗ рдЗрд╕рдореЗрдВ рд╕рдВрджреЗрд╣ рд╣реИ, рд▓реЗрдХрд┐рди рдХреБрдЫ рдмреЗрдВрдЪрдорд╛рд░реНрдХ рдЪрд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП рд╕реНрд╡рддрдВрддреНрд░ рдорд╣рд╕реВрд╕ рдХрд░реЗрдВ - рдЖрдк рдореЗрд░реЗ AMI (ami-cf5028a5) рдХреЛ c4.4xlarge рдкрд░ рд╕реНрдерд╛рдкрд┐рдд рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ рдФрд░ cifar10_train.py рдЪрд▓рд╛ рд╕рдХрддреЗ рд╣реИрдВ

рджрд░рдЕрд╕рд▓, g2.2xlarge рдореЗрдВ GPU рдХреЗ рд╕рд╛рде 8 cpus рд╣реИред рдпрд╣ рдХреЛрд╢рд┐рд╢ рдХрд░рдиреЗ рдЬрд╛ рд░рд╣реЗ рд╣реИрдВред

рдорд▓реНрдЯреА рдереНрд░реЗрдбреЗрдб рд╕реАрдкреАрдпреВ рд╕рдорд░реНрдерд┐рдд рд╣реИ, рд▓реЗрдХрд┐рди рдпрджрд┐ рдЖрдк рдХреЛрдИ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХрд░рдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВ,
GPU 4 рд▓рд╛рдЗрдл, рдЬрдм рддрдХ рд╡реЗ рд╡рд┐рддрд░рд┐рдд рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдЬрд╛рд░реА рдирд╣реАрдВ рдХрд░рддреЗ

рдереВ, рдирд╡рдВрдмрд░ 12, 2015 рдЕрдкрд░рд╛рд╣реНрди 4:53 рдмрдЬреЗ, рдПрд░рд┐рдХ рдмрд░реНрдирд╣рд╛рд░реНрдбрд╕рди < рдиреЛрдЯрд┐рдлрд┐рдХреЗрд╢рди @github.com

рд▓рд┐рдЦрд╛ рдерд╛:

@timshefard https://github.com/timshefard рдореБрдЭреЗ рдЗрд╕рдореЗрдВ рд╕рдВрджреЗрд╣ рд╣реИ, рд▓реЗрдХрд┐рди рдмреЗрдЭрд┐рдЭрдХ
рдХреБрдЫ рдмреЗрдВрдЪрдорд╛рд░реНрдХ рдЪрд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП - рдЖрдк рдореЗрд░реЗ AMI (ami-cf5028a5) рдХреЛ a . рдкрд░ рд╕реНрдерд╛рдкрд┐рдд рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ
c4.4xрдмрдбрд╝рд╛ рдХрд░реЗрдВ рдФрд░ cifar10_train.py рдЪрд▓рд╛рдПрдВ

-
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ рдпрд╛ рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/tensorflow/tensorflow/issues/25#issuecomment -156274039
.

рдореБрдЭреЗ рдбреЙрдХрдЯрд░ рдкрд░ рдЕрдкрдиреЗ рд╡рд┐рдВрдбреЛрдЬрд╝ рд╕реАрдкреАрдпреВ рдкрд░ рдЕрдореЗрдЬрд╝реЕрди рдЬреАрдкреАрдпреВ рдХреЗ рд▓рд┐рдП рдХреЗрд╡рд▓ 3x рд╕реНрдкреАрдб рдорд┐рд▓ рд░рд╣реА рдереАред рдЕрдЪреНрдЫрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рд╡рд╣ рдореЗрд░реЗ рдХреЛрд░ рдореЗрдВ рд╕реЗ рдХреЗрд╡рд▓ 1 рдерд╛ред рдореЗрд░реЗ рд╡рд┐рдВрдбреЛрдЬрд╝ рдмреЙрдХреНрд╕ рдХреЗ рд╕рднреА 4 рдХреЛрд░ рд╢рд╛рдпрдж рдПрдХ рдЕрдореЗрдЬрд╝реЕрди рдЬреАрдкреАрдпреВ рдХреЛ рд╣рд░рд╛ рд╕рдХрддреЗ рд╣реИрдВред

рдпрд╣ рджрд┐рд▓рдЪрд╕реНрдк рд╣реИ, рдХреНрдпреЛрдВрдХрд┐ caffe рдХреЗ рд╕рд╛рде, рдореИрдВрдиреЗ рдХреЛрдИ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдмреЗрдВрдЪрдорд╛рд░реНрдХ рдирд╣реАрдВ рдХрд┐рдпрд╛,
рд▓реЗрдХрд┐рди рд╕реАрдкреАрдпреВ рдореЛрдб рдореЗрдВ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рднрдпрд╛рдирдХ рд╣реИ, рдЬреИрд╕реЗ рдкрд░рд┐рдорд╛рдг рдХрд╛ рдХреНрд░рдо рдпрд╛ рдЕрдзрд┐рдХ
рдЕрдВрддрд░ред рд╣реЛ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ TF рдХреЛ CPU рдореЛрдб рдореЗрдВ рдмреЗрд╣рддрд░ рдврдВрдЧ рд╕реЗ рдЕрдиреБрдХреВрд▓рд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реЛ - рдЖрд╢реНрдЪрд░реНрдп рдирд╣реАрдВ рд╣реЛрдЧрд╛
рдореБрдЭреЗред

рдЧреБрд░реБ, рдирд╡рдВрдмрд░ 12, 2015 рдХреЛ рд╢рд╛рдо 5:01 рдмрдЬреЗ, timshefard [email protected]
рд▓рд┐рдЦрд╛ рдерд╛:

рдореИрдВ рдЕрдкрдиреЗ рд╡рд┐рдВрдбреЛрдЬрд╝ рд╕реАрдкреАрдпреВ рдкрд░ рдЕрдореЗрдЬрд╝рди рдЬреАрдкреАрдпреВ рдХреЗ рд▓рд┐рдП рдХреЗрд╡рд▓ 3x рдЧрддрд┐ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣рд╛ рдерд╛
рдбреЛрдХрд░ рдЕрдЪреНрдЫрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рд╡рд╣ рдореЗрд░реЗ рдХреЛрд░ рдореЗрдВ рд╕реЗ рдХреЗрд╡рд▓ 1 рдерд╛ред my . рдкрд░ 4 рдХреЛрд░ рдХреЗ рд▓рд┐рдП рд╕рднреА
рд╡рд┐рдВрдбреЛрдЬрд╝ рдмреЙрдХреНрд╕ рд╢рд╛рдпрдж рдПрдХ рдЕрдореЗрдЬрд╝реЕрди рдЬреАрдкреАрдпреВ рдХреЛ рд╣рд░рд╛ рд╕рдХрддрд╛ рд╣реИред

-
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ рдпрд╛ рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/tensorflow/tensorflow/issues/25#issuecomment -156275410
.

рдХреГрдкрдпрд╛ рдзреНрдпрд╛рди рд░рдЦреЗрдВ рдХрд┐ cifar10 рдЯреНрдпреВрдЯреЛрд░рд┐рдпрд▓ рдЬреИрд╕рд╛ рдХрд┐ рдпрд╣ рдПрдХ рдмреЗрдВрдЪрдорд╛рд░реНрдХ рд╣реЛрдиреЗ рдХреЗ рд▓рд┐рдП рдирд╣реАрдВ рд╣реИред рдпрд╣ рдХреБрдЫ рдЕрд▓рдЧ рд╡рд┐рд╢реЗрд╖рддрд╛рдУрдВ рдХреЛ рджрд┐рдЦрд╛рдиреЗ рдХреЗ рд▓рд┐рдП рд╣реИ, рдЬреИрд╕реЗ рд╕реЗрд╡рд░ рдФрд░ рд╕рд╛рд░рд╛рдВрд╢ред рдЕрдкрдиреЗ рд╡рд░реНрддрдорд╛рди рд╕реНрд╡рд░реВрдк рдореЗрдВ, рдпрд╣ CPU-рд╕реАрдорд┐рдд рд╣реЛрдЧрд╛, рдпрд╣рд╛рдБ рддрдХ рдХрд┐ GPU рдХреЗ рд╕рд╛рде рднреАред рдмреЗрдВрдЪрдорд╛рд░реНрдХ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рдХрд┐рд╕реА рдХреЛ рдЕрдзрд┐рдХ рд╕рд╛рд╡рдзрд╛рди рд░рд╣рдирд╛ рд╣реЛрдЧрд╛ рдФрд░ рдХреЗрд╡рд▓ рдЖрд╡рд╢реНрдпрдХ рд╕реБрд╡рд┐рдзрд╛рдУрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ рд╣реЛрдЧрд╛ред

рд╣реЛ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ рдХрд┐рд╕реА рдХрд╛рд░рдг рд╕реЗ рд╕рд┐рд░реНрдл amazon GPU рдзреАрдорд╛ рд╣реЛ https://www.reddit.com/r/MachineLearning/comments/305me5/slow_gpu_performance_on_amazon_g22xlarge/
рджрд┐рд▓рдЪрд╕реНрдк рд░рд┐рдкреЛрд░реНрдЯ: "рдПрдХ g2.2xlarge рдПрдХ рдбрд╛рдЙрдирдХреНрд▓реЙрдХ рдХрд┐рдпрд╛ рдЧрдпрд╛ GK104 (797 MHz) рд╣реИ, рдЬреЛ рдЗрд╕реЗ рд╣рд╛рд▓ рд╣реА рдореЗрдВ рдЬрд╛рд░реА рдХрд┐рдП рдЧрдП TitanX рдХреА рдЧрддрд┐ рдХрд╛ 1/4 рдФрд░ GTX 980 рдХреА рддреБрд▓рдирд╛ рдореЗрдВ 2.7x рдзреАрдорд╛ рдмрдирд╛ рджреЗрдЧрд╛ред"

fwiw, 2015-11-13 00:38: 05.472034 рдкреНрд░рд╛рдкреНрдд рдХрд░рдирд╛: рдЪрд░рдг 20, рд╣рд╛рдирд┐ = 4.64 (362.5 рдЙрджрд╛рд╣рд░рдг/рд╕реЗрдХрдВрдб; 0.353 рд╕реЗрдХрдВрдб/рдмреИрдЪ)
рдЕрдм 7 рд╕реАрдкреАрдпреВ рдФрд░ cifar10_multi_gpu_train.py рдХреЗ рд╕рд╛рдеред рдореИрдВрдиреЗ рд╕рднреА рдбрд┐рд╡рд╛рдЗрд╕ рд╕рдВрджрд░реНрднреЛрдВ рдХреЛ рдЬреАрдкреАрдпреВ рд╕реЗ рд╕реАрдкреАрдпреВ рдореЗрдВ рдмрджрд▓ рджрд┐рдпрд╛, рдЕрдЧрд░ рдпрд╣ рд╕рдордЭ рдореЗрдВ рдЖрддрд╛ рд╣реИред

рдареАрдХ рд╣реИ, рдЕрдЬреАрдмред 2015-11-13 00: 43: 56.914273: рдЪрд░рдг 10, рд╣рд╛рдирд┐ = 4.65 (347.4 рдЙрджрд╛рд╣рд░рдг/рд╕реЗрдХрдВрдб; 0.368 рд╕реЗрдХрдВрдб/рдмреИрдЪ) рдФрд░ 2 рд╕реАрдкреАрдпреВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реБрдП, рддреЛ рд╕реНрдкрд╖реНрдЯ рд░реВрдк рд╕реЗ рдпрд╣рд╛рдВ рдХреБрдЫ рд╡рд┐рдлрд▓ рд░рд╣рд╛ред рдЕрднреА рднреА GPU рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ рдЪрд╛рд╣рд┐рдПред рджрд┐рд▓рдЪрд╕реНрдк рд╣реИ рдХрд┐ рдпрд╣ рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдХреЗ рд╕рд┐рдВрдЧрд▓ рдЬреАрдкреАрдпреВ рд╡рд░реНрдЬрди рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдереЛрдбрд╝рд╛ рддреЗрдЬ рдкреНрд░реЛрд╕реЗрд╕ рдХрд░рддрд╛ рд╣реИред

рдпрд╣рд╛рдВ рддрдХ тАЛтАЛтАЛтАЛрдХрд┐ рдПрд░рд┐рдХрдмрд░реНрди рдХреЗ рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХреЗ рд╕рд╛рде рднреА рдореБрдЭреЗ рдЕрднреА рднреА рдорд┐рд▓ рд░рд╣рд╛ рд╣реИ

рдЕрднрд┐рдХрдерди рддреНрд░реБрдЯрд┐: рдЬрдм рдореИрдВ cifar_train.py рдФрд░ mnist/convolutional.py рдЪрд▓рд╛рддреЗ рд╕рдордп рдпрд╣ рдХреЛрд╢рд┐рд╢ рдХрд░рддрд╛ рд╣реВрдВ рддреЛ рдореЙрдбрд▓ рдиреБрдХрд╕рд╛рди = NaN рдХреЗ рд╕рд╛рде рдмрджрд▓ рдЬрд╛рддрд╛ рд╣реИ

рдпреБрдЧ 1.63
рдорд┐рдиреАрдмреИрдЪ рд╣рд╛рдирд┐: рдирд╛рди, рд╕реАрдЦрдиреЗ рдХреА рджрд░: рдирд╛рди
рдорд┐рдиреАрдмреИрдЪ рддреНрд░реБрдЯрд┐: 90.6%
рд╕рддреНрдпрд╛рдкрди рддреНрд░реБрдЯрд┐: 90.4%
рдпреБрдЧ 1.75
рдорд┐рдиреАрдмреИрдЪ рд╣рд╛рдирд┐: рдирд╛рди, рд╕реАрдЦрдиреЗ рдХреА рджрд░: 0.000000
рдорд┐рдиреАрдмреИрдЪ рддреНрд░реБрдЯрд┐: 92.2%
рд╕рддреНрдпрд╛рдкрди рддреНрд░реБрдЯрд┐: 90.4%
рдпреБрдЧ 1.86
рдорд┐рдиреАрдмреИрдЪ рд╣рд╛рдирд┐: рдирд╛рди, рд╕реАрдЦрдиреЗ рдХреА рджрд░: 0.000000

рдореБрдЭреЗ рдпрд╣ рдПрдбрдмреНрд▓реНрдпреВрдПрд╕ рдкрд░ рдЬреАрдкреАрдпреВ рдкрд░ рдЪрд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдорд┐рд▓рд╛, рд▓реЗрдХрд┐рди рджреВрд╕рд░реЛрдВ рдХреА рддрд░рд╣ рдореБрдЭреЗ рдЕрдкреНрд░рднрд╛рд╡реА рдЧрддрд┐ рдорд┐рд▓ рд░рд╣реА рд╣реИред

рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди рдЪрд▓рд╛рддреЗ рд╕рдордп рд╡рд┐рдХрд▓реНрдк рд╕реЗрдЯ рдХрд░рдиреЗ рдХреЗ @ рдЭреЗрдВрдЧ-рдПрдХреНрд╕рдХреНрдпреВ рджреНрд╡рд╛рд░рд╛ рд╕реБрдЭрд╛рдП рдЧрдП рд╕рд╣реА рдлрд┐рдХреНрд╕ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж рдореИрдВ рд╕реНрдореГрддрд┐ рд╕реЗ рдмрд╛рд╣рд░ рдЪрд▓рд╛рдП рдмрд┐рдирд╛ convolutional.py рдЙрджрд╛рд╣рд░рдг рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдерд╛

@erikbern рджреНрд╡рд╛рд░рд╛ рдкреНрд░рджрд╛рди рдХреА рдЧрдИ рдЗрдВрд╕реНрдЯреЙрд▓ рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдЕрдм 9c3043ff3bf31a6a81810b4ce9e87ef936f1f529 рдкреНрд░рддрд┐рдмрджреНрдз рдХреЗ рд░реВрдк рдореЗрдВ рдХрд╛рдо рдирд╣реАрдВ рдХрд░рддреА рд╣реИ

рд╕рдмрд╕реЗ рд╣рд╛рд▓рд┐рдпрд╛ рдХрдорд┐рдЯ рдиреЗ рдЗрд╕ рдмрдЧ рдХреЛ рдкреЗрд╢ рдХрд┐рдпрд╛, @keveman рдиреЗ рдкрд╣рд▓реЗ рд╣реА рдпрд╣рд╛рдВ рдХрдорд┐рдЯ рдкрд░ рдПрдХ рдиреЛрдЯ рдмрдирд╛ рд▓рд┐рдпрд╛ рд╣реИ:
https://github.com/tensorflow/tensorflow/commit/9c3043ff3bf31a6a81810b4ce9e87ef936f1f529#diff -1a60d717df0f558f55ec004e6af5c7deL25

рдирдорд╕реНрддреЗ! рдореБрдЭреЗ GTX 670 рдХреЗ рд╕рд╛рде рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдХреЗ рд╕рдВрдХрд▓рди рдореЗрдВ рд╕рдорд╕реНрдпрд╛ рд╣реИред рдореИрдВ рджреМрдбрд╝рддрд╛ рд╣реВрдБ

TF_UNOFFICIAL_SETTING=1 ./configure
bazel build -c opt --config=cuda //tensorflow/cc:tutorials_example_trainer

рдореБрдЭреЗ рддреНрд░реБрдЯрд┐ рдорд┐рд▓реА:

INFO: Found 1 target...
INFO: From Compiling tensorflow/core/kernels/bias_op_gpu.cu.cc:
tensorflow/core/kernels/bias_op_gpu.cu.cc(40): error: identifier "__ldg" is undefined
          detected during:
            instantiation of "void tensorflow::functor::BiasOpCustomKernel(int, const T *, const T *, int, int, T *) [with T=float]" 
(57): here
            instantiation of "void tensorflow::functor::Bias<tensorflow::GPUDevice, T, Dims>::operator()(const tensorflow::functor::Bias<tensorflow::GPUDevice, T, Dims>::Device &, tensorflow::TTypes<T, Dims, Eigen::DenseIndex>::ConstTensor, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::ConstVec, tensorflow::TTypes<T, Dims, Eigen::DenseIndex>::Tensor) [with T=float, Dims=2]" 
(69): here

tensorflow/core/kernels/bias_op_gpu.cu.cc(40): error: identifier "__ldg" is undefined
          detected during:
            instantiation of "void tensorflow::functor::BiasOpCustomKernel(int, const T *, const T *, int, int, T *) [with T=double]" 
(57): here
            instantiation of "void tensorflow::functor::Bias<tensorflow::GPUDevice, T, Dims>::operator()(const tensorflow::functor::Bias<tensorflow::GPUDevice, T, Dims>::Device &, tensorflow::TTypes<T, Dims, Eigen::DenseIndex>::ConstTensor, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::ConstVec, tensorflow::TTypes<T, Dims, Eigen::DenseIndex>::Tensor) [with T=double, Dims=2]" 
(69): here

2 errors detected in the compilation of "/tmp/tmpxft_000067dd_00000000-7_bias_op_gpu.cu.cpp1.ii".
ERROR: /home/piotr/tensorflow/tensorflow/tensorflow/core/BUILD:248:1: output 'tensorflow/core/_objs/gpu_kernels/tensorflow/core/kernels/bias_op_gpu.cu.o' was not created.
ERROR: /home/piotr/tensorflow/tensorflow/tensorflow/core/BUILD:248:1: not all outputs were created.
Target //tensorflow/cc:tutorials_example_trainer failed to build

NVIDIA рдирдореВрдиреЗ рдбрд┐рд╡рд╛рдЗрд╕ рдХреНрд╡реЗрд░реА рд╕реЗ рдореЗрд░реЗ рдХрд╛рд░реНрдб рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдЬрд╛рдирдХрд╛рд░реА:

Device 0: "GeForce GTX 670"
  CUDA Driver Version / Runtime Version          7.5 / 7.0
  CUDA Capability Major/Minor version number:    3.0
  Total amount of global memory:                 2046 MBytes (2145235968 bytes)
  ( 7) Multiprocessors, (192) CUDA Cores/MP:     1344 CUDA Cores
  GPU Max Clock rate:                            980 MHz (0.98 GHz)
  Memory Clock rate:                             3004 Mhz
  Memory Bus Width:                              256-bit
  L2 Cache Size:                                 524288 bytes
  Maximum Texture Dimension Size (x,y,z)         1D=(65536), 2D=(65536, 65536), 3D=(4096, 4096, 4096)
  Maximum Layered 1D Texture Size, (num) layers  1D=(16384), 2048 layers
  Maximum Layered 2D Texture Size, (num) layers  2D=(16384, 16384), 2048 layers
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       49152 bytes
  Total number of registers available per block: 65536
  Warp size:                                     32
  Maximum number of threads per multiprocessor:  2048
  Maximum number of threads per block:           1024
  Max dimension size of a thread block (x,y,z): (1024, 1024, 64)
  Max dimension size of a grid size    (x,y,z): (2147483647, 65535, 65535)
  Maximum memory pitch:                          2147483647 bytes
  Texture alignment:                             512 bytes
  Concurrent copy and kernel execution:          Yes with 1 copy engine(s)
  Run time limit on kernels:                     Yes
  Integrated GPU sharing Host Memory:            No
  Support host page-locked memory mapping:       Yes
  Alignment requirement for Surfaces:            Yes
  Device has ECC support:                        Disabled
  Device supports Unified Addressing (UVA):      Yes
  Device PCI Domain ID / Bus ID / location ID:   0 / 1 / 0
  Compute Mode:
     < Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 7.5, CUDA Runtime Version = 7.0, NumDevs = 1, Device0 = GeForce GTX 670

рдХреЛрдИ рд╡рд┐рдЪрд╛рд░ рдХреНрдпреЛрдВ рдпрд╣ рдХрд╛рдо рдирд╣реАрдВ рдХрд░ рд░рд╣рд╛ рд╣реИ?
рдзрдиреНрдпрд╡рд╛рдж!

рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ __ldg рдЖрджрд┐рдо рдХреЗрд╡рд▓ 3.5+ рдХреЗ рд▓рд┐рдП рдореМрдЬреВрдж рд╣реИред рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рджреЛрдиреЛрдВ рдХрд╛ рд╕рдорд░реНрдерди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдЖрдВрддрд░рд┐рдХ рд╕реБрдзрд╛рд░ рд╣реИ рдЬрд┐рд╕реЗ рд╣рдо рдЬрд▓реНрдж рд╣реА рдмрд╛рд╣рд░ рдирд┐рдХрд╛рд▓рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░реЗрдВрдЧреЗред

рдЕрдзрд┐рдХ рдЬрд╛рдирдХрд╛рд░реА рдХреЗ рд▓рд┐рдП рджреЗрдЦреЗрдВ https://github.com/tensorflow/tensorflow/issues/320

рдзрдиреНрдпрд╡рд╛рдж! #320 рд╕реЗ рдлрд┐рдХреНрд╕ рдЬреЛрдбрд╝рдиреЗ рд╕реЗ рдореБрдЭреЗ рдорджрдж рдорд┐рд▓реА, рдореИрдВ (рдмрд╣реБрдд рд╕реА рдЪреЗрддрд╛рд╡рдирд┐рдпреЛрдВ рдХреЗ рд╕рд╛рде) рд╕рдВрдХрд▓рд┐рдд рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ рдФрд░ рдирд┐рд╖реНрдкрд╛рджрд┐рдд рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ

bazel-bin/tensorflow/cc/tutorials_example_trainer --use_gpu

рдЬрдм рдореИрдВ рдЙрджрд╛рд╣рд░рдг рдЪрд▓рд╛рддрд╛ рд╣реВрдВ:

tensorflow/models/image/mnist$ python convolutional.py 

рдореБрдЭреЗ рдЪреЗрддрд╛рд╡рдиреА рдорд┐рд▓рддреА рд╣реИ рдХрд┐:

Ignoring gpu device (device: 0, name: GeForce GTX 670, pci bus id: 0000:01:00.0) with Cuda compute capability 3.0. The minimum required Cuda capability is 3.5.

рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ/рдореЙрдбрд▓/рдЫрд╡рд┐рдпреЛрдВ рд╕реЗ рдЙрджрд╛рд╣рд░рдгреЛрдВ рдореЗрдВ GPU рдХреИрд╕реЗ рд╕рдХреНрд╖рдо рдХрд░реЗрдВ?

@erikbern
рдХреНрдпрд╛ рдЖрдкрдиреЗ Amazon рдкрд░ рдХрдИ GPU рд╕рдорд╕реНрдпрд╛ рдХрд╛ рдкрддрд╛ рд▓рдЧрд╛рдпрд╛ рд╣реИ? рдореИрдВ рд╕реАрдЖрдИрдПрдлрдПрдЖрд░ рдПрдХрд╛рдзрд┐рдХ рдЬреАрдкреАрдпреВ рдЗрдВрд╕реНрдЯреЗрдВрд╕ рднреА рдЪрд▓рд╛ рд░рд╣рд╛ рд╣реВрдВ рд▓реЗрдХрд┐рди рдХреЛрдИ рдЧрддрд┐ рдирд╣реАрдВ рджрд┐рдЦ рд░рд╣реА рд╣реИред

рдпрд╣рд╛рдБ GPU рдЙрдкрдпреЛрдЧ рдХреА рд╕реНрдерд┐рддрд┐ рд╣реИ, рдРрд╕рд╛ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рд╕рднреА GPU рдЙрдкрдпреЛрдЧ рдореЗрдВ рд╣реИрдВ рд▓реЗрдХрд┐рди рд╡реЗ рдХреБрдЫ рдирд╣реАрдВ рдХрд░рддреЗ рд╣реИрдВред

+-------------------------------------------------------- -----+
| NVIDIA-SMI 346.46 рдбреНрд░рд╛рдЗрд╡рд░ рд╕рдВрд╕реНрдХрд░рдг: 346.46 |
|------------------------------------------+----------------- -----+---------------------+
| GPU рдирд╛рдо рдкрд░реНрд╕рд┐рд╕реНрдЯреЗрдВрд╕-рдПрдо| рдмрд╕-рдЖрдИрдбреА рдбрд┐рд╕реНрдк.рдП | рдЕрд╕реНрдерд┐рд░ рдИрд╕реАрд╕реА |
| рдлреИрди рдЯреЗрдореНрдк рдкрд░рдл Pwr: рдЙрдкрдпреЛрдЧ/рдХреИрдк | рдореЗрдореЛрд░реА-рдЙрдкрдпреЛрдЧ | рдЬреАрдкреАрдпреВ-рдпреВрдЯрд┐рд▓ рдХрдВрдкреНрдпреВрдЯ рдПрдоред |
|============================================= =====+======================|
| 0 рдЧреНрд░рд┐рдб K520 рдСрдл | 0000: 00: 03.0 рдмрдВрдж | рдПрди/рдП |
| рдПрди/рдП 54рд╕реА рдкреА0 55рдбрдмреНрд▓реВ / 125рдбрдмреНрд▓реВ | 3832MiB / 4095MiB | 37% рдбрд┐рдлрд╝реЙрд▓реНрдЯ |
+------------------------------------------ -----+---------------------+
| 1 рдЧреНрд░рд┐рдб K520 рдмрдВрдж | 0000: 00: 04.0 рдмрдВрдж | рдПрди/рдП |
| рдПрди/рдП 42C P0 42W / 125W | 3796MiB / 4095MiB | 0% рдбрд┐рдлрд╝реЙрд▓реНрдЯ |
+------------------------------------------ -----+---------------------+
| 2 рдЧреНрд░рд┐рдб K520 рдСрдл | 0000: 00: 05.0 рдмрдВрдж | рдПрди/рдП |
| рдПрди/рдП 46рд╕реА рдкреА0 43рдбрдмреНрд▓реНрдпреВ / 125рдбрдмреНрд▓реНрдпреВ | 3796MiB / 4095MiB | 0% рдбрд┐рдлрд╝реЙрд▓реНрдЯ |
+------------------------------------------ -----+---------------------+
| 3 рдЧреНрд░рд┐рдб K520 рдСрдл | 0000: 00: 06.0 рдмрдВрдж | рдПрди/рдП |
| рдПрди/рдП 43рд╕реА рдкреА0 41рдбрдмреНрд▓реНрдпреВ / 125рдбрдмреНрд▓реНрдпреВ | 3796MiB / 4095MiB | 0% рдбрд┐рдлрд╝реЙрд▓реНрдЯ |
+------------------------------------------ -----+---------------------+

+-------------------------------------------------------- -----------------------------+
| рдкреНрд░рдХреНрд░рд┐рдпрд╛рдПрдВ: рдЬреАрдкреАрдпреВ рдореЗрдореЛрд░реА |
| GPU PID рдкреНрд░рдХрд╛рд░ рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдХрд╛ рдирд╛рдо рдЙрдкрдпреЛрдЧ |
|============================================ ============================|
| 0 60160 рд╕реА рдЕрдЬрдЧрд░ 3819MiB |
| 1 60160 рд╕реА рдЕрдЬрдЧрд░ 3783 рдПрдордЖрдИрдмреА |
| 2 60160 рд╕реА рдЕрдЬрдЧрд░ 3783MiB |
| 3 60160 рд╕реА рдЕрдЬрдЧрд░ 3783 рдПрдордЖрдИрдмреА |
+-------------------------------------------------------- -----------------------------+

@mhejrati https://news.ycombinator.com/item?id=10555692 рдкрд░ рдПрдХ рдЯрд┐рдкреНрдкрдгреА рдХреЗ рдЕрдиреБрд╕рд╛рд░ рдРрд╕рд╛ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдЖрдк рдЗрд╕реЗ AWS рдореЗрдВ рдирд╣реАрдВ рдХрд░ рд╕рдХрддреЗ:

Xen рд╡рд░реНрдЪреБрдЕрд▓рд╛рдЗрдЬреЗрд╢рди P2P рдкреНрд░рддрд┐рдпреЛрдВ рдХреЛ рдирд┐рд╖реНрдХреНрд░рд┐рдп рдХрд░ рджреЗрддрд╛ рд╣реИ, ergo GPU рдореЗрдВ рд╡рд╣ рд╣реЛрддрд╛ рд╣реИ рдЬрд┐рд╕реЗ рд╣рдо "рд╕рдВрд╡рд╛рдж рдХрд░рдиреЗ рдореЗрдВ рд╡рд┐рдлрд▓рддрд╛ рдФрд░ рдХреБрдЫ GPU рдЬрд┐рдиреНрд╣реЗрдВ рдЖрдк рдЕрднреА рддрдХ рдирд╣реАрдВ рдкрд╣реБрдВрдЪ рд╕рдХрддреЗ (CPU рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдЬрд╛рдиреЗ рдХреЗ рдмрд┐рдирд╛) рддрдХ рдирд╣реАрдВ рдкрд╣реБрдВрдЪ рд╕рдХрддреЗ рд╣реИрдВред"

рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдирд╣реАрдВ рд╣реИ рдХрд┐ рдПрдЪрдПрди рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдВ рдХрд┐рддрдиреА рднрд░реЛрд╕реЗрдордВрдж рд╣реИрдВ, рд▓реЗрдХрд┐рди рдореБрдЭреЗ рдЕрдм рддрдХ рдмрд╕ рдЗрддрдирд╛ рд╣реА рдкрддрд╛ рд╣реИ

@erikbern @mhejrati рдореБрдЭреЗ рдЗрддрдирд╛ рдпрдХреАрди рдирд╣реАрдВ рд╣реИ рдХрд┐ рдЬрд╝реЗрди рдХреА рд╡рд┐рд╢рд┐рд╖реНрдЯ рд╕рдВрдкрддреНрддрд┐ рдПрдХ рд╕рдорд╕реНрдпрд╛ рд╣реИред P2P рдкреНрд░рддрд┐рдпрд╛рдВ рдЖрд╡рд╢реНрдпрдХ рдирд╣реАрдВ рд▓рдЧрддреА рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ CPU рдЕрднреА рднреА рдкреНрд░рддреНрдпреЗрдХ GPU рдХреЛ рдПрдХ рджреВрд╕рд░реЗ рд╕реЗ рд╕рдВрд╡рд╛рдж рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП GPU рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рдХреЗ рдмрд┐рдирд╛ рдХрд╛рд░реНрдп рд╕реМрдВрдк рд╕рдХрддрд╛ рд╣реИред рдпрд╣ рдЕрднреА рднреА рдЕрдЬреАрдм рд╣реИ рдХрд┐ рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП рд╕рднреА GPU рдЗрд╕ рдЕрд░реНрдз-рдЙрдкрдпреЛрдЧ рдХреА рд╕реНрдерд┐рддрд┐ рдореЗрдВ рдкреНрд░рддреАрдд рд╣реЛрддреЗ рд╣реИрдВ рд▓реЗрдХрд┐рди рдХрд╛рдо рдмрд┐рдирд╛ рдХрд┐рд╕реА рддреНрд░реБрдЯрд┐ рдХреЗ рд╣реЛрддрд╛ рд╣реИред

рдореИрдВ рдЗрд╕ рдмрдЧ рдХреЛ рдмрдВрдж рдХрд░ рджреВрдВрдЧрд╛ред рдпрджрд┐ рдпрд╣рд╛рдВ рдХреА рдХреБрдЫ рд╕рдорд╕реНрдпрд╛рдПрдВ рдЕрдирд╕реБрд▓рдЭреА рд░рд╣рддреА рд╣реИрдВ, рддреЛ рдХреГрдкрдпрд╛ рдЕрдзрд┐рдХ рд╡рд┐рд╢рд┐рд╖реНрдЯ рд╢реАрд░реНрд╖рдХ рдХреЗ рд╕рд╛рде рдПрдХ рдирдпрд╛ рдЦреЛрд▓реЗрдВред

рдХреНрдпрд╛ рдЗрд╕рдХрд╛ рдорддрд▓рдм рдпрд╣ рд╣реИ рдХрд┐ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдХрд╛ рдЕрдВрддрд┐рдо рд╕рдВрд╕реНрдХрд░рдг Amazon g2 рдЗрдВрд╕реНрдЯреЗрдВрд╕ рдкрд░ рдмрд┐рдирд╛ рдХрд┐рд╕реА рд╣реИрдХ рдХреЗ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ? рдФрд░ рдХреНрдпрд╛ рдЗрд╕рдХрд╛ рдорддрд▓рдм рдпрд╣ рд╣реИ рдХрд┐ рдпрд╣ рд╡рд╣рд╛рдВ рдПрдХ рд╕реЗ рдЕрдзрд┐рдХ GPU рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ?

рдореБрдЭреЗ рдпрдХреАрди рдирд╣реАрдВ рд╣реИ рдХрд┐ рд╣рдореЗрдВ TF_UNOFFICIAL_* "рд╣реИрдХ рдирд╣реАрдВ" рдХрд╣рдирд╛ рдЪрд╛рд╣рд┐рдП, рд▓реЗрдХрд┐рди рд╣рд╛рдВ, рдпрд╣ _рдЪрд╛рд╣рд┐рдП_ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред рдпрджрд┐ рдРрд╕рд╛ рдирд╣реАрдВ рд╣реЛрддрд╛ рд╣реИ, рддреЛ рдпрд╣ рд╕рдВрднрд╡рддрдГ рдХреНрдпреВрдбрд╛ 3.0 рдкреНрд░рддрд┐ рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рдирд╣реАрдВ рд╣реИ, рдФрд░ рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдПрдХ рдФрд░ рд╡рд┐рд╢рд┐рд╖реНрдЯ рдмрдЧ рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдПред

рдФрд░ рдХреНрдпрд╛ рдЕрдореЗрдЬрд╝реЕрди рдЗрдВрд╕реНрдЯреЗрдВрд╕ рдкрд░ рджреЛ рдпрд╛ рджреЛ рд╕реЗ рдЕрдзрд┐рдХ рдЬреАрдкреАрдпреВ рдкрд░ рдХреЛрдб рдирд┐рд╖реНрдкрд╛рджрд┐рдд рдХрд░рдирд╛ рд╕рдВрднрд╡ рд╣реИ? рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, CIFAR рдЙрджрд╛рд╣рд░рдг рдЬреИрд╕реЗ рдореЙрдбрд▓ рдХреЛ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдбреЗрдЯрд╛ рд╕рдорд╛рдирддрд╛ред рдХрдИ рд▓реЛрдЧреЛрдВ рдиреЗ рдЗрд╕ рдЯрд┐рдкреНрдкрдгреА рдХреЗ рдКрдкрд░ рд╕рд┐рд░реНрдл 5 рдЯрд┐рдкреНрдкрдгрд┐рдпреЛрдВ рдореЗрдВ рд▓рд┐рдЦрд╛ рдХрд┐ рдпрд╣ рд╕рдВрднрд╡ рдирд╣реАрдВ рдерд╛ред

рдореБрдЭреЗрдВ рдирд╣реАрдВ рдкрддрд╛ред рд▓реЗрдХрд┐рди рдЕрдЧрд░ рдпрд╣ рдЕрднреА рднреА 0.6.0 рдХреЗ рд╕рд╛рде рдПрдХ рд╕рдорд╕реНрдпрд╛ рд╣реИ, рддреЛ рдпрд╣ рдПрдХ рдмрдЧ рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдП, рдХрдИ GPU рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдЕрдзрд┐рдХ рд╡рд┐рд╢рд┐рд╖реНрдЯред

рдореИрдВ рдЙрдмрдВрдЯреВ рдкрд░ 0.6.0 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рд╣реВрдВ, рдПрдХ рд╕реЗ рдЕрдзрд┐рдХ рдЬреАрдкреАрдпреВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдирд╣реАрдВ рд╣реВрдВред рдПрдХ GPU рдкрд░ GPU рдХрд╛ рдЙрдкрдпреЛрдЧ рд╣рдореЗрд╢рд╛ 0 рд╣реЛрддрд╛ рд╣реИред

рдХреЗрд╡рд▓ рд╕рдВрджрд░реНрдн рдХреЗ рд▓рд┐рдП, K40 рдпрд╛ K80 рдХрд┐рд░рд╛рдП рдкрд░ рд▓реЗрдирд╛ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдирд┐рд╖реЗрдзрд╛рддреНрдордХ рд░реВрдк рд╕реЗ рдорд╣рдВрдЧрд╛ рдирд╣реАрдВ рд╣реИред рдЕрдореЗрдЬрд╝реЕрди рдХреЗ рдкрд╛рд╕ рд╡реЗ рдирд╣реАрдВ рд╣реИрдВ, рд▓реЗрдХрд┐рди http://www.nvidia.com/object/gpu-cloud-computing-services.html рдкрд░ рдХрдИ рд╡рд┐рдХрд▓реНрдк рд╣реИрдВред (рдХреБрдЫ рдХрдо рд╕реЗ рдХрдо 3$/рдШрдВрдЯрд╛ рдХреА рддрд░рд╣)

рдереАрдиреЛ рдФрд░ рдЯреЙрд░реНрдЪ рдХреЛ рдХрдВрдкреНрдпреВрдЯ 3.0 рд╕реЗ рдХреЛрдИ рд╕рдорд╕реНрдпрд╛ рдирд╣реАрдВ рд╣реИред рдХреНрдпрд╛ рд╣рдо рдЙрдореНрдореАрдж рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ рдХрд┐ TensorFlow рдЬрд▓реНрдж рд╣реА рдХрднреА рднреА рдХрдВрдкреНрдпреВрдЯ 3.0 рдХрд╛ рд╕рдорд░реНрдерди рдХрд░реЗрдЧрд╛?

рдпрд╛ рдХрдо рд╕реЗ рдХрдо рдкреБрди: рд╕рдВрдХрд▓рд┐рдд рдХрд┐рдП рдмрд┐рдирд╛ рдкреНрд░рддрд┐рдмрдВрдз рдХреЛ рдУрд╡рд░рд░рд╛рдЗрдб рдХрд░рдиреЗ рдХреА рдХреНрд╖рдорддрд╛ рдЬреЛрдбрд╝реЗрдВред

@Dringite , рдЖрдк рдирд┐рдореНрди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ Cuda 3.0 рдХреЛ рд╕рдХреНрд╖рдо рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ:

TF_UNOFFICIAL_SETTING=1 ./configure

рдпрд╣ рдХрд╛рд░реНрдпрд╛рддреНрдордХ рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдПред рдФрд░ рдпрджрд┐ рдРрд╕рд╛ рдирд╣реАрдВ рд╣реЛрддрд╛ рд╣реИ, рддреЛ рдЗрд╕реЗ рдЯреНрд░реИрдХ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХреЛрдИ рдЕрдиреНрдп рд╕рдорд╕реНрдпрд╛ рджрд░реНрдЬ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕реНрд╡рддрдВрддреНрд░ рдорд╣рд╕реВрд╕ рдХрд░реЗрдВред

рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдЗрдВрд╕реНрдЯрд╛рд▓ рдЧрд╛рдЗрдб рдореЗрдВ рдЕрдм рдХреНрдпреВрдбрд╛ 3.0 рдХреЗ рд▓рд┐рдП рднреА рдПрдХ рдлрд┐рдХреНрд╕ рд╢рд╛рдорд┐рд▓ рд╣реИ

рдмреБрдз, 10 рдлрд░рд╡рд░реА 2016 рдЕрдкрд░рд╛рд╣реНрди 2:37 рдмрдЬреЗ, zheng-xq [email protected] рдиреЗ рд▓рд┐рдЦрд╛:

@Dringite https://github.com/Dringite , рдЖрдк Cuda 3.0 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рд╕рдХреНрд╖рдо рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ
рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд:

TF_UNOFFICIAL_SETTING=1 ./configure

рдпрд╣ рдХрд╛рд░реНрдпрд╛рддреНрдордХ рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдПред рдФрд░ рдЕрдЧрд░ рдРрд╕рд╛ рдирд╣реАрдВ рд╣реЛрддрд╛ рд╣реИ, рддреЛ рдмреЗрдЭрд┐рдЭрдХ рджреВрд╕рд░рд╛ рдлрд╛рдЗрд▓ рдХрд░реЗрдВ
рдЗрд╕реЗ рдЯреНрд░реИрдХ рдХрд░рдиреЗ рдХрд╛ рдореБрджреНрджрд╛ред

-
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ рдпрд╛ рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/tensorflow/tensorflow/issues/25#issuecomment -182610763
.

рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рд╡рд░реНрддрдорд╛рди рдЧрд╛рдЗрдб рдЬреАрдкреАрдпреВ рдХреЗ рд▓рд┐рдП рдХрд╛рдо рдирд╣реАрдВ рдХрд░рддрд╛ рд╣реИ - рдкрд░реАрдХреНрд╖рдг рдиреЗрди рдХреА рд╡рд╛рдкрд╕реА рдХрд░рддрд╛ рд╣реИ рдЬреИрд╕рд╛ рдХрд┐ рдкрд╣рд▓реЗ рдмрддрд╛рдпрд╛ рдЧрдпрд╛ рдерд╛ред
рд╡рд┐рд╢реЗрд╖ рд░реВрдк рд╕реЗ рдЖрдкрдХреЛ рдЕрднреА рднреА рдРрд╕рд╛ рдХрд░рдиреЗ рдХреА рдЬрд╝рд░реВрд░рдд рд╣реИ:
TF_UNOFFICIAL_SETTING=1 ./configure

рдореБрдЭреЗ рдХреНрдпреВрдбрд╛ 3.0 рдХреЗ рд▓рд┐рдП рдПрдХ рдлрд┐рдХреНрд╕ рд╕рд╣рд┐рдд рдЗрдВрд╕реНрдЯреЙрд▓ рдЧрд╛рдЗрдб рдирд╣реАрдВ рдорд┐рд▓ рд░рд╣рд╛ рд╣реИ, рдХреНрдпрд╛ рдХреЛрдИ рдореЗрд░реЗ рд▓рд┐рдП рдЗрдВрдЧрд┐рдд рдХрд░ рд╕рдХрддрд╛ рд╣реИ? рдзрдиреНрдпрд╡рд╛рдж!

рдкреНрд░рд┐рдВрдЯрдл "\ny\n7.5\n\n\n\n3.0\n" | рдХреЙрдиреНрдлрд╝рд┐рдЧрд░

7.5 рдХреНрдпреВрдбрд╛ рд╕рдВрд╕реНрдХрд░рдг рд╣реИ, 3.0 рдЧрдгрдирд╛ рд╣реИред

рдПрдХрд▓ GPU рдХреЗ рд╕рд╛рде рддреБрд▓рдирд╛ рдХрд░рдиреЗ рдкрд░ Amazon (CUDA=7.5, cudnn =4.0,compute = 3.0) рдкрд░ рдХрдИ GPU рдХреЗ рд▓рд┐рдП рдЕрднреА рднреА рдХреЛрдИ рдкреНрд░рджрд░реНрд╢рди рд╕реБрдзрд╛рд░ рдирд╣реАрдВ рд╣реБрдЖ рд╣реИред

рдХреВрдбрд╛ рдЧрдгрдирд╛ рдХреНрд╖рдорддрд╛ 2.0 рдкрд░ рдХреЛрдИ рднреА рд╕рдлрд▓ рд╣реЛрддрд╛ рд╣реИ?

рд╕рддреНрдпрд╛рдкрд┐рдд рд╣реИ рдХрд┐ 'TF_UNOFFICIAL_SETTING=1 ./configure' GeForce GT 750M рдХреЗ рд╕рд╛рде рдореИрдХрдмреБрдХ рдкреНрд░реЛ рдкрд░ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред рдзрдиреНрдпрд╡рд╛рдж!

рдХреНрдпрд╛ рдЖрдзрд┐рдХрд╛рд░рд┐рдХ рдлрд┐рдХреНрд╕ рдХреЗ рд▓рд┐рдП рдХреЛрдИ рдИрдЯреАрдП рд╣реИ? рдпрд╣ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдЙрддреНрдкрд╛рджрди рдореЗрдВ рдмрдирд╛рдП рд░рдЦрдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рджрд░реНрдж рд╣реИ (рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП рдЕрдкрдиреЗ рд╕реНрд╡рдпрдВ рдХреЗ рдбреЙрдХрд░рдлрд╛рдЗрд▓ рдХреЗ рд╕рд╛рде рдЫрд╡рд┐рдпрд╛рдВ рдмрдирд╛рдПрдВ)ред

рдЬрдм рдореИрдВ mnist рдирдореВрдирд╛ рдЪрд▓рд╛рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░рддрд╛ рд╣реВрдВ рддреЛ рдореЗрд░рд╛ рд▓реИрдкрдЯреЙрдк рдореБрдЭреЗ рдпрд╣ рд▓реЙрдЧ рджреЗрддрд╛ рд╣реИ:
"рдХреНрдпреВрдбрд╛ рдХрдВрдкреНрдпреВрдЯ рдХреНрд╖рдорддрд╛ 2.1 рдХреЗ рд╕рд╛рде рдЬреАрдкреАрдпреВ рдбрд┐рд╡рд╛рдЗрд╕ (рдбрд┐рд╡рд╛рдЗрд╕: 0, рдирд╛рдо: рдЬреАрдИрдлрд╝реЛрд░реНрд╕ рдЬреАрдЯреА 635 рдПрдо, рдкреАрд╕реАрдЖрдИ рдмрд╕ рдЖрдИрдбреА) рдХреЛ рдЕрдирджреЗрдЦрд╛ рдХрд░рдирд╛ред рдиреНрдпреВрдирддрдо рдЖрд╡рд╢реНрдпрдХ рдХреНрдпреВрдбрд╛ рдХреНрд╖рдорддрд╛ 3.0 рд╣реИред"
рддреЛ рдХреНрдпрд╛ рдЗрд╕рдХрд╛ рдорддрд▓рдм рдпрд╣ рд╣реИ рдХрд┐ рдореИрдВ GPU рд╕рдВрд╕реНрдХрд░рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдирд╣реАрдВ рдХрд░ рд╕рдХрддрд╛ рдХреНрдпреЛрдВрдХрд┐ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдХреЗ рд▓рд┐рдП рдиреНрдпреВрдирддрдо Cuda 3.0 рд╣реИ?
рдзрдиреНрдпрд╡рд╛рдж

рдпрджрд┐ рдЖрдк рдкреВрд░реНрд╡рдирд┐рд░реНрдорд┐рдд рдмрд╛рдпрдиреЗрд░рд┐рдЬрд╝ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВ, рд╣рд╛рдБред рдпрджрд┐ рдЖрдк рд╕реНрд░реЛрдд рд╕реЗ рдирд┐рд░реНрдорд╛рдг рдХрд░рддреЗ рд╣реИрдВ рддреЛ рдЖрдк рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ
рдХреНрдпреВрдбрд╛ 2.1 рд╕рдорд░реНрдерди рдХреЗ рд╕рд╛рде рдирд┐рд░реНрдорд╛рдг рдХрд░реЗрдВ рд▓реЗрдХрд┐рди рдореБрдЭреЗ рдирд╣реАрдВ рдкрддрд╛ рдХрд┐ рдпрд╣ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ рдпрд╛ рдирд╣реАрдВред рдпрд╣ рд╣реИ
рд╕рдВрднрд╛рд╡рдирд╛ рд╣реИ рдХрд┐ рдкреНрд░рднрд╛рд╡реА рдиреНрдпреВрдирддрдо рдХреНрдпреВрдбрд╛ 3.0 рд╣реИред
рд╢рдирд┐рд╡рд╛рд░, 10 рд╕рд┐рддрдВрдмрд░, 2016 рдХреЛ 11:51 Mojtaba Tabatabaie [email protected] . рдкрд░
рд▓рд┐рдЦрд╛ рдерд╛:

рдЬрдм рдореИрдВ mnist рдирдореВрдирд╛ рдЪрд▓рд╛рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░рддрд╛ рд╣реВрдВ рддреЛ рдореЗрд░рд╛ рд▓реИрдкрдЯреЙрдк рдореБрдЭреЗ рдпрд╣ рд▓реЙрдЧ рджреЗрддрд╛ рд╣реИ:
"рдХреНрдпреВрдбрд╛ рдХреЗ рд╕рд╛рде рдЬреАрдкреАрдпреВ рдбрд┐рд╡рд╛рдЗрд╕ (рдбрд┐рд╡рд╛рдЗрд╕: 0, рдирд╛рдо: рдЬреАрдИрдлрд╝реЛрд░реНрд╕ рдЬреАрдЯреА 635 рдПрдо, рдкреАрд╕реАрдЖрдИ рдмрд╕ рдЖрдИрдбреА) рдХреЛ рдЕрдирджреЗрдЦрд╛ рдХрд░рдирд╛
рдЧрдгрдирд╛ рдХреНрд╖рдорддрд╛ 2.1ред рдиреНрдпреВрдирддрдо рдЖрд╡рд╢реНрдпрдХ рдХреВрдбрд╛ рдХреНрд╖рдорддрд╛ 3.0 рд╣реИред "
рддреЛ рдХреНрдпрд╛ рдЗрд╕рдХрд╛ рдорддрд▓рдм рдпрд╣ рд╣реИ рдХрд┐ рдореИрдВ GPU рд╕рдВрд╕реНрдХрд░рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдирд╣реАрдВ рдХрд░ рд╕рдХрддрд╛ рдХреНрдпреЛрдВрдХрд┐ рдиреНрдпреВрдирддрдо Cuda
рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдХреЗ рд▓рд┐рдП 3.0 рд╣реИ?
рдзрдиреНрдпрд╡рд╛рдж

-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдиреЗ рдЦреБрд▓реА/рдмрдВрдж рд╕реНрдерд┐рддрд┐ рдХреЛ рд╕рдВрд╢реЛрдзрд┐рдд рдХрд┐рдпрд╛ рд╣реИред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/tensorflow/tensorflow/issues/25#issuecomment -246128896,
рдпрд╛ рдереНрд░реЗрдб рдХреЛ рдореНрдпреВрдЯ рдХрд░реЗрдВ
https://github.com/notifications/unsubscribe-auth/AAjO_RvNrRMQEmsueXWoaU5FX4tWHZq3ks5qovwegaJpZM4Ge0kc
.

@smtabatabaie рдХреНрдпрд╛ рдЖрдкрдиреЗ @martinwicke рджреНрд╡рд╛рд░рд╛ рд╕реБрдЭрд╛рдП рдЧрдП рд╕реНрд░реЛрдд рд╕реЗ cuDNN рдмрдирд╛рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХреА рд╣реИ, рдореБрдЭреЗ рдЖрдкрдХреЗ рдЬреИрд╕реЗ рд╣реА рдореБрджреНрджреЛрдВ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝ рд░рд╣рд╛ рд╣реИ рдФрд░ рдпрджрд┐ рдЖрдк рдЕрдкрдирд╛ рдЕрдиреБрднрд╡ рд╕рд╛рдЭрд╛ рдХрд░рддреЗ рд╣реИрдВ рддреЛ рдЗрд╕рд╕реЗ рдореБрдЭреЗ рдмрд╣реБрдд рдорджрдж рдорд┐рд▓реЗрдЧреА?

рдХреГрдкрдпрд╛ рдХреБрдЫ рдорджрдж рдХрд░реЗрдВред рдореБрдЭреЗ рдПрдХ рд╣реА рддреНрд░реБрдЯрд┐ рд╕рдВрджреЗрд╢ рдорд┐рд▓ рд░рд╣рд╛ рд╣реИ "рджреГрд╢реНрдпрдорд╛рди рдЬреАрдкреАрдпреВ рдбрд┐рд╡рд╛рдЗрд╕ рдХреЛ рдЕрдирджреЗрдЦрд╛ рдХрд░рдирд╛ (рдбрд┐рд╡рд╛рдЗрд╕: 0, рдирд╛рдо: GeForce GT 750M, рдкреАрд╕реАрдЖрдИ рдмрд╕ рдЖрдИрдбреА: 0000: 01:00.0) рдХреНрдпреВрдбрд╛ рдЧрдгрдирд╛ рдХреНрд╖рдорддрд╛ 3.0 рдХреЗ рд╕рд╛рдеред рдиреНрдпреВрдирддрдо рдЖрд╡рд╢реНрдпрдХ рдХреНрдпреВрдбрд╛ рдХреНрд╖рдорддрд╛ 3.5 рд╣реИред"

рдореИрдВрдиреЗ рджреВрд╕рд░реЛрдВ рд╕реЗ рдкреЛрд╕реНрдЯ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдкрдврд╝рд╛ рд╣реИ, рдПрдХрдорд╛рддреНрд░ рдореБрджреНрджрд╛ рдпрд╣ рд╣реИ рдХрд┐ рдпрд╣ рдПрдХ рд╕реАрдзреА рд╡рд┐рдВрдбреЛрдЬрд╝ рд╕реНрдерд╛рдкрдирд╛ рд╣реИ рдФрд░ рдПрдбрдмреНрд▓реНрдпреВрдПрд╕ рдкрд░ рдирд╣реАрдВ рд╣реИ рдХреНрдпреЛрдВрдХрд┐ рдореИрдВ рдорд╛рди рд░рд╣рд╛ рд╣реВрдВ рдХрд┐ рдпрд╣рд╛рдВ рдЕрдзрд┐рдХрд╛рдВрд╢ рд▓реЛрдЧреЛрдВ рдХреЗ рдкрд╛рд╕ рд╣реИред рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рд╡реЗрдмрд╕рд╛рдЗрдЯ рдореЗрдВ, рдпрд╣ рдХрд╣рд╛ рдЧрдпрд╛ рд╣реИ рдХрд┐ рдиреНрдпреВрдирддрдо 3.0 рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ, рдореИрдВ рдЗрд╕рдХрд╛ рдЙрдкрдпреЛрдЧ рдХреНрдпреЛрдВ рдирд╣реАрдВ рдХрд░ рдкрд╛ рд░рд╣рд╛ рд╣реВрдБ? рдФрд░ рдореИрдВ рдЗрд╕рдХреЗ рдЖрд╕рдкрд╛рд╕ рдХреИрд╕реЗ рдЬрд╛ рд╕рдХрддрд╛ рд╣реВрдВ?

рдХреГрдкрдпрд╛ рдЗрд╕реЗ рдХреИрд╕реЗ рдХрд░реЗрдВ рдЗрд╕ рдкрд░ рд╕реБрдЭрд╛рд╡реЛрдВ рдХрд╛ рд╕реНрд╡рд╛рдЧрдд рд╣реИред

@gunan @mrry рд╡рд┐рдВрдбреЛрдЬрд╝ рдкреИрдХреЗрдЬ рд╣реИрдВ рдЬреЛ cuda 3.0 рдХреЗ рд╕рд╛рде рдирд╣реАрдВ рдмрдиреЗ рд╣реИрдВ? рдХреНрдпрд╛ рдЗрд╕реАрд▓рд┐рдП
рд╡реЗ рдЗрддрдиреЗ рдЫреЛрдЯреЗ рд╣реИрдВ?

@martinwicke рд░рд╛рддреЗрдВ рд╣реИрдВ рдФрд░ рдЖрд░рд╕реА 1 рднреА рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдПред

рд░рд╛рддреНрд░рд┐рдХрд╛рд▓реАрди рд╣рд╛рдБред
rc0 рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ 3.5 рдерд╛ред
рдХреНрдпрд╛ рд╣рдордиреЗ 3.0 рд╕реЗ r0.12 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкрд░рд┐рд╡рд░реНрддрди рдХреЛ рдЪреБрдирд╛?

рд╣рдордиреЗ рдкрд░рд┐рд╡рд░реНрддрди рдХреЛ рдЪреЗрд░реАрдкрд┐рдХ рдХрд┐рдпрд╛ред
@cydal рдЖрдк рдпрд╣рд╛рдВ рд░рд╛рдд рдХреЗ рдирд┐рд░реНрдорд╛рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ:
http://ci.tensorflow.org/view/Nightly/job/nightly-win/14/DEVICE=gpu ,OS=windows/artifact/cmake_build/tf_python/dist/tensorflow_gpu-0.12.0rc0-cp35-cp35m-win_amd64. wl

рдпрд╛ рдЖрдк 0.12.0rc1 рдХреА рдкреНрд░рддреАрдХреНрд╖рд╛ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ, рдЬреЛ рдХреБрдЫ рджрд┐рдиреЛрдВ рдореЗрдВ рдЙрддрд░рдирд╛ рдЪрд╛рд╣рд┐рдПред

рддреНрд╡рд░рд┐рдд рдкреНрд░рддрд┐рдХреНрд░рд┐рдпрд╛ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж рджреЛрд╕реНрддреЛрдВ, рдореИрдВ рдХрдо рд╕реЗ рдХрдо рдереЛрдбрд╝реА рджреЗрд░ рдХреЗ рд▓рд┐рдП рдПрдХ рдХреА рдЙрдореНрдореАрдж рдирд╣реАрдВ рдХрд░ рд░рд╣рд╛ рдерд╛ред рдХреНрд╖рдорд╛ рдХрд░реЗрдВ рдЕрдЧрд░ рдпрд╣ рдПрдХ рдмреЗрд╡рдХреВрдл рд╕рд╡рд╛рд▓ рдХреА рддрд░рд╣ рд▓рдЧрддрд╛ рд╣реИ, рддреЛ рдореИрдВ рдЗрд╕реЗ рдХреИрд╕реЗ рд╕реНрдерд╛рдкрд┐рдд рдХрд░реВрдВ? рдХреНрдпрд╛ рдореИрдВ рдмрд╕ рдЗрд╕реЗ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкрд╛рдЗрдк рдХрд░рддрд╛ рд╣реВрдВ? (рдпрджрд┐ рд╣рд╛рдВ, рддреЛ рдХреНрдпрд╛ рдореИрдВрдиреЗ рдкрд┐рдЫрд▓реЗ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдЬреАрдкреАрдпреВ рдХреЛ рд╣рдЯрд╛ рджрд┐рдпрд╛ рд╣реИ? рдпрд╛ рдпрд╣ рд╕реНрд╡рдЪрд╛рд▓рд┐рдд рд░реВрдк рд╕реЗ рдРрд╕рд╛ рдХрд░рддрд╛ рд╣реИ?) рдореБрдЭреЗ рдереЛрдбрд╝рд╛ рдиреМрд╕рд┐рдЦрд┐рдпрд╛ рд╕рдордЭреЛред

рд▓рд┐рдВрдХ "рдкреАрдЖрдИрдкреА рдкреИрдХреЗрдЬ" рдХреЛ рдЗрдВрдЧрд┐рдд рдХрд░рддрд╛ рд╣реИред
рдпрджрд┐ рдЖрдкрдиреЗ pip install рдХрдорд╛рдВрдб рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рд╣реИ, рддреЛ рдЖрдкрдХреЛ --upgrade рдзреНрд╡рдЬ рдХреЗ рд╕рд╛рде рдЙрд╕реА рдХрдорд╛рдВрдб рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдПред
рдпрд╛ рдЖрдк pip uninstall tensorflow рдЪрд▓рд╛ рд╕рдХрддреЗ рд╣реИрдВ рдФрд░ рдлрд┐рд░ рдКрдкрд░ рд╕реВрдЪреАрдмрджреНрдз рдкреИрдХреЗрдЬ рдХреЛ рд╕реНрдерд╛рдкрд┐рдд рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред
рдПрдХ рдмрд╛рд░ рдЬрдм рдЖрдк рдпреВрдЖрд░рдПрд▓ рдХреЛ рдкрд╛рдЗрдк рдХрдорд╛рдВрдб рджреЗрддреЗ рд╣реИрдВ, рддреЛ рдпрд╣ рд╕реНрд╡рдЪрд╛рд▓рд┐рдд рд░реВрдк рд╕реЗ рдбрд╛рдЙрдирд▓реЛрдб рдФрд░ рдЗрдВрд╕реНрдЯреЙрд▓ рд╣реЛ рдЬрд╛рдПрдЧрд╛ред

рдпрд╣ рд╕рдм рдореИрдВ рдЖрдкрдХреЗ рд╕рд┐рд╕реНрдЯрдо, рдЖрдкрдХреЗ рдЕрдЬрдЧрд░ рд╡рд┐рддрд░рдг рдЖрджрд┐ рдкрд░ рд╕реАрдорд┐рдд рдЬреНрдЮрд╛рди рдХреЗ рд╕рд╛рде рджреЗ рд╕рдХрддрд╛ рд╣реВрдВред
рдкрд╛рдЗрдк рдкреИрдХреЗрдЬ рдЗрдВрд╕реНрдЯреЙрд▓реЗрд╢рди рдЖрдкрдХреЗ рдкрд╛рдпрдерди рд╡рд┐рддрд░рдг рдХреЗ рд╕рд╛рде рдХреИрд╕реЗ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ, рдЗрд╕ рдмрд╛рд░реЗ рдореЗрдВ рдЕрдзрд┐рдХ рдЬрд╛рдирдХрд╛рд░реА рдХреЗ рд▓рд┐рдП Google рдЦреЛрдЬ рдХрд░рдиреЗ рдкрд░ рд╡рд┐рдЪрд╛рд░ рдХрд░реЗрдВред

рдирдорд╕реНрддреЗ, рдореИрдВрдиреЗ рдмрд╕ рдкрд┐рдЫрд▓реЗ рдПрдХ рдХреЛ рдЕрдирдЗрдВрд╕реНрдЯреЙрд▓ рдХрд┐рдпрд╛ рдФрд░ рдкреБрдирдГ рдЗрдВрд╕реНрдЯреЙрд▓ рдХрд┐рдпрд╛ рдФрд░ рдпрд╣ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ! рдмрд╣реБрдд-рдмрд╣реБрдд рдзрдиреНрдпрд╡рд╛рдж, рдЖрдкрдиреЗ рдореБрдЭреЗ рдирдпрд╛ рд▓реИрдкрдЯреЙрдк рдЦрд░реАрджрдиреЗ рд╕реЗ рдмрдЪрд╛рдпрд╛ред

рд╣рд╛рдп @gunan 3.5 рд╕рдВрдЧрддрддрд╛ рдХреЗ рд▓рд┐рдП рдирд╡реАрдирддрдо рдкрд░рд┐рд╡рд░реНрддрди рдХреЗ рд╕рд╛рде, рдореБрдЭреЗ рдирд┐рдореНрди рд▓реЙрдЧ рдорд┐рд▓рддрд╛ рд╣реИ:

>>>> sess = tf.Session()
I c:\tf_jenkins\home\workspace\nightly-win\device\gpu\os\windows\tensorflow\core
\common_runtime\gpu\gpu_device.cc:885] Found device 0 with properties:
name: Quadro K4100M
major: 3 minor: 0 memoryClockRate (GHz) 0.7055
pciBusID 0000:01:00.0
Total memory: 4.00GiB
Free memory: 3.69GiB
I c:\tf_jenkins\home\workspace\nightly-win\device\gpu\os\windows\tensorflow\core
\common_runtime\gpu\gpu_device.cc:906] DMA: 0
I c:\tf_jenkins\home\workspace\nightly-win\device\gpu\os\windows\tensorflow\core
\common_runtime\gpu\gpu_device.cc:916] 0:   Y
I c:\tf_jenkins\home\workspace\nightly-win\device\gpu\os\windows\tensorflow\core
\common_runtime\gpu\gpu_device.cc:975] Creating TensorFlow device (/gpu:0) -> (d
evice: 0, name: Quadro K4100M, pci bus id: 0000:01:00.0)
E c:\tf_jenkins\home\workspace\nightly-win\device\gpu\os\windows\tensorflow\core
\common_runtime\gpu\gpu_device.cc:586] Could not identify NUMA node of /job:loca
lhost/replica:0/task:0/gpu:0, defaulting to 0.  Your kernel may not have been bu
ilt with NUMA support.

рдореИрдВ рдЗрд╕рдХреЗ рдЖрд╕рдкрд╛рд╕ рдХреИрд╕реЗ рдЬрд╛ рд╕рдХрддрд╛ рд╣реВрдВ? рдЗрд╕реЗ рдХреИрд╕реЗ рдХрд░реЗрдВ рдЗрд╕ рдкрд░ рд╕реБрдЭрд╛рд╡реЛрдВ рдХрд╛ рд╕реНрд╡рд╛рдЧрдд рд╣реИред

@ kay10 рдРрд╕рд╛ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдХрд╛рдо рдХрд░ рдЧрдпрд╛ред рдЕрдВрддрд┐рдо рдкрдВрдХреНрддрд┐ рдкрд░ рд╡рд╣ рддреНрд░реБрдЯрд┐ рд╕рдВрджреЗрд╢ рд╕рд╣рдЬ рд╣реИ, рдФрд░ рд░рд┐рд▓реАрдЬ рдореЗрдВ рд╣рдЯрд╛ рджрд┐рдпрд╛ рдЬрд╛ рд░рд╣рд╛ рд╣реИред

рдЬреИрд╕рд╛ рдХрд┐ рдореИрдВрдиреЗ рдЗрд╕ рдзрд╛рдЧреЗ рдореЗрдВ рджреЗрдЦрд╛ рд╣реИ, рд╕рднреА рдХреЗ рдкрд╛рд╕ рд╕рдВрдЧрддрддрд╛ рд╕реНрддрд░ 3 рд╣реИред рдЬрд┐рдирдХреЗ рдкрд╛рд╕ 2 рдХреА рд╕рдВрдЧрддрддрд╛ рд╣реИ, рдХреНрдпрд╛ рд╕реНрд░реЛрдд рдХреЛрдб рд╕рдВрдХрд▓рд┐рдд рдХрд┐рдП рдмрд┐рдирд╛ рдХреЛрдИ рд╕рдорд╛рдзрд╛рди рд╣реИ?
рдореИрдВрдиреЗ @gunan рджреНрд╡рд╛рд░рд╛ рд╕рд╛рдЭрд╛ рдХрд┐рдП рдЧрдП рд░рд╛рдд рдХреЗ рдирд┐рд░реНрдорд╛рдг рдХреА рдХреЛрд╢рд┐рд╢ рдХреА рдФрд░ рддреНрд░реБрдЯрд┐ рдорд┐рд▓реА:
tensorflow_gpu-0.12.0rc0-cp35-cp35m-win_amd64.whl is not a supported wheel on this platform.
рдпрд╣ рдПрдХ рд▓рд┐рдирдХреНрд╕ рд╡реНрд╣реАрд▓ рдирд╣реАрдВ рд╣реИ рдФрд░ рдореИрдВрдиреЗ рдЗрд╕реЗ рдереЛрдбрд╝рд╛ рдЬрд▓реНрдж рд╣реА рдорд╣рд╕реВрд╕ рдХрд┐рдпрд╛ред

16.04 рдЙрдмрдВрдЯреВ рдкрд░ рд╡рд░реНрддрдорд╛рди рд╕реНрдерд┐рддрд┐ред
I tensorflow/core/common_runtime/gpu/gpu_device.cc:948] Ignoring visible gpu device (device: 0, name: GeForce GTX 590, pci bus id: 0000:03:00.0) with Cuda compute capability 2.0. The minimum required Cuda capability is 3.0. I tensorflow/core/common_runtime/gpu/gpu_device.cc:948] Ignoring visible gpu device (device: 1, name: GeForce GTX 590, pci bus id: 0000:04:00.0) with Cuda compute capability 2.0. The minimum required Cuda capability is 3.0.

@batuhandayioglugil рд╣рдорд╛рд░реЗ рдмрд╣реБрдд рд╕реЗ GPU рдХрд░реНрдиреЗрд▓ рдХрд╛рд░реНрдпрдХреНрд╖рдорддрд╛ рдкрд░ рднрд░реЛрд╕рд╛ рдХрд░рддреЗ рд╣реИрдВ рдЬреЛ рдХреЗрд╡рд▓ 3.0 рдФрд░ рдЗрд╕рдХреЗ рдмрд╛рдж рдХреЗ рд╕рдВрд╕реНрдХрд░рдг рдореЗрдВ рдЙрдкрд▓рдмреНрдз рд╣реИ, рдЗрд╕рд▓рд┐рдП рджреБрд░реНрднрд╛рдЧреНрдп рд╕реЗ рдЖрдкрдХреЛ рдПрдХ рдирдП GPU рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрдЧреАред рдЖрдк рдХреНрд▓рд╛рдЙрдб рд╕реЗрд╡рд╛рдУрдВ рдореЗрдВ рд╕реЗ рдХрд┐рд╕реА рдПрдХ рдХреЛ рдЖрдЬрд╝рдорд╛рдиреЗ рдкрд░ рднреА рд╡рд┐рдЪрд╛рд░ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред

@vrv рдореИрдВ рдЗрди рдореБрджреНрджреЛрдВ рдкрд░ рдХрд╛рдлреА рд╕рдордп рдмрд┐рддрд╛рдиреЗ рдФрд░ рдПрдХ рдирдпрд╛ рдкреАрдПрд╕рдпреВ рдЦрд░реАрджрдиреЗ рдХреЗ рдмрд╛рдж рдЗрд╕ рдмрд┐рдВрджреБ рдкрд░ рдЖрдпрд╛, рдЗрд╕рд▓рд┐рдП рдореБрдЭреЗ рдмрд╣реБрдд рдЦрд░реНрдЪ рд╣реБрдЖред рд╕рдордп рдХреА рдмрд░реНрдмрд╛рджреА рд╕реЗ рдмрдЪрдиреЗ рдХреЗ рд▓рд┐рдП, рдореИрдВ рдПрдХ рдкреНрд░рд╢реНрди рдкреВрдЫрдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реВрдВ: рдХрдо рд╕реЗ рдХрдо 15 рдЧрд╣рди рд╢рд┐рдХреНрд╖рдг рдкреБрд╕реНрддрдХрд╛рд▓рдп рд╣реИрдВ рдЬрд┐рдиреНрд╣реЗрдВ рдореИрдВрдиреЗ рд╕реБрдирд╛ рд╣реИред рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдХреЗ рд▓рд┐рдП Cuda рдФрд░ cuDNN рдЖрд╡рд╢реНрдпрдХ рдереЗред рдХреНрдпрд╛ рдпрд╣ рд╕реНрдерд┐рддрд┐ (рдЧрдгрдирд╛ рдХреНрд╖рдорддрд╛) cuda рдкреБрд╕реНрддрдХрд╛рд▓рдп рдХреЗ рд▓рд┐рдП рд╡рд┐рд╢реЗрд╖ рд╣реИ? рдХреНрдпрд╛ рдореБрдЭреЗ рдХреЛрдИ рдФрд░ рдореМрдХрд╛ рдорд┐рд▓ рд╕рдХрддрд╛ рд╣реИ? рдпрджрд┐ рдирд╣реАрдВ, рддреЛ рдореИрдВ рд╕рд╣реА рдЬрд╛рдирдирд╛ рдЫреЛрдбрд╝ рджреВрдВрдЧрд╛ рдФрд░ рд╕реАрдкреАрдпреВ рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░рдирд╛ рдЬрд╛рд░реА рд░рдЦреВрдВрдЧрд╛ (рдореЗрд░реА рдЙрдкреЗрдХреНрд╖рд╛ рдХреЛ рдХреНрд╖рдорд╛ рдХрд░реЗрдВ)

рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдЖрдкрдХреЗ 2.0 рдХрд╛рд░реНрдб рдХреЛ рдХрд╛рдо рдХрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░рдиреЗ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдЕрдзрд┐рдХ рдкрд░реЗрд╢рд╛рдиреА рд╣реЛрдЧреА - рдпрд╣ рд╕рдВрднрд╡ рд╣реИ рдХрд┐ рдЖрдкрдХрд╛ рдореМрдЬреВрджрд╛ рд╕реАрдкреАрдпреВ рдЖрдкрдХреЗ рд╡рд┐рд╢рд┐рд╖реНрдЯ рдЬреАрдкреАрдпреВ рд╕реЗ рддреЗрдЬ рдпрд╛ рддреЗрдЬ рд╣реЛ, рдФрд░ рд╢реБрд░реВ рдХрд░рдиреЗ рдореЗрдВ рдмрд╣реБрдд рдХрдо рдкрд░реЗрд╢рд╛рдиреА рд╣реЛред рдореБрдЭреЗ рдирд╣реАрдВ рдкрддрд╛ рдХрд┐ рджреБрд░реНрднрд╛рдЧреНрдп рд╕реЗ рдЕрдиреНрдп рдкреБрд╕реНрддрдХрд╛рд▓рдпреЛрдВ рдХреА рдХреНрдпрд╛ рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИред

рдХреНрдпрд╛ рдпрд╣ рдкрд╣рд▓реЗ рд╕реЗ рд╣реА GPU рдЧрдгрдирд╛ 3.0 рдХрд╛ рд╕рдорд░реНрдерди рдХрд░рддрд╛ рд╣реИ?

рд╣рд╛рдВред

@martinwicke рддреЗрдЬреА рд╕реЗ рдкреНрд░рддрд┐рдХреНрд░рд┐рдпрд╛ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рджред рдХреНрдпрд╛ рдореБрдЭреЗ рдЕрднреА рднреА рдЗрд╕реЗ рд╕реНрд░реЛрдд рд╕реЗ рдмрдирд╛рдирд╛ рд╣реИ, рдпрд╛ рд╕реАрдзреЗ рдЗрд╕реЗ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдирд╛ рд╣реИ? рдореИрдВ рдЖрд░реНрдХ рд▓рд┐рдирдХреНрд╕ рдкрд░ рд╣реВрдВ рдФрд░ рд╕реА рдХрдВрдкрд╛рдЗрд▓рд░ рдХреЗ рд╕рд╛рде рддреНрд░реБрдЯрд┐ рджреЗрдиреЗ рд╡рд╛рд▓реЗ рд╕реНрд░реЛрдд рд╕реЗ рдЗрд╕реЗ рдмрдирд╛рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдВрдШрд░реНрд╖ рдХрд░рддрд╛ рд╣реВрдВред

рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдЗрд╕реЗ рдмрд╛рдЗрдирд░реА рд╕реЗ рдХрд╛рдо рдХрд░рдирд╛ рдЪрд╛рд╣рд┐рдПред

рдореБрдЭреЗ рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛ рд╣реИ "рдХреВрдбрд╛ рдХрдВрдкреНрдпреВрдЯ рдХреНрд╖рдорддрд╛ 2.1 рдХреЗ рд╕рд╛рде gpu рдбрд┐рд╡рд╛рдЗрд╕ (рдбрд┐рд╡рд╛рдЗрд╕: 0, рдирд╛рдо: GeForce GT 635M, pci рдмрд╕ рдЖрдИрдбреА) рдХреЛ рдЕрдирджреЗрдЦрд╛ рдХрд░рдирд╛ред рдиреНрдпреВрдирддрдо рдЖрд╡рд╢реНрдпрдХ Cuda рдХреНрд╖рдорддрд╛ 3.0 рд╣реИред" . @smtabatabaie @martinwicke @alphajatinред рдорджрдж !!!!

рдЧрдгрдирд╛ рдХреНрд╖рдорддрд╛ 2.1 TensorFlow рдЪрд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдмрд╣реБрдд рдХрдо рд╣реИред GPU рдкрд░ TensorFlow рдЪрд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдЖрдкрдХреЛ рдПрдХ рдирдП (рдпрд╛ рдЕрдзрд┐рдХ рд╢рдХреНрддрд┐рд╢рд╛рд▓реА) рдЧреНрд░рд╛рдлрд┐рдХреНрд╕ рдХрд╛рд░реНрдб рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрдЧреАред

рдкреНрд░рд╢реНрди рдХреЗ рдЙрддреНрддрд░ рдХрд╛ url рдЕрдорд╛рдиреНрдп рд╣реИред рдХреНрдпрд╛ рдЖрдк рдЗрд╕реЗ рдЕрдкрдбреЗрдЯ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ?

рд░рд╛рддреНрд░рд┐рдХрд╛рд▓реАрди рдкрд╛рдЗрдк рдкреИрдХреЗрдЬ рдХреЗ рд▓рд┐рдП, рд╕рдВрд╕реНрдерд╛рдкрди рдХрд╛ рдЕрдиреБрд╢рдВрд╕рд┐рдд рддрд░реАрдХрд╛ pip install tf-nightly рдХрдорд╛рдВрдб рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ рд╣реИред
ci.tensorflow.org рдкрджрд╛рд╡рдирдд рд╣реИред

рдХреНрдпрд╛ рдпрд╣ рдкреГрд╖реНрда рдЙрдкрдпреЛрдЧреА рдерд╛?
0 / 5 - 0 рд░реЗрдЯрд┐рдВрдЧреНрд╕

рд╕рдВрдмрдВрдзрд┐рдд рдореБрджреНрджреЛрдВ

waleedka picture waleedka  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

ppwwyyxx picture ppwwyyxx  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

MrSaad picture MrSaad  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

aerointern16 picture aerointern16  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

indiejoseph picture indiejoseph  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ