Tensorflow: CuDNN 7 рдФрд░ CUDA 9 рдореЗрдВ рдЕрдкрдЧреНрд░реЗрдб рдХрд░реЗрдВ

рдХреЛ рдирд┐рд░реНрдорд┐рдд 5 рдЕрдЧре░ 2017  ┬╖  170рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ  ┬╖  рд╕реНрд░реЛрдд: tensorflow/tensorflow

рд╡реНрдпрд╡рд╕реНрдерд╛ рдЬрд╛рдирдХрд╛рд░реА

  • рдХреНрдпрд╛ рдореИрдВрдиреЗ рдХрд╕реНрдЯрдо рдХреЛрдб рд▓рд┐рдЦрд╛ рд╣реИ (рдЬреИрд╕рд╛ рдХрд┐ TensorFlow рдореЗрдВ рдкреНрд░рджрд╛рди рдХреА рдЧрдИ рд╕реНрдЯреЙрдХ рдЙрджрд╛рд╣рд░рдг рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд╡рд┐рдкрд░реАрдд) : рдирд╣реАрдВ
  • рдУрдПрд╕ рдкреНрд▓реЗрдЯрдлреЙрд░реНрдо рдФрд░ рд╡рд┐рддрд░рдг (рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рд▓рд┐рдирдХреНрд╕ рдЙрдмрдВрдЯреВ 16.04) : рд╡рд┐рдВрдбреЛрдЬ рд╕рд░реНрд╡рд░ 2012
  • TensorFlow (рд╕реНрд░реЛрдд рдпрд╛ рдмрд╛рдЗрдирд░реА) рд╕реЗ рд╕реНрдерд╛рдкрд┐рдд : рдмрд╛рдЗрдирд░реА
  • TensorFlow рд╕рдВрд╕реНрдХрд░рдг (рдиреАрдЪреЗ рдХрдорд╛рдВрдб рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░реЗрдВ) : 1.3.0-rc1
  • рдкрд╛рдпрдерди рд╕рдВрд╕реНрдХрд░рдг : 3.5.2
  • рдмреЗрдЬрд╝рд▓ рд╕рдВрд╕реНрдХрд░рдг (рдпрджрд┐ рд╕реНрд░реЛрдд рд╕реЗ рд╕рдВрдХрд▓рд┐рдд рдХрд┐рдпрд╛ рдЬрд╛ рд░рд╣рд╛ рд╣реИ) : рдПрди/рдП
  • CUDA/cuDNN рд╕рдВрд╕реНрдХрд░рдг : CUDA V8.0.44, CuDNN 6.0
  • GPU рдореЙрдбрд▓ рдФрд░ рдореЗрдореЛрд░реА : Nvidia GeForce GTX 1080 Ti, 11 GB
  • рдкреБрди :

рд╕рдорд╕реНрдпрд╛ рд╡рд┐рд╕реНрддрд╛рд░ рд╕реЗ рд╕рдордЭрд╛рдЗрдпреЗ

рдХреГрдкрдпрд╛ CUDA 9 рдФрд░ CuDNN 7 рдХрд╛ рд╕рдорд░реНрдерди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП TensorFlow рдХреЛ рдЕрдкрдЧреНрд░реЗрдб рдХрд░реЗрдВред рдПрдирд╡реАрдбрд┐рдпрд╛ рдХрд╛ рджрд╛рд╡рд╛ рд╣реИ рдХрд┐ рдпрд╣ рдкрд╛рд╕реНрдХрд▓ рдЬреАрдкреАрдпреВ рдкрд░ 2x рдкреНрд░рджрд░реНрд╢рди рдХреЛ рдмрдврд╝рд╛рд╡рд╛ рджреЗрдЧрд╛ред

рд╕рдмрд╕реЗ рдЙрдкрдпреЛрдЧреА рдЯрд┐рдкреНрдкрдгреА

рдЬреЛрдбрд╝реЗ рдЬрд╛рдиреЗ рд╡рд╛рд▓реЗ рддрд░реАрдХреЛрдВ рдХреА рдмрд╛рдд рдХрд░реЗрдВ рддреЛ, cudnn7 рд╕реЗ рд╕рдореВрд╣ рдХрдирд╡рд▓реНрд╢рди рджреГрд╖реНрдЯрд┐ рд╕рдореБрджрд╛рдп рдХреЗ рд▓рд┐рдП рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╡рд┐рд╢реЗрд╖рддрд╛ рд╣реЛрдЧреАред

рд╕рднреА 170 рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

@tfboyd рдХреНрдпрд╛ рдЗрд╕ рдкрд░ рдЖрдкрдХреА рдХреЛрдИ рдЯрд┐рдкреНрдкрдгреА рд╣реИ?

cuDNN 7 рдЕрднреА рднреА рдкреВрд░реНрд╡рд╛рд╡рд▓реЛрдХрди рдореЛрдб рдореЗрдВ рд╣реИ рдФрд░ рдЗрд╕ рдкрд░ рдХрд╛рдо рдХрд┐рдпрд╛ рдЬрд╛ рд░рд╣рд╛ рд╣реИред рд╣рдо рд╕рд┐рд░реНрдл 1.3 рдХреЗ рд╕рд╛рде cuDNN 6.0 рдореЗрдВ рдЪрд▓реЗ рдЧрдП, рдЬреЛ рдХреБрдЫ рд╣рдлреНрддреЛрдВ рдореЗрдВ рдЕрдВрддрд┐рдо рд╣реЛ рдЬрд╛рдирд╛ рдЪрд╛рд╣рд┐рдПред рдпрджрд┐ рдЖрдк рдЙрд╕рдореЗрдВ рд░реБрдЪрд┐ рд░рдЦрддреЗ рд╣реИрдВ рддреЛ рдЖрдк cuDNN 1.3.0rc2 рдбрд╛рдЙрдирд▓реЛрдб рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред рдореИрдВрдиреЗ рдЕрднреА рддрдХ cuDNN 7 рдпрд╛ CUDA 9 рдХреЗ рд╕рд╛рде рд╕рдВрдХрд▓рд┐рдд рдирд╣реАрдВ рдХрд┐рдпрд╛ рд╣реИред рдореИрдВрдиреЗ рд╕реБрдирд╛ рд╣реИ рдХрд┐ CUDA 9 рд╕рднреА рдкреНрд▓реЗрдЯрдлреЙрд░реНрдо рдкрд░ рдЗрдВрд╕реНрдЯреЙрд▓ рдХрд░рдирд╛ рдЖрд╕рд╛рди рдирд╣реАрдВ рд╣реИ рдФрд░ рдХреЗрд╡рд▓ рдЪреБрдирд┐рдВрджрд╛ рдЗрдВрд╕реНрдЯреЙрд▓ рдкреИрдХреЗрдЬ рд╣реА рдЙрдкрд▓рдмреНрдз рд╣реИрдВред рдЬрдм рдкреБрд╕реНрддрдХрд╛рд▓рдп рдЕрдВрддрд┐рдо рд╣реЛрдВрдЧреЗ рддреЛ рд╣рдо рдЕрдВрддрд┐рдо рдореВрд▓реНрдпрд╛рдВрдХрди рд╢реБрд░реВ рдХрд░реЗрдВрдЧреЗред рдПрдирд╡реАрдЖрдИрдбреАрдЖрдИрдП рдиреЗ рдЗрди рдирдП рдкреБрд╕реНрддрдХрд╛рд▓рдпреЛрдВ рдХреЗ рдкрд╣рд▓реБрдУрдВ рдХрд╛ рд╕рдорд░реНрдерди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкреНрд░рдореБрдЦ рдПрдордПрд▓ рдкреНрд▓реЗрдЯрдлреЙрд░реНрдо рдкрд░ рдкреИрдЪ рднреЗрдЬрдирд╛ рд╢реБрд░реВ рдХрд░ рджрд┐рдпрд╛ рд╣реИ рдФрд░ рдореБрдЭреЗ рд╕рдВрджреЗрд╣ рд╣реИ рдХрд┐ рдЕрддрд┐рд░рд┐рдХреНрдд рдХрд╛рдо рд╣реЛрдЧрд╛ред

рд╕рдВрдкрд╛рджрд┐рдд рдХрд░реЗрдВ: рдореЗрд░рд╛ рдХрд╣рдирд╛ рдерд╛ рдХрд┐ CUDA 9 рд╕рднреА рдкреНрд▓реЗрдЯрдлрд╛рд░реНрдореЛрдВ рдкрд░ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдирд╛ рдЖрд╕рд╛рди рдирд╣реАрдВ рд╣реИ рдФрд░ рдЗрд╕рдХреЗ рдмрдЬрд╛рдп cuDNN рдиреЗ рдХрд╣рд╛ред рдореИрдВрдиреЗ рдпрд╣ рднреА рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд┐рдпрд╛ рдХрд┐ рдХрд╛рдо рд╣реЛрдЧрд╛ рдореБрдЭреЗ рд╕рдВрджреЗрд╣ рд╣реИ рдХрд┐ рдЕрддрд┐рд░рд┐рдХреНрдд рдХрд╛рдо рд╣реЛрдЧрд╛ред рдореЗрд░реЗ рджреНрд╡рд╛рд░рд╛ рдЫреЛрдбрд╝реЗ рдЧрдП рдореЗрд░реЗ рдмрд╛рдХреА рдореВрд░реНрдЦрддрд╛рдкреВрд░реНрдг рдмрдпрд╛рди, рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП рдореБрдЭреЗ рдирд╣реАрдВ рдкрддрд╛ рдерд╛ рдХрд┐ cuDNN 7 рдХрд▓ рд▓рд╛рдЗрд╡ рд╣реЛ рдЧрдпрд╛ рдерд╛ред

рдпрд╣ рдирд╣реАрдВ рдХрд╣ рд░рд╣рд╛ рдХрд┐ рдЖрдкрдХреЛ рд╡реЗрдмрд╕рд╛рдЗрдЯ рдХреИрд╕реЗ рдкрдврд╝рдиреА рдЪрд╛рд╣рд┐рдПред рд▓реЗрдХрд┐рди рдкрд╛рд╕реНрдХрд▓ рдкрд░ 2x рддреЗрдЬ CUDA 8 рд░рд┐рд▓реАрдЬ рдХрд╛ рд╣рд┐рд╕реНрд╕рд╛ рд▓рдЧрддрд╛ рд╣реИред рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдЗрд╕ рдмрд╛рдд рдкрд░ рдирд┐рд░реНрднрд░ рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдЖрдк рд╕рд╛рдЗрдЯ рдХреЛ рдХреИрд╕реЗ рдкрдврд╝рддреЗ рд╣реИрдВред NVIDIA рдиреЗ рд╣рдореЗрдВ рдпрд╣ рдЙрд▓реНрд▓реЗрдЦ рдирд╣реАрдВ рдХрд┐рдпрд╛ рд╣реИ рдХрд┐ CUDA 9 рдкрд╛рд╕реНрдХрд▓ рдХреЛ 2x (рд╣рд░ рдЪреАрдЬ рдкрд░) рддреЗрдЬ рдХрд░рдиреЗ рдЬрд╛ рд░рд╣рд╛ рд╣реИ рдФрд░ рдЬрдмрдХрд┐ рдХреБрдЫ рднреА рд╕рдВрднрд╡ рд╣реИ, рдореИрдВ рдРрд╕рд╛ рд╣реЛрдиреЗ рдХреА рдЙрдореНрдореАрдж рдирд╣реАрдВ рдХрд░реВрдВрдЧрд╛ред

https://developer.nvidia.com/cuda-toolkit/whatsnew

рд╕рд╛рдЗрдЯ рдереЛрдбрд╝реА рднреНрд░рдорд┐рдд рдХрд░рдиреЗ рд╡рд╛рд▓реА рд╣реИ рд▓реЗрдХрд┐рди рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдЖрдк рдЬрд┐рд╕ рдЕрдиреБрднрд╛рдЧ рдХреЛ рдЙрджреНрдзреГрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рд╡рд╣ CUDA 8 рдХреЗ рдЕрдВрддрд░реНрдЧрдд рдирд┐рд╣рд┐рдд рд╣реИред рдореИрдВ рдХреЗрд╡рд▓ рдЗрд╕рдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд░рддрд╛ рд╣реВрдВ рддрд╛рдХрд┐ рдЖрдкрдХреЛ рдЙрдирдХреА рд░рд┐рд╣рд╛рдИ рдХреЗ рд▓рд┐рдП рдЕрд╡рд╛рд╕реНрддрд╡рд┐рдХ рдЕрдкреЗрдХреНрд╖рд╛рдПрдВ рди рд╣реЛрдВред рд╡реЛрд▓реНрдЯрд╛ рдХреЗ рд▓рд┐рдП рдЬреЛ рдХреБрдЫ рдореИрдВ рд╕рдордЭрддрд╛ рд╣реВрдВ рдЙрд╕рд╕реЗ рдХреБрдЫ рдмрдбрд╝рд╛ рд▓рд╛рдн рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдП рдФрд░ рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ (рдореБрдЭреЗ рдЕрдм рдпрдХреАрди рдирд╣реАрдВ рд╣реИ) рд▓реЛрдЧреЛрдВ рдХреЛ рд╡реЛрд▓реНрдЯрд╛ рдХреЗ рдЗрдВрдЬреАрдирд┐рдпрд░рд┐рдВрдЧ рдирдореВрдиреЗ рдорд┐рд▓ рд░рд╣реЗ рд╣реИрдВ рддрд╛рдХрд┐ рдкреВрд░реНрдг рд░рд┐рд▓реАрдЬ рдХреЗ рд▓рд┐рдП рддреИрдпрд╛рд░ рд╣реЛрдиреЗ рдХреЗ рд▓рд┐рдП рдЙрдЪреНрдЪ рд╕реНрддрд░реАрдп рдХрд╛рдо рд╢реБрд░реВ рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХреЗред

@tfboyd cuDNN 7 рдХрд▓ рдХреА рддрд░рд╣ рдЕрдм рдкреВрд░реНрд╡рд╛рд╡рд▓реЛрдХрди рдореЛрдб рдореЗрдВ рдирд╣реАрдВ рд╣реИред рдЗрд╕реЗ рдЖрдзрд┐рдХрд╛рд░рд┐рдХ рддреМрд░ рдкрд░ CUDA 8.0 рдФрд░ CUDA 9.0 RC рджреЛрдиреЛрдВ рдХреЗ рд▓рд┐рдП рдЬрд╛рд░реА рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред

рдЖрд╣ рдореБрдЭреЗ рд╡рд╣ рдпрд╛рдж рдЖрдпрд╛ред рдзрдиреНрдпрд╡рд╛рдж @sclarkson рдФрд░ рдЧрд▓рдд рдЬрд╛рдирдХрд╛рд░реА рдХреЗ рд▓рд┐рдП рдЦреЗрдж рд╣реИред

рдореИрдВ рдирд┐рд╢реНрдЪрд┐рдд рд░реВрдк рд╕реЗ рдЗрд╕реЗ рдЖрдЬрдорд╛рдЙрдВрдЧрд╛ рдХреНрдпреЛрдВрдХрд┐ рдЕрдВрдд рдореЗрдВ рдЬреАрд╕реАрд╕реА 6 рд╕реАрдпреВрдбреАрдП 9 рджреНрд╡рд╛рд░рд╛ рд╕рдорд░реНрдерд┐рдд рд╣реИ рдФрд░ рдЙрдмрдВрдЯреВ 17.04 рдЗрд╕рдХреЗ рд╕рд╛рде рдЖрддрд╛ рд╣реИред

рдЕрдЧрд░ рдЖрдкрдХреА рдХрд┐рд╕реНрдордд рдЕрдЪреНрдЫреА рд╣реИ рддреЛ рдзрд╛рдЧреЗ рдХреЛ рдмрддрд╛рдПрдВред рдореИрдВ рд╡реНрдпрдХреНрддрд┐рдЧрдд рд░реВрдк рд╕реЗ рдЕрднреА рд╢реБрд░реВ рдХрд░ рд░рд╣рд╛ рд╣реВрдБ
рдкреВрд░реА рддрд░рд╣ рд╕реЗ cuDNN 6 рдХрд╛ рдкрд░реАрдХреНрд╖рдг рдХрд░реЗрдВ (рдЖрдВрддрд░рд┐рдХ рд░реВрдк рд╕реЗ рдЗрд╕рдХрд╛ рдмрд╣реБрдд рдкрд░реАрдХреНрд╖рдг рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ рд▓реЗрдХрд┐рди рдореИрдВ рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ
рдЗрд╕реЗ рд╡реНрдпрдХреНрддрд┐рдЧрдд рд░реВрдк рд╕реЗ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛)ред рдореИрдВ рдЕрдХреНрд╕рд░ рдирд╡реАрдирддрдо рд╕рд╛рдордЧреНрд░реА рдореЗрдВ рдЕрдкрдЧреНрд░реЗрдб рдХрд░рдиреЗ рдореЗрдВ рдзреАрдорд╛ рд╣реЛрддрд╛ рд╣реВрдВред рдореЗрд░реЗ
рдЕрдиреБрдорд╛рди рд╣реИ рдХрд┐ рдЖрдк cuDNN 7 рдХреЗ рд╕рд╛рде рддрдм рддрдХ рдХреЛрдИ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдкрд░рд┐рд╡рд░реНрддрди рдирд╣реАрдВ рджреЗрдЦ рд╕рдХрддреЗ рдЬрдм рддрдХ рдХрд┐ рд╕рдм рдХреБрдЫ рдирд╣реАрдВ рдорд┐рд▓ рдЬрд╛рддрд╛
рдирд╡реАрдирддрдо рдПрдкреАрдЖрдИ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкреИрдЪ рдХрд┐рдпрд╛ рдЧрдпрд╛ред рдореИрдВ рдлрд┐рд░ рд╕реЗ рдЬреЛрд░ рджреЗрдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реВрдВ рдХрд┐ рдореИрдВ рдЧрд▓рдд рд╣реВрдВ
рд╕рдордп рдХрд╛ред рдореИрдВрдиреЗ рдПрдХ рдмрд╛рд╣рд░реА рд╡реНрдпрдХреНрддрд┐ рдХреЗ рд░реВрдк рдореЗрдВ рдЬреЛ рджреЗрдЦрд╛ рд╣реИ рд╡рд╣ рдирдпрд╛ cuDNN рд╕рдВрд╕реНрдХрд░рдг рд╣реИ
рдирдП рддрд░реАрдХреЗ/рдПрдкреАрдЖрдИред рдХреБрдЫ рджрд┐рд▓рдЪрд╕реНрдк рд╣реИрдВ рдФрд░ рдХреБрдЫ рддреБрд░рдВрдд рдирд╣реАрдВ рд╣реИрдВ
рдЙрдкрдпреЛрдЧреАред рдлрд┐рд░ рдЙрди API рдХреЛ TensorFlow API рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдЙрдЬрд╛рдЧрд░ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдпрд╛ рдмрд╕ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ
рдкрд░реНрджреЗ рдХреЗ рдкреАрдЫреЗ рдореМрдЬреВрджрд╛ рддрд░реАрдХреЛрдВ рдХреЛ рддреЗрдЬ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдПред рдореЗрд░рд╛ рдмрд╣реБрдд рдЙрдЪреНрдЪ рд╕реНрддрд░
рд╕рдордЭ рд╣реИ cuDNN 7 + CUDA 9, FP16 рд╕рдорд░реНрдерди рдХреЛ рдмрдврд╝рд╛рдиреЗ рдкрд░ рдзреНрдпрд╛рди рдХреЗрдВрджреНрд░рд┐рдд рдХрд░реЗрдЧрд╛
рд╡реЛрд▓реНрдЯрд╛ред рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдореБрдЦреНрдп рдлреЛрдХрд╕ рдореЗрдВ рд╕реЗ рдПрдХ рдпрд╣ рд╣реИ рдХрд┐ рдореЙрдбрд▓ рдХреИрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░реЗрдВ (рдХрдИ рди рд╕рд┐рд░реНрдл
рдХреБрдЫ) FP16 рдХреЗ рд╕рд╛рде рдЕрднрд┐рд╕рд░рдг рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЕрдВрддрд╣реАрди рд░реВрдк рд╕реЗ рд╕рд╣реА рдХрд╛ рдЕрдиреБрдорд╛рди рд▓рдЧрд╛рдП рдмрд┐рдирд╛
config/hyperparameters рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдПред рдореИрдВ рдЗрд╕ рдмрд╛рдд рдкрд░ рдЬреЛрд░ рджреЗрдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реВрдВ рдХрд┐ рдореИрдВ рдЗрд╕ рддрд░рд╣ рд╣реВрдВ
рдмрд╛рддрдЪреАрдд рдХреЛ рд╕рдордЭрд╛ рдФрд░ рдореИрдВ рдЧрд▓рдд рдпрд╛ рдЖрдзрд╛ рд╕рд╣реА рд╣реЛ рд╕рдХрддрд╛ рд╣реВрдВред

рддрдирд╛рд╡: рдпрджрд┐ рдРрд╕реА рдХреЛрдИ рд╡рд┐рдзрд┐рдпрд╛рдБ рд╣реИрдВ рдЬреЛ рдЖрдкрдХреЛ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдЬреЛрдбрд╝рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ (рдпрд╛ рдЗрд╕рдХреЗ рд▓рд┐рдП рдЙрддреНрддреЛрд▓рди)
рдкреНрд░рджрд░реНрд╢рди) cuDNN рд╕реЗ TensorFlow рдХреЗ рд▓рд┐рдП рд╣рдо рд╣рдореЗрд╢рд╛ рдПрдХ рд╕реВрдЪреА рдореЗрдВ рд░реБрдЪрд┐ рд░рдЦрддреЗ рд╣реИрдВред
рдЖрдВрддрд░рд┐рдХ рд░реВрдк рд╕реЗ, рдпрд╣ cuDNN 6 рдХреЗ рд╕рд╛рде рд╣реБрдЖ рдФрд░ рд╣рдордиреЗ рдЗрд╕реЗ рд▓рд╛рдЧреВ рдХрд░рдиреЗ рдкрд░ рдзреНрдпрд╛рди рдХреЗрдВрджреНрд░рд┐рдд рдХрд┐рдпрд╛
рдлреАрдЪрд░ рдЯреАрдореЛрдВ рдиреЗ рдХрд╣рд╛ рдХрд┐ рд╡реЗ рдЪрд╛рд╣рддреЗ рдереЗ рдХрд┐ рдЗрд╕рд╕реЗ рдЙрдирдХреА рдкрд░рд┐рдпреЛрдЬрдирд╛рдУрдВ рдореЗрдВ рдорджрдж рдорд┐рд▓реЗрдЧреАред

рд╢рдирд┐рд╡рд╛рд░, 5 рдЕрдЧрд╕реНрдд, 2017 рдХреЛ рд╕реБрдмрд╣ 8:46 рдмрдЬреЗ, рдХреЛрд░реНрдЯрд┐рдпрд▓ рдлреНрд▓реЛрд░рд┐рдпрди рдиреЛрдЯрд┐рдлрд┐рдХреЗрд╢рди @github.com
рд▓рд┐рдЦрд╛ рдерд╛:

рдореИрдВ рдирд┐рд╢реНрдЪрд┐рдд рд░реВрдк рд╕реЗ рдЗрд╕реЗ рдЖрдЬрдорд╛рдЙрдВрдЧрд╛ рдХреНрдпреЛрдВрдХрд┐ рдЕрдВрдд рдореЗрдВ рдЬреАрд╕реАрд╕реА 6 рд╕реАрдпреВрдбреАрдП 9 рджреНрд╡рд╛рд░рд╛ рд╕рдорд░реНрдерд┐рдд рд╣реИ рдФрд░
рдЙрдмрдВрдЯреВ 17.04 рдЗрд╕рдХреЗ рд╕рд╛рде рдЖрддрд╛ рд╣реИред

-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-320450756 ,
рдпрд╛ рдереНрд░реЗрдб рдХреЛ рдореНрдпреВрдЯ рдХрд░реЗрдВ
https://github.com/notifications/unsubscribe-auth/AWZessKqj_nPY1br9SD9L9SX-8Kf5Dbtks5sVI5TgaJpZM4OuRL7
.

рдЬреЛрдбрд╝реЗ рдЬрд╛рдиреЗ рд╡рд╛рд▓реЗ рддрд░реАрдХреЛрдВ рдХреА рдмрд╛рдд рдХрд░реЗрдВ рддреЛ, cudnn7 рд╕реЗ рд╕рдореВрд╣ рдХрдирд╡рд▓реНрд╢рди рджреГрд╖реНрдЯрд┐ рд╕рдореБрджрд╛рдп рдХреЗ рд▓рд┐рдП рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╡рд┐рд╢реЗрд╖рддрд╛ рд╣реЛрдЧреАред

рдХреВрд▓ рдореИрдВ рдЗрд╕реЗ рдЙрд╕ рд╕реВрдЪреА рдореЗрдВ рдЬреЛрдбрд╝ рджреВрдВрдЧрд╛ рдЬреЛ рдореИрдВ рд╢реБрд░реВ рдХрд░ рд░рд╣рд╛ рд╣реВрдВред рдореИрдВ рднреВрд▓ рд╕рдХрддрд╛ рд╣реВрдБ рд▓реЗрдХрд┐рди рд╕реНрд╡рддрдВрддреНрд░ рдорд╣рд╕реВрд╕ рдХрд░рддрд╛ рд╣реВрдБ
рдореБрдЭреЗ рдХрд┐рд╕реА рдкреНрд░рдХрд╛рд░ рдХреА рд╕реВрдЪреА рдкреНрд░рдХрд╛рд╢рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдпрд╛рдж рджрд┐рд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдЬрд╣рд╛рдВ рдореИрдВ рдХреБрдЫ рдорд╛рд░реНрдЧрджрд░реНрд╢рди рдкреНрд░рджрд╛рди рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ
рдЬрд┐рд╕ рдкрд░ рдХрд╛рдо рд╣реЛрдиреЗ рдХреА рд╕рдВрднрд╛рд╡рдирд╛ рд╣реИред рдпрд╣ рд╡рд╛рджрд╛ рдирд╣реАрдВ рд╣реЛ рд╕рдХрддрд╛ рд▓реЗрдХрд┐рди рд╣рдо рдЪрд╛рд╣рддреЗ рд╣реИрдВ
рдкреНрд░рддрд┐рдХреНрд░рд┐рдпрд╛ рджреЗрдВ рддрд╛рдХрд┐ рд╣рдо рдкреНрд░рд╛рдердорд┐рдХрддрд╛ рджреЗ рд╕рдХреЗрдВ рдХрд┐ рд▓реЛрдЧ рдХреНрдпрд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВ рдФрд░ рдХреНрдпрд╛ рдЪрд╛рд╣рд┐рдПред рдзрдиреНрдпрд╡рд╛рдж рдпреБрдХреНрд╕рд┐рдиред

рдкрд░ 12:26 рд╢рдирд┐, 5 рдЕрдЧрд╕реНрдд, 2017 рдкрд░, Yuxin рд╡реВ [email protected] рд▓рд┐рдЦрд╛ рд╣реИ:

рдЬреЛрдбрд╝реЗ рдЬрд╛рдиреЗ рд╡рд╛рд▓реЗ рддрд░реАрдХреЛрдВ рдХреА рдмрд╛рдд рдХрд░реЗрдВ рддреЛ cudnn7 рд╕реЗ рдЧреНрд░реБрдк рдХрдирд╡рд▓реНрд╢рди рд╣реЛрдЧрд╛ a
рджреГрд╖реНрдЯрд┐ рд╕рдореБрджрд╛рдп рдХреЗ рд▓рд┐рдП рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╡рд┐рд╢реЗрд╖рддрд╛ред

-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-320465264 ,
рдпрд╛ рдереНрд░реЗрдб рдХреЛ рдореНрдпреВрдЯ рдХрд░реЗрдВ
https://github.com/notifications/unsubscribe-auth/AWZesv9udRRxy9WvsK2eUEZCj7LAGM8bks5sVMHVgaJpZM4OuRL7
.

рдореИрдВрдиреЗ рд╕рд┐рд░реНрдл CUDA 8 рдХреЗ рд╕рд╛рде cuDNN 7 рдХреЗ рд╕рд╛рде рд╕рдВрдХрд▓рди рдХрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХреА рдФрд░ рдпрд╣ рд╡рд┐рдлрд▓ рд░рд╣рд╛ рдЬреЛ рдореБрдЭреЗ рдкрд╕рдВрдж рд╣реИ
рдЕрдкреЗрдХреНрд╖рд┐рдд рдХрд╛ред NVIDIA рд╕реЗ рдПрдХ рдкреИрдЪ рдЖ рд░рд╣рд╛ рд╣реИ рдЬреЛ рд╣реЗрд▓реНрдк рд▓рд╛рдЗрди
рдЪреАрдЬрд╝реЗрдВ рдКрдкрд░ рд▓реЗ рдЬрд╛рдПрдВред рдЕрдЧрд░ рдХреЛрдИ рдХреЛрд╢рд┐рд╢ рдХрд░ рд░рд╣рд╛ рд╣реИ рддреЛ рдмрд╕ рдПрдХ рд╕рд┐рд░ рдКрдкрд░ред

рд╢рдирд┐рд╡рд╛рд░, 5 рдЕрдЧрд╕реНрдд, 2017 рдХреЛ рджреЛрдкрд╣рд░ 1:47 рдмрдЬреЗ рдЯреЛрдмреА рдмреЙрдпрдб [email protected] рдиреЗ рд▓рд┐рдЦрд╛:

рдХреВрд▓ рдореИрдВ рдЗрд╕реЗ рдЙрд╕ рд╕реВрдЪреА рдореЗрдВ рдЬреЛрдбрд╝ рджреВрдВрдЧрд╛ рдЬреЛ рдореИрдВ рд╢реБрд░реВ рдХрд░ рд░рд╣рд╛ рд╣реВрдВред рдореИрдВ рднреВрд▓ рд╕рдХрддрд╛ рд╣реВрдБ рд▓реЗрдХрд┐рди рд╕реНрд╡рддрдВрддреНрд░ рдорд╣рд╕реВрд╕ рдХрд░рддрд╛ рд╣реВрдБ
рдореБрдЭреЗ рдХрд┐рд╕реА рдкреНрд░рдХрд╛рд░ рдХреА рд╕реВрдЪреА рдкреНрд░рдХрд╛рд╢рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдпрд╛рдж рджрд┐рд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдЬрд╣рд╛рдВ рдореИрдВ рдХреБрдЫ рдорд╛рд░реНрдЧрджрд░реНрд╢рди рдкреНрд░рджрд╛рди рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ
рдЬрд┐рд╕ рдкрд░ рдХрд╛рдо рд╣реЛрдиреЗ рдХреА рд╕рдВрднрд╛рд╡рдирд╛ рд╣реИред рдпрд╣ рд╡рд╛рджрд╛ рдирд╣реАрдВ рд╣реЛ рд╕рдХрддрд╛ рд▓реЗрдХрд┐рди рд╣рдо рдЪрд╛рд╣рддреЗ рд╣реИрдВ
рдкреНрд░рддрд┐рдХреНрд░рд┐рдпрд╛ рджреЗрдВ рддрд╛рдХрд┐ рд╣рдо рдкреНрд░рд╛рдердорд┐рдХрддрд╛ рджреЗ рд╕рдХреЗрдВ рдХрд┐ рд▓реЛрдЧ рдХреНрдпрд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВ рдФрд░ рдХреНрдпрд╛ рдЪрд╛рд╣рд┐рдПред рдзрдиреНрдпрд╡рд╛рдж рдпреБрдХреНрд╕рд┐рдиред

рд╢рдирд┐рд╡рд╛рд░, 5 рдЕрдЧрд╕реНрдд, 2017 рдХреЛ рджреЛрдкрд╣рд░ 12:26 рдмрдЬреЗ, рдпреБрдХреНрд╕рд┐рди рд╡реВ рд╕реВрдЪрдирд╛рдПрдВ @github.com
рд▓рд┐рдЦрд╛ рдерд╛:

рдЬреЛрдбрд╝реЗ рдЬрд╛рдиреЗ рд╡рд╛рд▓реЗ рддрд░реАрдХреЛрдВ рдХреА рдмрд╛рдд рдХрд░реЗрдВ рддреЛ cudnn7 рд╕реЗ рдЧреНрд░реБрдк рдХрдирд╡рд▓реНрд╢рди рд╣реЛрдЧрд╛ a
рджреГрд╖реНрдЯрд┐ рд╕рдореБрджрд╛рдп рдХреЗ рд▓рд┐рдП рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╡рд┐рд╢реЗрд╖рддрд╛ред

-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-320465264 ,
рдпрд╛ рдереНрд░реЗрдб рдХреЛ рдореНрдпреВрдЯ рдХрд░реЗрдВ
https://github.com/notifications/unsubscribe-auth/AWZesv9udRRxy9WvsK2eUEZCj7LAGM8bks5sVMHVgaJpZM4OuRL7
.

рдореИрдВ CUDA 8/9 рдЪрд▓рдиреЗ рдХреЗ рд╕рд╛рде cuDNN 7 рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░ рд░рд╣рд╛ рд╣реВрдВред CUDA 8 GTX 1080 Ti рджреНрд╡рд╛рд░рд╛ рд╕рдорд░реНрдерд┐рдд рдирд╣реАрдВ рд╣реИ - рдХрдо рд╕реЗ рдХрдо рдЗрдВрд╕реНрдЯреЙрд▓рд░ рдРрд╕рд╛ рдХрд╣рддрд╛ рд╣реИ ^^

рдореБрдЭреЗ рдЗрд╕реЗ рдПрдХ рд╕рд╛рде рдЪрд▓рд╛рдиреЗ рдореЗрдВ рдмрдбрд╝реА рдкрд░реЗрд╢рд╛рдиреА рд╣реЛ рд░рд╣реА рд╣реИред рдореИрдВ рдЗрд╕ рдорд╣рд╛рди рд▓реЗрдЦ рдХреЛ рдЗрдВрдЧрд┐рдд рдХрд░рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реВрдВ рдЬреЛ рдореИрдВрдиреЗ рдкрд╣рд▓реЗ рд╣реА рдХреЛрд╢рд┐рд╢ рдХреА рд╣реИ: https://nitishmutha.github.io/tensorflow/2017/01/22/TensorFlow-with-gpu-for-windows.html

CUDA рдЙрджрд╛рд╣рд░рдг рджреЛрдиреЛрдВ рд╕реЗрдЯрдЕрдк рд╕рдВрдпреЛрдЬрдиреЛрдВ рдореЗрдВ рд╡рд┐рдЬреБрдЕрд▓-рд╕реНрдЯреВрдбрд┐рдпреЛ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдХрд╛рдо рдХрд░ рд░рд╣реЗ рд╣реИрдВред
рдпрд╣рд╛рдБ deviceQuery.exe рдХрд╛ рдЖрдЙрдЯрдкреБрдЯ рд╣реИ рдЬрд┐рд╕реЗ рд╡рд┐рдЬреБрдЕрд▓-рд╕реНрдЯреВрдбрд┐рдпреЛ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рд╕рдВрдХрд▓рд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛:

PS C:\ProgramData\NVIDIA Corporation\CUDA Samples\v9.0\bin\win64\Release> deviceQuery.exe
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v9.0\bin\win64\Release\deviceQuery.exe Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "GeForce GTX 1080 Ti"
  CUDA Driver Version / Runtime Version          9.0 / 9.0
  CUDA Capability Major/Minor version number:    6.1
  Total amount of global memory:                 11264 MBytes (11811160064 bytes)
  (28) Multiprocessors, (128) CUDA Cores/MP:     3584 CUDA Cores
  GPU Max Clock rate:                            1683 MHz (1.68 GHz)
  Memory Clock rate:                             5505 Mhz
  Memory Bus Width:                              352-bit
  L2 Cache Size:                                 2883584 bytes
  Maximum Texture Dimension Size (x,y,z)         1D=(131072), 2D=(131072, 65536), 3D=(16384, 16384, 16384)
  Maximum Layered 1D Texture Size, (num) layers  1D=(32768), 2048 layers
  Maximum Layered 2D Texture Size, (num) layers  2D=(32768, 32768), 2048 layers
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       49152 bytes
  Total number of registers available per block: 65536
  Warp size:                                     32
  Maximum number of threads per multiprocessor:  2048
  Maximum number of threads per block:           1024
  Max dimension size of a thread block (x,y,z): (1024, 1024, 64)
  Max dimension size of a grid size    (x,y,z): (2147483647, 65535, 65535)
  Maximum memory pitch:                          2147483647 bytes
  Texture alignment:                             512 bytes
  Concurrent copy and kernel execution:          Yes with 2 copy engine(s)
  Run time limit on kernels:                     Yes
  Integrated GPU sharing Host Memory:            No
  Support host page-locked memory mapping:       Yes
  Alignment requirement for Surfaces:            Yes
  Device has ECC support:                        Disabled
  CUDA Device Driver Mode (TCC or WDDM):         WDDM (Windows Display Driver Model)
  Device supports Unified Addressing (UVA):      Yes
  Supports Cooperative Kernel Launch:            No
  Supports MultiDevice Co-op Kernel Launch:      No
  Device PCI Domain ID / Bus ID / location ID:   0 / 1 / 0
  Compute Mode:
     < Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 9.0, CUDA Runtime Version = 9.0, NumDevs = 1, Device0 = GeForce GTX 1080 Ti
Result = PASS

@tfboyd рдХреНрдпрд╛ рдЖрдкрдХреЗ рдкрд╛рд╕ Nvidea рд╕реЗ cuDNN рдЕрдкрдбреЗрдЯ рдХреА рдкреБрд╖реНрдЯрд┐ рдХрд░рдиреЗ рд╡рд╛рд▓рд╛ рдХреЛрдИ рд▓рд┐рдВрдХ рд╣реИ?

@4F2E4A2E 1080 Ti рдирд┐рд╢реНрдЪрд┐рдд рд░реВрдк рд╕реЗ CUDA 8.0 рдХреЛ рд╕рдкреЛрд░реНрдЯ рдХрд░рддрд╛ рд╣реИред рдореИрдВ рдкрд┐рдЫрд▓реЗ рдХрдИ рдорд╣реАрдиреЛрдВ рд╕реЗ TensorFlow рдХреЗ рд╕рд╛рде рдпрд╣реА рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рд╣реВрдВред

рд╣рд╛рдп рд╕рдм, рдЗрд╕рд▓рд┐рдП рдореЗрд░реЗ рдкрд╛рд╕ cuda 8.0 рдХреЗ рд╕рд╛рде gtx 1080 ti рд╣реИред рдореИрдВ рдЯреЗрдВрд╕рд░рдлреНрд▓реЛ-рдЬреАрдкреАрдпреВ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░ рд░рд╣рд╛ рд╣реВрдВ, рдХреНрдпрд╛ рдореИрдВ рд╕реАрдпреВрдбреАрдПрдирдПрди 5.1, 6.0 рдпрд╛ 7.0 рдХреЗ рд▓рд┐рдП рдЬрд╛ рд╕рдХрддрд╛ рд╣реВрдВ?

рдореЗрд░рд╛ рд╕реБрдЭрд╛рд╡ рд╣реИ рдХрд┐ рдлрд┐рд▓рд╣рд╛рд▓ 5.1 рдХреЗ рд╕рд╛рде рдмрдиреЗ рд░рд╣реЗрдВред рдореИрдВ рдХреБрдЫ рдЧрд╣рд░рд╛ рдкреНрд░рджрд░реНрд╢рди рдЪрд▓рд╛ рд░рд╣рд╛ рд╣реВрдБ
6 рдкрд░ рдкрд░реАрдХреНрд╖рдг рдФрд░ рдорд┐рд╢реНрд░рд┐рдд рдкрд░рд┐рдгрд╛рдо рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдФрд░ рдЕрдзрд┐рдХ рдкрд░реАрдХреНрд╖рдг рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИред

рдЕрдЧрд╕реНрдд 6, 2017 9:30 рдкреАрдПрдо, "colmantse" [email protected] рд▓рд┐рдЦрд╛ рд╣реИ:

рд╣рд╛рдп рд╕рдм, рдЗрд╕рд▓рд┐рдП рдореЗрд░реЗ рдкрд╛рд╕ cuda 8.0 рдХреЗ рд╕рд╛рде gtx 1080 ti рд╣реИред рдореИрдВ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░ рд░рд╣рд╛ рд╣реВрдБ
tensorflow-gpu, рдХреНрдпрд╛ рдореИрдВ cuDNN 5.1, 6.0 рдпрд╛ 7.0 рдХреЗ рд▓рд┐рдП рдЬрд╛ рд╕рдХрддрд╛ рд╣реВрдБ?

-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-320566071 ,
рдпрд╛ рдереНрд░реЗрдб рдХреЛ рдореНрдпреВрдЯ рдХрд░реЗрдВ
https://github.com/notifications/unsubscribe-auth/AWZeshvEFsdeWz-1uyzl_L6HE15E0BzSks5sVpLlgaJpZM4OuRL7
.

рдзрдиреНрдпрд╡рд╛рдж, рдореИрдВрдиреЗ рдХреБрдбрди 6.0 рдХреЗ рд╕рд╛рде рдкреНрд░рдпрд╛рд╕ рдХрд┐рдпрд╛ рд▓реЗрдХрд┐рди рдХрд╛рдо рдирд╣реАрдВ рдХрд░рддрд╛, рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдореЗрд░реА рдбрдореА рдЯреАрдПрдл-рдЬреАрдкреАрдпреВ рд╕реНрдерд╛рдкрдирд╛ рдХреЗ рдХрд╛рд░рдгред cudnn 5.1 рдореЗрд░реЗ рд▓рд┐рдП рдЕрдЬрдЧрд░ 3.6 . рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ

@tpankaj рдзрдиреНрдпрд╡рд╛рдж! рдореИрдВрдиреЗ рдЗрд╕реЗ CUDA 8 рдФрд░ cuDNN 5.1 рдХреЗ рд╕рд╛рде рдЪрд▓рд╛рдпрд╛ рд╣реИ

рдпрд╣рд╛рдБ cuDNN 7 рдореЗрдВ рд╕реБрд╡рд┐рдзрд╛рдУрдВ рдХрд╛ рдкреВрд░рд╛ рд╕реЗрдЯ рджрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ:

рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдВ рдФрд░ рд╕рдВрд╡рд░реНрджреНрдзрди
рдЗрд╕ cuDNN рд░рд┐рд▓реАрдЬ рдореЗрдВ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдкреНрд░рдореБрдЦ рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдВ рдФрд░ рд╕рдВрд╡рд░реНрджреНрдзрди рд╢рд╛рдорд┐рд▓ рд╣реИрдВред
рдЯреЗрдВрд╕рд░ рдХреЛрд░
cuDNN рдХрд╛ рд╕рдВрд╕реНрдХрд░рдг 7.0.1 рдЕрдкрдиреЗ рдореЗрдВ рдЯреЗрдВрд╕рд░ рдХреЛрд░ рд╕рдВрдЪрд╛рд▓рди рдХрд╛ рд╕рдорд░реНрдерди рдХрд░рдиреЗ рд╡рд╛рд▓рд╛ рдкрд╣рд▓рд╛ рд╣реИ
рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрдиред Tensor Core рдЕрддреНрдпрдзрд┐рдХ рдЕрдиреБрдХреВрд▓рд┐рдд рдореИрдЯреНрд░рд┐рдХреНрд╕ рдЧреБрдгрди рдкреНрд░рджрд╛рди рдХрд░рддреЗ рд╣реИрдВ
рдмрд┐рд▓реНрдбрд┐рдВрдЧ рдмреНрд▓реЙрдХреНрд╕ рдЬрд┐рдирдХрд╛ рдкрд╛рд░рдВрдкрд░рд┐рдХ рдореЗрдВ рд╕рдорд╛рди рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рд╡реНрдпрд╡рд╣рд╛рд░ рдирд╣реАрдВ рд╣реИ
рдирд┐рд░реНрджреЗрд╢, рдЗрд╕рд▓рд┐рдП, рдЗрд╕рдХрд╛ рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рд╡реНрдпрд╡рд╣рд╛рд░ рдереЛрдбрд╝рд╛ рдЕрд▓рдЧ рд╣реИред
cudnnSetConvolutionMathType, cudnnSetRNNMatrixMathType, рдФрд░
cudnnMathType_t
cudnnSetConvolutionMathType рдФрд░ cudnnSetRNNMatrixMathType
рдлрд╝рдВрдХреНрд╢рдВрд╕ рдЖрдкрдХреЛ рдпрд╣ рдЪреБрдирдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдмрдирд╛рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ Tensor Core рд╕рдВрдЪрд╛рд▓рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ рд╣реИ рдпрд╛ рдирд╣реАрдВ
рдЧрдгрд┐рдд рдореЛрдб рдХреЛ рдпрд╛ рддреЛ рд╕реЗрдЯ рдХрд░рдХреЗ рдХреНрд░рдорд╢рдГ рдХрдирд╡рд▓реНрд╢рди рдФрд░ рдЖрд░рдПрдирдПрди рд▓реЗрдпрд░реНрд╕
CUDNN_TENSOR_OP_MATH рдпрд╛ CUDNN_DEFAULT_MATHред
рдЯреЗрдВрд╕рд░ рдХреЛрд░ рдСрдкрд░реЗрд╢рди рдорд▓реНрдЯреАрдкрд▓ рдХреЗ рд╕рдорд╛рдирд╛рдВрддрд░ рдлреНрд▓реЛрдЯрд┐рдВрдЧ рдкреЙрдЗрдВрдЯ рд╕рдВрдЪрдп рдХрд░рддреЗ рд╣реИрдВ
рдлреНрд▓реЛрдЯрд┐рдВрдЧ рдкреЙрдЗрдВрдЯ рдЙрддреНрдкрд╛рджред
рдЧрдгрд┐рдд рдореЛрдб рдХреЛ CUDNN_TENSOR_OP_MATH рдкрд░ рд╕реЗрдЯ рдХрд░рдирд╛ рдЗрдВрдЧрд┐рдд рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдкреБрд╕реНрддрдХрд╛рд▓рдп рдЙрдкрдпреЛрдЧ рдХрд░реЗрдЧрд╛
рдЯреЗрдВрд╕рд░ рдХреЛрд░ рд╕рдВрдЪрд╛рд▓рдиред
рдбрд┐рдлрд╝реЙрд▓реНрдЯ CUDNN_DEFAULT_MATH рд╣реИред рдпрд╣ рдбрд┐рдлрд╝реЙрд▓реНрдЯ рдЗрдВрдЧрд┐рдд рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдЯреЗрдВрд╕рд░ рдХреЛрд░
рдкреБрд╕реНрддрдХрд╛рд▓рдп рджреНрд╡рд╛рд░рд╛ рд╕рдВрдЪрд╛рд▓рди рд╕реЗ рдмрдЪрд╛ рдЬрд╛рдПрдЧрд╛ред рдбрд┐рдлрд╝реЙрд▓реНрдЯ рдореЛрдб рдПрдХ рдХреНрд░рдордмрджреНрдз рдСрдкрд░реЗрд╢рди рд╣реИ
рдЬрдмрдХрд┐, Tensor Core рдПрдХ рд╕рдорд╛рдирд╛рдВрддрд░ рдСрдкрд░реЗрд╢рди рд╣реИ, рдЗрд╕рд▓рд┐рдП рджреЛрдиреЛрдВ рдХрд╛ рдкрд░рд┐рдгрд╛рдо рд╣реЛ рд╕рдХрддрд╛ рд╣реИ
рд╕рдВрдЪрд╛рд▓рди рдХреЗ рдЕрд▓рдЧ-рдЕрд▓рдЧ рдЕрдиреБрдХреНрд░рдордг рдХреЗ рдХрд╛рд░рдг рдереЛрдбрд╝реЗ рднрд┐рдиреНрди рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рдкрд░рд┐рдгрд╛рдореЛрдВ рдореЗрдВред
рдЬрдм Tensor Core рдСрдкрд░реЗрд╢рди рд╣реЛрддреЗ рд╣реИрдВ, рддреЛ рд▓рд╛рдЗрдмреНрд░реЗрд░реА рдбрд┐рдлрд╝реЙрд▓реНрдЯ рдЧрдгрд┐рдд рдореЛрдб рдореЗрдВ рд╡рд╛рдкрд╕ рдЖ рдЬрд╛рддреА рд╣реИ
рд╕рдорд░реНрдерд┐рдд рдирд╣реАрдВ рд╣реИ рдпрд╛ рдЕрдиреБрдорддрд┐ рдирд╣реАрдВ рд╣реИред
cudnnSetConvolutionGroupCount
рдПрдХ рдирдпрд╛ рдЗрдВрдЯрд░рдлрд╝реЗрд╕ рдЬреЛ рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рдХреЛ рдХрдирд╡рд▓реНрд╢рди рд╕рдореВрд╣реЛрдВ рдХреЛ рдирд┐рд╖реНрдкрд╛рджрд┐рдд рдХрд░рдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рджреЗрддрд╛ рд╣реИ
рд╕рд┐рдВрдЧрд▓ рдПрдкреАрдЖрдИ рдХреЙрд▓ рдореЗрдВ рдХрдирд╡рд▓реНрд╢рди рд▓реЗрдпрд░реНрд╕ред
cudnnCTCLoss
cudnnCTCLoss рдХрдиреЗрдХреНрд╢рдирд┐рд╕реНрдЯ рдЯреЗрдореНрдкреЛрд░рд▓ рдХрд╛ GPU рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИ
рдЖрд░рдПрдирдПрди рдХреЗ рд▓рд┐рдП рд╡рд░реНрдЧреАрдХрд░рдг (рд╕реАрдЯреАрд╕реА) рд╣рд╛рдирд┐ рдХрд╛рд░реНрдпред рд╕реАрдЯреАрд╕реА рд╣рд╛рдирд┐ рдлрд╝рдВрдХреНрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ
рд╡рд╛рдХреН рдФрд░ рд╣рд╕реНрддрд▓рд┐рдкрд┐ рдкрд╣рдЪрд╛рди рдореЗрдВ рдзреНрд╡рдиреНрдпрд╛рддреНрдордХ рдкрд╣рдЪрд╛рдиред
CUDNN_BATCHNORM_SPATIAL_PERSISTENT
CUDNN_BATCHNORM_SPATIAL_PERSISTENT рдлрд╝рдВрдХреНрд╢рди рдПрдХ рдирдпрд╛ рдмреИрдЪ рд╣реИ
cudnnBatch рдХреЗ рд▓рд┐рдП рд╕рд╛рдорд╛рдиреНрдпреАрдХрд░рдг рдореЛрдбрд╕рд╛рдорд╛рдиреНрдпреАрдХрд░рдгрдЖрдЧреЗрдкреНрд░рд╢рд┐рдХреНрд╖рдг
рдФрд░ cudnnBatchNormalizationBackward. рдпрд╣ рдореЛрдб рдХреЗ рд╕рдорд╛рди рд╣реИ
CUDNN_BATCHNORM_SPATIAL, рд╣рд╛рд▓рд╛рдВрдХрд┐, рдпрд╣ рдХреБрдЫ рдХрд╛рд░реНрдпреЛрдВ рдХреЗ рд▓рд┐рдП рддреЗрдЬрд╝ рд╣реЛ рд╕рдХрддрд╛ рд╣реИред
cudnnQueryRuntimeError
CudnnQueryRuntimeError рдлрд╝рдВрдХреНрд╢рди GPU рджреНрд╡рд╛рд░рд╛ рд▓рд┐рдЦреЗ рдЧрдП рддреНрд░реБрдЯрд┐ рдХреЛрдб рдХреА рд░рд┐рдкреЛрд░реНрдЯ рдХрд░рддрд╛ рд╣реИ
cudnnBatchNormalizationForwardTraining рдирд┐рд╖реНрдкрд╛рджрд┐рдд рдХрд░рддреЗ рд╕рдордп рдЧреБрдард▓реА
рдФрд░ cudnnBatchNormalizationрдкрд┐рдЫрдбрд╝реЗ рдХреЗ рд╕рд╛рде
CUDNN_BATCHNORM_SPATIAL_PERSISTENT рдореЛрдбред
cudnnGetConvolutionForwardAlgorithm_v7
рдпрд╣ рдирдпрд╛ рдПрдкреАрдЖрдИ рдЕрдкреЗрдХреНрд╖рд┐рдд рдкреНрд░рджрд░реНрд╢рди рдХреЗ рдЕрдиреБрд╕рд╛рд░ рдХреНрд░рдордмрджреНрдз рд╕рднреА рдПрд▓реНрдЧреЛрд░рд┐рджрдо рд▓реМрдЯрд╛рддрд╛ рд╣реИ
(рдЖрдВрддрд░рд┐рдХ рд╣реНрдпреБрд░рд┐рд╕реНрдЯрд┐рдХреНрд╕ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ)ред рдпреЗ рдПрд▓реНрдЧреЛрд░рд┐рджрдо рд╕рдорд╛рди рд░реВрдк рд╕реЗ рдЖрдЙрдЯрдкреБрдЯ рд╣реИрдВ
cudnnFindConvolutionForwardAlgorithm.
cudnnGetConvolutionBackwardDataAlgorithm_v7
рдпрд╣ рдирдпрд╛ рдПрдкреАрдЖрдИ рдЕрдкреЗрдХреНрд╖рд┐рдд рдкреНрд░рджрд░реНрд╢рди рдХреЗ рдЕрдиреБрд╕рд╛рд░ рдХреНрд░рдордмрджреНрдз рд╕рднреА рдПрд▓реНрдЧреЛрд░рд┐рджрдо рд▓реМрдЯрд╛рддрд╛ рд╣реИ
(рдЖрдВрддрд░рд┐рдХ рд╣реНрдпреБрд░рд┐рд╕реНрдЯрд┐рдХреНрд╕ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ)ред рдпреЗ рдПрд▓реНрдЧреЛрд░рд┐рджрдо рд╕рдорд╛рди рд░реВрдк рд╕реЗ рдЖрдЙрдЯрдкреБрдЯ рд╣реИрдВ
cudnnFindConvolutionBackwardAlgorithm.
cudnnGetConvolutionBackwardFilterAlgorithm_v7
рдпрд╣ рдирдпрд╛ рдПрдкреАрдЖрдИ рдЕрдкреЗрдХреНрд╖рд┐рдд рдкреНрд░рджрд░реНрд╢рди рдХреЗ рдЕрдиреБрд╕рд╛рд░ рдХреНрд░рдордмрджреНрдз рд╕рднреА рдПрд▓реНрдЧреЛрд░рд┐рджрдо рд▓реМрдЯрд╛рддрд╛ рд╣реИ
(рдЖрдВрддрд░рд┐рдХ рд╣реНрдпреБрд░рд┐рд╕реНрдЯрд┐рдХреНрд╕ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ)ред рдпреЗ рдПрд▓реНрдЧреЛрд░рд┐рджрдо рд╕рдорд╛рди рд░реВрдк рд╕реЗ рдЖрдЙрдЯрдкреБрдЯ рд╣реИрдВ
cudnnFindConvolutionBackwardFilterAlgorithm.
CUDNN_REDUCE_TENSOR_MUL_NO_ZEROS
MUL_NO_ZEROS рдлрд╝рдВрдХреНрд╢рди рдПрдХ рдЧреБрдгрди рдХрдореА рд╣реИ рдЬреЛ рд╢реВрдиреНрдп рдХреЛ рдЕрдирджреЗрдЦрд╛ рдХрд░рддрд╛ рд╣реИ
рдЖрдВрдХрдбрд╝реЗред
CUDNN_OP_TENSOR_NOT
OP_TENSOR_NOT рдлрд╝рдВрдХреНрд╢рди рдПрдХ рдпреВрдирд░реА рдСрдкрд░реЗрд╢рди рд╣реИ рдЬреЛ рдХрд╛ рдЛрдгрд╛рддреНрдордХ рд▓реЗрддрд╛ рд╣реИ
(рдЕрд▓реНрдлрд╛ * рдП)ред
cudnnGetDropoutDescriptor
CudnnGetDropoutDescriptor рдлрд╝рдВрдХреНрд╢рди рдПрдкреНрд▓рд┐рдХреЗрд╢рди рдХреЛ рдбреНрд░реЙрдкрдЖрдЙрдЯ рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рджреЗрддрд╛ рд╣реИ
рдореВрд▓реНрдпред

рдареАрдХ рд╣реИ, рдореИрдВ рдПрдХ рдирдпрд╛ рдореБрджреНрджрд╛ рд╢реБрд░реВ рдХрд░рдиреЗ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рд╕реЛрдЪ рд░рд╣рд╛ рд╣реВрдВ рдЬреЛ рдХрд┐ CUDA 9 RC + cuDNN 7.0 рдХреЗ "рдмреНрд▓реЙрдЧ" рд╕реЗ рдЕрдзрд┐рдХ рд╣реИред рдореЗрд░реЗ рдкрд╛рд╕ "рдореЗрд░реЗ рд╣рд╛рде рдореЗрдВ" рдПрдХ TF рдмрд┐рд▓реНрдб рд╣реИ рдЬреЛ рдПрдХ рд╕рд╛рде рдкреИрдЪ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ рд▓реЗрдХрд┐рди CUDA 9RC рдФрд░ cuDNN 7.0 рд╣реИ рдФрд░ рдореИрдВ рджреЗрдЦрдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реВрдВ рдХрд┐ рдХреЛрдИ рдЗрд╕реЗ рдЖрдЬрд╝рдорд╛рдиреЗ рдореЗрдВ рджрд┐рд▓рдЪрд╕реНрдк рд╣реИ рдпрд╛ рдирд╣реАрдВред рдореБрдЭреЗ рдпрд╣ рднреА рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ рдХрд┐ рдХреЛрдИ рдЕрдЬреАрдм рдХрд╛рд░рдг рддреЛ рдирд╣реАрдВ рд╣реИ рдХрд┐ рдореИрдВ рдЗрд╕реЗ рд╕рд╛рдЭрд╛ рдХреНрдпреЛрдВ рдирд╣реАрдВ рдХрд░ рд╕рдХрддрд╛ред TensorFlow рджреНрд╡рд╛рд░рд╛ рдЙрдкрдпреЛрдЧ рдХреА рдЬрд╛рдиреЗ рд╡рд╛рд▓реА рдХреБрдЫ рдЕрдкрд╕реНрдЯреНрд░реАрдо рд▓рд╛рдЗрдмреНрд░реЗрд░реА рдореЗрдВ рдХреБрдЫ рдмрджрд▓рд╛рд╡ рдХрд┐рдП рдЬрд╛рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдирд┐рдХрдЯ рднрд╡рд┐рд╖реНрдп рдореЗрдВ рдЖрдк NVIDIA рд╕реЗ рдЖрдиреЗ рд╡рд╛рд▓реЗ рдкреАрдЖрд░ рдХреЛ рджреЗрдЦрдирд╛ рд╢реБрд░реВ рдХрд░ рджреЗрдВрдЧреЗред рдореИрдВ рдФрд░ рдЯреАрдо рд╡реЛрд▓реНрдЯрд╛ рдкрд░ CUDA 8 + cuDNN 6 рдФрд░ рдлрд┐рд░ FP32 рдХреЛрдб рдХреЗ рд╕рд╛рде рд╡реЛрд▓реНрдЯрд╛ (V100) рдкрд░ CUDA 9RC + cuDNN 7 рдХрд╛ рдкрд░реАрдХреНрд╖рдг рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдереЗред рдореИрдВ рдХреЗрд╡рд▓ рд▓рд┐рдирдХреНрд╕ рдмрд┐рд▓реНрдб рдФрд░ рдкрд╛рдпрдерди 2.7 рдХрд░рддрд╛ рд╣реВрдВ, рд▓реЗрдХрд┐рди рдпрджрд┐ рдЖрдк рд╕рднреА/рдЖрдк рдореЗрдВ рд╕реЗ рдХреЛрдИ рднреА рд░реБрдЪрд┐ рд░рдЦрддрд╛ рд╣реИ рддреЛ рдореИрдВ рд╕рдореБрджрд╛рдп рдХреЛ cuDNN 6.0 рдХреЗ рд╕рд╛рде рдХрд░рдиреЗ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдЕрдзрд┐рдХ рдкреНрд░рдпрд╛рд╕ рдХрд░рдирд╛ рдФрд░ рд╢рд╛рдорд┐рд▓ рдХрд░рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реВрдВред рдпрд╣ рд╕реБрдкрд░ рдордЬреЗрджрд╛рд░ рдирд╣реАрдВ рд╣реЛ рд╕рдХрддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдореИрдВ рдкреЗрд╢рдХрд╢ рдХрд░рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реВрдВ рдФрд░ рд╕рд╛рде рд╣реА рдпрд╣ рдорд╣рд╕реВрд╕ рдХрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реВрдВ рдХрд┐ рд╣рдо рдЗрд╕рдореЗрдВ рдПрдХ рд╕рд╛рде рд╣реИрдВ рдмрдирд╛рдо рдореИрдВ рдЬрд╛рдирдХрд╛рд░реА рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣рд╛ рд╣реВрдВред рдореИрдВ рдЕрднреА рднреА рдЙрди рд╡рд┐рд╢реЗрд╖рддрд╛рдУрдВ рдХреА рд╕реВрдЪреА рдмрдирд╛рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реВрдВ рдЬрд┐рди рдкрд░ рд╣рдо рдХрд╛рдо рдХрд░ рд░рд╣реЗ рд╣реИрдВ рд▓реЗрдХрд┐рди cuDNN 7 (рдФрд░ 6.0) рдХреЗ рд▓рд┐рдП рдЖрд╢рд╛рдЬрдирдХ рдирд╣реАрдВ рд╣реИрдВред @ cancan101 рдкреВрд░реА рд╕реВрдЪреА рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рджред

@tfboyd : рдореИрдВ CUDA 9.0RC+cuDNN 7.0 рдХрд░рдиреЗ рдХреЗ рд╡рд┐рд╡рд░рдг рдХреЗ рд▓рд┐рдП рдЖрднрд╛рд░реА рд░рд╣реВрдВрдЧрд╛ред рдореИрдВ рдЦреБрдж рдПрдХ рдЕрдЬреАрдм рдкреНрд░рдгрд╛рд▓реА рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рд╣реВрдВ (рдЙрдмрдВрдЯреВ 17.10 рдмреАрдЯрд╛ TF1.3, CUDA 8.0 рдФрд░ cuDNN 6.0 gcc-4.8 рдХреЗ рд╕рд╛рде), рдФрд░ cuda 9 рдФрд░ cudnn 7 рдореЗрдВ рдЕрдкрдЧреНрд░реЗрдб рдХрд░рдирд╛ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдЕрдЪреНрдЫрд╛ рдХрдВрдкрд╛рдЗрд▓рд░ рд╣реЛрдЧрд╛ред

рдореИрдВ рджреЗрдЦреВрдВрдЧрд╛ рдХрд┐ рдЦреБрдж рдХреЛ рдмрдирд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдЖрдкрдХреЛ рдЬреЛ рдЪрд╛рд╣рд┐рдП рд╡рд╣ рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдкрд░ рдореИрдВ рдХреНрдпрд╛ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ рдФрд░ a
рджреНрд╡рд┐рдЖрдзрд╛рд░реАред рдкреНрд░рджрд░реНрд╢рди рдЯреАрдо рд▓реАрдб рдиреЗ рд╕рдВрдХреЗрдд рджрд┐рдпрд╛ рдХрд┐ рдореИрдВ рдХреЛрд╢рд┐рд╢ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ рдФрд░ рдРрд╕рд╛ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ
рдЗрд╕рд▓рд┐рдП рд╣рдо рдФрд░ рдЕрдзрд┐рдХ рдкрд╛рд░рджрд░реНрд╢реА рд╣реЛ рд╕рдХрддреЗ рд╣реИрдВ рдФрд░ рдореБрдЭреЗ рдЖрд╢рд╛ рд╣реИ рдХрд┐ рдПрдХ рд╕рдореБрджрд╛рдп рдХреЗ рд░реВрдк рдореЗрдВ рдФрд░ рдЕрдзрд┐рдХ рдордЬрд╝рд╛ рдЖрдПрдЧрд╛ред
рдЖрдкрдХреЛ рдкреИрдЪ рдкреНрд░рд╛рдкреНрдд рдХрд░рдирд╛ рдФрд░ рдЗрд╕реЗ рдХреИрд╕реЗ рдмрдирд╛рдирд╛ рд╣реИ рдпрд╣ рдмрд╣реБрдд рдХрдард┐рди рдирд╣реАрдВ рд╣реИ, рд▓реЗрдХрд┐рди рдереЛрдбрд╝рд╛ рд╕рд╛ рд╣реИ
рдФрд░ рдЬреЛрд░ рд╕реЗред рдпрд╣ рдмрд╣реБрдд рдЕрдиреМрдкрдЪрд╛рд░рд┐рдХ рднреА рд╣реЛрдЧрд╛ рдХреНрдпреЛрдВрдХрд┐ рдореЗрд░реЗ рдкрд╛рд╕ рдкреНрд░рдмрдВрдзрди рдХреЗ рд▓рд┐рдП рд╕рдордп рдирд╣реАрдВ рд╣реИ
рд╢рд╛рдЦрд╛ рдФрд░ рдкреИрдЪ рдмрд╣реБрдд рдЬрд▓реНрджреА рд╕рдбрд╝ рд╕рдХрддрд╛ рд╣реИ (рд╕рд╛рдл-рд╕рдлрд╛рдИ рд╕реЗ рд▓рд╛рдЧреВ рдирд╣реАрдВ)ред NS
рдкреИрдЪ рдХрд╛ рдЙрдкрдпреЛрдЧ рдпрд╣ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ рдХрд┐ рдЗрд╕рдореЗрдВ рд╢рд╛рдорд┐рд▓ рд╕рднреА рд▓реЛрдЧ рдкрд░рд┐рд╡рд░реНрддрдиреЛрдВ рдХреЗ рд╕рд╛рде рдареАрдХ рд╣реИрдВ
рд╕рд╛рдорд╛рдиреНрдп рдФрд░ рдореБрдЭреЗ рдЙрдореНрдореАрдж рд╣реИ рдХрд┐ рд╡реНрдпрдХреНрддрд┐рдЧрдд рдкреАрдЖрд░ рдЖрдирд╛ рд╢реБрд░реВ рд╣реЛ рдЬрд╛рдПрдВрдЧреЗред

рд╢реБрдХреНрд░, рдЕрдЧрд╕реНрдд резрез, реирежрезрен рдкреВрд░реНрд╡рд╛рд╣реНрди рел:реиреи рдмрдЬреЗ, рдПрд░реНрд▓реЗрдВрдб рдФрдиреЗ рдиреЛрдЯрд┐рдлрд┐рдХреЗрд╢рди @github.com
рд▓рд┐рдЦрд╛ рдерд╛:

@tfboyd https://github.com/tfboyd : рдореИрдВ рд╡рд┐рд╡рд░рдг рдХреЗ рд▓рд┐рдП рдЖрднрд╛рд░реА рд░рд╣реВрдВрдЧрд╛
CUDA 9.0RC+cuDNN 7.0 рдХрд░рдиреЗ рдкрд░ред рдореИрдВ рд╕реНрд╡рдпрдВ рдПрдХ рдЕрдЬреАрдм рдкреНрд░рдгрд╛рд▓реА рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рд╣реВрдВ (рдЙрдмрдВрдЯреВ
TF1.3, CUDA 8.0 рдФрд░ cuDNN 6.0 gcc-4.8 рдХреЗ рд╕рд╛рде 17.10 рдмреАрдЯрд╛), рдФрд░ рдЕрдкрдЧреНрд░реЗрдб рдХрд░рдирд╛
cuda 9 рдФрд░ cudnn 7 рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдЕрдЪреНрдЫрд╛ рдХрдВрдкрд╛рдЗрд▓рд░ рд╣реЛрдЧрд╛ред

-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-321798364 ,
рдпрд╛ рдереНрд░реЗрдб рдХреЛ рдореНрдпреВрдЯ рдХрд░реЗрдВ
https://github.com/notifications/unsubscribe-auth/AWZesj4WRkFKNX-Nt2oKtvp0oyQVBtM5ks5sXEdqgaJpZM4OuRL7
.

@tfboyd : рдореБрдЭреЗ рджрд┐рд▓рдЪрд╕реНрдкреА рд╣реИ, рдЖрдк рдЗрд╕реЗ рдХреИрд╕реЗ рд╕рд╛рдЭрд╛ рдХрд░реЗрдВрдЧреЗ? рдПрдХ рд╢рд╛рдЦрд╛?

@tfboyd рдореБрдЭреЗ рдирд┐рд╢реНрдЪрд┐рдд рд░реВрдк рд╕реЗ рднреА рдмрд╣реБрдд рджрд┐рд▓рдЪрд╕реНрдкреА рд╣реЛрдЧреАред рдзрдиреНрдпрд╡рд╛рдж!

рдЗрд╕ рд╕рдкреНрддрд╛рд╣ рдЗрд╕рдХрд╛ рдкрддрд╛ рд▓рдЧрд╛рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХреА рдЬрд╛ рд░рд╣реА рд╣реИред рд░рд╕рдж рдЕрдХреНрд╕рд░ I . рд╕реЗ рдХрдард┐рди рд╣реЛрддреА рд╣реИ
рд╕реЛрдЪред

12 рдЕрдЧрд╕реНрдд 2017 рдХреЛ рд╕реБрдмрд╣ 10:18 рдмрдЬреЗ "рддрдиреНрдордп рдмрдЦреНрд╢реА" рдиреЛрдЯрд┐рдлрд┐рдХреЗрд╢рди @github.com рдиреЗ рд▓рд┐рдЦрд╛:

@tfboyd https://github.com/tfboyd рдореБрдЭреЗ рдирд┐рд╢реНрдЪрд┐рдд рд░реВрдк рд╕реЗ рдмрд╣реБрдд рджрд┐рд▓рдЪрд╕реНрдкреА рд╣реЛрдЧреА рдХреНрдпреЛрдВрдХрд┐
рдХреБрдВрдЖред рдзрдиреНрдпрд╡рд╛рдж!

-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-321994065 ,
рдпрд╛ рдереНрд░реЗрдб рдХреЛ рдореНрдпреВрдЯ рдХрд░реЗрдВ
https://github.com/notifications/unsubscribe-auth/AWZesjO42Rl1WCyW0KR22KgbydKh1O4Zks5sXd6AgaJpZM4OuRL7
.

рдпрджрд┐ рдЖрдк рдкрд╛рдпрдерди 2.7 рдХреЛ рдкрд╕рдВрдж рдХрд░рддреЗ рд╣реИрдВ рддреЛ рдирд┐рд░реНрджреЗрд╢ рдФрд░ рдЦреЗрд▓рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдмрд╛рдЗрдирд░реАред рдореИрдВ рдЗрд╕реЗ рдмрдВрдж рдХрд░рдиреЗ рдЬрд╛ рд░рд╣рд╛ рд╣реВрдВ рдХреНрдпреЛрдВрдХрд┐ рдореИрдВ рдкреНрд░рдпрд╛рд╕ рдХреЛ рдЯреНрд░реИрдХ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдмрдирд╛рдИ рдЧрдИ рд╕рдорд╕реНрдпрд╛ рдХреЛ рдЕрдкрдбреЗрдЯ рдХрд░реВрдВрдЧрд╛ред @tanmayb123 @Froskekongen

https://github.com/tensorflow/tensorflow/issues/12474

рдореИрдВрдиреЗ рд╡рд┐рдВрдбреЛрдЬ x64 рдкрд░ рдкрд╛рдпрдерди 3.6 рдХреЗ рд▓рд┐рдП рдкреВрд░реНрд╡-рд╕рдВрдХрд▓рд┐рдд рдЯреЗрдВрд╕рд░рдлреНрд▓реЛ-рдЬреАрдкреАрдпреВ-1.3.0 рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХреА рдФрд░ рдХреНрдпреВрдбреАрдПрди 8.0 рдХреЗ рд╕рд╛рде рд╕реАрдпреВрдбреАрдПрдирдПрди рд▓рд╛рдЗрдмреНрд░реЗрд░реА рд╕рдВрд╕реНрдХрд░рдг 7.0 рдкреНрд░рджрд╛рди рдХрд┐рдпрд╛ рдФрд░ рдХрдо рд╕реЗ рдХрдо рдореЗрд░реЗ рд▓рд┐рдП, рд╕рдм рдХреБрдЫ рдХрд╛рдо рдХрд░рдиреЗ рд▓рдЧрддрд╛ рд╣реИред рдореБрдЭреЗ рдХреЛрдИ рдЕрдкрд╡рд╛рдж рдпрд╛ рд╕рдорд╕реНрдпрд╛ рдирд╣реАрдВ рджрд┐рдЦ рд░рд╣реА рд╣реИред
рдХреНрдпрд╛ рдЗрд╕рдХреА рдЙрдореНрдореАрдж рдХреА рдЬрд╛рдиреА рдЪрд╛рд╣рд┐рдП рдереА? рдХреНрдпрд╛ cuDNN 7.0 рдкреАрдЫреЗ рдХреА рдУрд░-cuDNN 6.0 рдХреЗ рдЕрдиреБрдХреВрд▓ рд╣реИ? рдХреНрдпрд╛ рдЗрд╕рд╕реЗ рдХреЛрдИ рд╕рдорд╕реНрдпрд╛ рд╣реЛ рд╕рдХрддреА рд╣реИ?

@ рдЕрдкрд╛рдЪрд╛ рдореИрдВ рдереЛрдбрд╝рд╛ рд╣реИрд░рд╛рди рд╣реВрдВ рдХрд┐ рдЗрд╕рдиреЗ рдХрд╛рдо рдХрд┐рдпрд╛ред рдореИрдВрдиреЗ рдЕрдкрдиреЗ рдкрд░реАрдХреНрд╖рдг рдореЗрдВ рдкрд╣рд▓реЗ рддреНрд░реБрдЯрд┐ рджреЗрдЦреА рд╣реИ рдЬрд╣рд╛рдВ TensorFlow рдмрд╛рдЗрдирд░реА cuDNN рдирд╣реАрдВ рдвреВрдВрдв рд╕рдХрддрд╛ рдХреНрдпреЛрдВрдХрд┐ рдпрд╣ рдирд╛рдо рд╕реЗ рдЗрд╕реЗ рдвреВрдВрдврддрд╛ рд╣реИ рдФрд░ *.so рдлрд╛рдЗрд▓реЛрдВ рдореЗрдВ рдирд╛рдореЛрдВ рдореЗрдВ 6.0/7.0 рд╢рд╛рдорд┐рд▓ рд╣реИред рджреВрд░ рд╕реЗ рд╕рдВрднрд╡ рд╣реИ рдХрд┐ рдЖрдкрдХреЗ рд░рд╛рд╕реНрддреЗ рдореЗрдВ рдЕрднреА рднреА cuDNN 6 рд╣реИред рдореБрдЭреЗ рдЖрдкрдХреЗ рд╕реЗрдЯрдЕрдк рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдЕрдиреБрдорд╛рди рд▓рдЧрд╛рдирд╛ рдкрд╕рдВрдж рдирд╣реАрдВ рд╣реИ, рд▓реЗрдХрд┐рди рдЕрдЧрд░ рдореИрдВ рд╢рд░реНрдд рд▓рдЧрд╛ рд░рд╣рд╛ рд╣реЛрддрд╛ рддреЛ рдореИрдВ рдХрд╣рддрд╛ рдХрд┐ рдпрд╣ рдЕрднреА рднреА cuDNN 6 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рд╣реИред

рдПрдХ рд╡рд┐рд╢рд┐рд╖реНрдЯ рд╕рдВрд╕реНрдХрд░рдг рдХреА рддрд▓рд╛рд╢ рдХреЗ рд▓рд┐рдП рдмреИрдХрд╡рд░реНрдб рд╕рдВрдЧрдд рдорд╛рдЗрдирд╕ TensorFlow рдХреЛ рд╕рдВрдХрд▓рд┐рдд рдХрд░рдиреЗ рдХреЗ рд╕рдВрдмрдВрдз рдореЗрдВред рдореБрдЭреЗрдВ рдирд╣реАрдВ рдкрддрд╛ред

рдЕрдВрдд рдореЗрдВ, рдпрд╣ рдХреЛрдИ рдмрдбрд╝реА рдмрд╛рдд рдирд╣реАрдВ рд╣реИред cuDNN 7 PR рд▓рдЧрднрдЧ рд╕реНрд╡реАрдХреГрдд/рд╡рд┐рд▓рдп рд╣реЛ рдЪреБрдХреЗ рд╣реИрдВ рдФрд░ рдкрд╣рд▓реЗ рд╕реЗ рд╕рдВрдХрд▓рд┐рдд рдмрд╛рдЗрдирд░реА 1.5 рдХреЗ рд░реВрдк рдореЗрдВ cuDNN 7 рдореЗрдВ рдЬрд╛рдиреЗ рдХреА рд╕рдВрднрд╛рд╡рдирд╛ рд╣реИред

CUDA 9RC рдФрд░ cuDNN 7 рдХреА рдкреНрд░рдЧрддрд┐ рдкрд░ рдЕрджреНрдпрддрди

  • NVIDIA рдХреЗ рдкреАрдЖрд░ рд▓рдЧрднрдЧ рд╕реНрд╡реАрдХреГрдд рд╣реИрдВ
  • EIGEN рдкрд░рд┐рд╡рд░реНрддрди рд╕реНрд╡реАрдХреГрдд рдФрд░ рд╡рд┐рд▓рдп рдХрд░ рджрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ
  • FP16 рдкрд░реАрдХреНрд╖рдг V100 (рд╡реЛрд▓реНрдЯрд╛) рдкрд░ рдмрдпрд╛рдирд╛ рдореЗрдВ рд╢реБрд░реВ рд╣реЛ рдЧрдпрд╛ рд╣реИ

@tfboyd рд╕рд┐рд░реНрдл рдкреВрд░реНрдгрддрд╛ рдХреЗ рд▓рд┐рдП: рдореИрдВ рдкрд╣рд▓реЗ cuDNN 5 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рдерд╛ рдФрд░ рдЪреВрдВрдХрд┐ рдореБрдЭреЗ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ 1.3 рдХреЗ рд▓рд┐рдП рдЕрдкрдбреЗрдЯ рдХрд░рдирд╛ рдерд╛, рдЗрд╕рд▓рд┐рдП рдореИрдВ рдЗрд╕реЗ рдПрдХ рд╢реЙрдЯ рджреЗрдиреЗ рдХреЗ рд▓рд┐рдП cuDNN рд╕рдВрд╕реНрдХрд░рдг 7 рдкрд░ рд░реБрдХ рд░рд╣рд╛ рдерд╛ред рдореИрдВрдиреЗ рд╕реНрдкрд╖реНрдЯ рд░реВрдк рд╕реЗ cudnn64_5.dll рд╣рдЯрд╛ рджрд┐рдпрд╛ рд╣реИ рдФрд░ рдореЗрд░реЗ CUDA рд╕реНрдерд╛рдкрдирд╛ рдкрде рдореЗрдВ рдХреЛрдИ cudnn64_6.dll рд╣реИред рд╢рд╛рдпрдж рдпрд╣ рд╡рд┐рдВрдбреЛрдЬрд╝ рдЬрд╛рджреВ рд╣реИред :-рдкреА

рд╣рд╛рд▓рд╛рдБрдХрд┐ рдПрдХ рдмрд╛рдд рдкрд░ рдзреНрдпрд╛рди рджреЗрдВ: рдореИрдВ рдЕрднреА рднреА CUDA 8.0 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рд╣реВрдБ, 9.0 рдХрд╛ рдирд╣реАрдВред

@apacha рдпрд╣ рд╡рд┐рдВрдбреЛрдЬрд╝ рдЬрд╛рджреВ рд╣реЛ рд╕рдХрддрд╛ рд╣реИред рдореИрдВ рдирд┐рд░реНрдгрдп рдирд╣реАрдВ рд▓реЗрдирд╛ рдЪрд╛рд╣рддрд╛ рдерд╛ рдХреНрдпреЛрдВрдХрд┐ рдореБрдЭреЗ рдкрддрд╛ рдирд╣реАрдВ рдерд╛ред рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рд╡рд┐рдВрдбреЛрдЬрд╝ рдЬрд╛рджреВ рд╕рдВрднрд╡ рд╣реИ рдХреНрдпреЛрдВрдХрд┐ рд╕реАрдпреВрдбреАрдПрдирдПрди рдХреЙрд▓ рдирд╣реАрдВ рдмрджрд▓рдиреА рдЪрд╛рд╣рд┐рдП рдереА рдФрд░ рдЗрд╕ рдкреНрд░рдХрд╛рд░ рдкреАрдЫреЗ рдХреА рдУрд░ рд╕рдВрдЧрдд рд╣реЛрдиреЗ рдХреА рд╕рдВрднрд╛рд╡рдирд╛ рд╣реИред Linux рдХреЗ рдирд┐рд░реНрдорд╛рдг рдХреЗ рд▓рд┐рдП TensorFlow рд╡рд┐рд╢рд┐рд╖реНрдЯ рдлрд╝рд╛рдЗрд▓реЛрдВ рдХреА рддрд▓рд╛рд╢ рдХрд░ рд░рд╣рд╛ рд╣реИ (рдпрд╛ рдЬрдм рдореБрдЭреЗ рддреНрд░реБрдЯрд┐рдпрд╛рдБ рдорд┐рд▓рддреА рд╣реИрдВ рддреЛ рдРрд╕рд╛ рджрд┐рдЦрддрд╛ рд╣реИ) рдФрд░ рдЕрдЧрд░ рдпрд╣ cudnnblahblah.6.so рдирд╣реАрдВ рдорд┐рд▓рддрд╛ рд╣реИ рддреЛ рдмрд╣реБрдд рджреБрдЦреА рд╣реЛрддрд╛ рд╣реИред рдЕрджреНрдпрддрди рдФрд░ рд╡рд┐рд╢рд┐рд╖реНрдЯрддрд╛рдУрдВ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рджред

рдХреНрдпрд╛ рдХреЛрдИ рд╢рд╛рдЦрд╛/рдЯреИрдЧ рд╣реИ рдЬрд┐рд╕реЗ рд╣рдо рдЪреЗрдХрдЖрдЙрдЯ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ рдФрд░ рдЗрд╕реЗ рдЖрдЬрд╝рдорд╛ рд╕рдХрддреЗ рд╣реИрдВ?
рдПрдХ рдирдпрд╛ рдЗрдВрд╕реНрдЯреЙрд▓реЗрд╢рди рд╢реБрд░реВ рдХрд┐рдпрд╛, рдЙрдмрдВрдЯреВ 17 ... рдлрд┐рд░ рдирдпрд╛ рдЬреАрд╕реАрд╕реА CUDA 9 рд▓рдЧрд╛рддрд╛ рд╣реИ, рдореИрдВ рджреЗрдЦрддрд╛ рд╣реВрдВ рдХрд┐ CuDNN рдЬреЛ рдлрд┐рдЯ рдмреИрдарддрд╛ рд╣реИ рд╡рд╣ 7 рд╣реИ ... рдЖрдк рджреЗрдЦрддреЗ рд╣реИрдВ рдХрд┐ рдореИрдВ рдХрд╣рд╛рдВ рдЬрд╛ рд░рд╣рд╛ рд╣реВрдВред
рдореИрдВ рдирд┐рд╢реНрдЪрд┐рдд рд░реВрдк рд╕реЗ рдХрдИ рдЬрдЧрд╣реЛрдВ рдкрд░ рдЕрдкрдиреЗ рд╕реЗрдЯрдЕрдк рдХреЛ рд╣реИрдХ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ (рдФрд░ рдЗрд╕реЗ рдЙрдмрдВрдЯреВ 16 рдХреЗ рд╕рд╛рде рдлрд┐рд░ рд╕реЗ рд╢реБрд░реВ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ) рдмрд╕ рдореИрдВ рдмрд╣реБрдд рдХрд░реАрдм рд╣реВрдВ, рдлрд┐рдХреНрд╕ рдХреЛ рдХрд░реАрдм рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИ ... рдЕрдЧрд░ рдореИрдВ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ рддреЛ рдЕрддреАрдд рдореЗрдВ рдмрдбрд╝реА рдЫрд▓рд╛рдВрдЧ рдХреНрдпреЛрдВ рд▓рдЧрд╛рдПрдВ рднрд╡рд┐рд╖реНрдп рдореЗрдВ рдПрдХ рдЫреЛрдЯреА рд╕реА рдЫрд▓рд╛рдВрдЧ!

рдкреАрдЖрд░ рд▓рдЧрднрдЧ рд╕реНрд╡реАрдХреГрдд рд╣реИрдВред рд╡реЗ рд╕рдореАрдХреНрд╖рд╛ рдореЗрдВ рд╣реИрдВред рдореБрдЭреЗ рдХреБрдЫ рдФрд░ рд╢рдХ рд╣реИ
рдЕрдзрд┐рдХ рд╕реЗ рдЕрдзрд┐рдХ рд╕рдкреНрддрд╛рд╣, рд▓реЗрдХрд┐рди рдЗрди рд╕рдореАрдХреНрд╖рд╛рдУрдВ рдореЗрдВ рд╕рдордп рд▓рдЧ рд╕рдХрддрд╛ рд╣реИред рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпреЗ рд╕рдм рд╣реИрдВ
рдЙрдиреНрд╣реЗрдВред EIGEN рдкрд░рд┐рд╡рд░реНрддрди рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХреЛрдИ рд╕реНрдЯреНрд░рдЧрд▓рд░ рдпрд╛ рдкрд░рд┐рд╡рд░реНрддрди рд╣реЛ рд╕рдХрддрд╛ рд╣реИ
CUDA 9. рдореИрдВрдиреЗ рдЙрдиреНрд╣реЗрдВ рд╡реНрдпрдХреНрддрд┐рдЧрдд рд░реВрдк рд╕реЗ рддреИрдпрд╛рд░ рдирд╣реАрдВ рдХрд┐рдпрд╛ рд╣реИред рд╡реЗ рд╣рд░ рджрд┐рди рдХрд░реАрдм рдЖрддреЗ рд╣реИрдВред

https://github.com/tensorflow/tensorflow/pull/12504
https://github.com/tensorflow/tensorflow/pull/12503
https://github.com/tensorflow/tensorflow/pull/12502

рдордВрдЧрд▓рд╡рд╛рд░, 12 рд╕рд┐рддрдВрдмрд░, 2017 рдХреЛ рд╢рд╛рдо 7:49 рдмрдЬреЗ, рд░реЗрдореА рдореЛрд░рд┐рди рд╕реВрдЪрдирд╛рдПрдВ @github.com
рд▓рд┐рдЦрд╛ рдерд╛:

рдХреНрдпрд╛ рдХреЛрдИ рд╢рд╛рдЦрд╛/рдЯреИрдЧ рд╣реИ рдЬрд┐рд╕реЗ рд╣рдо рдЪреЗрдХрдЖрдЙрдЯ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ рдФрд░ рдЗрд╕реЗ рдЖрдЬрд╝рдорд╛ рд╕рдХрддреЗ рд╣реИрдВ?
рдПрдХ рдирдпрд╛ рдЗрдВрд╕реНрдЯреЙрд▓реЗрд╢рди рд╢реБрд░реВ рдХрд┐рдпрд╛, рдЙрдмрдВрдЯреВ 17 ... рдлрд┐рд░ рдирдпрд╛ рдЬреАрд╕реАрд╕реА рдиреЗ рд╕реАрдпреВрдбреАрдП 9 рд▓рдЧрд╛рдпрд╛,
рдореИрдВ рджреЗрдЦ рд░рд╣рд╛ рд╣реВрдБ рдХрд┐ CuDNN рдЬреЛ рдлрд┐рдЯ рдмреИрдарддрд╛ рд╣реИ рд╡рд╣ 7 рд╣реИ... рдЖрдк рджреЗрдЦрддреЗ рд╣реИрдВ рдХрд┐ рдореИрдВ рдХрд╣рд╛рдБ рдЬрд╛ рд░рд╣рд╛ рд╣реВрдБред
рдореИрдВ рдирд┐рд╢реНрдЪрд┐рдд рд░реВрдк рд╕реЗ рдЕрдкрдиреЗ рд╕реЗрдЯрдЕрдк рдХреЛ рдХрдИ рдЬрдЧрд╣реЛрдВ рдкрд░ рд╣реИрдХ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ (рдФрд░ рдЗрд╕реЗ рдЦрд░реЛрдВрдЪ рд╕реЗ рд╢реБрд░реВ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ
рдлрд┐рд░ рд╕реЗ рдЙрдмрдВрдЯреВ 16 рдХреЗ рд╕рд╛рде) рдмрд╕ рдореИрдВ рдмрд╣реБрдд рдХрд░реАрдм рд╣реВрдВ, рдлрд┐рдХреНрд╕ рдХреЛ рдХрд░реАрдм рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИ ... рдХреНрдпреЛрдВ
рдЕрдЧрд░ рдореИрдВ рднрд╡рд┐рд╖реНрдп рдореЗрдВ рдЫреЛрдЯреА рдЫрд▓рд╛рдВрдЧ рд▓рдЧрд╛ рд╕рдХрддрд╛ рд╣реВрдВ рддреЛ рдЕрддреАрдд рдореЗрдВ рдмрдбрд╝реА рдЫрд▓рд╛рдВрдЧ рд▓рдЧрд╛рдУ!

-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-329041739 ,
рдпрд╛ рдереНрд░реЗрдб рдХреЛ рдореНрдпреВрдЯ рдХрд░реЗрдВ
https://github.com/notifications/unsubscribe-auth/AWZesrpX6TSN6fVESEsql3QNtjgo-LM9ks5sh0KqgaJpZM4OuRL7
.

@tfboyd рдХреНрдпрд╛ рдпрд╣ рдЕрднреА рднреА рдПрдХ рдореБрджреНрджрд╛ рд╣реИ? рдореБрдЭреЗ рдПрд╣рд╕рд╛рд╕ рд╣реБрдЖ рдХрд┐ cuda 9.0 рдЖрдЬ рд╣реА рдЬрд╛рд░реА рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред

cuda 9.0 рдЬрд╛рд░реА рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ, рдореБрдЭреЗ cuda 8.0 рдЗрдВрд╕реНрдЯреЙрд▓ рдлрд╝рд╛рдЗрд▓ рдирд╣реАрдВ рдорд┐рд▓ рд░рд╣реА рд╣реИ ....
рдХреГрдкрдпрд╛ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдЕрдкрдЧреНрд░реЗрдб рдХрд░реЗрдВ...

cuda 9.0 рдЬрд╛рд░реА рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ, рдореБрдЭреЗ cuda 8.0 рдЗрдВрд╕реНрдЯреЙрд▓ рдлрд╝рд╛рдЗрд▓ рдирд╣реАрдВ рдорд┐рд▓ рд░рд╣реА рд╣реИ ....

@zjjot https://developer.nvidia.com/cuda-toolkit-archive

@thomasjo рдзрдиреНрдпрд╡рд╛рджя╝Б

рддреЛ @tfboyd рдиреЗ рдЙрдирдХреЗ рджреНрд╡рд╛рд░рд╛ рдмрддрд╛рдП рдЧрдП

@voxmenthe рдореИрдВрдиреЗ рдЕрднреА CUDA 9.0 рдФрд░ cuDNN7 рдХреЗ рд╕рд╛рде tf1.3 рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд┐рдпрд╛ рд╣реИред рдореБрдЭреЗ рдЗрд╕ рдЕрдВрдХ рдореЗрдВ рд╕рдВрдмрдВрдзрд┐рдд рддреНрд░реБрдЯрд┐ рдорд┐рд▓реА #резреирекреореп

рд╕рдВрдкрд╛рджрд┐рдд рдХрд░реЗрдВ: рдЕрд╕рд▓ рдореЗрдВ, рдореБрдЭреЗ рдирд╣реАрдВ рдкрддрд╛ рдХрд┐ рдХреИрд╕реЗред рд▓реЗрдХрд┐рди рдмрд┐рдирд╛ рдХрд┐рд╕реА рдФрд░ рдмрджрд▓рд╛рд╡ рдХреЗ рдорд╛рд╕реНрдЯрд░ рд╢рд╛рдЦрд╛ (рдЬреЛ рд╢реБрд░реБрдЖрдд рдореЗрдВ рдореЗрд░реЗ рд▓рд┐рдП рд╕реНрдерд╛рдкрд┐рдд рдирд╣реАрдВ рд╣реЛ рд░рд╣реА рдереА) рдореЗрдВ рдЬрд╛ рд░рд╣рд╛ рдерд╛, рдореИрдВ рдЗрд╕реЗ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдерд╛ред рд╣рд╛рд▓рд╛рдБрдХрд┐, рдЕрдм рдЬрдм рдореИрдВ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдЖрдпрд╛рдд рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░рддрд╛ рд╣реВрдБ рддреЛ рдпрд╣ рдХрд╣рддрд╛ рд╣реИ рдХрд┐ рдЗрд╕рдореЗрдВ рдкреНрд▓реЗрдЯрдлрд╝реЙрд░реНрдо рдореЙрдбреНрдпреВрд▓ рдЧреБрдо рд╣реИред

рдХреЛрдИ рд╕рдВрдХреЗрдд рд╣реИ рдХрд┐ рд╕рдВрдмрдВрдзрд┐рдд рдкреАрдЖрд░ рдХрд┐рддрдиреЗ рдХрд░реАрдм рдЬрд╛ рд░рд╣реЗ рд╣реИрдВ? рдореИрдВрдиреЗ cuDNN 7 рд╕реНрдерд╛рдкрд┐рдд рдХрд┐рдпрд╛, рдлрд┐рд░ рдорд╣рд╕реВрд╕ рдХрд┐рдпрд╛ рдХрд┐ рдпрд╣ рд╕рдорд╕реНрдпрд╛рдПрдБ рдкреИрджрд╛ рдХрд░ рд░рд╣рд╛ рд╣реИ - рдореИрдВ v6 рдореЗрдВ рдбрд╛рдЙрдирдЧреНрд░реЗрдб рдХрд░ рд╕рдХрддрд╛ рд╣реВрдБ рд▓реЗрдХрд┐рди рдореБрдЭреЗ рд▓рдЧрд╛ рдХрд┐ рдЕрдЧрд░ рдпрд╣ рд╣рд▓ рд╣реЛрдиреЗ рдХреЗ рдХрд░реАрдм рд╣реИ рддреЛ рдореИрдВ рдкреНрд░рддреАрдХреНрд╖рд╛ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдБ ...

рдРрд╕рд╛ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдкреАрдЖрд░ рд╕реНрд╡реАрдХреГрдд рд╣реЛ рдЧрдП рд╣реИрдВред рдореИрдВрдиреЗ рдХреБрдЫ рджрд┐рдиреЛрдВ рдореЗрдВ рдЦреБрдж рдмрд┐рд▓реНрдб рдирд╣реАрдВ рдЪрд▓рд╛рдпрд╛ рд╣реИред рдзреНрдпрд╛рди рд░рдЦреЗрдВ рдХрд┐ 1.3 рдореЗрдВ рдпреЗ рдкрд░рд┐рд╡рд░реНрддрди рдирд╣реАрдВ рд╣реЛрдВрдЧреЗ рдЬреИрд╕рд╛ рдХрд┐ рдХреБрдЫ рд╕рдордп рдкрд╣рд▓реЗ рдерд╛ред 1.4 рдореЗрдВ рдкрд░рд┐рд╡рд░реНрддрди рд╣реЛрдВрдЧреЗред рдЙрдореНрдореАрдж рд╣реИ рдХрд┐ рдЗрд╕ рд╕рдкреНрддрд╛рд╣ рдореИрдВ рдирд╡реАрдирддрдо рд╕рдВрд╕реНрдХрд░рдг рдбрд╛рдЙрдирд▓реЛрдб рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ рдФрд░ рдПрдХ рдирдпрд╛ рдирд┐рд░реНрдорд╛рдг рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВред рдореБрдЭреЗ рд╕рдВрджреЗрд╣ рд╣реИ рдХрд┐ рдореЗрд░реЗ рдкрд╛рд╕ рд╕рдордп рд╣реЛрдиреЗ рд╕реЗ рдкрд╣рд▓реЗ рдХреЛрдИ рдЗрд╕реЗ рдЕрдЪреНрдЫреА рддрд░рд╣ рд╕реЗ рдХрд░реЗрдЧрд╛ред

рдХрд┐рд╕реА рднреА рдореМрдХреЗ рдкрд░ рдЖрдк рдореЗрдВ рд╕реЗ рдХреЛрдИ рднреА рд╕реНрдорд╛рд░реНрдЯ рд▓реЛрдЧ tf 1.3 рдпрд╛ 1.4 рдХреЗ рд▓рд┐рдП CUDA v9.0, cudnn 7.0 рд╡рд┐рди 10 x64 рдХреЗ рд▓рд┐рдП рдЯреНрдпреВрдЯреЛрд░рд┐рдпрд▓ рдмрдирд╛ рд░рд╣реЗ рд╣реЛрдВрдЧреЗ? рдореИрдВрдиреЗ (рдПрдирд╛рдХреЛрдВрдбрд╛) рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд┐рдпрд╛ рд╣реИ, рд▓реЗрдХрд┐рди '_pywrap_tensorflow_internal' рддреНрд░реБрдЯрд┐ рдкреНрд░рд╛рдкреНрдд рдХрд░рдирд╛ рдЬрд╛рд░реА рд░рдЦреЗрдВ рдФрд░ рдореИрдВрдиреЗ рдкрд╣рд▓реЗ рд╣реА рдЬрд╛рдБрдЪ рдХрд░ рд▓реА рд╣реИ рдХрд┐ msvcp140.dll рдореЗрд░реЗ рдкрде рдореЗрдВ рдЬреЛрдбрд╝рд╛ рдЧрдпрд╛ рд╣реИред

@ devilsnare007 : рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ https://github.com/philferriere/dlwin рдХрд╛ рдЕрдиреБрд╕рд░рдг рдХрд░рдХреЗ рд╕рд░реНрд╡реЛрддреНрддрдо рд╕рдВрднрд╛рд╡рдирд╛рдПрдВ рд╣реИрдВ

TF 1.4 рдЬрд╛рд░реА рд╣реЛрдиреЗ рдкрд░ рдХреНрдпрд╛ cuDNN 7.0 рд╕рдорд░реНрдерд┐рдд рд╣реЛрдЧрд╛?

@soloice
рд╕рд┐рд░ рдкрд░ (рдХреБрдЫ рджрд┐рдиреЛрдВ рдкрд╣рд▓реЗ рддрдХ) рдореИрдВ CUDA 9 (рд░рд┐рд▓реАрдЬрд╝ рд╕рдВрд╕реНрдХрд░рдг) рдХреЛ cuDNN 7.0 рдХреЗ рд╕рд╛рде рдмрд┐рдирд╛ рдХрд┐рд╕реА рд╡рд┐рд╢реЗрд╖ рдкрд░рд┐рд╡рд░реНрддрди рдХреЗ рд╕рдВрдХрд▓рд┐рдд рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдерд╛ рдФрд░ GTX 1080 рдкрд░ рдХреБрдЫ tf_cnn_benchmarks.py рдкрд░реАрдХреНрд╖рдг рдЪрд▓рд╛рдПред рд╕рдм рдХреБрдЫ рдареАрдХ рд▓рдЧ рд░рд╣рд╛ рд╣реИред TF 1.4 рдЬрд┐рд╕реЗ рдЗрд╕ рд╕рдкреНрддрд╛рд╣ RC рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдП, рдЙрд╕рдореЗрдВ CUDA 8 рдФрд░ cuDNN 6 рдмрд╛рдпрдиреЗрд░рд┐рдЬрд╝ рд╣реЛрдВрдЧреЗ, рд▓реЗрдХрд┐рди CUDA 9 рдФрд░ cuDNN 7 рдХреЗ рд╕рд╛рде рднреА рдареАрдХ рд╕рдВрдХрд▓рд┐рдд рд╣реЛрдВрдЧреЗред рд▓рдХреНрд╖реНрдп TF 1.5 рдХреЗ рд▓рд┐рдП CUDA 9 рдФрд░ cuDNN 7 рдмрд╛рдЗрдирд░реА рдореЗрдВ рд╣реИред рдЗрд╕рд╕реЗ рд▓реЛрдЧреЛрдВ рдХреЛ рдЕрдкрдиреЗ рд╕рд┐рд╕реНрдЯрдо рд▓рд╛рдЗрдмреНрд░реЗрд░реА рдХреЛ рдЕрдкрдЧреНрд░реЗрдб рдХрд░рдиреЗ рдХрд╛ рд╕рдордп рдорд┐рд▓рддрд╛ рд╣реИ рдФрд░ рдкрд░реАрдХреНрд╖рдг рдХреЗ рд▓рд┐рдП рдЕрдзрд┐рдХ рд╕рдордп рдорд┐рд▓рддрд╛ рд╣реИред рдпрджрд┐ рдЖрдк рд╡реЛрд▓реНрдЯрд╛рд╕ рдЪрд▓рд╛ рд░рд╣реЗ рд╣реИрдВ рддреЛ рдмреЗрдЭрд┐рдЭрдХ рдПрдХ рдФрд░ рдзрд╛рдЧрд╛ рд╢реБрд░реВ рдХрд░реЗрдВ рдФрд░ рдореИрдВ рдЕрдкрдбреЗрдЯ рдХрд░реВрдВрдЧрд╛ рдХрд┐ рдпрд╣ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рд╕рдордп рдореЗрдВ FP16 рдкрд░ рдкреНрд░рдЧрддрд┐ рдХрд░реЗрдЧрд╛ред

@tfboyd рдпрд╣ рд╕реБрдирдХрд░ рдмрд╣реБрдд рдЕрдЪреНрдЫрд╛ рд▓рдЧрд╛ рдХрд┐ TF 1.4 cuDNN 7 рдХреЗ рд╕рд╛рде рд╕рдВрдХрд▓рд┐рдд рд╣реИ! рдпрджрд┐ рдХрд┐рд╕реА рдмрд┐рдВрджреБ рдкрд░ рдЖрдк рдПрдХ рдЗрдВрд╕реНрдЯреЙрд▓ рдЧрд╛рдЗрдб рдмрдирд╛рдиреЗ рдХрд╛ рдорди рдХрд░рддреЗ рд╣реИрдВ рддреЛ рдпрд╣ рдбреАрдПрд▓ рд╕рдореБрджрд╛рдп рдХреЗ рд▓рд┐рдП рдПрдХ рдорд╣рд╛рди рд╕рд╛рд░реНрд╡рдЬрдирд┐рдХ рд╕реЗрд╡рд╛ рд╣реЛрдЧреАред

рдХреЛрдИ рдмрд╛рдд рдирд╣реАрдВ, рдпрд╣ рдХрд╛рдлреА рдЖрд╕рд╛рди рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдП рдФрд░ рдореБрдЭреЗ рдЗрд╕реЗ рднрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░рдиреЗ рдореЗрдВ рдЦреБрд╢реА рд╣реЛ рд░рд╣реА рд╣реИ
рдЕрдВрддрд░рд╛рд▓ред

рд╕реЛрдо, 9 рдЕрдХреНрдЯреВрдмрд░, 2017 рдХреЛ рд╕реБрдмрд╣ 9:42 рдмрдЬреЗ, рдЬреЗрдлрд╝ рдиреЛрдЯрд┐рдлрд┐рдХреЗрд╢рди @github.com рдиреЗ рд▓рд┐рдЦрд╛:

@tfboyd https://github.com/tfboyd рдпрд╣ рд╕реБрдирдХрд░ рдмрд╣реБрдд рдЕрдЪреНрдЫрд╛ рд▓рдЧрд╛ рдХрд┐ TF 1.4 рд╕рдВрдХрд▓рд┐рдд рд╣реИ
рд╕реАрдпреВрдбреАрдПрдирдПрди 7 рдХреЗ рд╕рд╛рде! рдпрджрд┐ рдХрд┐рд╕реА рдмрд┐рдВрджреБ рдкрд░ рдЖрдк рдПрдХ рдЗрдВрд╕реНрдЯреЙрд▓ рдЧрд╛рдЗрдб рдмрдирд╛рдиреЗ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рд╕реЛрдЪрддреЗ рд╣реИрдВ рддреЛ
рдбреАрдПрд▓ рд╕рдореБрджрд╛рдп рдХреЗ рд▓рд┐рдП рдПрдХ рдорд╣рд╛рди рд╕рд╛рд░реНрд╡рдЬрдирд┐рдХ рд╕реЗрд╡рд╛ рд╣реЛрдЧреАред

-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-335212652 ,
рдпрд╛ рдереНрд░реЗрдб рдХреЛ рдореНрдпреВрдЯ рдХрд░реЗрдВ
https://github.com/notifications/unsubscribe-auth/AWZesp7d2aT8gsGOWb6YjHH_CnpKXUIPks5sqkztgaJpZM4OuRL7
.

рдХреНрдпрд╛ CUDA 9 рдФрд░ cuDNN 7.0 рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░рдиреЗ рд╡рд╛рд▓рд╛ whl рд╣реЛрдиреЗ рдХреА рд╕рдВрднрд╛рд╡рдирд╛ рд╣реИ?

рдзрдиреНрдпрд╡рд╛рдж!

рдореИрдВ рдЕрдкрдирд╛ рдкреНрд░рдХрд╛рд╢рд┐рдд рдХрд░реВрдВрдЧрд╛ (рдЬреЛ рд╕рдВрднрд╡рдд: 1.4 рдирд╣реАрдВ рд╣реЛрдЧрд╛ рд▓реЗрдХрд┐рди рдХреБрдЫ рдореИрдЪ рдХреЗ рдХрд░реАрдм рд╣реЛрдЧрд╛
рдФрд░ рдореИрдВ рдирд╛рдо рдореЗрдВ рд╣реИрд╢ рд╢рд╛рдорд┐рд▓ рдХрд░рддрд╛ рд╣реВрдВ) рдЬрдм рдореИрдВ рдЗрд╕реЗ рдкрд░реАрдХреНрд╖рдг рдХреЗ рд▓рд┐рдП рдмрдирд╛рддрд╛ рд╣реВрдВ рд▓реЗрдХрд┐рди рдпрд╣ рд╣реЛрдЧрд╛
рдЙрдмрдВрдЯреВ 16.04 рдмрдиреЗрдВ (рдореИрдВ рднреВрд▓ рдЧрдпрд╛ рдХрд┐ рдЬреАрд╕реАрд╕реА рд╕рдВрд╕реНрдХрд░рдг рдХреНрдпрд╛ рд╣реИ), рд▓рд┐рдирдХреНрд╕, рдкрд╛рдпрдерди 2.7 рд╕рд┐рд░реНрдл рдПрдлрд╡рд╛рдИрдЖрдИред
рдФрд░ рдореИрдВ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдЙрди рдмрд┐рд▓реНрдб рдХреЛ рд╕рд╛рдЭрд╛ рдХрд░рдиреЗ рдХрд╛ рдЕрдиреБрдорд╛рди рдирд╣реАрдВ рд▓рдЧрд╛ рд░рд╣рд╛ рд╣реВрдВ рдХреНрдпреЛрдВрдХрд┐ рдпрд╣ рд╣реЛ рд╕рдХрддрд╛ рд╣реИ
рд▓реЛрдЧреЛрдВ рдХреЗ рд▓рд┐рдП рднреНрд░рдорд┐рдд рдХрд░рдиреЗ рд╡рд╛рд▓рд╛ рдФрд░ рдореИрдВ рдЙрди рд╕рднреА рдХреЗ рд▓рд┐рдП рдЬреЛрд░ рджреВрдВрдЧрд╛ рдЬреЛ рдЖрдк рдЬрд╛рдирддреЗ рд╣реИрдВ рдХрд┐ рдореИрдВрдиреЗ рдХреБрдЫ рд╢рд╛рдорд┐рд▓ рдХрд┐рдП рд╣реИрдВ
рдкрд╛рдЧрд▓ рдкрд┐рдЫрд▓рд╛ рджрд░рд╡рд╛рдЬрд╛ред рд╣рд╛рд▓рд╛рдВрдХрд┐ рдХреБрдЫ рд╕реАрдХреНрд░реЗрдЯ рдХреЛрдб рдЬреЛрдбрд╝рдиреЗ рд╕реЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдмрд╣реБрдд рдХрд╛рдо рд╣реЛ рдЧрдпрд╛ рд╣реИ
рдореЗрд░реЗ рд▓рд┐рдПред

рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рд░рд╛рддреНрд░рд┐-рдЬреАрдкреАрдпреВ рдмрд┐рд▓реНрдб рд▓рдЧрднрдЧ рдкреАрдЖрдИрдкреА рдореЗрдВ рд░рд╣рддреЗ рд╣реИрдВ (рдореБрдЭреЗ рдкреВрд░рд╛ рдпрдХреАрди рд╣реИ рдХрд┐ рд╡реЗ
рд╣рдореЗрд╢рд╛ рд╣реБрдЖ рд╣реИ рдЖрдкрдХреЛ рдмрд╕ рдЙрдиреНрд╣реЗрдВ рдвреВрдВрдврдирд╛ рдерд╛) рдЬрд┐рд╕рдХрд╛ рдЕрд░реНрде рд╣реИ 1.4 рдХреЗ рдмрд╛рдж
рд░рд╛рдд рдХреЗ рдирд┐рд░реНрдорд╛рдг рдмрд╣реБрдд рдЬрд▓реНрджреА CUDA 9 + cuDNN 7 рдореЗрдВ рдЪрд▓реЗ рдЬрд╛рдПрдВрдЧреЗред

рд╕реЛрдо, рдЕрдХреНрдЯреВрдмрд░ 9, 2017 рдореЗрдВ 11:41 рдмрдЬреЗ, alexirae рдкрд░ [email protected] рд▓рд┐рдЦрд╛ рд╣реИ:

рдХреНрдпрд╛ CUDA 9 рдФрд░ cuDNN 7.0 рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░рдиреЗ рд╡рд╛рд▓рд╛ whl рд╣реЛрдиреЗ рдХреА рд╕рдВрднрд╛рд╡рдирд╛ рд╣реИ?

рдзрдиреНрдпрд╡рд╛рдж!

-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-335249979 ,
рдпрд╛ рдереНрд░реЗрдб рдХреЛ рдореНрдпреВрдЯ рдХрд░реЗрдВ
https://github.com/notifications/unsubscribe-auth/AWZeskJ5LXJwFcRpm-sKZ9QORoltrHOEks5sqmj1gaJpZM4OuRL7
.

@tfboyd рдЖрдкрдХреЗ рдЙрддреНрддрд░ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рджред рдЕрдВрдд рдореЗрдВ рдореИрдВ Ubuntu 16.04 рдкрд░ CUDA 8 + cuDNN 7 рд╕рдорд░реНрдерди рд╡рд╛рд▓реЗ рд╕реНрд░реЛрддреЛрдВ рд╕реЗ рдирд╡реАрдирддрдо TF рдмрдирд╛рдиреЗ рдореЗрдВ рдХрд╛рдордпрд╛рдм рд░рд╣рд╛ рдФрд░ GTX 1080 Ti рдкрд░ рд╕рдм рдХреБрдЫ рдареАрдХ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред

@tfboyd рдХреНрдпрд╛ 14.rc TF CuDNN 7 рдФрд░ CUDA 9 рдХреЛ рд╕рдкреЛрд░реНрдЯ рдХрд░рддрд╛ рд╣реИ?

рдпрджрд┐ рдЖрдк рд╕реНрд░реЛрдд рд╕реЗ рдирд┐рд░реНрдорд╛рдг рдХрд░рддреЗ рд╣реИрдВ рддреЛ рдЗрд╕реЗ рд╢рд╛рдорд┐рд▓ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рдореИрдВ рдбрд┐рдлрд╝реЙрд▓реНрдЯ рдмрджрд▓рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реВрдБ
рдмрд╛рдпрдиреЗрд░рд┐рдЬрд╝ рдЬрд┐рд╕рдХреЗ рд▓рд┐рдП рдореБрдЭреЗ AWS рдкрд░ K80s рдкрд░ рдХреБрдЫ рдкреНрд░рддрд┐рдЧрдорди рдкрд░реАрдХреНрд╖рдг рдЪрд▓рд╛рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ
рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░реЗрдВ рдХрд┐ рд╕рдм рдХреБрдЫ рдЕрдЪреНрдЫрд╛ рд▓рдЧ рд░рд╣рд╛ рд╣реИ рдФрд░ рд╕рд╛рде рд╣реА рдмрд┐рд▓реНрдб рдмрдирд╛рдПрдВред рд╣рдо
рддреБрд░рдВрдд рдПрдХ рд╕рдорд╕реНрдпрд╛ рдереА рдХреНрдпреЛрдВрдХрд┐ NVIDIA рдбреНрд░рд╛рдЗрд╡рд░ рдХреЛ рдХрдо рдкреНрд░рджрд░реНрд╢рди рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рдереА
рдХреЛрдХреЛрд░реЛ рдкрд░ Google рдХреНрд▓рд╛рдЙрдб рдореЗрдВ 30% рддрдХ рдЪрд▓ рд░рд╣рд╛ рд╣реИред рдХреБрдЫ рднреА рд╕реАрдзрд╛ рдирд╣реАрдВ рд╣реИ
рдЖрдЧреЗ, рд▓реЗрдХрд┐рди CUDA 9 рдФрд░ cuDNN 7 1.4 рд╕реНрд░реЛрдд рдореЗрдВ рд╣реИрдВ рдФрд░ рдЙрдореНрдореАрдж рдХреЗ рдореБрддрд╛рдмрд┐рдХ рд╣реИрдВ
рдореЗрд░реЗ рд▓рд┐рдП рдкрд╛рд╕реНрдХрд▓ рдкрд░ рдмрд╣реБрдд рд╕реАрдорд┐рдд рдкрд░реАрдХреНрд╖рдгред

рдЧреБрд░реБ, 12 рдЕрдХреНрдЯреВрдмрд░, 2017 рдХреЛ рджреЛрдкрд╣рд░ 2:40 рдмрдЬреЗ, рдХреЙрдиреНрд╕реНрдЯреЗрдВрдЯрд┐рди рдиреЛрдЯрд┐рдлрд┐рдХреЗрд╢рди @github.com
рд▓рд┐рдЦрд╛ рдерд╛:

@tfboyd https://github.com/tfboyd рдХреНрдпрд╛ 14.rc TF CuDNN 7 рдХрд╛ рд╕рдорд░реНрдерди рдХрд░рддрд╛ рд╣реИ рдФрд░
рдХреБрдбрд╛ 9?

-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-336075883 ,
рдпрд╛ рдереНрд░реЗрдб рдХреЛ рдореНрдпреВрдЯ рдХрд░реЗрдВ
https://github.com/notifications/unsubscribe-auth/AWZesq03dvnXWd0GLXODBTNCWEExlZGPnks5srd6pgaJpZM4OuRL7
.

рдХреНрдпрд╛ рд╕реАрдпреВрдбреАрдП 9, рд╕реАрдпреВрдбреАрдПрдирдПрди 7.0 рдФрд░ рдкрд╛рдпрдерди 3.5 рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░рдиреЗ рд╡рд╛рд▓рд╛ рдПрдХ рдбрдмреНрд▓реНрдпреВрдПрдЪрдПрд▓ рд╣реЛрдиреЗ рдХреА рд╕рдВрднрд╛рд╡рдирд╛ рд╣реИ?

TF 1.4 рдХреЛ рдЕрдВрддрд┐рдо рд░реВрдк рджрд┐рдП рдЬрд╛рдиреЗ рдХреЗ рдмрд╛рдж рд░рд╛рдд рдХреЗ рдирд┐рд░реНрдорд╛рдг рдХреЛ CUDA 9 + . рдореЗрдВ рд╕реНрдерд╛рдирд╛рдВрддрд░рд┐рдд рдХрд░ рджрд┐рдпрд╛ рдЬрд╛рдПрдЧрд╛
cuDNN 7 рдпрд╣ рдорд╛рдирддреЗ рд╣реБрдП рдХрд┐ рдХреЛрдИ рд╕рдорд╕реНрдпрд╛ рдирд╣реАрдВ рд╣реИред рдореЗрд░реЗ рджреНрд╡рд╛рд░рд╛ рдмрдирд╛рдП рдЧрдП рдирд┐рд░реНрдорд╛рдг рдФрд░ рдордиреЛрд░рдВрдЬрди рдХреЗ рд▓рд┐рдП рд╕рд╛рдЭрд╛ рдХрд┐рдП рдЧрдП рд╣реИрдВ
рд╣рдореЗрд╢рд╛ рдЕрдЬрдЧрд░ 2.7 рдХреНрдпреЛрдВрдХрд┐ рдпрд╣ рдореЗрд░реЗ рдкрд░реАрдХреНрд╖рдг рд╕рд┐рд╕реНрдЯрдо рдкрд░ рдбрд┐рдлрд╝реЙрд▓реНрдЯ рд╣реИред

рд╕реЛрдо, 16 рдЕрдХреНрдЯреВрдмрд░, 2017 рдХреЛ рд╕реБрдмрд╣ 6:59 рдмрдЬреЗ, рдбрд┐рдПрдЧреЛ рд╕реНрдЯреИрд▓реНрдбрд░ рд╕реВрдЪрдирд╛рдПрдВ @github.com
рд▓рд┐рдЦрд╛ рдерд╛:

рдХреНрдпрд╛ CUDA 9, cuDNN 7.0 рдФрд░ . рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░рдиреЗ рд╡рд╛рд▓рд╛ whl рд╣реЛрдиреЗ рдХреА рд╕рдВрднрд╛рд╡рдирд╛ рд╣реИ?
рдЕрдЬрдЧрд░ 3.5?

-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-336894073 ,
рдпрд╛ рдереНрд░реЗрдб рдХреЛ рдореНрдпреВрдЯ рдХрд░реЗрдВ
https://github.com/notifications/unsubscribe-auth/AWZesqgclWqET4OufQHV3FAD4XxgnZiKks5ss2E6gaJpZM4OuRL7
.

рдХреЛрдИ рдЕрдкреЗрдХреНрд╖рд┐рдд рд░рд┐рд▓реАрдЬ рдХреА рддрд╛рд░реАрдЦ?

рд╡реЗ рд╕рднреА рдЬреЛ рдереЛрдбрд╝рд╛-рдереЛрдбрд╝рд╛ рдХрд╛рдЯ рд░рд╣реЗ рд╣реИрдВ, рдмрд╕ рд╕реНрд░реЛрдд рд╕реЗ #рдорд╛рд╕реНрдЯрд░ рдХрд╛ рдирд┐рд░реНрдорд╛рдг рдХрд░реЗрдВред рдпрд╣ рдмрд╣реБрдд рдХрдард┐рди рдирд╣реАрдВ рд╣реИ (рдмрд╕ рд╕рдордп рд▓рдЧрддрд╛ рд╣реИ), рдЖрдкрдХреЛ рдирд╡реАрдирддрдо CUDA/cuDNN, _рдФрд░_ рдПрдХ pip/whl рдЗрдВрд╕реНрдЯреЙрд▓ рдкрд░ рдЕрддрд┐рд░рд┐рдХреНрдд рдЕрдиреБрдХреВрд▓рди рдорд┐рд▓рддреЗ рд╣реИрдВ (рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдЗрд╕ рдЯрдЯ рдореЗрдВ CPU рдЕрдиреБрдХреВрд▓рди рджреЗрдЦреЗрдВ)ред рд╕рд╛рде рд╣реА рдЕрдЧрд▓реА рдмрд╛рд░ CUDA/cuDNN рдЕрдкрдЧреНрд░реЗрдб рд╣реЛрдиреЗ рдкрд░, рдЖрдк рдкреНрд░рддреАрдХреНрд╖рд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдлрд┐рд░ рд╕реЗ рдирд┐рд░реНрдорд╛рдг рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред

рд╕реНрд░реЛрддреЛрдВ рд╕реЗ рдирд┐рд░реНрдорд╛рдг, TF1.4 cuda 9.0, cuDNN v7.0.3 рдФрд░ python3.5 . рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░ рд░рд╣рд╛ рд╣реИ

рдХреНрдпрд╛ рдореИрдВ win10 рдкреНрд▓реЗрдЯрдлреЙрд░реНрдо рдкрд░ рд╕реНрд░реЛрдд рд╕реЗ рдирд┐рд░реНрдорд╛рдг рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ?
рдЪрд╛рд╣рддреЗ рд╣реИрдВ рдХрд┐ TF cuda 9.0, cuDNN v7, python3 рдкрд░ рдХрд╛рдо рдХрд░реЗред 6 , рдФрд░ win10

рд╕реНрд░реЛрддреЛрдВ рд╕реЗ рдирд┐рд░реНрдорд╛рдг, TF1.4 cuda 9.0, cuDNN v7.0.3 рдФрд░ python2.7 рдХреЗ рд╕рд╛рде рднреА рдХрд╛рдо рдХрд░ рд░рд╣рд╛ рд╣реИред

@affromero рдХреНрдпрд╛

рдореИрдВрдиреЗ CUDA 9 / cuDNN 7 рдХреЗ рд╕рд╛рде TF 1.4RC0 рд╢рд╛рдЦрд╛ рд╕реЗ AWS рднрд╡рди рдкрд░ tf_cnn_benchmarks рдХрд╛ рдкрд░реАрдХреНрд╖рдг рдХрд┐рдпрд╛ рдФрд░ рдкрд░рд┐рдгрд╛рдо CUDA 8 + cuDNN 6 рдХреЗ рдмрд░рд╛рдмрд░ рдпрд╛ рдереЛрдбрд╝реЗ рддреЗрдЬрд╝ рдереЗред

рд╕рдВрдкрд╛рджрд┐рдд рдХрд░реЗрдВ: рдЙрд▓реНрд▓реЗрдЦ рд╣рдЯрд╛рдПрдВ рдореИрдВ рдПрд▓реАрдкреЗрдЯрд░реНрд╕ рдЯрд┐рдкреНрдкрдгреА рдХреЛ рд╕рдВрдмреЛрдзрд┐рдд рдирд╣реАрдВ рдХрд░ рд░рд╣рд╛ рдерд╛ред :-)

@рдПрд▓реАрдкреАрдЯрд░реНрд╕

рдЬрдм рд╣рдо рдмрд┐рд▓реНрдбрд┐рдВрдЧ рдХрд╣рддреЗ рд╣реИрдВ рддреЛ рд╣рдорд╛рд░рд╛ рдорддрд▓рдм рд╣реЛрддрд╛ рд╣реИ рд╕реЛрд░реНрд╕ рд╕реЗ рдмрд┐рд▓реНрдбрд┐рдВрдЧ, рд╡реНрд╣реАрд▓ рдлрд╛рдЗрд▓ рдХреЛ рдЗрдВрд╕реНрдЯрд╛рд▓ рдирд╣реАрдВ рдХрд░рдирд╛ред рдПрдХ рдкрд╣рд┐рдпрд╛ рдкрд╣рд▓реЗ рд╕реЗ рд╣реА рд╕рдВрдХрд▓рд┐рдд рд╣реИ рдФрд░ 1.4 рдмрд╛рдпрдиреЗрд░рд┐рдЬрд╝ CUDA 8 + cuDNN 6 рдХрд╛ рд╕рдорд░реНрдерди рдХрд░рддреЗ рд╣реИрдВред CUDA 9 рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЖрдкрдХреЛ рд╕реНрд░реЛрдд рд╕реЗ рдирд┐рд░реНрдорд╛рдг рдХрд░рдирд╛ рд╣реЛрдЧрд╛ред рдореИрдВрдиреЗ рдХрднреА рд╡рд┐рдВрдбреЛрдЬрд╝ рдмрд┐рд▓реНрдб рдирд╣реАрдВ рдХрд┐рдпрд╛ рд╣реИред 1.4 рдЬрд╣рд╛рдЬреЛрдВ рдХреЗ рдмрд╛рдж рдЯреАрдо рд░рд╛рдд рдХреЗ рдирд┐рд░реНрдорд╛рдг рдХреЛ CUDA 9 рдореЗрдВ рдмрджрд▓ рджреЗрдЧреАред

рдкреНрд░реАрдХрдВрдкреАрд▓реНрдб рд╡реНрд╣реАрд▓ (https://pypi.python.org/pypi/tensorflow) рдХреЗ рд░реВрдк рдореЗрдВ 1.4 рдЖрдЙрдЯ рдХреЗ рд▓рд┐рдП рджреВрд╕рд░рд╛ рд░рд┐рд▓реАрдЬрд╝ рдЙрдореНрдореАрджрд╡рд╛рд░ (rc1) рд╣реИред рдХреНрдпрд╛ рдХрд┐рд╕реА рдиреЗ рдЕрднреА рддрдХ CUDA 9 рдХреЗ рд╕рд╛рде рдЗрд╕рдХрд╛ рдкрд░реАрдХреНрд╖рдг рдХрд┐рдпрд╛ рд╣реИ?

рдХреЛрд╢рд┐рд╢ рдХреА, рд▓реЗрдХрд┐рди рдХрд╛рдо рдХрд░ рд░рд╣реЗ рдХреНрдпреВрдбрд╛ 9.0 рдХреЗ рд╕рд╛рде рдирд╣реАрдВред

рдореИрдВ рдлрд┐рд░ рд╕реЗ рдХреЛрд╢рд┐рд╢ рдХрд░реВрдВрдЧрд╛ред

1.4 CUDA 8 + cuDNN 6 рд╣реИ рдпрд╣ CUDA 9 рдХреЗ рд╕рд╛рде рдХрд╛рдо рдирд╣реАрдВ рдХрд░реЗрдЧрд╛ рдЖрдкрдХреЛ рд╕реНрд░реЛрдд рд╕реЗ рд╕рдВрдХрд▓рди рдХрд░рдирд╛ рд╣реЛрдЧрд╛
рдПрдХ рдмрд╛рд░ 1.4 рдЬрд╛рд░реА рд╣реЛрдиреЗ рдХреЗ рдмрд╛рдж рд╣рдо рд░рд╛рдд рдХреЗ рдирд┐рд░реНрдорд╛рдг рдХреЛ CUDA 9 рдкрд░ рд╕реНрд╡рд┐рдЪ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд╛рдо рдХрд░реЗрдВрдЧреЗ рдФрд░ рдлрд┐рд░ 1.5 рд╕рдмрд╕реЗ рдЕрдзрд┐рдХ рд╕рдВрднрд╛рд╡рдирд╛ CUDA 9 рд╣реЛрдЧреАред

рдореБрдЭреЗ рдкрддрд╛ рд╣реИ рдХрд┐ CUDA 9 рд╕реНрд░реЛрдд рд╕реЗ 1.4 рдХрд╛ рдирд┐рд░реНрдорд╛рдг рдХрд░рддреЗ рд╕рдордп рдареАрдХ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ (рдЙрдмрдВрдЯреВ 16.04/рдкрд╛рдпрдерди 2) рдХреНрдпреЛрдВрдХрд┐ рдореИрдВ рдкрд┐рдЫрд▓реЗ рд╕рдкреНрддрд╛рд╣рд╛рдВрдд рдореЗрдВ рдПрдбрдмреНрд▓реНрдпреВрдПрд╕ рдкрд░ рдмреЗрдВрдЪрдорд╛рд░реНрдХ рдХрд░ рд░рд╣рд╛ рдерд╛ред

рдореЗрд░реЗ рдкрд╛рд╕ рдпрд╣рд╛рдВ рд╕реНрд░реЛрдд рд╕реЗ рдирд┐рд░реНрдорд╛рдг рдкрд░ рдПрдХ рд╣рд╛рд▓рд┐рдпрд╛ рдиреБрд╕реНрдЦрд╛

рдЖрдк рд╕рдмрд╕реЗ рдЕрдЪреНрдЫреЗ рдпрд╛рд░реЛрд╕реНрд▓рд╛рд╡ рд╣реИрдВред

рдмреБрдзрд╡рд╛рд░, 25 рдЕрдХреНрдЯреВрдмрд░, 2017 рдХреЛ рд╕реБрдмрд╣ 8:11 рдмрдЬреЗ, рдпрд╛рд░реЛрд╕реНрд▓рд╛рд╡ рдмреБрд▓рдЯреЛрд╡ рдиреЛрдЯрд┐рдлрд┐рдХреЗрд╢рди @github.com
рд▓рд┐рдЦрд╛ рдерд╛:

рдореЗрд░реЗ рдкрд╛рд╕ рдпрд╣рд╛рдВ рд╕реНрд░реЛрдд рд╕реЗ рдирд┐рд░реНрдорд╛рдг рдкрд░ рдПрдХ рд╣рд╛рд▓рд┐рдпрд╛ рдиреБрд╕реНрдЦрд╛ рд╣реИ
https://github.com/yaroslavvb/tensorflow-community-wheels (рдХреГрдкрдпрд╛ рдкреЛрд╕реНрдЯ рдХрд░реЗрдВ
рдЖрдкрдХреЗ CUDA 9.0 рд╡реНрд╣реАрд▓ рдХрд╛ рд▓рд┐рдВрдХ рдПрдХ рдмрд╛рд░ рдЬрдм рдЖрдк рдЗрд╕реЗ рдмрдирд╛ рд▓реЗрддреЗ рд╣реИрдВ)

-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/tensorflow/tensorflow/issues/12052#issuecomment-339361959 ,
рдпрд╛ рдереНрд░реЗрдб рдХреЛ рдореНрдпреВрдЯ рдХрд░реЗрдВ
https://github.com/notifications/unsubscribe-auth/AWZesmRwb0UmLWxzANWCq5RrT6teYtr5ks5sv0-IgaJpZM4OuRL7
.

рдирдорд╕реНрддреЗ, рдореИрдВ win10 env рджреНрд╡рд╛рд░рд╛ tensorflow gpu рдмрдирд╛рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░рддрд╛ рд╣реВрдВ, рдлрд┐рд░ рдореИрдВ рднреА рдЗрд╕ рддрд░рд╣ рд╕реЗ рдорд┐рд▓рд╛ рд╣реВрдВя╝М рдХреНрдпрд╛ рдХреЛрдИ рдореЗрд░реА рдорджрдж рдХрд░ рд╕рдХрддрд╛ рд╣реИя╝Мрдкрд╣рд▓реЗ рдзрдиреНрдпрд╡рд╛рджред
рдореЗрд░рд╛ рд╡рд╛рддрд╛рд╡рд░рдгя╝Ъ
win10 + gtx 1080ti + cuda 9.0 + cuDNN 7 + рд╡рд┐рдЬреБрдЕрд▓ рд╕реНрдЯреВрдбрд┐рдпреЛ рдкреНрд░реЛрдлреЗрд╢рди 2015 + cmake 3.6.3 + рдкрд╛рдпрдерди 3.5.4

рдЬрдм рдореИрдВ tensorflow r1.4 рдкрд░ рд╕реНрд╡рд┐рдЪ рдХрд░рддрд╛ рд╣реВрдВ рдФрд░ win10 рдкрд░реНрдпрд╛рд╡рд░рдг рдкрд░ cmake рджреНрд╡рд╛рд░рд╛ рдирд┐рд░реНрдорд╛рдг рдХрд░рддрд╛ рд╣реВрдВ, рддреЛ рд╕рдорд╕реНрдпрд╛ рдареАрдХ рд╣реЛрддреА рд╣реИред

`рдХрд╕реНрдЯрдордмрд┐рд▓реНрдб: рдЖрдВрддрд░рд┐рдХ рддреНрд░реБрдЯрд┐: рджрд╛рд╡рд╛ рд╡рд┐рдлрд▓: "рд╕реА:/рдбреАрд╡реАрдПрд╕/рдкреА4/рдмрд┐рд▓реНрдб/рдПрд╕рдбрдмреНрд▓реНрдпреВ/рд░рд┐рд▓/рдЬреАрдкреАрдпреВ_рдбреАрдЖрд░рд╡реА/рдЖрд░384/рдЖрд░384_00/рдбреНрд░рд╛рдЗрд╡рд░/рдХрдВрдкрд╛рдЗрд▓рд░/рдИрдбреАрдЬреА/рдИрдбреАрдЬреА_4.12/src/lookup.c", рд▓рд╛рдЗрди 2652 [ C:\TF\tensorflow\tensorflow\contrib\cmake\build\tf_core_gpu_kernels.vcxproj]

"C:/Users/ADMINI~1/AppData/Local/Temp/tmpxft_00000c94_00000000-8_adjust_contrast_op_gpu.cu.cpp4.ii" рдХреЗ рд╕рдВрдХрд▓рди рдореЗрдВ 1 рднрдпрд╛рд╡рд╣ рддреНрд░реБрдЯрд┐ рдкрд╛рдИ рдЧрдИред

рд╕рдВрдХрд▓рди рдирд┐рд░рд╕реНрдд рдХрд░ рджрд┐рдпрд╛ рдЧрдпрд╛ред

рдПрдбрдЬрд╕реНрдЯ_рдХреЙрдиреНрдЯреНрд░рд╛рд╕реНрдЯ_op_gpu.cu.cc

рдХрд╕реНрдЯрдо рдмрд┐рд▓реНрдб: nvcc рддреНрд░реБрдЯрд┐: 'cudafe++' рд╕реНрдерд┐рддрд┐ 0xC0000409 рдХреЗ рд╕рд╛рде рдореГрддреНрдпреБ рд╣реЛ рдЧрдИ [C:\TF\tensorflow\tensorflow\contrib\cmake\build\tf_core_gpu_kernels.vcxproj]

tf_core_gpu_kernels_generated_adjust_contrast_op_gpu.cu.cc.obj.Release рдкрд░ рд╕реАрдПрдордХреЗ рддреНрд░реБрдЯрд┐ред рд╕реЗрдореЗрдХ: 267 (рд╕рдВрджреЗрд╢):
рдлрд╝рд╛рдЗрд▓ рдЬрдирд░реЗрдЯ рдХрд░рдиреЗ рдореЗрдВ рддреНрд░реБрдЯрд┐
рд╕реА:/рдЯреАрдПрдл/рдЯреЗрдВрд╕рд░рдлреНрд▓реЛ/рдЯреЗрдВрд╕рд░рдлреНрд▓реЛ/рдХрдВрдЯреНрд░реАрдм/рд╕реЗрдореЗрдХ/рдмрд┐рд▓реНрдб/рд╕реАрдПрдордХреЗрдлрд╛рдЗрд▓реНрд╕/tf_core_gpu_kernels.dir/__/__/core/kernels/Release/tf_core_gpu_kernels_generated_adjust_contrast_op_gpu.cu.cc.obj`
image

рдЙрдкрд░реЛрдХреНрдд рд╕рдорд╕реНрдпрд╛ рдХреНрдпреВрдбрд╛ рдХреЙрдореНрдкреЛрд▓реА рдХреА рддрд░рд╣ рд╣реА рд╕рдорд╕реНрдпрд╛ рджрд┐рдЦрддреА рд╣реИ, рд▓реЗрдХрд┐рди рдЬрдм рдореИрдВ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рд╕рдВрд╕реНрдХрд░рдг рдХреЛ r1.3 рдкрд░ рд╕реНрд╡рд┐рдЪ рдХрд░рддрд╛ рд╣реВрдВ (рдПрдХ рдФрд░ рд╕рдорд╕реНрдпрд╛ рдареАрдХ рд╣реЛрддреА рд╣реИ)

`c:\tftest\tensorflow\tensorflow\contrib\cmake\build\external\eigen_archive\eigen\src/Core/util/Macros.h(416): рдШрд╛рддрдХ рддреНрд░реБрдЯрд┐ C1017:
цЧацХИчЪДцХ┤цХ░х╕╕щЗПшбиш╛╛х╝П [C:\TFtest\tensorflow\tensorflow\contrib\cmake\build\tf_core_gpu_kernels.vcxproj]

tf_core_gpu_kernels_generated_adjust_contrast_op_gpu.cu.cc.obj.Release рдкрд░ рд╕реАрдПрдордХреЗ рддреНрд░реБрдЯрд┐ред рд╕реЗрдореЗрдХ: 267 (рд╕рдВрджреЗрд╢):
рдлрд╝рд╛рдЗрд▓ рдЬрдирд░реЗрдЯ рдХрд░рдиреЗ рдореЗрдВ рддреНрд░реБрдЯрд┐
C:/TF/test/tensorflow/tensorflow/contrib/cmake/build/CMakeFiles/tf_core_gpu_kernels.dir/__/__/core/kernels/Release/tf_core_gpu_kernels_generated_adjust_contrast_op_gpu.cu.cc.obj`
image

рдРрд╕рд╛ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдлрд╝рд╛рдЗрд▓ рдПрдбрдЬрд╕реНрдЯ_рдХреЙрдиреНрдЯреНрд░рд╛рд╕реНрдЯ_рдУрдк_рдЬреАрдкреАрдпреВ.рдХреНрдпреВрдпреВ.рд╕реАрд╕реА рдореЗрдВ рдХреБрдЫ рд╕рдорд╕реНрдпрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдореБрдЭреЗ рдЗрд╕рдореЗрдВ рд╕реЗ рдХреЛрдИ рддреНрд░реБрдЯрд┐ рдирд╣реАрдВ рдорд┐рд▓ рд░рд╣реА рд╣реИред

рдЗрд╕ рддрд░рд╣ рдХреЗ рдЙрдкрд░реЛрдХреНрдд рдореБрджреНрджреЗ рдореБрдЭреЗ рдХреБрдЫ рджрд┐рдиреЛрдВ рдореЗрдВ рдкрд░реЗрд╢рд╛рди рдХрд░рддреЗ рд╣реИрдВ, рдХрд┐рд╕реА рдХреЛ рдЗрд╕ рдХреЛрд╢рд┐рд╢ рдФрд░ рд╕рдлрд▓рддрд╛ рдореЗрдВ рдЬрд╛рдиреЗ рдореЗрдВ рдореЗрд░реА рдорджрдж рдХрд░рдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВ, рдФрд░ рдордЬрдмреВрдд рдЙрдореНрдореАрдж рд╣реИ рдХрд┐ Google рдЕрдкрдЧреНрд░реЗрдб tensorflow рд╕рдорд░реНрдерди cuda 9.0 рдФрд░ cudnn 7 win10 рд╡рд╛рддрд╛рд╡рд░рдг рдореЗрдВред

рдХреНрдпрд╛ рдХрд┐рд╕реА рдиреЗ CUDA 9 рдФрд░ cuDNN 7.0 рдХреЗ рд╕рд╛рде TensorFlow рдХреЗ рд▓рд┐рдП рдПрдХ whl рдЬрд╛рд░реА рдХрд┐рдпрд╛ рд╣реИ?

@vellamike рдореБрдЭреЗ рдкрддрд╛ рд╣реИ рдХрд┐ рдЖрдкрдХрд╛ рдкреНрд░рд╢реНрди рд╕рд╛рдорд╛рдиреНрдп рд╣реИ, рд▓реЗрдХрд┐рди TF рдЯреАрдо рдХреЗ рдкрд╛рд╕ рдмрд╛рдпрдиреЗрд░рд┐рдЬрд╝ рдореЗрдВ CUDA 9 рд╣реЛрдЧрд╛ рдЬрд┐рд╕рдореЗрдВ 1.5 рд╣реИ рдЬреЛ Q4 рдореЗрдВ рдЙрддрд░рдирд╛ рдЪрд╛рд╣рд┐рдПред рдЕрднреА рдХреЗ рд▓рд┐рдП, рдЖрдкрдХреЛ рд╕реНрд░реЛрдд рд╕реЗ рдирд┐рд░реНрдорд╛рдг рдХрд░рдирд╛ рд╣реЛрдЧрд╛ред

рдореИрдВ рдореИрдХ 10.13 рдЙрдЪреНрдЪ рд╕рд┐рдПрд░рд╛ рдореЗрдВ CUDA 9 рдФрд░ cuDNN 7 рдХреЗ рд╕рд╛рде 1.4 рдмрдирд╛рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░ рд░рд╣рд╛ рд╣реВрдВред рдореБрдЭреЗ рдпрд╣ рддреНрд░реБрдЯрд┐ рдорд┐рд▓рддреА рд░рд╣рддреА рд╣реИ

ERROR: /Users/smitshilu/tensorflow/tensorflow/core/kernels/BUILD:2948:1: output 'tensorflow/core/kernels/_objs/depthwise_conv_op_gpu/tensorflow/core/kernels/depthwise_conv_op_gpu.cu.pic.o' was not created.
ERROR: /Users/smitshilu/tensorflow/tensorflow/core/kernels/BUILD:2948:1: not all outputs were created or valid.
Target //tensorflow/tools/pip_package:build_pip_package failed to build

рдЗрд╕рдХреЗ рд▓рд┐рдП рдХреЛрдИ рдЙрдкрд╛рдп?

@smitshilu рд╕рдВрднрд╡рддрдГ рд╕рдВрдмрдВрдзрд┐рдд https://github.com/tensorflow/tensorflow/issues/2143

рдХреНрдпреЛрдВ 1.4 рдореЗрдВ рдЕрднреА рднреА рдмрд╛рдпрдиреЗрд░рд┐рдЬрд╝ рдореЗрдВ CUDA 9 рдирд╣реАрдВ рд╣реИ? рдпрд╣ рд╕рдВрд╕реНрдХрд░рдг рдмрд╣реБрдд рдкрд╣рд▓реЗ рдЬрд╛рд░реА рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ рдФрд░ рд╕реНрд░реЛрдд рд╕реЗ V100 рдмрд┐рд▓реНрдбрд┐рдВрдЧ рдХреЗ рд╕рд╛рде рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЖрд╡рд╢реНрдпрдХ рд╣реИ рдЬреЛ рдХрд┐ рд░рд┐рдкреЛрд░реНрдЯ рдХрд┐рдП рдЧрдП рдХрдИ рдореБрджреНрджреЛрдВ рдХреЗ рдмрд╛рдж рдЗрддрдирд╛ рдЖрд╕рд╛рди рдФрд░ рддреЗрдЬрд╝ рдирд╣реАрдВ рд╣реИред

@ViktorM рдЖрдкрдиреЗ рд╕реНрд░реЛрдд рд╕реЗ рд╕рдВрдХрд▓рди рдХрд░рдиреЗ рдореЗрдВ рдХреНрдпрд╛ рд╕рдорд╕реНрдпрд╛рдПрдБ рдХреАрдВ? рдпрд╣ рдереЛрдбрд╝рд╛ рдореБрд╢реНрдХрд┐рд▓ рдерд╛ рд▓реЗрдХрд┐рди рдЗрддрдирд╛ рдХрдард┐рди рдирд╣реАрдВ рдерд╛ред

26-SEP-2017 CUDA 9 рдХреЗ рд▓рд┐рдП GA рдерд╛ред рдЕрдЧрд░ рд╣рдо Q4 рдореЗрдВ CUDA 9 + cuDNN 7 рдмрд╛рдпрдиреЗрд░рд┐рдЬрд╝ рдЬрд╛рд░реА рдХрд░рддреЗ рд╣реИрдВ, рддреЛ рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рд╕рдмрд╕реЗ рддреЗрдЬрд╝ рд╣реЛрдЧрд╛ рдЬрд┐рд╕реЗ рд╣рдордиреЗ cuDNN рдХреЛ рдЕрдкрдЧреНрд░реЗрдб рдХрд┐рдпрд╛ рд╣реИред рдореИрдВ рдпрд╣рд╛рдВ 8.5 рд╕реЗ 9 рдмрдЬреЗ рддрдХ рдирд╣реАрдВ рдерд╛ рдЗрд╕рд▓рд┐рдП рдореБрдЭреЗ рдХреЛрдИ рдЬрд╛рдирдХрд╛рд░реА рдирд╣реАрдВ рд╣реИред рдореИрдВ рдЪрд╛рд╣рддрд╛ рд╣реВрдВ рдХрд┐ рд╣рдо рдереЛрдбрд╝реА рддреЗрдЬреА рд╕реЗ рдЖрдЧреЗ рдмрдврд╝реЗрдВ рд▓реЗрдХрд┐рди рдЗрд╕рдХрд╛ рдорддрд▓рдм рдпрд╣ рднреА рд╣реИ рдХрд┐ CUDA 8 рд╕реЗрдЯрдЕрдк рд╡рд╛рд▓реЗ рдХрд┐рд╕реА рднреА рд╡реНрдпрдХреНрддрд┐ рдХреЛ рди рдХреЗрд╡рд▓ CUDA 9 рдореЗрдВ рдЕрдкрдЧреНрд░реЗрдб рдХрд░рдирд╛ рд╣реЛрдЧрд╛, рдмрд▓реНрдХрд┐ рдЙрдиреНрд╣реЗрдВ рдЕрдкрдиреЗ рдбрд┐рд╡рд╛рдЗрд╕ рдбреНрд░рд╛рдЗрд╡рд░ рдХреЛ 384.x рдореЗрдВ рдЕрдкрдЧреНрд░реЗрдб рдХрд░рдирд╛ рд╣реЛрдЧрд╛, рдЬреЛ рдореИрдВ рдХрд╣ рд╕рдХрддрд╛ рд╣реВрдВ рдХрд┐ рдХреБрдЫ рдЙрддреНрдкрд╛рджрди рд▓реЛрдЧ рдирд╣реАрдВ рд╣реИрдВ рд╣рд▓реНрдХреЗ рд╕реЗ рд▓реЗрдВред

рдЖрджрд░реНрд╢ рд░реВрдк рд╕реЗ рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдЕрдирдВрдд (рдпрд╛ рдмрд╕ рдХреБрдЫ рдФрд░ рд▓реЗрдХрд┐рди рдореИрдЯреНрд░рд┐рдХреНрд╕ рддреЗрдЬреА рд╕реЗ рд╡рд┐рд╕реНрдлреЛрдЯ рд╣реЛрддрд╛ рд╣реИ) рдмрдирд╛рддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдпрд╣ рдПрдХ рдФрд░ рд╕рдорд╕реНрдпрд╛ рд╣реИ рдЬрд┐рд╕реЗ рд╕рдордЭрд╛рдиреЗ рдореЗрдВ рдХрд╛рдлреА рд╕рдордп рд▓рдЧреЗрдЧрд╛ рдФрд░ рдореБрдЭреЗ рд╕рдВрджреЗрд╣ рд╣реИ рдХрд┐ рдмрд╣реБрдд рд╕реЗ рд▓реЛрдЧ рдкрд░рд╡рд╛рд╣ рдХрд░рддреЗ рд╣реИрдВред

Btw, рдореИрдВ рдордирд╛рдпрд╛ рдПрдирд╡реАрдбрд┐рдпрд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ float16 matmul / V100 рдкрд░ 85 рдЯреА рдСрдкреНрд╕ / CUDA 9 рдХреЗ рд╕рд╛рде рджреВрд╕рд░реЗ рдПрдирдЬреАрд╕реА TensorFlow рдХрдВрдЯреЗрдирд░ (рдХреЗ рд░реВрдк рдореЗрдВ 8.8 рдЯреА рдСрдкреНрд╕ рдХрд░рдиреЗ рдХрд╛ рд╡рд┐рд░реЛрдз рдХрд┐рдпрд╛ / рдореЗрд░реА GTX 1080 рдШрд░ рдкрд░ рдкрд░ рд╣реИ)ред рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдЖрдзрд┐рдХрд╛рд░рд┐рдХ рддреМрд░ рдкрд░ рд╕рдорд░реНрдерд┐рдд рд╕рдВрд╕реНрдХрд░рдг рдореЗрдВ рдЗрди рд╕реБрдзрд╛рд░реЛрдВ рдХреЗ рд╣реЛрдиреЗ рдХреА рдЙрдореНрдореАрдж рд╣реИ!

@yaroslavvb рдмрд╣реБрдд рдИрдорд╛рдирджрд╛рд░ рд╣реЛрдиреЗ рдХреЗ рдирд╛рддреЗ рд╣рдо рдХреБрдЫ FP16 рдореБрджреНрджреЛрдВ рдкрд░ рдХрд╛рдо рдХрд░ рд░рд╣реЗ рд╣реИрдВред FP16 рдХреЗ рд▓рд┐рдП tf_cnn_benchmarks рдореЗрдВ рдПрдХ рдкрд╛рде рд╣реИ рдФрд░ рдлреЛрдХрд╕ рдкрд╣рд▓реЗ ResNet50 рдкрд░ рд╣реИ рдФрд░ рд╣рдо FP16 рдХреЗ рд▓рд┐рдП рдСрдЯреЛ рд╕реНрдХреЗрд▓рд┐рдВрдЧ рдкрд░ рднреА рдХрд╛рдо рдХрд░ рд░рд╣реЗ рд╣реИрдВред рдпрджрд┐ рдЖрдк рд░реБрдЪрд┐ рд░рдЦрддреЗ рд╣реИрдВ рддреЛ рдЖрдк рдЗрд╕реЗ рдЖрдЬрдорд╛ рд╕рдХрддреЗ рд╣реИрдВ рд▓реЗрдХрд┐рди рд╣рдо рдХреБрдЫ рд╕рдорд╕реНрдпрд╛рдУрдВ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рд╕рдХреНрд░рд┐рдп рд░реВрдк рд╕реЗ рдХрд╛рдо рдХрд░ рд░рд╣реЗ рд╣реИрдВред рд▓реЛрдЧ рдЗрд╕ рдкрд░ рд╣реИрдВ рдФрд░ рдЗрд╕рдореЗрдВ рдЕрднреА рд╕рдордп рд▓рдЧ рд░рд╣рд╛ рд╣реИред рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдЕрдВрддрдд: DGX-1s рдШрд░ рдореЗрдВ рд╣реИ, рдЗрд╕рд▓рд┐рдП рд╣рдо рдЙрдиреНрд╣реАрдВ рдХрдВрдЯреЗрдирд░реЛрдВ рдХреЗ рд╕рд╛рде рднреА рдЦреЗрд▓ рд╕рдХрддреЗ рд╣реИрдВ рдФрд░ рдЖрдЧреЗ рдмрдврд╝рддреЗ рд╣реБрдП рдЙрд╕ рд╕рдЯреАрдХ рдкреНрд▓реЗрдЯрдлреЙрд░реНрдо рдкрд░ рдкреНрд░рджрд░реНрд╢рди рдХрд╛ рдЯреНрд░реИрдХ рд░рдЦрдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред

рдареАрдХ рд╣реИ, рддреЛ рдореИрдВ рдЙрдмрдВрдЯреВ 17.10 рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдЬрд╛ рд░рд╣рд╛ рд╣реВрдВ рдФрд░ рдореИрдВ рд╕рд┐рд░реНрдл рдордиреЛрд░рдВрдЬрди рдХреЗ рд▓рд┐рдП рд╕рднреА рдирд╡реАрдирддрдо рдЪреАрдЬреЛрдВ рдХреЛ рдЖрдЬрдорд╛рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реВрдВред
рдЗрд╕рд╕реЗ рдкрд╣рд▓реЗ рдХрд┐ рдореИрдВ рд╕рд┐рд░реНрдл рдпрд╣ рдЬрд╛рдирдирд╛ рдЪрд╛рд╣рддрд╛ рдерд╛ рдХрд┐ рдХреНрдпрд╛ рдХрд┐рд╕реА рдиреЗ рд╕реНрд░реЛрдд рд╕реЗ рдиреАрдЪреЗ рдХреЗ рдвреЗрд░ рдХреЗ рдирд┐рд░реНрдорд╛рдг рдХреА рдХреЛрд╢рд┐рд╢ рдХреА рдФрд░ рдХреЛрдИ рднрд╛рдЧреНрдп рдорд┐рд▓рд╛?

-> рдЙрдмрдВрдЯреВ 17.10, CUDA 9.0, cuDNN 7.0, TF рдорд╛рд╕реНрдЯрд░
-> рдЙрдмрдВрдЯреВ 17.10, рд╕реАрдпреВрдбреАрдП 8.0, рд╕реАрдПрдирдбреАрдПрдирдПрди 6.1, рдЯреАрдПрдл 1.4

рдореБрдЭреЗ @ xsr-ai рдЬреИрд╕реА рд╣реА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝ рд░рд╣рд╛ рд╣реИ, рд╡рд┐рд╢реЗрд╖ рд░реВрдк рд╕реЗ Python 3.6.3, VS 2017, CUDA 9, cuDNN 7 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗред

@ aluo-x рдЖрдкрдХрд╛ рдорддрд▓рдм рд╣реИ рдХрд┐ рдЖрдкрдиреЗ рд╡рд┐рдВрдбреЛрдЬ 10 рдкрд░ рдХреЛрд╢рд┐рд╢ рдХреА рд╣реИ? рдорд╛рди рд▓реАрдЬрд┐рдП рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдиреЗ рд╡реАрдПрд╕ 2017 рдХрд╣рд╛ рдерд╛ред

рд╣рд╛рдВ рдпрд╣ рд╕рд╣реА рд╣реИред рдпрд╣рд╛рдБ рд╡рд┐рд╢рд┐рд╖реНрдЯ рддреНрд░реБрдЯрд┐ рд╣реИ:

CustomBuild:
  Building NVCC (Device) object CMakeFiles/tf_core_gpu_kernels.dir/__/__/core/kernels/Release/tf_core_gpu_kernels_generated_adjust_contrast_op_gpu.cu.cc.obj
  CMake Error at tf_core_gpu_kernels_generated_adjust_contrast_op_gpu.cu.cc.obj.Release.cmake:222 (message):
    Error generating
    C:/optimae/tensorflow-1.4.0/tensorflow/contrib/cmake/build/CMakeFiles/tf_core_gpu_kernels.dir/__/__/core/kernels/Release/tf_core_gpu_kernels_generated_adjust_contrast_op_gpu.cu.cc.obj


C:\Program Files (x86)\Microsoft Visual Studio\2017\BuildTools\Common7\IDE\VC\VCTargets\Microsoft.CppCommon.targets(171,5): error MSB6006: "cmd.exe" exited with code 1. [C:\optimae\tensorflow-1.4.0\
tensorflow\contrib\cmake\build\tf_core_gpu_kernels.vcxproj]

@ aluo-x рдХреНрдпрд╛ рдЖрдкрдиреЗ рдирд╡реАрдирддрдо рд╕реА-рдореЗрдХ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рд╣реИ? рдпрд╛рдиреА рд░рд┐рд▓реАрдЬ рдЙрдореНрдореАрджрд╡рд╛рд░ рдпрд╛ рд╕реНрдерд┐рд░ рд░рд┐рд▓реАрдЬ?

cmake 3.9.5, swig 3.0.12, CUDA 9.0.176, cuDNN 7.0.3 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ред рд╡реАрдПрд╕ 2017 19.11.25547ред

@ рдЕрд▓реБрдУ-рдПрдХреНрд╕ рдпрд╣рд╛рдВ рддрдХ тАЛтАЛтАЛтАЛрдХрд┐ рдореБрдЭреЗ рд╕реА-рдореЗрдХ рдХреЗ рд╕рд╛рде рдмрд╣реБрдд рднрд╛рдЧреНрдп рдирд╣реАрдВ рдорд┐рд▓рд╛ред рд▓реЗрдХрд┐рди рдХреНрдпрд╛ рдЖрдк Bazel рдХреЗ рд╕рд╛рде рдирд┐рд░реНрдорд╛рдг рдХрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ?

@smitshilu рдЕрдЧрд░ рдореБрдЭрд╕реЗ рдЧрд▓рддреА рдирд╣реАрдВ рд╣реБрдИ рд╣реИ, рддреЛ рдЖрдкрдХреЛ рд╕рдВрд░реЗрдЦрдг рдХреЗ рд╕рдВрдмрдВрдз рдореЗрдВ рдПрдХ рддреНрд░реБрдЯрд┐ рдорд┐рд▓ рд░рд╣реА рд╣реИ, рд╣реИ рдирд╛? рдкрд╛рдЗрдЯреЛрд░рдЪ рдХреЗ рд▓рд┐рдП рдпрд╣рд╛рдБ рд╡рд░реНрдгрд┐рдд рдХреЗ рд╕рдорд╛рди: https://github.com/pytorch/pytorch/issues/2692

рдореИрдВрдиреЗ рдЙрд╕реА рд╕рдорд╛рдзрд╛рди рдХреЛ рд▓рд╛рдЧреВ рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд┐рдпрд╛, рдЬреЛ рд╕рдорд╕реНрдпрд╛рдЧреНрд░рд╕реНрдд рдлрд╝рд╛рдЗрд▓реЛрдВ рд╕реЗ рд╕рднреА ___align__(sizeof(T))_ рдХреЛ рд╣рдЯрд╛ рд░рд╣рд╛ рд╣реИ:
_tensorflow/рдХреЛрд░/рдХрд░реНрдиреЗрд▓/concat_lib_gpu_impl.cu.cc_
_tensorflow/рдХреЛрд░/рдХрд░реНрдиреЗрд▓/рдЧрд╣рд░рд╛рдИ рдХреЗ рдЕрдиреБрд╕рд╛рд░_conv_op_gpu.cu.cc_
_tensorflow/рдХреЛрд░/рдХрд░реНрдиреЗрд▓/split_lib_gpu.cu.cc_

рдореБрдЭреЗ рдпрдХреАрди рдирд╣реАрдВ рд╣реИ рдХрд┐ рдпрд╣ рдХрд┐рд╕реА рднреА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рдХрд╛рд░рдг рдмрдирддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдРрд╕рд╛ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдЕрдм рддрдХ рдареАрдХ рдХрд╛рдо рдХрд░ рд░рд╣рд╛ рд╣реИред рдФрд░ рдЬреЛ рдореИрдВ рд╕рдордЭрддрд╛ рд╣реВрдВ, рд░рдирдЯрд╛рдЗрдо рд╣рдореЗрд╢рд╛ рд╕рд╛рдЭрд╛ рд╕реНрдореГрддрд┐ рдХреЗ рд▓рд┐рдП 16 рдХреЗ рдирд┐рд╢реНрдЪрд┐рдд рд╕рдВрд░реЗрдЦрдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░реЗрдЧрд╛ред

рд░реБрдЪрд┐ рд░рдЦрдиреЗ рд╡рд╛рд▓реЗ рд▓реЛрдЧреЛрдВ рдХреЗ рд▓рд┐рдП рд╣рдорд╛рд░реЗ рдкрд╛рд╕ CUDA 9 рдкрд╣рд┐рдП рдЕрдкрд▓реЛрдб рд╣реИрдВред рдЦреБрдж рдХреЛ рдмрдирд╛рдиреЗ рдХреА рдЬрд░реВрд░рдд рдирд╣реАрдВ рд╣реИ! https://github.com/mind/wheels/releases/tag/tf1.4-gpu-cuda9

Ubuntu 17.10, CUDA 9, CuDNN 7, Python 3.6, bazel 0.7.0 + TF рд╕реНрд░реЛрдд (рдорд╛рд╕реНрдЯрд░) рд╕реЗред

CUDA рдХреЛ рдКрдкрд░ рдФрд░ рдЪрд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдЗрд╕ рдЙрддреНрддрд░ рдореЗрдВ рджрд┐рдП рдЧрдП рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рдкрд╛рд▓рди рдХрд░реЗрдВ:
https://askubuntu.com/questions/967332/how-can-i-install-cuda-9-on-ubuntu-17-10

рдзреНрдпрд╛рди рджреЗрдВ, рдЖрдк 64 рдмрд┐рдЯ рд╕рдВрд╕реНрдХрд░рдг рдХреЗ рдмрдЬрд╛рдп рдЗрди рдЖрджреЗрд╢реЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ рдЪрд╛рд╣ рд╕рдХрддреЗ рд╣реИрдВ:

sudo ln -s /usr/bin/gcc-6 /usr/local/cuda-9.0/bin/gcc 
sudo ln -s /usr/bin/g++-6 /usr/local/cuda-9.0/bin/g++ 
sudo ./cuda_9.0.176_384.81_linux-run --override

Tensorflow рдХреЛ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЖрдкрдХреЛ рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрдЧреА

  1. рдЯреАрдПрдл рд╕рдВрдХрд▓рд┐рдд рдХрд░рдиреЗ рд╕реЗ рдкрд╣рд▓реЗ: рдкрде рдЪрд░ рдХреЛ рд╕рд╣реА рдврдВрдЧ рд╕реЗ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд░реЗрдВ (рдПрдирд╡реАрдЖрдИрдбреАрдЖрдИрдП рдкреЗрдЬ рд╕реЗ рдкрде рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рдирд╣реАрдВ рдХрд░рддреЗ рд╣реИрдВ):
export PATH=/usr/local/cuda-9.0/bin:${PATH}
export LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:/usr/local/cuda-9.0/lib64
  1. рд╕рдВрдХрд▓рди рдХрд░рдиреЗ рд╕реЗ рдкрд╣рд▓реЗ: CUDA рд╕реНрдерд╛рдкрдирд╛ рдХреЗ рджреМрд░рд╛рди рдЙрд╕реА gcc рд╕рдВрд╕реНрдХрд░рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП bazel рдХреЛ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд░реЗрдВ:
sudo update-alternatives --remove-all g++
sudo update-alternatives --remove-all gcc
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-6 10
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-6 10
  1. рдПрдХ рдмрд╛рд░ рдЬрдм рдЖрдк bazel рдмрд┐рд▓реНрдб рд╕реНрдЯреЗрдк рдиреЛрдЯ рдкрд░ рдкрд╣реБрдВрдЪ рдЬрд╛рддреЗ рд╣реИрдВ, рддреЛ TF рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рдкрд╛рд▓рди рдХрд░рддреЗ рд╣реБрдП, рдХрд┐ рдЖрдкрдХреЛ 4.* рд╕реЗ рдЕрдзрд┐рдХ gcc рд╕рдВрд╕реНрдХрд░рдг рдХреЗ рд╕рд╛рде рд╕рдВрдХрд▓рди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдЕрддрд┐рд░рд┐рдХреНрдд рдзреНрд╡рдЬ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрдЧреА:
    bazel build --config=opt --config=cuda --cxxopt="-D_GLIBCXX_USE_CXX11_ABI=0" //tensorflow/tools/pip_package:build_pip_package

@alexbrad рдореИрдВ CUDA 9, cuDNN 7 рдХреЗ рд╕рд╛рде рдореИрдХ GPU рдХреЗ рд▓рд┐рдП рдПрдХ рд╣реА рдореБрджреНрджреЗ рдХреЗ рдирд┐рд░реНрдорд╛рдг рдореЗрдВ рднрд╛рдЧ рдЧрдпрд╛ред рдпрд╣ рд╕рдорд╛рдзрд╛рди рдореЗрд░реЗ рд▓рд┐рдП рднреА рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ рдФрд░ рдореИрдВрдиреЗ рдЕрдм рддрдХ TF рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдХрд┐рд╕реА рднреА рд╕рдорд╕реНрдпрд╛ рдореЗрдВ рднрд╛рдЧ рдирд╣реАрдВ рд▓рд┐рдпрд╛ рд╣реИред
рд╕реНрд░реЛрдд рдкрд░рд┐рд╡рд░реНрддрди рдФрд░ рдкрд╣рд┐рдпрд╛: https://github.com/nathanielatom/tensorflow/releases/tag/v1.4.0-mac

Ubuntu 16.04, TensorFlow 1.4 CUDA 9.0 рдФрд░ cuDNN 7.0.3 рдХреЗ рд╕рд╛рде рдкрд╣рд▓реЗ рд╕реЗ рд╣реА рд╕реНрдерд╛рдкрд┐рдд рдФрд░ рдкрд░реАрдХреНрд╖рдг рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ:

рд╕реНрд░реЛрдд рд╕реЗ Tensorflow 1.4 рд╕реНрдерд╛рдкрд┐рдд рдХрд░реЗрдВ

cd ~/Downloads
git clone https://github.com/tensorflow/tensorflow
cd tensorflow
git checkout r1.4
  • CUDA рд╕рдВрд╕реНрдХрд░рдг рдХреЗ рд▓рд┐рдП рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд░реЗрдВ: 9.0
  • cuDNN рд╕рдВрд╕реНрдХрд░рдг рдХреЗ рд▓рд┐рдП рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд░реЗрдВ: 7.0.3
  • https://developer.nvidia.com/cuda-gpus . рд╕реЗ рдЕрдкрдиреА рдЧрдгрдирд╛ рдХреНрд╖рдорддрд╛ рдкреНрд░рд╛рдкреНрдд
  • рдореИрдВрдиреЗ рдЗрд╕реЗ 6.1 рдкрд░ рд╕реЗрдЯ рдХрд┐рдпрд╛ рд╣реИ рдХреНрдпреЛрдВрдХрд┐ рдореЗрд░реЗ рдкрд╛рд╕ GeForce GTX 1070 . рд╣реИ
  • рдЕрдиреНрдп рд╡рд┐рдХрд▓реНрдкреЛрдВ рдХреЛ рдЙрдкрдпреБрдХреНрдд рдХреЗ рд░реВрдк рдореЗрдВ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд░реЗрдВ

./configure

рдмреЗрдЬрд╝реЗрд▓ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдирд╛

sudo add-apt-repository ppa:webupd8team/java
sudo apt-get update && sudo apt-get install oracle-java8-installer
echo "deb [arch=amd64] http://storage.googleapis.com/bazel-apt stable jdk1.8" | sudo tee /etc/apt/sources.list.d/bazel.list
curl https://bazel.build/bazel-release.pub.gpg | sudo apt-key add -
sudo apt-get update && sudo apt-get install bazel
sudo /sbin/ldconfig -v

рдмрд┐рд▓реНрдбрд┐рдВрдЧ рдЯреЗрдВрд╕рд░рдлреНрд▓реЛ

bazel build --config=opt --config=cuda //tensorflow/tools/pip_package:build_pip_package --cxxopt="-D_GLIBCXX_USE_CXX11_ABI=0
bazel-bin/tensorflow/tools/pip_package/build_pip_package /tmp/tensorflow_pkg
pip install /tmp/tensorflow_pkg/tensorflow-1.4.0-cp36-cp36m-linux_x86_64.whl

рдКрдкрд░ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рд╡реНрд╣реАрд▓ рдлрд╝рд╛рдЗрд▓ рдХрд╛ рдирд╛рдо рднрд┐рдиреНрди рд╣реЛ рд╕рдХрддрд╛ рд╣реИ
рдЬрд╛рдБрдЪ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдмрд╕ ls /tmp/tensorflow_pkg

Mac 10.13, CUDA 9 рдФрд░ tensorflow 1.4 https://gist.github.com/smitshilu/53cf9ff0fd6cdb64cca69a7e2827ed0f рдХреЗ рд▓рд┐рдП рдЗрдВрд╕реНрдЯреЙрд▓реЗрд╢рди рдЪрд░рдг

рдХреНрдпрд╛ рдХреЛрдИ рдореБрдЭреЗ рдмрддрд╛ рд╕рдХрддрд╛ рд╣реИ, рдореИрдВ рдмреЗрдЬрд╝рд▓ рдХреЗ рд╕рд╛рде рд▓рд┐рдирдХреНрд╕ (рдЙрдмрдВрдЯреВ 16.04) рдореЗрдВ рд╡рд┐рдВрдбреЛрдЬрд╝ рдХреЗ рд▓рд┐рдП рд╕реНрд░реЛрддреЛрдВ рд╕реЗ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ whl рдкреИрдХреЗрдЬ рдХреИрд╕реЗ рдмрдирд╛ рд╕рдХрддрд╛ рд╣реВрдБ? рд╕рдВрд╕реНрдХрд░рдг 1.2 рдХреЗ рд▓рд┐рдП рдпрд╣ рд╕рдВрднрд╡ рдерд╛ рдпрджрд┐ рдореИрдВ рд╕рд╣реА рд╣реВрдВред рдзрдиреНрдпрд╡рд╛рджред

@ValeryPiashchynski рдЖрдк рдЗрди рдЪрд░рдгреЛрдВ рдХрд╛ рдкрд╛рд▓рди рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ https://www.tensorflow.org/install/install_sources

@smitshilu рдЖрдкрдХреЗ рдЙрддреНрддрд░ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рджред рдореИрдВ рдЗрд╕ рдЪрд░рдгреЛрдВ рдХрд╛ рдкрд╛рд▓рди рдХрд░рддреЗ рд╣реБрдП рдЙрдмрдВрдЯреВ рдореЗрдВ рд╡реНрд╣реАрд▓ рдкреИрдХреЗрдЬ рдмрдирд╛ рд╕рдХрддрд╛ рд╣реВрдВ рдФрд░ рдЙрдмрдВрдЯреВ рдореЗрдВ рд╕рднреА рдЕрдЪреНрдЫреЗ рдХрд╛рдо рдХрд░рддреЗ рд╣реИрдВред рд▓реЗрдХрд┐рди рдореИрдВ рд╡рд┐рдВрдбреЛрдЬ рдУрдПрд╕ рдореЗрдВ рдЙрд╕ рдбрдмреНрд▓реНрдпреВрдПрдЪрдПрд▓ рдкреИрдХреЗрдЬ рдХреЛ рд╕реНрдерд╛рдкрд┐рдд рдирд╣реАрдВ рдХрд░ рд╕рдХрддрд╛ (рдПрдХ рддреНрд░реБрдЯрд┐ рд╣реИ: рд╕рдкреЛрд░реНрдЯреЗрдЯ рд╡реНрд╣реАрд▓ рдирд╣реАрдВ рд╣реИ)ред рддреЛ рдореЗрд░рд╛ рд╕рд╡рд╛рд▓ рдпрд╣ рд╣реИ рдХрд┐ рдореИрдВ рдЙрдмрдВрдЯреВ рдореЗрдВ рдкреИрдХреЗрдЬ рдХреИрд╕реЗ рдмрдирд╛ рд╕рдХрддрд╛ рд╣реВрдВ рдЬрд┐рд╕реЗ рдореИрдВ рд╡рд┐рдВрдбреЛрдЬрд╝ рдореЗрдВ рд╕реНрдерд╛рдкрд┐рдд рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ?

~ @ValeryPiashchynski рдореБрдЭреЗ рдирд╣реАрдВ рд▓рдЧрддрд╛ рдХрд┐ рдпрд╣ рд╕рдВрднрд╡ рд╣реИред~

(рдЗрд╕реЗ рдиреАрдЪреЗ рдЯрд┐рдкреНрдкрдгреА рдХреЗ рд░реВрдк рдореЗрдВ рд▓реЗрдирд╛ рдЕрдиреНрдпрдерд╛ рд╕реБрдЭрд╛рд╡ рджреЗрддрд╛ рд╣реИ)

рд╡рд┐рдВрдбреЛрдЬ рдХреЗ рд▓рд┐рдП рдЙрдмрдВрдЯреВ рдкрд░ рдХреНрд░реЙрд╕-рдмрд┐рд▓реНрдбрд┐рдВрдЧ рдПрдХ рджрд┐рди рдХреНрд▓реИрдВрдЧ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рд╕рдВрднрд╡ рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдПред рдЗрд╕рдХреЗ рд▓рд┐рдП рд╢рд╛рдпрдж рдмрд╣реБрдд рд╕рд╛рд░реЗ рд╕реБрдзрд╛рд░реЛрдВ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрдЧреА, рдХреНрдпреЛрдВрдХрд┐ рд╡рд┐рдВрдбреЛрдЬрд╝ рдмрд╛рдпрдиреЗрд░рд┐рдЬрд╝ рд╡рд░реНрддрдорд╛рди рдореЗрдВ MSVC рдХреЗ рд╕рд╛рде рдирд┐рд░реНрдорд┐рдд рд╣реИрдВред рдореИрдВрдиреЗ рдкрд┐рдЫрд▓реЗ рд╕реЛрдорд╡рд╛рд░ рдХреЛ @gunan рд╕реЗ рд╡реНрдпрдХреНрддрд┐рдЧрдд рд░реВрдк рд╕реЗ рдмрд╛рдд рдХрд░рддреЗ рд╕рдордп рдореВрд▓ рд░реВрдк рд╕реЗ рд╡рд╣реА рдкреНрд░рд╢реНрди рдкреВрдЫрд╛ рдерд╛ред рдХреНрдпрд╛ рдЗрд╕реЗ рд╕реНрд╡рдпрдВ рдХреЗ рдЬреАрдПрдЪ рдореБрджреНрджреЗ рдореЗрдВ рд╢рд╛рдорд┐рд▓ рдХрд┐рдпрд╛ рдЬрд╛рдирд╛ рдЪрд╛рд╣рд┐рдП, рдХреНрдпреЛрдВрдХрд┐ рдЗрд╕рдХрд╛ рд╕реАрдпреВрдбреАрдП рд╕реЗ рд╕реАрдзреЗ рдХреЛрдИ рд▓реЗрдирд╛-рджреЗрдирд╛ рдирд╣реАрдВ рд╣реИ?

рдмреЗрдЬрд╝рд▓ рдХреЗ рд╕рд╛рде рдХреНрд░реЙрд╕ рдХрдВрдкрд╛рдЗрд▓ рд╕рдВрднрд╡ рд╣реИ рд▓реЗрдХрд┐рди рдпрд╣ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдирд╣реАрдВ рд╣реИ рдХрд┐ рдЗрд╕реЗ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдкрд░ рдХреИрд╕реЗ рдХрд┐рдпрд╛ рдЬрд╛рдПред рд╕рдиреНрджрд░реНрдн рдХреЗ рд▓рд┐рдП
https://github.com/bazelbuild/bazel/wiki/Building-with-a-custom-toolchain
https://github.com/bazelbuild/bazel/issues/1353

рдХреНрдпрд╛ рдХрд┐рд╕реА рдХреЛ рдкрддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ 1.5 рд░рд╛рдд рдХреЗ рдмрд┐рд▓реНрдб рдпрд╣рд╛рдВ рдкреЛрд╕реНрдЯ рдХрд┐рдП рдЧрдП рд╣реИрдВ (win10 рдмрд┐рд▓реНрдб) рдореЗрдВ CUDA9 + CuDNN7 рд╕рдкреЛрд░реНрдЯ рд╣реИ?
https://pypi.python.org/pypi/tf-nightly-gpu/1.5.0.dev20171115

рдПрдХ рддрд░рдл рдзреНрдпрд╛рди рджреЗрдВ, рдЗрд╕ рдЯрд┐рдХрдЯ рдХреЗ рд╕рд╛рде-рд╕рд╛рде #14126 рдХреЛ рдмрдВрдж рдХрд░рдирд╛ рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдЧреИрд░-рдЬрд┐рдореНрдореЗрджрд╛рд░рд╛рдирд╛ рд╣реИ рдХреНрдпреЛрдВрдХрд┐ рдЖрдк рдХрд╣рддреЗ рд╣реИрдВ "рдпрд╣ рдЯреАрдПрдл 1.5 рдХреЗ рд╕рд╛рде рдЬрд╛рд░реА рд╣реЛрдиреЗ рдЬрд╛ рд░рд╣рд╛ рд╣реИ"ред MXNET 0.12 рдореЗрдВ рдкрд╣рд▓реЗ рд╕реЗ рд╣реА CUDA9 FP16 рдЙрддреНрдкрд╛рджрди рдореЗрдВ рд╣реИред Tensorflow рдФрд░ CNTK рдХреЛ рдЬрд▓реНрджреА рдХрд░рдиреЗ рдХреА рдЬрд░реВрд░рдд рд╣реИред рдпрд╣ рд╕рд┐рд░реНрдл рд╡реЛрд▓реНрдЯрд╛ рдХреЗ рд▓рд┐рдП рдлрд╛рдпрджреЗрдордВрдж рдирд╣реАрдВ рд╣реИред

рдЕрднреА рдирд╣реАрдВ, рд╣рдо CUDA 9 рдХреЗ рд▓рд┐рдП рдЕрдкрдиреЗ рдмрд┐рд▓реНрдб рдЗрдиреНрдлреНрд░рд╛ рдХреЛ рдЕрдкрдЧреНрд░реЗрдб рдХрд░рдиреЗ рдкрд░ рдХрд╛рдо рдХрд░ рд░рд╣реЗ рд╣реИрдВред
рд╣рдо рдЗрд╕ рд╕рдкреНрддрд╛рд╣ рдХреЗ рдЕрдВрдд рд╕реЗ рдкрд╣рд▓реЗ CUDA 9 рдХреЗ рд╕рд╛рде рдкрд╛рдЗрдк рдкреИрдХреЗрдЬ рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдХрд╛ рд▓рдХреНрд╖реНрдп рдмрдирд╛ рд░рд╣реЗ рд╣реИрдВред

рдореЗрд░реЗ рдкрд╛рд╕ рджреЛ рдХрдВрдкреНрдпреВрдЯрд░ рд╣реИрдВ, рдФрд░ рдХрд▓ рдореИрдВрдиреЗ 1080ti рд╕реНрдерд╛рдкрд┐рдд рдХрд┐рдпрд╛ рдФрд░ рд╕рдм рдХреБрдЫ рд╕реНрдерд╛рдкрд┐рдд рдХрд┐рдпрд╛ (cuda8 рдФрд░ cudnn6) рдирдпрд╛ рдЧреНрд░рд╛рдлрд┐рдХ рдбреНрд░рд╛рдЗрд╡рд░, рд╡рд┐рдЬреБрдЕрд▓ рд╕реНрдЯреВрдбрд┐рдпреЛ 2015
рдореИрдВ рдпреБрдЧ рдХреЗ рд╕рдордп рдХреА рддреБрд▓рдирд╛ 1080ti рдмрдирд╛рдо 980ti . рдХрд░рддрд╛ рд╣реВрдВ
рдФрд░ рдореИрдВ рджреЗрдЦрддрд╛ рд╣реВрдВ рдХрд┐ 1080ti рдкреНрд░рддреНрдпреЗрдХ рдпреБрдЧ рдХреЛ 22 рдорд┐рдирдЯ рдореЗрдВ рдЪрд▓рд╛рддрд╛ рд╣реИ рд▓реЗрдХрд┐рди 980ti 13 рдорд┐рдирдЯ рдореЗрдВ рдЪрд▓рддрд╛ рд╣реИ !!!(рдмреИрдЪ = 60 рдХреЗ рд▓рд┐рдП 1080 рдмрдирд╛рдо рдмреИрдЪ = 20 рдХреЗ рд▓рд┐рдП 980ti)
рдХреНрдпреЛрдВ 1080ti рдХрд╛рдо 980ti рд╕реЗ рдзреАрдорд╛ рд╣реИ !!!! рдФрд░ рдореИрдВ рдХреИрд╕реЗ рдЬрд╛рдВрдЪ рд╕рдХрддрд╛ рд╣реВрдВ рдХрд┐ рдХреНрдпрд╛ рдЧрд▓рдд рд╣реИ?!

рдпрджрд┐ рдЖрдк 1080Ti рдХреЗ рд▓рд┐рдП 20 рдмреИрдЪ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВ рддреЛ рд░рди рдЯрд╛рдЗрдо рдХреНрдпрд╛ рд╣реИ?

@ рдЧреБрдирди , рдмрд╕ рд╕реЛрдЪ рд░рд╣рд╛ рдерд╛ рдХрд┐ рдЗрд╕рдХреЗ рд▓рд┐рдП рдХреЛрдИ рдирдпрд╛ рдИрдЯреАрдП рд╣реИ рдпрд╛ рдирд╣реАрдВ?

@smitshilu
1080ti рдореЗрдВ 20 рдмреИрдЪ рдХреЗ рд╕рд╛рде =26 рдорд┐рдирдЯ
рдФрд░ ремрежрдмреИрдЪ рдХреЗ рд╕рд╛рде = резреп рдорд┐рдирдЯ
рдмреИрдЪ реиреж = резрек рдорд┐рдирдЯ рдХреЗ рд╕рд╛рде репреорежgtx рдореЗрдВ !!!!
рдореИрдВ рд╡рд┐рдВрдбреЛрдЬрд╝ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реВрдВ, рдбреНрд░рд╛рдЗрд╡рд░ рдХрд╛ рдЕрдВрддрд┐рдо рд╕рдВрд╕реНрдХрд░рдг cuda 8 рдФрд░ cudnn 6 рдХреЗ рд╕рд╛рде рд╕реНрдерд╛рдкрд┐рдд рдХрд░рддрд╛ рд╣реВрдВ
рдореИрдВ рдХреИрд╕реЗ рдкрддрд╛ рд▓рдЧрд╛ рд╕рдХрддрд╛ рд╣реВрдВ рдХрд┐ рдпрд╣ 980 рд╕реЗ рдзреАрдорд╛ рдХреНрдпреЛрдВ рдЪрд▓ рд░рд╣рд╛ рд╣реИ?

@nasergh рдХреНрдпрд╛ рдЖрдкрдХреЗ рдкрд╛рд╕ SLI рдореЗрдВ GTX 1080ti рдФрд░ тАЛтАЛ980ti рд╣реИ?

@рд╡рд┐рдХреАрд▓реЗрдВрд╕
рдирд╣реАрдВ
рджреЛ рдЕрд▓рдЧ рдХрдВрдкреНрдпреВрдЯрд░!
рджреЛрдиреЛрдВ cori7 рдФрд░ 1TB рд╣рд╛рд░реНрдб рдбрд┐рд╕реНрдХ рд╣реИрдВ рдФрд░ рдореИрдВ 1TB sata HDD рд╕реЗ рдбреЗрдЯрд╛ рдЫрд╡рд┐ рд▓реЛрдб рдХрд░рддрд╛ рд╣реВрдВ
рд▓реЗрдХрд┐рди 980 рдореЗрдВ рдореЗрд░реЗ рдкрд╛рд╕ рдПрд╕рдПрд╕рдбреА рд╣рд╛рд░реНрдб рдбрд┐рд╕реНрдХ рдкрд░ рдЦрд┐рдбрд╝рдХрд┐рдпрд╛рдВ рд╣реИрдВ
рдореИрдВ рдбреНрд░рд╛рдЗрд╡рд░ рдХреЗ рд╡рд┐рднрд┐рдиреНрди рд╕рдВрд╕реНрдХрд░рдг рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░рддрд╛ рд╣реВрдВ, рдЖрдЦрд┐рд░реА рдЪреАрдЬ рдореИрдВ CUDA 8 рдФрд░ cudnn 6 рдХреЗ рд╕рд╛рде asus рд╡реЗрдмрд╕рд╛рдЗрдЯ рд╕реЗ рдбрд╛рдЙрдирд▓реЛрдб рдХрд┐рдП рдЧрдП 388.13 рдХреА рдЬрд╛рдВрдЪ рдХрд░рддрд╛ рд╣реВрдВ
рдореБрдЭреЗ рдирд╣реАрдВ рдкрддрд╛ рдХрд┐ рдЗрд╕рдХрд╛ рдХреМрди рд╕рд╛ рдХрд╛рд░рдг рд╣реИ
1- рдЦрд┐рдбрд╝рдХрд┐рдпрд╛рдБ! рд╢рд╛рдпрдж рдпрд╣ рд▓рд┐рдирдХреНрд╕ рдкрд░ рдмреЗрд╣рддрд░ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ
2- рдПрдЪрдбреАрдбреА рд╕реНрдкреАрдб
3- рдирдХрд▓реА 1080TI
4- CUDA рдФрд░ cudnn 1080ti . рдХреЗ рд╕рд╛рде рд╕рдВрдЧрдд рдирд╣реАрдВ рд╣реИрдВ
5- CPU (1080TI рдХрдВрдкреНрдпреВрдЯрд░ рдкрд░ CPU 980 рд╕реЗ рдЕрдзрд┐рдХ рд╢рдХреНрддрд┐рд╢рд╛рд▓реА рд╣реИ)
рдЖрдкрдХреА рдХреНрдпрд╛ рд╕рд▓рд╛рд╣ рд╣реИ ?

@nasergh
1) рдХреНрдпрд╛ рд░реИрдо рд╕рдорд╛рди рд╣реИ? рдпрджрд┐ рдРрд╕рд╛ рд╣реИ рддреЛред рдореБрдЭреЗ рдпрдХреАрди рдирд╣реАрдВ рд╣реИ рдХрд┐ рдпрд╣ рдЗрддрдирд╛ рдкреНрд░рднрд╛рд╡рд┐рдд рдХрд░реЗрдЧрд╛, рд▓реЗрдХрд┐рди рдЬрд╛рдВрдЪреЗрдВ рдХрд┐ рдХреНрдпрд╛ рджреЛрдиреЛрдВ рдкреНрд░рдгрд╛рд▓рд┐рдпреЛрдВ рдореЗрдВ рд░реИрдо рдХрд╛ рдореЗрдЧрд╛рд╣рд░реНрдЯреНрдЬ рднреА рд╕рдорд╛рди рд╣реИред
2) 980ti рдФрд░ тАЛтАЛ1080ti рдкрд░ рдЪрд▓рддреЗ рд╕рдордп GPU рдЙрдкрдпреЛрдЧ% рдХреА рдЬрд╛рдБрдЪ рдХрд░реЗрдВред рдпрджрд┐ рдЖрдк GPU рдЙрдкрдпреЛрдЧ рдХреА рдЬрд╛рдВрдЪ рдХрд░рдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВ рддреЛ рдЗрд╕ рдЯреВрд▓ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░реЗрдВред https://docs.microsoft.com/en-us/sysinternals/downloads/process-explorer рд╡рд╣рд╛рдБ рдмреЗрд╣рддрд░ рд╣реИрдВ, рд▓реЗрдХрд┐рди рдпрд╣ рдореЗрд░реЗ рд╕рд┐рд░ рдХреЗ рдКрдкрд░ рдЖрдпрд╛ рд╣реИред
3) рдпрджрд┐ рдЖрдк рд╕рд░реНрд╡рд╢реНрд░реЗрд╖реНрда рдкреНрд░рджрд░реНрд╢рди рдкреНрд░рд╛рдкреНрдд рдХрд░рдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВ, рддреЛ рдореИрдВ рдЖрдкрдХреЗ 1080ti рд╕рд┐рд╕реНрдЯрдо рдкрд░ рдПрдХ рджреЛрд╣рд░реЗ рдмреВрдЯ рдХреЗ рд░реВрдк рдореЗрдВ Ubuntu16.04 рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдФрд░ CUDA 9.0 рдФрд░ cuDNN 7.0 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХрд╛ рд╕реБрдЭрд╛рд╡ рджреВрдВрдЧрд╛ред
4) рдЗрд╕рдХреЗ рдЕрд▓рд╛рд╡рд╛ рд╡рд┐рдВрдбреЛрдЬрд╝ рдЕрдкрдиреЗ рдЖрдк рдореЗрдВ рдмрд╣реБрдд рд╕рд╛рд░реЗ рд╕рд┐рд╕реНрдЯрдо рд╕рдВрд╕рд╛рдзрди рд▓реЗрддреА рд╣реИ, рдЗрд╕рд▓рд┐рдП рдЗрд╕реЗ рдПрд╕рдПрд╕рдбреА рдкрд░ рдЪрд▓рд╛рдиреЗ рд╕реЗ рдирд┐рд╢реНрдЪрд┐рдд рд░реВрдк рд╕реЗ рдЗрд╕реЗ рдмрдврд╝рдд рдорд┐рд▓рддреА рд╣реИ, рд▓реЗрдХрд┐рди рдЙрд╕ рдкрд░рд┐рдорд╛рдг рдХреЗ рдирд╣реАрдВ рдЬреИрд╕рд╛ рдХрд┐ рдЖрдкрдХреЗ рдкрд░реАрдХреНрд╖рдг рдкрд░рд┐рджреГрд╢реНрдп рдореЗрдВ рджреЗрдЦрд╛ рдЧрдпрд╛ рд╣реИред

рд╢рд╛рдпрдж рдпрд╣ рдЪрдпрдирд┐рдд рдмреЛрд░реНрдб рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░ рд╣реИред
TF рдХреЛ рдбрд┐рдлрд╝реЙрд▓реНрдЯ рд░реВрдк рд╕реЗ 3.0, 3.5 рдФрд░ 5.2 рдХреЗ рд▓рд┐рдП рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ; рдЬрдмрдХрд┐ https://en.wikipedia.org/wiki/CUDA#GPUs_supported рдХреЗ рдЕрдиреБрд╕рд╛рд░ 1080TI 6.1 (рдкрд╛рд╕реНрдХрд▓) рд╣реИ рдЬрдмрдХрд┐ 980 5.2 (рдореИрдХреНрд╕рд╡реЗрд▓) рд╣реИ
рд╣реЛ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ 3.0 рдпрд╛ 5.2 рдХрд╛ рдбрд╛рдЙрдирдЧреНрд░реЗрдб 1080TI рдкрд░ рдХреБрд╢рд▓ рдирд╣реАрдВ рд╣реИ, рдЬрдмрдХрд┐ рдпрд╣ 980 рдХреЗ рд▓рд┐рдП рдореВрд▓ рд╣реИ?
5.2 рдФрд░ 6.1 рджреЛрдиреЛрдВ рдХреНрд╖рдорддрд╛рдУрдВ рдХреЗ рд╕рд╛рде рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░реЗрдВ (рджреЗрдЦреЗрдВ CMakeLists.txt l.232 рдФрд░ l.246)

рдбреА: рдирд╕рд░рдШ [mailto:[email protected]]
рджреВрдд : mercredi 22 рдирд╡рдВрдмрд░ 2017 17:17
: рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ/рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ
рд╕реАрд╕реА: рд╕рд┐рд▓реНрд╡реЗрди-рдмреМрдЧреНрдиреМрдХреНрд╕; рд╣рд╛рде рд╕реЗ рдХрд┐рдпрд╛ рд╣реБрдЖ
рдУрдмреНрдЬреЗрдЯ: рдкреБрди: [рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ/рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ] CuDNN 7 рдФрд░ CUDA 9 (#12052) рдореЗрдВ рдЕрдкрдЧреНрд░реЗрдб рдХрд░реЗрдВ

@рд╡рд┐рдХреАрд▓реЗрдВрд╕
рдирд╣реАрдВ
рджреЛ рдЕрд▓рдЧ рдХрдВрдкреНрдпреВрдЯрд░!
рджреЛрдиреЛрдВ cori7 рдФрд░ 1TB рд╣рд╛рд░реНрдб рдбрд┐рд╕реНрдХ рд╣реИрдВ рдФрд░ рдореИрдВ 1TB sata HDD рд╕реЗ рдбреЗрдЯрд╛ рдЫрд╡рд┐ рд▓реЛрдб рдХрд░рддрд╛ рд╣реВрдВ
рд▓реЗрдХрд┐рди 980 рдореЗрдВ рдореЗрд░реЗ рдкрд╛рд╕ рдПрд╕рдПрд╕рдбреА рд╣рд╛рд░реНрдб рдбрд┐рд╕реНрдХ рдкрд░ рдЦрд┐рдбрд╝рдХрд┐рдпрд╛рдВ рд╣реИрдВ
рдореИрдВ рдбреНрд░рд╛рдЗрд╡рд░ рдХреЗ рд╡рд┐рднрд┐рдиреНрди рд╕рдВрд╕реНрдХрд░рдг рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░рддрд╛ рд╣реВрдВ, рдЖрдЦрд┐рд░реА рдЪреАрдЬ рдореИрдВ CUDA 8 рдФрд░ cudnn 6 рдХреЗ рд╕рд╛рде asus рд╡реЗрдмрд╕рд╛рдЗрдЯ рд╕реЗ рдбрд╛рдЙрдирд▓реЛрдб рдХрд┐рдП рдЧрдП 388.13 рдХреА рдЬрд╛рдВрдЪ рдХрд░рддрд╛ рд╣реВрдВ
рдореБрдЭреЗ рдирд╣реАрдВ рдкрддрд╛ рдХрд┐ рдЗрд╕рдХрд╛ рдХреМрди рд╕рд╛ рдХрд╛рд░рдг рд╣реИ
1- рдЦрд┐рдбрд╝рдХрд┐рдпрд╛рдБ! рд╢рд╛рдпрдж рдпрд╣ рд▓рд┐рдирдХреНрд╕ рдкрд░ рдмреЗрд╣рддрд░ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ
2- рдПрдЪрдбреАрдбреА рд╕реНрдкреАрдб
3- рдирдХрд▓реА 1080TI
4- CUDA рдФрд░ cudnn 1080ti . рдХреЗ рд╕рд╛рде рд╕рдВрдЧрдд рдирд╣реАрдВ рд╣реИрдВ
рдЖрдкрдХреА рдХреНрдпрд╛ рд╕рд▓рд╛рд╣ рд╣реИ ?
-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдиреЗ рдЗрд╕ рдереНрд░реЗрдб рдХреА рд╕рджрд╕реНрдпрддрд╛ рд▓реА рд╣реИред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ, рдпрд╛ рдереНрд░реЗрдб рдХреЛ рдореНрдпреВрдЯ рдХрд░реЗрдВред

рдкрд░реНрдпрд╛рд╡рд░рдг: cuda9.0+cudnn7.0+tf1.4я╝МрдФрд░ рдЬрдм рдореИрдВ "ptb" рдЙрджрд╛рд╣рд░рдг рдЪрд▓рд╛рддрд╛ рд╣реВрдВ рддреЛ рдореБрдЭреЗ рдПрдХ рддреНрд░реБрдЯрд┐ рдорд┐рд▓рддреА рд╣реИ, TypeError: __init__() рдХреЛ рдПрдХ рдЕрдкреНрд░рддреНрдпрд╛рд╢рд┐рдд рдХреАрд╡рд░реНрдб рддрд░реНрдХ 'input_size' рдорд┐рд▓рд╛, 'input_size' рдХрд╛ рдкреИрд░рд╛рдореАрдЯрд░ рд╣реИ рдХреБрдбрдирдПрд▓рдПрд╕рдЯреАрдПрдо

рдЗрд╕ рдзрд╛рдЧреЗ рдХреЛ рдорд╣реАрдиреЛрдВ рддрдХ рджреЗрдЦрдиреЗ рдХреЗ рдмрд╛рдж рдореИрдВ рдЗрд╕реЗ Gentoo linux рдкрд░ рдЖрдЬрд╝рдорд╛рдиреЗ рдЬрд╛ рд░рд╣рд╛ рд╣реВрдБ

рдореЗрд░реЗ рдкрд╛рд╕ рдЖрд╕реБрд╕ рд╕реНрдЯреНрд░реАрдХреНрд╕ 1080TI рд╣реИ
1- рдЙрдмрдВрдЯреВ рдореЗрдВ рдореИрдВ рдПрдирд╡реАрдбрд┐рдпрд╛ рд╡реЗрдмрд╕рд╛рдЗрдЯ рдореЗрдВ рдбреНрд░рд╛рдЗрд╡рд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ рдпрд╛ рдореБрдЭреЗ рдПрд╕рд╕ рд╕реЗ рдбрд╛рдЙрдирд▓реЛрдб рдХрд░рдирд╛ рд╣реЛрдЧрд╛ (рдХреНрдпреЛрдВрдХрд┐ рдореБрдЭреЗ рдПрд╕рд╕ рд╡реЗрдмрд╕рд╛рдЗрдЯ рдореЗрдВ рд▓рд┐рдирдХреНрд╕ рдХреЗ рд▓рд┐рдП рдбреНрд░рд╛рдЗрд╡рд░ рдирд╣реАрдВ рджрд┐рдЦ рд░рд╣рд╛ рд╣реИ)
2- рдЕрдВрддрд┐рдо рд╕рдВрд╕реНрдХрд░рдг рдареАрдХ рд╣реИ рдпрд╛ рдореБрдЭреЗ 378.13 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ рдЪрд╛рд╣рд┐рдП рдХреНрдпреЛрдВрдХрд┐ рдореИрдВ рдЬреНрдпрд╛рджрд╛рддрд░ рдЯрд┐рдкреНрдкрдгрд┐рдпреЛрдВ рдореЗрдВ рджреЗрдЦрддрд╛ рд╣реВрдВ рдХрд┐ рд╡реЗ рдХрд╣рддреЗ рд╣реИрдВ рдХрд┐ 378.13 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░реЗрдВ?
рдзрдиреНрдпрд╡рд╛рдж

рд╡рд┐рдВрдбреЛрдЬрд╝ рдкрд░ рдЙрди рд▓реЛрдЧреЛрдВ рдХреЗ рд▓рд┐рдП, рдореИрдВрдиреЗ рдЕрдкрдиреЗ рд░реЗрдкреЛ рдкрд░ рдПрд╡реАрдПрдХреНрд╕ рд╕рдорд░реНрдерди рдХреЗ рд╕рд╛рде рд╕реАрдпреВрдбреАрдП 8.0.61.2, рд╕реАрдпреВрдбреАрдПрди 7.0.4, рдкрд╛рдпрдерди 3.6.3 рдХреЗ рдЦрд┐рд▓рд╛рдл рдмрдирд╛рдпрд╛ рдЧрдпрд╛ рдЯреАрдПрдл 1.4.0 рдЕрдкрд▓реЛрдб рдХрд┐рдпрд╛ рд╣реИред рдЙрдореНрдореАрдж рд╣реИ рдХрд┐ рдпрд╣ рддрдм рддрдХ рдкрд░реНрдпрд╛рдкреНрдд рд╣реИ рдЬрдм рддрдХ CUDA 9 рд╡рд┐рдВрдбреЛрдЬрд╝ рдкрд░ рд╣рд▓ рдирд╣реАрдВ рд╣реЛ рдЬрд╛рддрд╛ред

рдореИрдВ ubuntu 16.04 рдФрд░ рдЕрдЬрдЧрд░ 3.6 рдкрд░ CUDA9 рдФрд░ cudnn 7 рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░ рд░рд╣рд╛ рд╣реВрдВ
рд▓реЗрдХрд┐рди рдореИрдВ рдЕрд╕рдлрд▓ рд╣реВрдБ :(
рдореИрдВ рд╕рдм рдХреБрдЫ рдХрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░рддрд╛ рд╣реВрдВ, рд╣рд░ рдЬрдЧрд╣ рдЦреЛрдЬрддрд╛ рд╣реВрдВ рд▓реЗрдХрд┐рди рдлрд┐рд░ рднреА рд╡рд╣реА рддреНрд░реБрдЯрд┐ рджреЗрддрд╛ рд╣реВрдВ "importError: libcublas.so.8.0 рд╕рд╛рдЭрд╛ рдСрдмреНрдЬреЗрдХреНрдЯ рдлрд╝рд╛рдЗрд▓ рдирд╣реАрдВ рдЦреЛрд▓ рд╕рдХрддрд╛: рдРрд╕реА рдХреЛрдИ рдлрд╝рд╛рдЗрд▓ рдпрд╛ рдирд┐рд░реНрджреЗрд╢рд┐рдХрд╛ рдирд╣реАрдВ
рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдЯреЗрдВрд╕рд░ CUDA8 рдЪрд▓рд╛рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реИ
рдореИрдВ рдЙрд╕реЗ cuda9 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХреИрд╕реЗ рдХрд╣ рд╕рдХрддрд╛ рд╣реВрдБ?!!!! рдЕрдЧрд░ рдЙрддреНрддрд░ рд╕реНрд░реЛрдд рд╕реЗ рдЪрд▓рд╛рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рддреЛ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдХреИрд╕реЗ? рдореИрдВрдиреЗ рд╕реНрд░реЛрдд рд╕реЗ рдирд┐рд░реНрдорд╛рдг рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдмрд╣реБрдд рд╕реНрдкрд╖реНрдЯ рд╡реЗрдмрд╕рд╛рдЗрдЯ рдирд╣реАрдВ рджреЗрдЦреА
рдзрдиреНрдпрд╡рд╛рдж

рдЖрдкрдХреЛ рд╕реНрд░реЛрдд@nasergh . рд╕реЗ tf рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдирд╛ рдЪрд╛рд╣рд┐рдП

@withme6696
рдореИрдВ рдЗрд╕реЗ рд╕реНрд░реЛрдд рд╕реЗ рдХреИрд╕реЗ рд╕реНрдерд╛рдкрд┐рдд рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ?

рдореБрдЭреЗ рдкрддрд╛ рд╣реИ рдХрд┐ рдореИрдВ рдЗрдирдореЗрдВ рд╕реЗ рдПрдХ рдбрд╛рдЙрдирд▓реЛрдб рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ
https://github.com/mind/wheels/releases
рд▓реЗрдХрд┐рди рдореБрдЭреЗ рдирд╣реАрдВ рдкрддрд╛ рдХрд┐ рдХреМрди рд╕рд╛ рдбрд╛рдЙрдирд▓реЛрдб рдХрд░реЗрдВ рдФрд░ рдЗрд╕реЗ рдХреИрд╕реЗ рдЗрдВрд╕реНрдЯреЙрд▓ рдХрд░реЗрдВ!

@nasergh рдХреИрд╕реЗ рд╕реНрдерд╛рдкрд┐рдд рдХрд░реЗрдВ, рдЗрд╕рдХреЗ рд▓рд┐рдП рд╣рдорд╛рд░рд╛ README рджреЗрдЦреЗрдВ ред рдпрджрд┐ рдЖрдкрдХреЛ рдПрдордХреЗрдПрд▓ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдореЗрдВ рдХреЛрдИ рдЖрдкрддреНрддрд┐ рдирд╣реАрдВ рд╣реИ, рддреЛ рдЖрдк рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ

pip --no-cache-dir install https://github.com/mind/wheels/releases/download/tf1.4-gpu-cuda9-37/tensorflow-1.4.0-cp36-cp36m-linux_x86_64.whl

рдпрджрд┐ рдЖрдк рдПрдордХреЗрдПрд▓ рд╕реНрдерд╛рдкрд┐рдд рдирд╣реАрдВ рдХрд░рдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВ, рддреЛ рдЖрдк рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ

pip --no-cache-dir install https://github.com/mind/wheels/releases/download/tf1.4-gpu-cuda9-nomkl/tensorflow-1.4.0-cp36-cp36m-linux_x86_64.whl

рдореИрдВ рдЗрд╕ рдореБрджреНрджреЗ рдХрд╛ рдЙрдкрдпреЛрдЧ CUDA 9 рд╕рдорд░реНрдерди рдХреЗ рд▓рд┐рдП рдЯреНрд░реИрдХрд┐рдВрдЧ рд╕рдорд╕реНрдпрд╛ рдХреЗ рд░реВрдк рдореЗрдВ рдХрд░реВрдВрдЧрд╛ред
рд╡рд░реНрддрдорд╛рди рдореЗрдВ, рджреЛ рдЕрд╡рд░реЛрдзрдХ рд╣реИрдВ:
1 - https://github.com/tensorflow/tensorflow/pull/14770
2 - рд╡рд┐рдВрдбреЛрдЬрд╝ рдкрд░, рдРрд╕рд╛ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдПрдирд╡реАрд╕реАрд╕реА рдХреЗ рд╕рд╛рде рдПрдХ рдмрдЧ рд╣реИред CUDA9 рдХреЗ рд╕рд╛рде рдмрд┐рд▓реНрдбрд┐рдВрдЧ TF рдПрдХ рдХрдВрдкрд╛рдЗрд▓рд░ рдХреНрд░реИрд╢ рдХреЗ рд╕рд╛рде рд╡рд┐рдлрд▓ рд╣реЛ рд░рд╣рд╛ рд╣реИред NVIDIA рдЗрд╕рдХреА рдЬрд╛рдВрдЪ рдореЗрдВ рдорджрдж рдХрд░ рд░рд╣рд╛ рд╣реИ, рдФрд░ рдПрдХ рдмрд╛рд░ рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдПрдХ рдЕрдкрдбреЗрдЯ рд╣реЛрдиреЗ рдХреЗ рдмрд╛рдж рд╣рдо рдЖрдЧреЗ рдмрдврд╝реЗрдВрдЧреЗред

@danqing
рдзрдиреНрдпрд╡рд╛рдж
1- рдПрдордХреЗрдПрд▓ рдЧрддрд┐ рдореЗрдВ рдХрд┐рддрдирд╛ рд╕реБрдзрд╛рд░ рдХрд░рддрд╛ рд╣реИ?
2- рдПрдордХреЗрдПрд▓ рдХреЗ рдмрд┐рдирд╛ рд╕рдВрд╕реНрдХрд░рдг рдореЗрдВ рдореБрдЭреЗ рдПрдордХреЗрдПрд▓ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ?!

1 рдХреЗ рд▓рд┐рдП, рджреЗрдЦрдирд╛ рдпрд╣ GPU рдкрд░ рдХрд┐рдпрд╛ рд╕рдВрдЧрдгрдирд╛ рд╕реНрдкрд╖реНрдЯ рд░реВрдк рд╕реЗ рдЧрддрд┐ рдХреЛ рдирд╣реАрдВ рд╣реЛрдЧрд╛ рдХрд┐ рдиреЛрдЯ -ред

2 рдХреЗ рд▓рд┐рдП, рдЖрдк рдирд╣реАрдВред рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░реЗрдВ рдХрд┐ рдЖрдкрдиреЗ рд╕рд╣реА рд╕рдВрд╕реНрдХрд░рдг рд╕реНрдерд╛рдкрд┐рдд рдХрд┐рдпрд╛ рд╣реИред

рдмреАрдЯреАрдбрдмреНрд▓реНрдпреВ, рдпрд╣ рдХрдИ рдЧреНрд░рд╛рд╣рдХреЛрдВ рдХреЗ рд╕рд╛рде рдПрдХ рдзрд╛рдЧрд╛ рд╣реИред рдпрджрд┐ рдЖрдкрдХреЗ рдкрд╛рд╕ рд╣рдорд╛рд░реЗ рдкрд╣рд┐рдпреЛрдВ рдХреЗ рд╕рд╛рде рднрд╡рд┐рд╖реНрдп рдХреЗ рдореБрджреНрджреЗ рд╣реИрдВ, рддреЛ рдХреГрдкрдпрд╛ рдиреАрдЪреЗ рдЯрд┐рдкреНрдкрдгреА рдХрд░рдиреЗ рдХреЗ рдмрдЬрд╛рдп рд╣рдорд╛рд░реЗ рд░реЗрдкреЛ рдореЗрдВ рдПрдХ рдореБрджреНрджрд╛ рдЦреЛрд▓реЗрдВ, рддрд╛рдХрд┐ рд╣рдо рдПрдХ рдЯрди рд▓реЛрдЧреЛрдВ рдХреЛ рд╕реНрдкреИрдо рди рдХрд░реЗрдВред

@Tweakmind : рдореИрдВ рдЗрд╕ рднрд╛рдЧ рдХреЛ рдкрд╛рд░рд┐рдд рдирд╣реАрдВ рдХрд░ рд╕рдХрддрд╛:

рдмрд┐рд▓реНрдбрд┐рдВрдЧ рдЯреЗрдВрд╕рд░рдлреНрд▓реЛ

bazel рдмрд┐рд▓реНрдб --config=opt --config=cuda //tensorflow/tools/pip_ рдкреИрдХреЗрдЬ:build_pip_package --cxxopt="-D_GLIBCXX_USE_CXX11_ABI=0
рдмреЗрдЬрд╝реЗрд▓-рдмрд┐рди/рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ/рдЯреВрд▓реНрд╕/рдкрд╛рдЗрдк_рдкреИрдХреЗрдЬ/рдмрд┐рд▓реНрдб_рдкрд┐рдк_рдкреИрдХреЗрдЬ/рдЯреАрдПрдордкреА/рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ_рдкреАрдХреЗрдЬреА
рдкрд╛рдЗрдк рд╕реНрдерд╛рдкрд┐рдд /tmp/tensorflow_pkg/tensorflow-1.4.0-cp36-cp36m-linux_x86_64.whl

рдкрд╣рд▓реА рдкрдВрдХреНрддрд┐ рдЕрдзреВрд░реА рд▓рдЧрддреА рд╣реИ (рджреЛрд╣рд░реЗ рдЙрджреНрдзрд░рдг рдЧрд╛рдпрдм рд╣реИрдВ)? рдпреЗ рддреАрди рдкрдВрдХреНрддрд┐рдпрд╛рдБ рд╣реИрдВ рдпрд╛ рджреЛ рдкрдВрдХреНрддрд┐рдпрд╛рдБ?

@goodmangu рд╕рд╣реА рдХреЛрдб, рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ, рд╣реИ:

bazel build --config=opt --config=cuda //tensorflow/tools/pip_package:build_pip_package --cxxopt="-D_GLIBCXX_USE_CXX11_ABI=0"

рдЖрджреЗрд╢ рд╕реЗ рджреЛрд╣рд░реЗ рдЙрджреНрдзрд░рдг рдЪрд┐рд╣реНрди рдЧрд╛рдпрдм рд╣реИрдВред

рдореИрдВ рдпрд╣рд╛рдБ рд╕реНрдХреНрд░рд┐рдкреНрдЯ https://github.com/tensorflow/tensorflow/issues/15108 рдореЗрдВ рдХреБрдЫ cuda рд╕рдВрдХрд▓рдХ рддреНрд░реБрдЯрд┐рдпреЛрдВ рд╕реЗ рдЕрд╡рд░реБрджреНрдз рд╣реЛ рд░рд╣рд╛ рд╣реВрдБ

рдзрдиреНрдпрд╡рд╛рдж рджреЛрд╕реНрддреЛрдВред рдЗрд╕рдХреА рд╕рд░рд╛рд╣рдирд╛ рдХреАред рдореИрдВ рдЗрд╕реЗ рдЙрд╕реА рджрд┐рди рдХрд╛рдо рдХрд░ рд░рд╣рд╛ рдерд╛, рдЗрд╕рдХреЗ рдмрдЬрд╛рдп рд░рд╛рдд рдХреЗ рдирд┐рд░реНрдорд╛рдг рд▓рд┐рдирдХреНрд╕ рдмрд╛рдЗрдирд░реА рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рдерд╛ред рджреЗрдЦреЗрдВ: https://github.com/tensorflow/tensorflow
рдЕрдм рдХреЗрд░рд╕ рдХреЗ рд╕рд╛рде 3 рдЬреАрдЯреАрдПрдХреНрд╕ 1080 рдЯреАрдЖрдИрдПрд╕ рдЪрд▓рд╛ рд░рд╣реЗ рд╣реИрдВред рдардВрдбрд╛!

рдПрдХ eGPU рдХреЗ рд╕рд╛рде рдореЗрд░реЗ рдореИрдХрдмреБрдХ рдкреНрд░реЛ рдХреЗ рд▓рд┐рдП рд╕реНрд░реЛрдд (r1.4) рд╕реЗ Tensorflow рдмрдирд╛рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдореЗрдВ рдкрд┐рдЫрд▓реЗ рджреЛ рджрд┐рди рдмрд┐рддрд╛рдПред рдЪрд╛рд▓рдХ рдХрд╛рдо рдХрд░ рд░рд╣рд╛ рд╣реИ, рдХреНрдпреВрдбрд╛ 8.0, рд╕реАрдпреВрдбреАрдПрдирдПрди 6.0, рдореИрдХ рдУрдПрд╕рдПрдХреНрд╕ рд╕рд┐рдПрд░рд╛ 10.12.4 рдХреЗ рд╕рд╛рдеред рдЕрдВрдд рдХреЗ рдмрд╣реБрдд рдХрд░реАрдм, рд▓реЗрдХрд┐рди 20 рдорд┐рдирдЯ рдХреЗ рдмрд╛рдж рдХреБрдЫ рдмрд┐рд▓реНрдб рддреНрд░реБрдЯрд┐рдпреЛрдВ рд╕реЗ рдЕрд╡рд░реБрджреНрдзред рдХрд┐рд╕реА рдХреЛ рдЕрдм рддрдХ рдирд╕реАрдм рд╣реБрдЖ рд╣реИ? рдХреЛрдИ рд╕рдлрд▓рддрд╛рдкреВрд░реНрд╡рдХ рдирд┐рд░реНрдорд┐рдд рдкреИрдХреЗрдЬ рдЬрд┐рд╕реЗ рдЖрдк рд╕рд╛рдЭрд╛ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ? рдЕрдЧреНрд░рд┐рдо рдореЗрдВ рдзрдиреНрдпрд╡рд╛рджред

@goodmangu рдХреНрдпрд╛ рдЖрдк рдХреГрдкрдпрд╛ рдирд┐рд░реНрджрд┐рд╖реНрдЯ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ рдХрд┐ рдЖрдк рдХрд┐рд╕ "рд░рд╛рдд рдХрд╛ рдирд┐рд░реНрдорд╛рдг рд▓рд┐рдирдХреНрд╕ рдмрд╛рдЗрдирд░реА" рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВ?

рдЬрд╝рд░реВрд░, рдпрд╣ рдПрдХ: tf_nightly_gpu-1.head-cp27-none-linux_x86_64.whl

Cuda 9.0 + cuDNN 7.0 рдХреЗ рд▓рд┐рдП рдЕрднреА рднреА рдХреЛрдИ Windows 10 рд╕рдорд░реНрдерди рдирд╣реАрдВ рд╣реИ? рдЕрднреА рд╕рддреНрдпрд╛рдкрди рдХрд░ рд░рд╣реЗ рд╣реИрдВред
рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдЬреАрдкреАрдпреВ 1.4.0

@goodmangu рдореИрдВрдиреЗ 1.4 рд▓реЗрдХрд┐рди OSX 10.13 рдФрд░ CUDA 9 cuDNN 7 рдХреЗ рд╕рд╛рде рдкреНрд░рдпрд╛рд╕ рдХрд┐рдпрд╛ред рдЖрдк рдпрд╣рд╛рдВ рдЪрд░рдг рдкрд╛ рд╕рдХрддреЗ рд╣реИрдВ

@ eeilon79 рд╡рд┐рдВрдбреЛрдЬрд╝ рдкрд░ рдПрдХ nvcc рдмрдЧ рд╣реИ рдЬреЛ рд╣рдореЗрдВ рдмрд╛рдпрдиреЗрд░рд┐рдЬрд╝ рдмрдирд╛рдиреЗ рд╕реЗ рд░реЛрдХрддрд╛ рд╣реИред рд╣рдореЗрдВ рдЙрди рдореБрджреНрджреЛрдВ рдХреЛ рдареАрдХ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдирд╡реАрдбрд┐рдпрд╛ рд╕реЗ рдорджрдж рдорд┐рд▓ рд░рд╣реА рд╣реИред

рдХреНрдпрд╛ tf-nightly-gpu pip рдкреИрдХреЗрдЬ рдХреЗ рддрд╣рдд Tensorflow Nightly Version (1.5-dev) рдореЗрдВ CUDA 9 рдХреЗ рд▓рд┐рдП рдХреЛрдИ рдЕрдкрдбреЗрдЯ рд╣реИ? рдХреЗрд░рд╛рд╕ рдореЗрдВ CuDNNLSTM рдХреЗ рд▓рд┐рдП рдЗрд╕ 1.5 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ

рдареАрдХ рд╣реИ, рдкреАрдЖрд░ рдЕрднреА рдорд░реНрдЬ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред
рдЦрд┐рдбрд╝рдХрд┐рдпреЛрдВ рдХреЛ рдЫреЛрдбрд╝рдХрд░, рд▓рдЧрднрдЧ 10-12 рдШрдВрдЯреЛрдВ рдореЗрдВ рд╣рдорд╛рд░реА рдирдИ рдирд╛рдЗрдЯрд▓реА cuda9 рдХреЗ рд╕рд╛рде рдмрди рдЬрд╛рдиреА рдЪрд╛рд╣рд┐рдПред
рд╡рд┐рдВрдбреЛрдЬрд╝ рдкрд░, рд╣рдо рдЕрднреА рднреА рдПрдХ рдПрдирд╡реАрд╕реАрд╕реА рдмрдЧ рджреНрд╡рд╛рд░рд╛ рдЕрд╡рд░реБрджреНрдз рд╣реИрдВред

рдореИрдВрдиреЗ Gentoo рд╕рд┐рд╕реНрдЯрдо рдХреЗ рд▓рд┐рдП рд╕рд╛рдорд╛рдиреНрдп CUDA 9 рдФрд░ CUDANN 7 рдкреИрдХреЗрдЬ рд╕рдорд╛рдкреНрдд рдХрд┐рдпрд╛ рдФрд░ рдбрдореА рдкрд░реАрдХреНрд╖рдг рдХреА рдХреЛрд╢рд┐рд╢ рдХреА рдФрд░ рдбрдореА рдЖрдпрд╛рдд tensorflow рджреНрд╡рд╛рд░рд╛ рдЕрдЬрдЧрд░ рдореЗрдВ tf рдХреЗ рд░реВрдк рдореЗрдВ рдХрд╛рдо рдХрд░рдиреЗ рдЬреИрд╕рд╛ рджрд┐рдЦрддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдореБрдЭреЗ рдЕрддрд┐рд░рд┐рдХреНрдд рдкрд░реАрдХреНрд╖рдг рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ:

рдореИрдВ рдкреНрд░рддрд┐рдмрджреНрдз рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рд╣реВрдБ: c9568f1ee51a265db4c5f017baf722b9ea5ecfbb

рд╡рд┐рдВрдбреЛрдЬрд╝ рдкрд░, рд╣рдо рдЕрднреА рднреА рдПрдХ рдПрдирд╡реАрд╕реАрд╕реА рдмрдЧ рджреНрд╡рд╛рд░рд╛ рдЕрд╡рд░реБрджреНрдз рд╣реИрдВред

рдХреНрдпрд╛ рдЖрдк рдЙрд╕ рдореБрджреНрджреЗ рдХрд╛ рд▓рд┐рдВрдХ рдпрд╣рд╛рдВ рдкреЛрд╕реНрдЯ рдХрд░рдирд╛ рдЪрд╛рд╣реЗрдВрдЧреЗ? рдЕрдЧреНрд░рд┐рдо рдореЗрдВ рдзрдиреНрдпрд╡рд╛рдж!

@smitshilu рдЖрдкрдХреЗ рд▓реЗрдЦ рдиреЗ рдореЗрд░реА рдорджрдж рдХреАред
рдФрд░ рдореИрдВрдиреЗ рдХреБрдЫ рддрддреНрд╡реЛрдВ рдХреЗ рд╕рд╛рде рдПрдХ рд▓реЗрдЦ рд▓рд┐рдЦрд╛ рдерд╛ред
https://github.com/masasys/MacTF1.4GPU

@arbynacosta
рдореИ рднрд╛рдЧрд╛
bazel рдмрд┐рд▓реНрдб --config=opt --config=cuda //tensorflow/tools/pip_ рдкреИрдХреЗрдЬ:build_pip_package --cxxopt="-D_GLIBCXX_USE_CXX11_ABI=0"
рд▓реЗрдХрд┐рди рдореБрдЭреЗ рдпрд╣ рддреНрд░реБрдЯрд┐ рдорд┐рд▓рддреА рд╣реИ
рддреНрд░реБрдЯрд┐: рдмрд┐рд▓реНрдб рдХрдорд╛рдВрдб рдХреЗрд╡рд▓ рдХрд╛рд░реНрдпрдХреНрд╖реЗрддреНрд░ рдХреЗ рднреАрддрд░ рд╕реЗ рд╕рдорд░реНрдерд┐рдд рд╣реИред

рдореИрдВ рднреА рд░рд╛рдд рдореЗрдВ рдЯреЗрдВрд╕рд░ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░рддрд╛ рд╣реВрдВ рд▓реЗрдХрд┐рди рдпрд╣ рддреНрд░реБрдЯрд┐ рджреЗрддрд╛ рд╣реИ
рд╡рд┐рд╢реЗрд╖рддрд╛ рддреНрд░реБрдЯрд┐: рдореЙрдбреНрдпреВрд▓ 'рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ' рдореЗрдВ рдХреЛрдИ рд╡рд┐рд╢реЗрд╖рддрд╛ рдирд╣реАрдВ рд╣реИ ....
рдбреАрдЖрдИрдЖрд░ (рдЯреАрдПрдл) рдХрд╛ рдЙрддреНрдкрд╛рджрди
['__doc__', '__loader__', '__name__', __package__ '__path__ __spec__]

рдХреНрд╖рдорд╛ рдХрд░реЗрдВ @goodmangu , рдореИрдВ рджреВрд░ рдерд╛ред рдХреНрдпрд╛ рдЖрдкрдХреЛ рдпрд╣ рдХрд╛рдо рдорд┐рд▓ рдЧрдпрд╛? рдЬреИрд╕рд╛ рдХрд┐ @arbynacosta рдиреЗ рдмрддрд╛рдпрд╛, рдореИрдВрдиреЗ рд╕рдорд╛рдкрди рджреЛрд╣рд░реЗ рдЙрджреНрдзрд░рдгреЛрдВ рдХреЛ рдпрд╛рдж рдХрд┐рдпрд╛ред рдореЗрд░реЗ рдкрд╛рд╕ рдпрд╣ рдЕрдм Ubuntu 17.10 рдХреЗ рддрд╣рдд CUDA 9.0 рдФрд░ cuDNN 7.0.4 рдХреЗ рд╕рд╛рде рдЪрд▓ рд░рд╣рд╛ рд╣реИред рдпрджрд┐ рдЖрд╡рд╢реНрдпрдХ рд╣реЛ рддреЛ рдореИрдВ рдореИрдХреЛрдЬрд╝ рдмрд┐рд▓реНрдб рдкрд░ рдХрд╛рдо рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВред рдореИрдВрдиреЗ Win10 рдФрд░ MacOS рджреЛрдиреЛрдВ рдкрд░ рдЬрдорд╛рдирдд рдХреА, рд▓реЗрдХрд┐рди рдЕрдЧрд░ рд▓реЛрдЧреЛрдВ рдХреЛ рдЗрд╕рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ рддреЛ рдореИрдВ рдЗрд╕ рд╕рдкреНрддрд╛рд╣ рдХреЗ рдЕрдВрдд рдореЗрдВ рдЙрди рдкрд░ рдХрд╛рдо рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВред

@nasergh , рдХреНрдпрд╛ рдЖрдк рдЙрд╕ рдХрдорд╛рдВрдб рдХреЛ рдХреНрд▓реЛрди рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдбрд╛рдпрд░реЗрдХреНрдЯрд░реА рдХреЗ рдЕрдВрджрд░ рд╕реЗ рдЪрд▓рд╛ рд░рд╣реЗ рд╣реИрдВред рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░реЗрдВ рдХрд┐ рдирд┐рд░реНрджреЗрд╢рд┐рдХрд╛ рдореЗрдВ рдХрд╛рд░реНрдпрд╕реНрдерд╛рди рдореМрдЬреВрдж рд╣реИред

рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП:

~/Downloads/tensorflow$ ls
ACKNOWLEDGMENTS     bazel-bin         bazel-testlogs      configure          LICENSE       tensorflow   WORKSPACE
ADOPTERS.md         bazel-genfiles    BUILD               configure.py       models.BUILD  third_party
arm_compiler.BUILD  bazel-out         CODE_OF_CONDUCT.md  CONTRIBUTING.md    README.md     tools
AUTHORS             bazel-tensorflow  CODEOWNERS          ISSUE_TEMPLATE.md  RELEASE.md    util

@Tweakmind
рдореИрдВ рдХрдорд╛рдВрдб рдЪрд▓рд╛рддрд╛ рд╣реВрдБ
рд╕реБрдбреЛ рд╕реБ
рдФрд░ рдлрд┐рд░ рдЧреЛрдЯреЛ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдлрд╝реЛрд▓реНрдбрд░ (рд╡рд╣рд╛рдБ рдХрд╛рд░реНрдпрдХреНрд╖реЗрддреНрд░ рдлрд╝рд╛рдЗрд▓ рдереА)
рд▓реЗрдХрд┐рди рдореБрдЭреЗ рдпрд╣ рддреНрд░реБрдЯрд┐рдпрд╛рдВ рдорд┐рд▓рддреА рд╣реИрдВ

root<strong i="10">@pc</strong>:/home/pc2/tensorflow# bazel build --config=opt --config=cuda //tensorflow/tools/pip_package:build_pip_package --cxxopt="-D_GLIBCXX_USE_CXX11_ABI=0"
..........
WARNING: Config values are not defined in any .rc file: opt
ERROR: /root/.cache/bazel/_bazel_root/cccfa03cbaf937d443248403ec70306e/external/local_config_cuda/crosstool/BUILD:4:1: Traceback (most recent call last):
    File "/root/.cache/bazel/_bazel_root/cccfa03cbaf937d443248403ec70306e/external/local_config_cuda/crosstool/BUILD", line 4
        error_gpu_disabled()
    File "/root/.cache/bazel/_bazel_root/cccfa03cbaf937d443248403ec70306e/external/local_config_cuda/crosstool/error_gpu_disabled.bzl", line 3, in error_gpu_disabled
        fail("ERROR: Building with --config=c...")
ERROR: Building with --config=cuda but TensorFlow is not configured to build with GPU support. Please re-run ./configure and enter 'Y' at the prompt to build with GPU support.
ERROR: no such target '@local_config_cuda//crosstool:toolchain': target 'toolchain' not declared in package 'crosstool' defined by /root/.cache/bazel/_bazel_root/cccfa03cbaf937d443248403ec70306e/external/local_config_cuda/crosstool/BUILD
INFO: Elapsed time: 6.830s
FAILED: Build did NOT complete successfully (2 packages loaded)
    currently loading: @bazel_tools//tools/jdk

@nasergh рдХреГрдкрдпрд╛ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░реЗрдВ рдХрд┐ рдЖрдк рдпрд╣рд╛рдВ рд╕рднреА рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рдкрд╛рд▓рди рдХрд░рддреЗ рд╣реИрдВ:
https://www.tensorflow.org/install/install_sources

рдпрджрд┐ рдЖрдк GPU рд╕рдорд░реНрдерди рдХреЗ рд╕рд╛рде рдирд┐рд░реНрдорд╛рдг рдХрд░ рд░рд╣реЗ рд╣реИрдВ, рддреЛ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░реЗрдВ рдХрд┐ рдЖрдк рдЙрдЪрд┐рдд рд░реВрдк рд╕реЗ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд░ рд░рд╣реЗ рд╣реИрдВред

рд╕реНрд░реЛрдд рд╕реЗ Tensorflow 1.4 рд╕реНрдерд╛рдкрд┐рдд рдХрд░реЗрдВред

  • рдЗрд╕ рд▓реЗрдЦрди рдХреЗ рд╕рдордп, рдпрд╣ CUDA 9.0 рдФрд░ cuDNN 7.0 . рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░рдиреЗ рдХрд╛ рдПрдХрдорд╛рддреНрд░ рддрд░реАрдХрд╛ рд╣реИ
  • рдирд┐рд░реНрджреЗрд╢: https://www.tensorflow.org/install/install_sources
  • рд╣реЛ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ рдХреБрдЫ рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рдХреЛрдИ рдорддрд▓рдм рди рд╣реЛ, рдореИрдВрдиреЗ рдпрд╣ рдХреИрд╕реЗ рдХрд┐рдпрд╛:
cd $HOME/Downloads
git clone https://github.com/tensorflow/tensorflow
cd tensorflow
git checkout r1.4
./configure

рдирдореВрдирд╛ рдЖрдЙрдЯрдкреБрдЯ рдФрд░ рд╡рд┐рдХрд▓реНрдк рдирд┐рд░реНрджреЗрд╢реЛрдВ рдореЗрдВ рдЙрд╕рд╕реЗ рднрд┐рдиреНрди рд╣реЛрдВрдЧреЗ

  • рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░реЗрдВ рдХрд┐ рдЖрдкрдиреЗ CUDA рд╕рдВрд╕реНрдХрд░рдг рдХреЗ рд▓рд┐рдП рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд┐рдпрд╛ рд╣реИ: 9.0
  • рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░реЗрдВ рдХрд┐ рдЖрдк cuDNN рд╕рдВрд╕реНрдХрд░рдг рдХреЗ рд▓рд┐рдП рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд░рддреЗ рд╣реИрдВ: 7.0.4
  • рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░реЗрдВ рдХрд┐ рдЖрдк рдЕрдкрдиреА рдЧрдгрдирд╛ рдХреНрд╖рдорддрд╛ https://developer.nvidia.com/cuda-gpus . рд╕реЗ рдЬрд╛рдирддреЗ рд╣реИрдВ
  • рдореИрдВрдиреЗ рдЗрд╕реЗ 6.1 рдкрд░ рд╕реЗрдЯ рдХрд┐рдпрд╛ рд╣реИ рдХреНрдпреЛрдВрдХрд┐ рдореЗрд░реЗ рдкрд╛рд╕ GeForce GTX 1070 . рд╣реИ

рдмреЗрдЬрд╝реЗрд▓ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдирд╛

sudo add-apt-repository ppa:webupd8team/java
sudo apt-get update && sudo apt-get install oracle-java8-installer
echo "deb [arch=amd64] http://storage.googleapis.com/bazel-apt stable jdk1.8" | sudo tee /etc/apt/sources.list.d/bazel.list
curl https://bazel.build/bazel-release.pub.gpg | sudo apt-key add -
sudo apt-get update && sudo apt-get install bazel
sudo /sbin/ldconfig -v

рдмрд┐рд▓реНрдбрд┐рдВрдЧ рдЯреЗрдВрд╕рд░рдлреНрд▓реЛ

bazel build --config=opt --config=cuda //tensorflow/tools/pip_package:build_pip_package --cxxopt="-D_GLIBCXX_USE_CXX11_ABI=0"
bazel-bin/tensorflow/tools/pip_package/build_pip_package /tmp/tensorflow_pkg
pip install /tmp/tensorflow_pkg/tensorflow-1.4.0-cp36-cp36m-linux_x86_64.whl

@Tweakmind : рдЗрд╕ рдкрд░ рдореЗрд░реЗ рдкрд╛рд╕ рд╡рд╛рдкрд╕ рдЖрдиреЗ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рджред рд╣рд╛рдВ, рдореБрдЭреЗ рдпрд╣ рдЙрдмрдВрдЯреВ рдХреЗ рд▓рд┐рдП рдХрд╛рдо рдХрд░ рд░рд╣рд╛ рд╣реИ, рдФрд░ рдЕрднреА рднреА рдореИрдХ рдУрдПрд╕рдПрдХреНрд╕ (10.12.6) рдХреЗ рд╕рд╛рде рдИрдЬреАрдкреАрдпреВ (1080 рдЯреАрдЖрдИ) рдХреЗ рд╕рд╛рде рдХреЛрдИ рднрд╛рдЧреНрдп рдирд╣реАрдВ рд╣реИред рдореЗрд░реЗ рджреНрд╡рд╛рд░рд╛ рдЕрдиреБрд╕рд░рдг рдХрд┐рдП рдЧрдП рд╕рднреА рд╕реНрд░реЛрддреЛрдВ рдХреЗ рд▓рд┐рдП, рд▓рдЧрднрдЧ 10-15 рдорд┐рдирдЯ рдХреЗ рдмрд╛рдж рдирд┐рд░реНрдорд╛рдг рд╡рд┐рдлрд▓ рд╣реЛ рдЧрдпрд╛ред рдпрд╣ рдмрд╣реБрдд рдЕрдЪреНрдЫрд╛ рд╣реЛрдЧрд╛ рдпрджрд┐ рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдкреНрд░рддрд┐рд▓рд┐рдкрд┐ рдкреНрд░рд╕реНрддреБрдд рдХрд░рдиреЗ рдпреЛрдЧреНрдп рд╕рдлрд▓рддрд╛ рд╣реИред рдЕрдЧреНрд░рд┐рдо рдореЗрдВ рдзрдиреНрдпрд╡рд╛рджред

@Tweakmind
рдореИрдВ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдХрд░рддрд╛ рд╣реВрдВ рдФрд░ рдлрд╝рд╛рдЗрд▓ рдХреЛ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рднреА рдХрд░рддрд╛ рд╣реВрдВ рд▓реЗрдХрд┐рди рдпрд╣ рдХрд╣рддрд╛ рд╣реИ:

pc2<strong i="7">@pc</strong>:~/Downloads/tensorflow$ bazel build --config=opt --config=cuda //tensorflow/tools/pip_package:build_pip_package --cxxopt="-D_GLIBCXX_USE_CXX11_ABI=0"
ERROR: Skipping '//tensorflow/tools/pip_package:build_pip_package': error loading package 'tensorflow/tools/pip_package': Encountered error while reading extension file 'cuda/build_defs.bzl': no such package '@local_config_cuda//cuda': Traceback (most recent call last):
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 1042
        _create_local_cuda_repository(repository_ctx)
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 905, in _create_local_cuda_repository
        _get_cuda_config(repository_ctx)
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 662, in _get_cuda_config
        _cudnn_version(repository_ctx, cudnn_install_base..., ...)
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 360, in _cudnn_version
        _find_cudnn_header_dir(repository_ctx, cudnn_install_base...)
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 612, in _find_cudnn_header_dir
        auto_configure_fail(("Cannot find cudnn.h under %s" ...))
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 129, in auto_configure_fail
        fail(("\n%sCuda Configuration Error:%...)))

Cuda Configuration Error: Cannot find cudnn.h under /usr/lib/x86_64-linux-gnu
WARNING: Target pattern parsing failed.
ERROR: error loading package 'tensorflow/tools/pip_package': Encountered error while reading extension file 'cuda/build_defs.bzl': no such package '@local_config_cuda//cuda': Traceback (most recent call last):
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 1042
        _create_local_cuda_repository(repository_ctx)
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 905, in _create_local_cuda_repository
        _get_cuda_config(repository_ctx)
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 662, in _get_cuda_config
        _cudnn_version(repository_ctx, cudnn_install_base..., ...)
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 360, in _cudnn_version
        _find_cudnn_header_dir(repository_ctx, cudnn_install_base...)
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 612, in _find_cudnn_header_dir
        auto_configure_fail(("Cannot find cudnn.h under %s" ...))
    File "/home/pc2/Downloads/tensorflow/third_party/gpus/cuda_configure.bzl", line 129, in auto_configure_fail
        fail(("\n%sCuda Configuration Error:%...)))

Cuda Configuration Error: Cannot find cudnn.h under /usr/lib/x86_64-linux-gnu
INFO: Elapsed time: 0.082s
FAILED: Build did NOT complete successfully (0 packages loaded)
    currently loading: tensorflow/tools/pip_package

рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдореИрдВ cuda рдФрд░ cudnn рдХреЛ рд╕рд╣реА рдврдВрдЧ рд╕реЗ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рддрд╛ рд╣реВрдВ
```
рдвреВрдБрдвреЗрдВ / usr | grep libcudnn
/usr/share/doc/libcudnn7
/usr/share/doc/libcudnn7/рдХреЙрдкреАрд░рд╛рдЗрдЯ
/usr/share/doc/libcudnn7/NVIDIA_SLA_cuDNN_Support.txt
/usr/share/doc/libcudnn7/changelog.Debian.gz
/usr/share/lintian/overrides/libcudnn7
/usr/lib/x86_64-linux-gnu/libcudnn.so.7.0.4
/usr/lib/x86_64-linux-gnu/libcudnn.so.7

```

@goodmangu , рдореИрдВ рд╕рдкреНрддрд╛рд╣рд╛рдВрдд рдореЗрдВ рдореИрдХреЛрдЬрд╝ рдмрд┐рд▓реНрдб рдкрд░ рдХрд╛рдо рдХрд░реВрдВрдЧрд╛ред

@nasergh , рдХреНрдпрд╛ рдЖрдкрдиреЗ cuDNN рд╕реНрдерд╛рдкрд┐рдд рдХрд┐рдпрд╛ рд╣реИ?

рдпрд╣рд╛рдБ cuDNN рдХреЗ рд▓рд┐рдП рдореЗрд░рд╛ рдЧрд╛рдЗрдб рд╣реИ рдЬрд┐рд╕рдореЗрдВ рд╕реНрд░реЛрдд рдФрд░ рдбреЙрдХреНрд╕ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ рдЬреЛ рдЗрдВрд╕реНрдЯреЙрд▓ рдХрд╛ рдкрд░реАрдХреНрд╖рдг рдХрд░рддреЗ рд╣реИрдВ:

cuDNN 7.0.4 рдлрд╝рд╛рдЗрд▓реЗрдВ рдбрд╛рдЙрдирд▓реЛрдб рдХрд░реЗрдВ

рдЖрдкрдХреЛ рдЕрдкрдиреЗ рдмреНрд░рд╛рдЙрдЬрд╝рд░ рдореЗрдВ рдЕрдкрдиреЗ рдПрдирд╡реАрдбрд┐рдпрд╛ рдбреЗрд╡рд▓рдкрд░ рдЦрд╛рддреЗ рдореЗрдВ рд▓реЙрдЧ рдЗрди рдХрд░рдирд╛ рд╣реЛрдЧрд╛

рдкреНрд░рддреНрдпреЗрдХ рд╣реИрд╢ рдХреА рдЬрд╛рдБрдЪ рдХрд░реЗрдВ

cd $HOME/Downloads
md5sum cudnn-9.0-linux-x64-v7.tgz && \
md5sum libcudnn7_7.0.4.31-1+cuda9.0_amd64.deb && \
md5sum libcudnn7-dev_7.0.4.31-1+cuda9.0_amd64.deb && \
md5sum libcudnn7-doc_7.0.4.31-1+cuda9.0_amd64.deb

рдЖрдЙрдЯрдкреБрдЯ рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдП:

fc8a03ac9380d582e949444c7a18fb8d cudnn-9.0-linux-x64-v7.tgz
e986f9a85fd199ab8934b8e4835496e2 libcudnn7_7.0.4.31-1+cuda9.0_amd64.deb
4bd528115e3dc578ce8fca0d32ab82b8 libcudnn7-dev_7.0.4.31-1+cuda9.0_amd64.deb
04ad839c937362a551eb2170afb88320 libcudnn7-doc_7.0.4.31-1+cuda9.0_amd64.deb

cuDNN 7.0.4 рдФрд░ рдкреБрд╕реНрддрдХрд╛рд▓рдп рд╕реНрдерд╛рдкрд┐рдд рдХрд░реЗрдВ

tar -xzvf cudnn-9.0-linux-x64-v7.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
sudo dpkg -i libcudnn7_7.0.4.31-1+cuda9.0_amd64.deb
sudo dpkg -i libcudnn7-dev_7.0.4.31-1+cuda9.0_amd64.deb
sudo dpkg -i libcudnn7-doc_7.0.4.31-1+cuda9.0_amd64.deb

cuDNN рд╕рддреНрдпрд╛рдкрд┐рдд рдХрд░рдирд╛

рдЙрдмрдВрдЯреВ 17.10 рдореЗрдВ рдЬреАрдПрдирдпреВ рдХрдВрдкрд╛рдЗрд▓рд░реНрд╕ рдХрд╛ рд╕рдВрд╕реНрдХрд░рдг 7+ рд╢рд╛рдорд┐рд▓ рд╣реИ
CUDA рд╕рдВрд╕реНрдХрд░рдг 6 . рд╕реЗ рдЕрдзрд┐рдХ рдХреЗ рд╕рд╛рде рд╕рдВрдЧрдд рдирд╣реАрдВ рд╣реИ
рд▓реМрдЯрд╛рдИ рдЧрдИ рддреНрд░реБрдЯрд┐ рд╣реИ:

рддреНрд░реБрдЯрд┐ -- рдЕрд╕рдорд░реНрдерд┐рдд GNU рд╕рдВрд╕реНрдХрд░рдг! 6 рдХреЗ рдмрд╛рдж рдХреЗ рдЬреАрд╕реАрд╕реА рд╕рдВрд╕реНрдХрд░рдг рд╕рдорд░реНрдерд┐рдд рдирд╣реАрдВ рд╣реИрдВ!

рдлрд┐рдХреНрд╕ - рд╕рдВрд╕реНрдХрд░рдг 6 рд╕реНрдерд╛рдкрд┐рдд рдХрд░реЗрдВ рдФрд░ CUDA рдмрд┐рди рдирд┐рд░реНрджреЗрд╢рд┐рдХрд╛ рдореЗрдВ рдкреНрд░рддреАрдХрд╛рддреНрдордХ рд▓рд┐рдВрдХ рдмрдирд╛рдПрдВ:

sudo apt-get install gcc-6 g++-6
sudo ln -sf /usr/bin/gcc-6 /usr/local/cuda/bin/gcc
sudo ln -sf /usr/bin/g++-6 /usr/local/cuda/bin/g++

рдЕрдм cuDNN рдХрд╛ рдкрд░реАрдХреНрд╖рдг рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП mnistCUDNN рдХрд╛ рдирд┐рд░реНрдорд╛рдг рдХрд░реЗрдВ

cp -r /usr/src/cudnn_samples_v7/ $HOME
cd $HOME/cudnn_samples_v7/mnistCUDNN
make clean && make
./mnistCUDNN

рдпрджрд┐ cuDNN рдареАрдХ рд╕реЗ рд╕реНрдерд╛рдкрд┐рдд рд╣реИ, рддреЛ рдЖрдк рджреЗрдЦреЗрдВрдЧреЗ:

рдкрд░реАрдХреНрд╖рд╛ рдЙрддреНрддреАрд░реНрдг рдХреА!

рдкреНрд░рд┐рдп @Tweakmind
рдЖрдкрдХрд╛ рддрд░реАрдХрд╛ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ рдЖрдкрдХреА рдорджрдж рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж (рдореИрдВ 3 рд╕рдкреНрддрд╛рд╣ рд╕реЗ рдЕрдзрд┐рдХ рд╕рдордп рд╕реЗ рдЯреЗрдВрд╕рд░ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░ рд░рд╣рд╛ рдерд╛ !!!)
рд╕рдорд╕реНрдпрд╛ рдпрд╣ рд╣реИ рдХрд┐ рдореИрдВ рдЗрд╕реЗ рдкрд╛рдпрдерди 3.6 рдкрд░ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рддрд╛ рд╣реВрдВ рдФрд░ рдЕрдм рдореБрдЭреЗ рдкреАрдЖрдИрдПрд▓ рдкреИрдХреЗрдЬ рдореЗрдВ рд╕рдорд╕реНрдпрд╛ рд╣реИ

Traceback (most recent call last):
  File "/home/pc2/venv/lib/python3.6/site-packages/keras/utils/data_utils.py", line 551, in get
    inputs = self.queue.get(block=True).get()
  File "/home/pc2/anaconda3/lib/python3.6/multiprocessing/pool.py", line 644, in get
    raise self._value
  File "/home/pc2/anaconda3/lib/python3.6/multiprocessing/pool.py", line 119, in worker
    result = (True, func(*args, **kwds))
  File "/home/pc2/venv/lib/python3.6/site-packages/keras/utils/data_utils.py", line 391, in get_index
    return _SHARED_SEQUENCES[uid][i]
  File "/home/pc2/venv/lib/python3.6/site-packages/keras/preprocessing/image.py", line 761, in __getitem__
    return self._get_batches_of_transformed_samples(index_array)
  File "/home/pc2/venv/lib/python3.6/site-packages/keras/preprocessing/image.py", line 1106, in _get_batches_of_transformed_samples
    interpolation=self.interpolation)
  File "/home/pc2/venv/lib/python3.6/site-packages/keras/preprocessing/image.py", line 345, in load_img
    raise ImportError('Could not import PIL.Image. '
ImportError: Could not import PIL.Image. The use of `array_to_img` requires PIL.

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
  File "<stdin>", line 7, in <module>
  File "/home/pc2/venv/lib/python3.6/site-packages/keras/legacy/interfaces.py", line 87, in wrapper
    return func(*args, **kwargs)
  File "/home/pc2/venv/lib/python3.6/site-packages/keras/models.py", line 1227, in fit_generator
    initial_epoch=initial_epoch)
  File "/home/pc2/venv/lib/python3.6/site-packages/keras/legacy/interfaces.py", line 87, in wrapper
    return func(*args, **kwargs)
  File "/home/pc2/venv/lib/python3.6/site-packages/keras/engine/training.py", line 2115, in fit_generator
    generator_output = next(output_generator)
  File "/home/pc2/venv/lib/python3.6/site-packages/keras/utils/data_utils.py", line 557, in get
    six.raise_from(StopIteration(e), e)
  File "<string>", line 3, in raise_from
StopIteration: Could not import PIL.Image. The use of `array_to_img` requires PIL.

рдореИрдВ рддрдХрд┐рдпрд╛ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░рддрд╛ рд╣реВрдВ рд▓реЗрдХрд┐рди рдпрд╣ рдорджрдж рдирд╣реАрдВ рдХрд░рддрд╛ рд╣реИ
рдореИрдВ рднреА рдЬрдирд╣рд┐рдд рдпрд╛рдЪрд┐рдХрд╛ рдХреЛ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░рддрд╛ рд╣реВрдВ рд▓реЗрдХрд┐рди

UnsatisfiableError: The following specifications were found to be in conflict:
  - pil -> python 2.6*
  - python 3.6*

@nasergh рдЖрдкрдХреЛ рдХреНрдпрд╛ рдорд┐рд▓рддрд╛ рд╣реИ:

pip install pillow

рдореЗрд░рд╛ рджрд┐рдЦрддрд╛ рд╣реИ:

~$ pip install pillow
Requirement already satisfied: pillow in ./anaconda3/lib/python3.6/site-packages

@nasergh , рдореБрдЭреЗ рджреБрд░реНрдШрдЯрдирд╛рдЧреНрд░рд╕реНрдд рд╣реЛрдиреЗ рдХреА рдЬрд░реВрд░рдд рд╣реИ, рд▓реЗрдХрд┐рди рдЬрдм рдореИрдВ

@goodmangu , рдореИрдВ рд╕рдкреНрддрд╛рд╣рд╛рдВрдд рдореЗрдВ рдореИрдХ рдмрд┐рд▓реНрдб рдирд╣реАрдВ рдХрд░ рдкрд╛рдКрдВрдЧрд╛ рдХреНрдпреЛрдВрдХрд┐ рдореЗрд░реЗ рдкрд╛рд╕ рдореЗрд░реЗ 2012 рдореИрдХ рдкреНрд░реЛ рддрдХ рдкрд╣реБрдВрдЪ рдирд╣реАрдВ рд╣реИред рдЙрдореНрдореАрдж рд╣реИ, рдЖрдк рдЕрднреА рдХреЗ рд▓рд┐рдП рдЙрдмрдВрдЯреВ рдХреЗ рд╕рд╛рде рдЕрдЪреНрдЫреЗ рд╣реИрдВред рдореБрдЭреЗ рдкрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдореЗрд░реЗ рд▓рд┐рдП рдЕрдЪреНрдЫрд╛ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред рдореБрдЭреЗ рдЗрд╕реЗ рдЕрдЧрд▓реЗ рд╕рдкреНрддрд╛рд╣рд╛рдВрдд рдореЗрдВ рд╡рд╛рдкрд╕ рдорд┐рд▓ рдЬрд╛рдирд╛ рдЪрд╛рд╣рд┐рдПред

@Tweakmind - рдзрдиреНрдпрд╡рд╛рдж! , рдХреНрдпрд╛ рдЖрдкрдиреЗ CUDA 9 рдФрд░ cuDNN 7 рдХреЗ рд╕рд╛рде рдХреЛрдИ рдкреНрд░рджрд░реНрд╢рди рд╡реГрджреНрдзрд┐ рджреЗрдЦреА рд╣реИ?

рдЗрд╕рдХреЗ рдЕрд▓рд╛рд╡рд╛, рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдиреАрдЪреЗ @Tweakmind рджреНрд╡рд╛рд░рд╛ рдЙрд▓реНрд▓рд┐рдЦрд┐рдд рдХреБрдЫ рдХрджрдо рдмреЗрдорд╛рдиреА рд╣реИрдВ, рдЖрдкрдХреЛ рдпрд╛ рддреЛ рдЗрд╕рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ:

tar -xzvf cudnn-9.0-linux-x64-v7.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

рдпрд╛

sudo dpkg -i libcudnn7_7.0.4.31-1+cuda9.0_amd64.deb
sudo dpkg -i libcudnn7-dev_7.0.4.31-1+cuda9.0_amd64.deb
sudo dpkg -i libcudnn7-doc_7.0.4.31-1+cuda9.0_amd64.deb

@ рдЧреБрдирд╛рди
CUDA 9.1.85 рдХреЛ рдХреБрдЫ рд╕рдордп рдкрд╣рд▓реЗ CuDNN 7.0.5 рдХреЗ рд╕рд╛рде nvcc рдХрдВрдкрд╛рдЗрд▓рд░ рдмрдЧ рдлрд┐рдХреНрд╕ рдХреЗ рд╕рд╛рде рдЬрд╛рд░реА рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред рдореБрдЭреЗ рдЖрд╢реНрдЪрд░реНрдп рд╣реИ рдХрд┐ рдХреНрдпрд╛ рдпрд╣ win10 рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рдХреЛ Tensorflow 1.4.1 рд╕рдВрдХрд▓рд┐рдд рдХрд░рдиреЗ рджреЗрддрд╛ рд╣реИ? рдпрд╣ рд╕рдордп рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рд╣реИред

NVIDIA рдХреЗ рд╕рд╛рде рд╣рдорд╛рд░реЗ рдкрддреНрд░рд╛рдЪрд╛рд░ рд╕реЗ, рдореБрдЭреЗ рдирд╣реАрдВ рд▓рдЧрддрд╛ рдХрд┐ 9.1 рдиреЗ рдЗрд╕ рдореБрджреНрджреЗ рдХреЛ рдареАрдХ рдХрд┐рдпрд╛ рд╣реИред
рд╣рд╛рд▓рд╛рдБрдХрд┐, рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдЙрдкрд╛рдп рд╣реИрдВред рд╕рдмрд╕реЗ рдкрд╣рд▓реЗ, рд╣рдореЗрдВ рдЗрд╕ рдкреАрдЖрд░ рдХреЛ рдИрдЬрд┐рди рдореЗрдВ рд╡рд┐рд▓рдп рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ:
https://bitbucket.org/eigen/eigen/pull-requests/351/win-nvcc/diff

рдлрд┐рд░ рд╣рдо рдЕрдкрдиреА рдИрдЬрд┐рди рдирд┐рд░реНрднрд░рддрд╛ рдХреЛ рдЕрдкрдбреЗрдЯ рдХрд░реЗрдВрдЧреЗ, рдЬреЛ CUDA9 рдХреЗ рд▓рд┐рдП рд╣рдорд╛рд░реЗ рд╕рднреА рдмрд┐рд▓реНрдб рдХреЛ рдареАрдХ рдХрд░рдирд╛ рдЪрд╛рд╣рд┐рдП

рдЬрдирд╕рдВрдкрд░реНрдХ рдЕрд╕реНрд╡реАрдХрд╛рд░ рдХрд░ рджрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ рд▓реЗрдХрд┐рди рдЗрд╕реЗ рдореИрдиреНрдпреБрдЕрд▓ рд░реВрдк рд╕реЗ рд╡рд┐рд▓рдп рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕реАрдо рд╣реИред рдХреНрдпрд╛ рд╣рдореЗрдВ рдИрдЬрд┐рди рд░рд┐рд▓реАрдЬ рдХреЗ рд▓рд┐рдП рдЗрдВрддрдЬрд╛рд░ рдХрд░рдирд╛ рд╣реЛрдЧрд╛ рдпрд╛ рдпрд╣ рд╕реВрддреНрд░реЛрдВ рджреНрд╡рд╛рд░рд╛ рдмрдирд╛рдпрд╛ рдЬрд╛ рд░рд╣рд╛ рд╣реИ?

рдХреВрд▓, рддреЛ рдпрд╣ рдирд╛рдЗрдЯрд▓реА рдкрд┐рдк рдкрд░ рд╣реЛрдЧрд╛?

@Tweakmind
рдореИрдВ рдЕрдЬрдЧрд░ 2.7 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдЯреЗрдВрд╕рд░ рдХреЛ рдлрд┐рд░ рд╕реЗ рдмрдирд╛рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░рддрд╛ рд╣реВрдВ
рд▓реЗрдХрд┐рди рдмреЗрдЬрд╝рд▓ рдмрд┐рд▓реНрдб рдореЗрдВ рдореБрдЭреЗ рдпрд╣ рддреНрд░реБрдЯрд┐ рдорд┐рд▓рддреА рд╣реИ
рдореИрдВ рднреА numpy рд╕реНрдерд╛рдкрд┐рдд рдХрд░рддрд╛ рд╣реВрдВ рд▓реЗрдХрд┐рди рдХреЛрдИ рдмрджрд▓рд╛рд╡ рдирд╣реАрдВред

bazel build --config=opt --config=cuda //tensorflow/tools/pip_package:build_pip_package --cxxopt="-D_GLIBCXX_USE_CXX11_ABI=0"
ERROR: /home/gh2/Downloads/tensorflow/util/python/BUILD:5:1: no such package '@local_config_python//': Traceback (most recent call last):
    File "/home/gh2/Downloads/tensorflow/third_party/py/python_configure.bzl", line 310
        _create_local_python_repository(repository_ctx)
    File "/home/gh2/Downloads/tensorflow/third_party/py/python_configure.bzl", line 274, in _create_local_python_repository
        _get_numpy_include(repository_ctx, python_bin)
    File "/home/gh2/Downloads/tensorflow/third_party/py/python_configure.bzl", line 257, in _get_numpy_include
        _execute(repository_ctx, [python_bin, "-c",..."], <2 more arguments>)
    File "/home/gh2/Downloads/tensorflow/third_party/py/python_configure.bzl", line 76, in _execute
        _python_configure_fail("\n".join([error_msg.strip() if ... ""]))
    File "/home/gh2/Downloads/tensorflow/third_party/py/python_configure.bzl", line 37, in _python_configure_fail
        fail(("%sPython Configuration Error:%...)))
Python Configuration Error: Problem getting numpy include path.
Traceback (most recent call last):
  File "<string>", line 1, in <module>
**ImportError: No module named numpy**
Is numpy installed?
 and referenced by '//util/python:python_headers'
ERROR: Analysis of target '//tensorflow/tools/pip_package:build_pip_package' failed; build aborted: Loading failed
INFO: Elapsed time: 10.826s
FAILED: Build did NOT complete successfully (26 packages loaded)
    currently loading: tensorflow/core ... (3 packages)
    Fetching http://mirror.bazel.build/.../~ooura/fft.tgz; 20,338b 5s
    Fetching http://mirror.bazel.build/zlib.net/zlib-1.2.8.tar.gz; 19,924b 5s
    Fetching http://mirror.bazel.build/.../giflib-5.1.4.tar.gz; 18,883b 5s

рдРрд╕рд╛ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ OSX рдХреЛ cuDNN рдХреЗ рд╕рдВрд╕реНрдХрд░рдг 7.0.5 рдореЗрдВ рд╢рд╛рдорд┐рд▓ рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред рдХреНрдпрд╛ рдХреЛрдИ рд╡рд┐рд╕реНрддреГрдд рдмрд╛рдд рдЬрд╛рдирддрд╛ рд╣реИ?

рдореБрдЭреЗ рдЕрднреА рднреА рд╡рд┐рдВрдбреЛрдЬ 10 рдореЗрдВ рдХрд╛рдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЯреЗрдВрд╕рд░рдлреНрд▓реЛ-рдЬреАрдкреАрдпреВ рдирд╣реАрдВ рдорд┐рд▓ рд░рд╣рд╛ рд╣реИ (рд╕реАрдпреВрдбреАрдП 9.0.176 рдФрд░ рдХреБрдбрди 7.0 рдХреЗ рд╕рд╛рде)ред
рдореИрдВрдиреЗ tensorflow рдФрд░ tensorflow-gpu рджреЛрдиреЛрдВ рдХреЛ рдЕрдирдЗрдВрд╕реНрдЯреЙрд▓ рдХрд░ рджрд┐рдпрд╛ рд╣реИ рдФрд░ рдЙрдиреНрд╣реЗрдВ рдкреБрдирдГ рдЗрдВрд╕реНрдЯреЙрд▓ рдХрд┐рдпрд╛ рд╣реИ (--no-cache-dir рдХреЗ рд╕рд╛рде eigen рд╡рд░реНрдХрдЕрд░рд╛рдЙрдВрдб рдХреЗ рд╕рд╛рде рдирд╡реАрдирддрдо рд╕рдВрд╕реНрдХрд░рдг рдХреЛ рдбрд╛рдЙрдирд▓реЛрдб рдХрд░рдирд╛ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП)ред рдЬрдм рдореИрдВ рджреЛрдиреЛрдВ рдХреЛ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рддрд╛ рд╣реВрдВ, рддреЛ рдореЗрд░рд╛ GPU рдкрд╣рдЪрд╛рдирд╛ рдирд╣реАрдВ рдЬрд╛рддрд╛ рд╣реИ:

InvalidArgumentError (рдЯреНрд░реЗрд╕рдмреИрдХ рдХреЗ рд▓рд┐рдП рдКрдкрд░ рджреЗрдЦреЗрдВ): рдСрдкрд░реЗрд╢рди 'random_uniform_1/sub' рдХреЗ рд▓рд┐рдП рдбрд┐рд╡рд╛рдЗрд╕ рдЕрд╕рд╛рдЗрди рдирд╣реАрдВ рдХрд░ рд╕рдХрддрд╛: рдСрдкрд░реЗрд╢рди рд╕реНрдкрд╖реНрдЯ рд░реВрдк рд╕реЗ / рдбрд┐рд╡рд╛рдЗрд╕ рдХреЛ рд╕реМрдВрдкрд╛ рдЧрдпрд╛ рдерд╛ рдЬреЙрдм: рд▓реЛрдХрд▓рд╣реЛрд╕реНрдЯ/рдкреНрд░рддрд┐рдХреГрддрд┐ : 0/ рдХрд╛рд░реНрдп: 0/рдбрд┐рд╡рд╛рдЗрд╕ : рд╕реАрдкреАрдпреВ: 0 ]ред рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░реЗрдВ рдХрд┐ рдбрд┐рд╡рд╛рдЗрд╕ рд╡рд┐рдирд┐рд░реНрджреЗрд╢ рдПрдХ рдорд╛рдиреНрдп рдбрд┐рд╡рд╛рдЗрд╕ рдХреЛ рд╕рдВрджрд░реНрднрд┐рдд рдХрд░рддрд╛ рд╣реИред

рдЬрдм рдореИрдВ рд╕рд┐рд░реНрдл рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ-рдЬреАрдкреАрдпреВ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рддрд╛ рд╣реВрдВ рддреЛ рдпрд╣ рдПрдХ рд▓рд╛рдкрддрд╛ рдбреАрдПрд▓ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рд╢рд┐рдХрд╛рдпрдд рдХрд░рддрд╛ рд╣реИ:

рдЖрдпрд╛рдд рддреНрд░реБрдЯрд┐: 'cudart64_80.dll' рдирд╣реАрдВ рдвреВрдБрдв рд╕рдХрд╛ред TensorFlow рдХреЗ рд▓рд┐рдП рдЖрд╡рд╢реНрдпрдХ рд╣реИ рдХрд┐ рдпрд╣ DLL рдЖрдкрдХреЗ %PATH% рдкрд░рд┐рд╡реЗрд╢ рдЪрд░ рдореЗрдВ рдирд╛рдорд┐рдд рдирд┐рд░реНрджреЗрд╢рд┐рдХрд╛ рдореЗрдВ рд╕реНрдерд╛рдкрд┐рдд рд╣реЛред рдЗрд╕ URL рд╕реЗ CUDA 8.0 рдбрд╛рдЙрдирд▓реЛрдб рдФрд░ рдЗрдВрд╕реНрдЯреЙрд▓ рдХрд░реЗрдВ: https://developer.nvidia.com/cuda-toolkit

рдЬреЛ рдЕрдЬреАрдм рд╣реИ рдХреНрдпреЛрдВрдХрд┐ рдореЗрд░рд╛ CUDA рд╕рдВрд╕реНрдХрд░рдг реп.реж рд╣реИ, рео.реж рдирд╣реАрдВ рд╣реИ, рдФрд░ рдкрд╣рдЪрд╛рдирд╛ рдЬрд╛рддрд╛ рд╣реИ (рдбрд┐рд╡рд╛рдЗрд╕рдХреНрд╡реЗрд░реА рдкрд░реАрдХреНрд╖рдг рдкрд╛рд╕ рд╣реБрдЖ)ред
рдореЗрд░рд╛ рдЕрдЬрдЧрд░ рд╕рдВрд╕реНрдХрд░рдг 3.6.3 рд╣реИред рдореИрдВ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ-рдЬреАрдкреАрдпреВ рдХрд╛ рдкрд░реАрдХреНрд╖рдг рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕реНрдкрд╛рдЗрдбрд░ (3.2.4) рдореЗрдВ рдЗрд╕ рдХреЛрдб рдХреЛ рдЪрд▓рд╛рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░ рд░рд╣рд╛ рд╣реВрдВред
рдореБрдЭрд╕реЗ рдХреНрдпрд╛ рдЫреВрдЯ рдЧрдпрд╛?

рдореИрдВ рдЬреАрдд 7 рдкрд░ рдмреЗрдЬрд╝рд▓ рджреНрд╡рд╛рд░рд╛ рд╕реНрд░реЛрдд рд╕реЗ рдирд┐рд░реНрдорд╛рдг рдХрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░ рд░рд╣рд╛ рд╣реВрдВ, рддреНрд░реБрдЯрд┐ рдкреНрд░рд╛рдкреНрдд рдХрд░реЗрдВ

рд╕реАрдкреАрдпреВ 'x64_windows' рдХреЗ рд▓рд┐рдП рдХреЛрдИ рдЯреВрд▓рдХреИрди рдирд╣реАрдВ

рдХреНрдпрд╛ рдХреЛрдИ whl рдмрдирд╛ рд╕рдХрддрд╛ рд╣реИ?

@ hadaev8 , рдореБрдЭреЗ рдорджрдж рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдмрд╣реБрдд рдЕрдзрд┐рдХ рдЬрд╛рдирдХрд╛рд░реА рдЪрд╛рд╣рд┐рдПред рдореИрдВ рдПрдХ whl рдкрд░ рдХрд╛рдо рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ рд▓реЗрдХрд┐рди рдЗрд╕рдХреА рднрд╛рд░реА рдирд┐рд░реНрднрд░рддрд╛ рд╣реЛрдЧреА рдФрд░ Win7 рдирд╣реАрдВ, рдПрдХ рдмрд╛рд░ рдЬрдм рдореИрдВ MacOS рдХреЛ рд╣рд▓ рдХрд░ рд▓реЗрддрд╛ рд╣реВрдВ, рддреЛ рдореИрдВ Win10 рдХреЛ рд╣рд▓ рдХрд░ рджреВрдВрдЧрд╛ред рдХрд┐рд╕реА рднреА рдорд╛рдорд▓реЗ рдореЗрдВ, рдЕрдкрдирд╛ рд╡рд┐рд╡рд░рдг рдкреЛрд╕реНрдЯ рдХрд░реЗрдВред

@ eeilon79 , рдореБрдЭреЗ рдЗрд╕реЗ Win10 рдХреЗ рддрд╣рдд рдлрд┐рд░ рд╕реЗ рдмрдирд╛рдирд╛ рд╣реЛрдЧрд╛ред рдореИрдВ рд╡рд░реНрддрдорд╛рди рдореЗрдВ рдореИрдХреЛрдЬрд╝ рдкрд░ рдзреНрдпрд╛рди рдХреЗрдВрджреНрд░рд┐рдд рдХрд░ рд░рд╣рд╛ рд╣реВрдВ рдХрд┐ рдЙрдмрдВрдЯреВ рд╣рд▓ рд╣реЛ рдЧрдпрд╛ рд╣реИред рдореИрдВ рд╡рд┐рди 10 рдкрд░ рд╡рд╛рдкрд╕ рдЖрдКрдВрдЧрд╛ред

@nasergh , рдХреНрдпрд╛ рдЕрдЬрдЧрд░ 2.7 рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ?

CUDA 8.0 рдФрд░ cuDNN 6.0 рдХреЗ рд╕рд╛рде, рдореИрдВрдиреЗ Win10 :: рдореЗрдВ Cuda GPU рдФрд░ AVX2 рд╕рдорд░реНрдерди рдХреЗ рд▓рд┐рдП рд╕реНрд░реЛрдд рд╕реЗ TensorFlow рд╕реНрдерд╛рдкрд┐рдд рдХрд┐рдпрд╛ рд╣реИ:

рдЖрд╡рд╢реНрдпрдХрддрд╛рдПрдВ:

* Windows 10 64-Bit
* Visual Studio 15 C++ Tools
* NVIDIA CUDA┬о Toolkit 8.0
* NVIDIA cuDNN 6.0 for CUDA 8.0
* Cmake
* Swig

рд╡рд┐рдЬреБрдЕрд▓ рд╕реНрдЯреВрдбрд┐рдпреЛ рдХрдореНрдпреБрдирд┐рдЯреА рдПрдбрд┐рд╢рди рдЕрдкрдбреЗрдЯ 3 w/Windows рдХрд┐рдЯ 10.0.10240.0 рд╕реНрдерд╛рдкрд┐рдд рдХрд░реЗрдВ
рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рдкрд╛рд▓рди рдХрд░реЗрдВ: https://github.com/philferriere/dlwin (рдзрдиреНрдпрд╡рд╛рдж рдлрд┐рд▓)

рд╡рд░реНрдЪреБрдЕрд▓ рдбреНрд░рд╛рдЗрд╡ N рдмрдирд╛рдПрдВ: рд╕реНрдкрд╖реНрдЯрддрд╛ рдХреЗ рд▓рд┐рдП
рдореЗрд░рд╛ рд╕реБрдЭрд╛рд╡ рд╣реИ рдХрд┐ рдЗрди рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ C: рдпрд╛ рдЕрдкрдиреА рдкрд╕рдВрдж рдХреА рдбреНрд░рд╛рдЗрд╡ рд╕реЗ рдПрдХ рдирд┐рд░реНрджреЗрд╢рд┐рдХрд╛ рдмрдирд╛рдПрдВ рдФрд░ N: рдмрдирд╛рдПрдВ (2GB рдорд┐рдирдЯ):
https://technet.microsoft.com/en-us/library/gg318052 (v=ws.10).aspx

рдХреВрдбрд╛ 8.0 64-рдмрд┐рдЯ рд╕реНрдерд╛рдкрд┐рдд рдХрд░реЗрдВ
https://developer.nvidia.com/cuda-downloads (рд▓реЗрдЧреЗрд╕реА рддрдХ рдиреАрдЪреЗ рд╕реНрдХреНрд░реЙрд▓

рдХреВрдбрд╛ 8.0 . рдХреЗ рд▓рд┐рдП cuDNN 6.0 рд╕реНрдерд╛рдкрд┐рдд рдХрд░реЗрдВ
https://developer.nvidia.com/rdp/cudnn-download
рдХреНрдпреВрдбрд╛ рдлреЛрд▓реНрдбрд░ рдХреЛ рдЬрд╝рд┐рдк рд╕реЗ N:\ рдкрд░ рд░рдЦреЗрдВ рдФрд░ cuDNN-6 рдХрд╛ рдирд╛рдо рдмрджрд▓реЗрдВ

рд╕реАрдПрдордХреЗ рд╕реНрдерд╛рдкрд┐рдд рдХрд░реЗрдВ
https://cmake.org/files/v3.10/cmake-3.10.0-rc5-win64-x64.msi

рд╕реНрд╡рд┐рдЧ рд╕реНрдерд╛рдкрд┐рдд рдХрд░реЗрдВ (рд╕реНрд╡рд┐рдЧрд╡рд┐рди-3.0.12)
https://sourceforge.net/projects/swig/files/swigwin/swigwin-3.0.12/swigwin-3.0.12.zip

cntk-py36

``` conda create --name cntk-py36 python=3.6 numpy scipy h5py jupyter
рд╕рдХреНрд░рд┐рдп cntk-py36
рдкрд╛рдЗрдк рд╕реНрдерд╛рдкрд┐рдд рдХрд░реЗрдВ https://cntk.ai/PythonWheel/GPU/cntk-2.2-cp36-cp36m-win_amd64.whl
рдкрд╛рдпрдерди-рд╕реА "рдЖрдпрд╛рдд рд╕реАрдПрдирдЯреАрдХреЗ; рдкреНрд░рд┐рдВрдЯ (рд╕реАрдПрдирдЯреАрдХреЗ .__ рд╕рдВрд╕реНрдХрд░рдг __)"
рдХреЛрдВрдбрд╛ pygpu рд╕реНрдерд╛рдкрд┐рдд рдХрд░реЗрдВ
рдкрд╛рдЗрдк рд╕реНрдерд╛рдкрд┐рдд keras

#### Remove old tensorflow in Tools if it exists
```cd C:\Users\%USERNAME%\Tools\
move tensorflow tensorflow.not
git clone --recursive https://github.com/tensorflow/tensorflow.git
cd C:\Users\%USERNAME%\Tools\tensorflow\tensorflow\contrib\cmake
Edit CMakeLists.txt

рдЗрди рдкрд░ рдЯрд┐рдкреНрдкрдгреА рдХрд░реЗрдВ:

# if (tensorflow_OPTIMIZE_FOR_NATIVE_ARCH)
#   include(CheckCXXCompilerFlag)
#   CHECK_CXX_COMPILER_FLAG("-march=native" COMPILER_OPT_ARCH_NATIVE_SUPPORTED)
#   if (COMPILER_OPT_ARCH_NATIVE_SUPPORTED)
#     set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -march=native")
#   endif()
# endif()

рдЗрдиреНрд╣реЗрдВ рдЬреЛрдбрд╝реЗрдВ:

if (tensorflow_OPTIMIZE_FOR_NATIVE_ARCH)
  include(CheckCXXCompilerFlag)
  CHECK_CXX_COMPILER_FLAG("-march=native" COMPILER_OPT_ARCH_NATIVE_SUPPORTED)
  if (COMPILER_OPT_ARCH_NATIVE_SUPPORTED)
    set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -march=native")
  else()
    CHECK_CXX_COMPILER_FLAG("/arch:AVX2" COMPILER_OPT_ARCH_AVX_SUPPORTED)
    if(COMPILER_OPT_ARCH_AVX_SUPPORTED)
      set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} /arch:AVX2")
    endif()
  endif()
endif()

рдПрдордХреЗрдбреАрдЖрдИрдЖрд░ рдмрд┐рд▓реНрдб рдФрд░ рд╕реАрдбреА рдмрд┐рд▓реНрдб

"C:\Program Files (x86)\Microsoft Visual Studio 14.0\VC\bin\amd64\vcvars64.bat"

cmake .. -A x64 -DCMAKE_BUILD_TYPE=Release ^
-DSWIG_EXECUTABLE=N:/swigwin-3.0.12/swig.exe ^
-DPYTHON_EXECUTABLE=N:/Anaconda3/python.exe ^
-DPYTHON_LIBRARIES=N:/Anaconda3/libs/python36.lib ^
-Dtensorflow_ENABLE_GPU=ON ^
-DCUDNN_HOME="n:\cuDNN-6" ^
-Dtensorflow_WIN_CPU_SIMD_OPTIONS=/arch:AVX2

-- рдЗрд╕рдХреЗ рд▓рд┐рдП рднрд╡рди: рд╡рд┐рдЬреБрдЕрд▓ рд╕реНрдЯреВрдбрд┐рдпреЛ 14 2015
- рд╡рд┐рдВрдбреЛрдЬ 10.0.16299 рдХреЛ рд▓рдХреНрд╖рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╡рд┐рдВрдбреЛрдЬ рдПрд╕рдбреАрдХреЗ рд╕рдВрд╕реНрдХрд░рдг 10.0.14393.0 рдХрд╛ рдЪрдпрди рдХрд░рдирд╛ред
- рд╕реА рд╕рдВрдХрд▓рдХ рдкрд╣рдЪрд╛рди MSVC 19.0.24225.1 рд╣реИ
-- CXX рдХрдВрдкрд╛рдЗрд▓рд░ рдХреА рдкрд╣рдЪрд╛рди MSVC 19.0.24225.1 рд╣реИ
- рдХрд╛рдо рдХрд░ рд░рд╣реЗ рд╕реА рдХрдВрдкрд╛рдЗрд▓рд░ рдХреА рдЬрд╛рдВрдЪ рдХрд░реЗрдВ: рд╕реА:/рдкреНрд░реЛрдЧреНрд░рд╛рдо рдлрд╛рдЗрд▓реНрд╕ (x86)/рдорд╛рдЗрдХреНрд░реЛрд╕реЙрдлреНрдЯ рд╡рд┐рдЬреБрдЕрд▓ рд╕реНрдЯреВрдбрд┐рдпреЛ 14.0/рд╡реАрд╕реА/рдмрд┐рди/x86_amd64/cl.exe
- рдХрд╛рдо рдХрд░ рд░рд╣реЗ рд╕реА рдХрдВрдкрд╛рдЗрд▓рд░ рдХреА рдЬрд╛рдВрдЪ рдХрд░реЗрдВ: рд╕реА:/рдкреНрд░реЛрдЧреНрд░рд╛рдо рдлрд╛рдЗрд▓реНрд╕ (x86)/рдорд╛рдЗрдХреНрд░реЛрд╕реЙрдлреНрдЯ рд╡рд┐рдЬреБрдЕрд▓ рд╕реНрдЯреВрдбрд┐рдпреЛ 14.0/рд╡реАрд╕реА/рдмрд┐рди/x86_amd64/cl.exe - рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ
- рд╕реА рдХрдВрдкрд╛рдЗрд▓рд░ рдПрдмреАрдЖрдИ рдЬрд╛рдирдХрд╛рд░реА рдХрд╛ рдкрддрд╛ рд▓рдЧрд╛рдирд╛
- рд╕реА рдХрдВрдкрд╛рдЗрд▓рд░ рдПрдмреАрдЖрдИ рдЬрд╛рдирдХрд╛рд░реА рдХрд╛ рдкрддрд╛ рд▓рдЧрд╛рдирд╛ - рдХрд┐рдпрд╛ рдЧрдпрд╛
- рдХрд╛рдо рдХрд░ рд░рд╣реЗ CXX рдХрдВрдкрд╛рдЗрд▓рд░ рдХреЗ рд▓рд┐рдП рдЬрд╛рдБрдЪ рдХрд░реЗрдВ: C:/Program Files (x86)/Microsoft Visual Studio 14.0/VC/bin/x86_amd64/cl.exe
-- рдХрд╛рдо рдХрд░ рд░рд╣реЗ CXX рдХрдВрдкрд╛рдЗрд▓рд░ рдХреЗ рд▓рд┐рдП рдЬрд╛рдБрдЪ рдХрд░реЗрдВ: C:/Program Files (x86)/Microsoft Visual Studio 14.0/VC/bin/x86_amd64/cl.exe -- рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ
- CXX рдХрдВрдкрд╛рдЗрд▓рд░ ABI рдЬрд╛рдирдХрд╛рд░реА рдХрд╛ рдкрддрд╛ рд▓рдЧрд╛рдирд╛
- CXX рдХрдВрдкрд╛рдЗрд▓рд░ ABI рдЬрд╛рдирдХрд╛рд░реА рдХрд╛ рдкрддрд╛ рд▓рдЧрд╛рдирд╛ - рдХрд┐рдпрд╛ рдЧрдпрд╛
- CXX рд╕рдВрдХрд▓рди рд╕реБрд╡рд┐рдзрд╛рдУрдВ рдХрд╛ рдкрддрд╛ рд▓рдЧрд╛рдирд╛
- CXX рд╕рдВрдХрд▓рди рд╕реБрд╡рд┐рдзрд╛рдУрдВ рдХрд╛ рдкрддрд╛ рд▓рдЧрд╛рдирд╛ - рдХрд┐рдпрд╛ рдЧрдпрд╛
-- рдкрд░реАрдХреНрд╖рдг рдХрд░рдирд╛ COMPILER_OPT_ARCH_NATIVE_SUPPORTED
-- рдкрд░реАрдХреНрд╖рдг рдХрд░рдирд╛ COMPILER_OPT_ARCH_NATIVE_SUPPORTED - рд╡рд┐рдлрд▓
-- рдкрд░реАрдХреНрд╖рдг рдХрд░ рд░рд╣рд╛ рд╣реИ COMPILER_OPT_ARCH_AVX_SUPPORTED
-- рдкрд░реАрдХреНрд╖рдг рдХрд░рдирд╛ COMPILER_OPT_ARCH_AVX_SUPPORTED - рд╕рдлрд▓рддрд╛
-- рдкрд░реАрдХреНрд╖рдг рдХрд░рдирд╛ COMPILER_OPT_WIN_CPU_SIMD_SUPPORTED
-- рдкрд░реАрдХреНрд╖рдг рдХрд░рдирд╛ COMPILER_OPT_WIN_CPU_SIMD_SUPPORTED - рд╕рдлрд▓рддрд╛
-- CUDA рдорд┐рд▓рд╛: C:/рдкреНрд░реЛрдЧреНрд░рд╛рдо рдлрд╝рд╛рдЗрд▓реЗрдВ/NVIDIA GPU рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рдЯреВрд▓рдХрд┐рдЯ/CUDA/v8.0 (рдЙрдкрдпреБрдХреНрдд рд╕рдВрд╕реНрдХрд░рдг "8.0" рдорд┐рд▓рд╛, рдиреНрдпреВрдирддрдо рдЖрд╡рд╢реНрдпрдХ "8.0" рд╣реИ)
- PythonInterp рдорд┐рд▓рд╛: C:/Users/%USERNAME%/Anaconda3/python.exe (рдорд┐рд▓рд╛ рд╕рдВрд╕реНрдХрд░рдг "3.6.3")
- PythonLibs рдорд┐рд▓рд╛: C:/Users/%USERNAME%/Anaconda3/libs/python36.lib (рдорд┐рд▓рд╛ рд╕рдВрд╕реНрдХрд░рдг "3.6.3")
-- SWIG рдорд┐рд▓рд╛: C:/Users/%USERNAME%/Tools/swigwin-3.0.12/swig.exe (рдорд┐рд▓рд╛ рд╕рдВрд╕реНрдХрд░рдг "3.0.12")
-- рд╡рд┐рдиреНрдпрд╛рд╕ рдХрд┐рдпрд╛ рдЧрдпрд╛
-- рдЬрдирд░реЗрдЯ рдХрд░ рд░рд╣рд╛ рд╣реИ
-- рдмрд┐рд▓реНрдб рдлрд╛рдЗрд▓ рдХреЛ рд▓рд┐рдЦрд╛ рдЧрдпрд╛ рд╣реИ: C:/Users/%USERNAME%/Tools/tensorflow/tensorflow/contrib/cmake/build

MSBuild /p:Configuration=Release tf_python_build_pip_package.vcxproj

@Tweakmind
рдЕрдЬрдЧрд░ 3.6, рдорд╛рд╕реНрдЯрд░ рд╕реЗ рдЕрдВрддрд┐рдо рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ, рдХреНрдпреВрдбрд╛ 9.0, рдХреНрдпреВрдбреАрдПрди 7.0.5 рдХреНрдпреВрдбрд╛ 9.0 рдХреЗ рд▓рд┐рдП, рдмреЗрд╕рд▓ рдФрд░ рд╕реНрд╡рд┐рдЧ рд▓реЛрдб рдЖрдЬред

@Tweakmind рдХреНрдпрд╛ рдЖрдк рдорд╛рд╕реНрдЯрд░ рдХреЗ рд╕рд╛рде рдирд┐рд░реНрдорд╛рдг рдХрд░рддреЗ рд╣реИрдВ рдпрд╛?

@Tweakmind
рдХреНрдпрд╛ рдЖрдк рд╡рд┐рдВрдбреЛрдЬрд╝ рдкрд░ cuda 9 cudnn 7 рдХреЗ рд╕рд╛рде рдирд┐рд░реНрдорд╛рдг рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ рдФрд░ .whl рд╕рд╛рдЭрд╛ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ?

@Tweakmind

рдХреНрдпрд╛ рдЖрдк cuda 9 cudnn 7 рдХреЗ рд╕рд╛рде win 10 рдкрд░ рдирд┐рд░реНрдорд╛рдг рдХрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдирд╣реАрдВ рдХрд░рддреЗ рд╣реИрдВ?

рдЖрдкрдХреА рд╡рд┐рд╢реЗрд╖рдЬреНрдЮрддрд╛ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж!

@hadaev8 @alc5978
pip install -U tf-nightly-gpu рдЕрдм 20171221 рдХрд╛ рдПрдХ win10 рдмрд┐рд▓реНрдб рджреЗрддрд╛ рд╣реИ, рдЬреЛ CUDA 9.0 рдФрд░ CuDNN 7.0.5 рдХреЗ рд╕рд╛рде TF 1.5 рдмреАрдЯрд╛ рдкрд░ рдЖрдзрд╛рд░рд┐рдд рд╣реИред рдореИрдВрдиреЗ рдХрд▓ рд░рд╛рдд рдЗрд╕реЗ рдЪрд▓рд╛рдпрд╛, рдпрд╣ рдареАрдХ рд╣реИред рдЕрдм рд╣рдореЗрдВ 12x CUDA рдХрд░реНрдиреЗрд▓ рд▓реЙрдиреНрдЪ рдЧрддрд┐ рдХреЗ рд▓рд┐рдП CUDA 9.1 рдкрд░ рдЬрд╛рдирд╛ рдЪрд╛рд╣рд┐рдПред Tensorflow windows рд╕рдорд░реНрдерди рдмрд╣реБрдд рдзреАрдорд╛ рдФрд░ рд░рдХреНрддрд╣реАрди рд╣реИред рд╕реНрдерд┐рд░ рдЖрдзрд┐рдХрд╛рд░рд┐рдХ рдирд┐рд░реНрдорд╛рдг ASAP рдХреА рдкреЗрд╢рдХрд╢ рдХреА рдЬрд╛рдиреА рдЪрд╛рд╣рд┐рдПред рдореИрдВ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдЬрдирд╡рд░реА рдХреЗ рдЕрдВрдд рддрдХ CUDA 9.1 рдХреЗ рд╕рд╛рде рдЬрд╛рд░реА рд╣реЛрдиреЗ рдХреЗ рд▓рд┐рдП Tensorflow 1.5 рд╕реНрдерд┐рд░ рдХреЗ рд▓рд┐рдП рд╣реВрдБ?

ubuntu рдкрд░ cuda 9.1 рдФрд░ cudnn7.05 рдХреЗ рд╕рд╛рде рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдХреА рдЪрд░рдгрдмрджреНрдз рд╕реНрдерд╛рдкрдирд╛ рдХреЗ рд▓рд┐рдП http://www.python36.com/install-tensorflow141-gpu/ рдкрд░ рдЬрд╛рдПрдВред рдФрд░ рд╡рд┐рдВрдбреЛрдЬрд╝ рдкрд░ cuda 9.1 рдФрд░ cudnn 7.0.5 рдХреЗ рд╕рд╛рде tensorflow рдХреА рдЪрд░рдгрдмрджреНрдз рд╕реНрдерд╛рдкрдирд╛ рдХреЗ рд▓рд┐рдП http://www.python36.com/install-tensorflow-gpu-windows рдкрд░

рдпрд╣ 2018 рд╣реИ, рд▓рдЧрднрдЧ рдЬрдирд╡рд░реА рдХрд╛ рдЕрдВрдд рдФрд░ рд╡рд┐рдВрдбреЛрдЬ 10 рдкрд░ CUDA9.1 рдФрд░ CuDNN7 рдХреЗ рд╕рд╛рде TF рдХреА рд╕реНрдерд╛рдкрдирд╛ рдЕрднреА рднреА рдирд╣реАрдВ рд╣реБрдИ рд╣реИ?

1.5, CUDA 9 + cuDNN 7 рдХреЗ рд╕рд╛рде

рдореИрдВрдиреЗ CUDA 9.1 рдкрд░ рдЪрд░реНрдЪрд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдореБрджреНрджрд╛ рдЦреЛрд▓рд╛ред

12x рдХрд░реНрдиреЗрд▓ рд▓реЙрдиреНрдЪ рдЧрддрд┐ рдореЗрдВ рд╕реБрдзрд╛рд░ 12x рд╕рдВрдЦреНрдпрд╛ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдЕрдзрд┐рдХ рдмрд╛рд░реАрдХ рд╣реИред 12x рдХрд╛ рд╢реАрд░реНрд╖ рдЫреЛрд░ рдмрд╣реБрдд рд╕рд╛рд░реЗ рддрд░реНрдХреЛрдВ рдХреЗ рд╕рд╛рде ops рдХреЗ рд▓рд┐рдП рд╣реИ рдФрд░ рдбрд┐рд╡рд╛рдЗрд╕ рдбреНрд░рд╛рдЗрд╡рд░ рдЕрдкрдЧреНрд░реЗрдб рдХреЗ рдХрд╛рд░рдг рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рдХреЗ рд▓рд┐рдП рд╡реНрдпрд╡рдзрд╛рди рдЕрдзрд┐рдХ рд╣реИред рдореБрдЭреЗ рдЙрдореНрдореАрдж рд╣реИ рдХрд┐ рдирд┐рдХрдЯ рднрд╡рд┐рд╖реНрдп рдореЗрдВ рдПрдХ "рдЪреИрдирд▓" рдкрд░реАрдХреНрд╖рдг 9.1 рд╣реЛрдЧрд╛ рдФрд░ рдпрд╣ рдкрддрд╛ рдЪрд▓реЗрдЧрд╛ рдХрд┐ рдЗрд╕ рдкреНрд░рддрд┐рдорд╛рди рд╕реЗ рдХреИрд╕реЗ рдирд┐рдкрдЯрд╛ рдЬрд╛рдПред

рдореБрдЭреЗ рдЖрд╢рд╛ рд╣реИ рдХрд┐ рдпрд╣ рдЕрдВрдд рдореЗрдВ CUDA 9.1 рд╣реЛрдЧрд╛, 9.0 рдирд╣реАрдВред

рдореБрдЭреЗ рдЙрдореНрдореАрдж рд╣реИ рдХрд┐ рдпрд╣ рдЕрдВрдд рдореЗрдВ CUDA 9.1 рд╣реЛрдЧрд╛, 9.0 рднреА рдирд╣реАрдВред

рдореБрдЭреЗ рдпрдХреАрди рд╣реИ рдХрд┐ рдпрд╣ рдЕрдВрдд рдореЗрдВ CUDA 9.1 рд╣реЛрдЧрд╛, 9.0 рднреА рдирд╣реАрдВ, рд╣реИ рдирд╛? :)

@ViktorM @Magicfeng007 @alc5978
9.1 рдзрд╛рдЧрд╛ рдпрд╣рд╛рдВ рд╣реИ рдпрджрд┐ рдЖрдк рд╕рд╛рде рдЪрд▓рдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВ, рд╣рд╛рд▓рд╛рдВрдХрд┐ рдпрд╣ рдореВрд▓ рд░реВрдк рд╕реЗ рдмрдВрдж рд╣реИред рдпрджрд┐ рдЖрдк рд╕реВрдЪреАрдмрджреНрдз рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ рдХрд┐ рдЖрдк 9.1 рдХреНрдпреЛрдВ рдЪрд╛рд╣рддреЗ рд╣реИрдВ рдЬреЛ рдЙрдкрдпреЛрдЧреА рд╣реЛрдЧрд╛, рдФрд░ рдЖрдкрдХрд╛ рд╕реЗрдЯрдЕрдк/рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди рдХреНрдпрд╛ рд╣реИред рдПрдХ рдмреЗрдВрдЪрдорд╛рд░реНрдХ рдЬрд┐рд╕реЗ рдЖрдкрдиреЗ рдкрд░рдлреЗрдХреНрдЯ рдмреВрд╕реНрдЯ рджрд┐рдЦрд╛рддреЗ рд╣реБрдП рдЪрд▓рд╛рдпрд╛ рдерд╛, рд╡рд╣ рддрддреНрдХрд╛рд▓ рдЬрд░реВрд░рдд рдХреЛ рд╕рдордЭрдиреЗ рдореЗрдВ рднреА рдЙрдкрдпреЛрдЧреА рд╣реЛрдЧрд╛ред NVIDIA рдХреЗ рд╕рд╛рде рдмреИрдардХреЛрдВ рдореЗрдВ, рд╣рдо рджреЛрдиреЛрдВ рд╕рд╣рдордд рдереЗ рдХрд┐ 9.1 рдХреЛ рдбрд┐рдлрд╝реЙрд▓реНрдЯ рдмрдирд╛рдиреЗ рдХреА рддрддреНрдХрд╛рд▓ рдЖрд╡рд╢реНрдпрдХрддрд╛ рдирд╣реАрдВ рд╣реИред рдЬреЛ рддрдм рд▓реЛрдЧреЛрдВ рдХреЛ рдЕрдкрдиреЗ рдбреНрд░рд╛рдЗрд╡рд░реЛрдВ рдХреЛ рдлрд┐рд░ рд╕реЗ рдЕрдкрдЧреНрд░реЗрдб рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдордЬрдмреВрд░ рдХрд░реЗрдЧрд╛ред

рдЕрдЧрд░ рдХрд┐рд╕реА рдХреЛ рдЕрднреА рднреА TensorFlow рдмреИрдХрдПрдВрдб рдХреЗ рд╕рд╛рде Keras рдЬреИрд╕реА рд╕рдорд╕реНрдпрд╛рдУрдВ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝ рд░рд╣рд╛ рд╣реИ рдЬреЛ GPU рдХрд╛ рдЙрдкрдпреЛрдЧ рдирд╣реАрдВ рдХрд░ рд░рд╣рд╛ рд╣реИ .... рдмрд╕ рдЗрд╕ рдкреГрд╖реНрда рдореЗрдВ рджрд┐рдП рдЧрдП рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рдкрд╛рд▓рди рдХрд░реЗрдВред рдпрд╣ рдЕрджреНрдпрддрди рд╣реИ рдФрд░ 100% рд╕рд╣реА рдврдВрдЧ рд╕реЗ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред
https://research.wmz.ninja/articles/2017/01/configuring-gpu-accelerated-keras-in-windows-10.html

рдирдорд╕реНрддреЗ
рдореИрдВ рдЖрдЬ CUDA 9.0 рдФрд░ cuDNN 7.0.5 рд▓рд╛рдЗрдмреНрд░реЗрд░реА рдХреЗ рд╕рд╛рде http://www.python36.com/install-tensorflow-using-official-pip-pacakage/ рдХреЗ рд╕рд╛рде win10 рдкрд░ tensorflow-gpu 1.6.0rc1 рд╕реНрдерд╛рдкрд┐рдд рдХрд░рддрд╛ рд╣реВрдВ

рд╕рдм рдареАрдХ рд▓рдЧрддрд╛ рд╣реИ

рдореИрдВрдиреЗ рдирд╡реАрдирддрдо TensorFlow (v1.5+) рдХреЗ рд▓рд┐рдП NVIDIA GPU рдкреВрд░реНрд╡рд╛рдкреЗрдХреНрд╖рд╛рдПрдБ (CUDA-9.0 рдФрд░ cuDNN-7.0) рдХреЗ рд▓рд┐рдП рдПрдХ рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдмрдирд╛рдИ, рдпрд╣рд╛рдБ рд▓рд┐рдВрдХ рд╣реИ ред

рдХреНрдпрд╛ рдпрд╣ рдкреГрд╖реНрда рдЙрдкрдпреЛрдЧреА рдерд╛?
0 / 5 - 0 рд░реЗрдЯрд┐рдВрдЧреНрд╕

рд╕рдВрдмрдВрдзрд┐рдд рдореБрджреНрджреЛрдВ

aerointern16 picture aerointern16  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

fobus42 picture fobus42  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

ahmed-touati picture ahmed-touati  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

ppwwyyxx picture ppwwyyxx  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

jricheimer picture jricheimer  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ