Tensorflow: Как ΡΠΊΠΎΠΌΠΏΠΈΠ»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Ρ‚Π΅Π½Π·ΠΎΡ€Π½Ρ‹ΠΉ ΠΏΠΎΡ‚ΠΎΠΊ с использованиСм SSE4.1, SSE4.2 ΠΈ AVX.

Π‘ΠΎΠ·Π΄Π°Π½Π½Ρ‹ΠΉ Π½Π° 3 ΠΌΠ°Ρ€. 2017  Β·  44ΠšΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΈ  Β·  Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ: tensorflow/tensorflow

Волько Ρ‡Ρ‚ΠΎ запустил Ρ‚Π΅Π½Π·ΠΎΡ€Π½Ρ‹ΠΉ ΠΏΠΎΡ‚ΠΎΠΊ. Π’Π΅ΠΏΠ΅Ρ€ΡŒ столкнулся с этой ошибкой.

Π’ настоящСС врСмя ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Mac Yosemite, Π·Π°Π³Ρ€ΡƒΠΆΠ΅Π½ Ρ‚Π΅Π½Π·ΠΎΡ€Π½Ρ‹ΠΉ ΠΏΠΎΡ‚ΠΎΠΊ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ pip3 Ρ‡Π΅Ρ€Π΅Π· anaconda, с использованиСм python 3.5.

W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use SSE4.1 instructions, but these are available on your machine and could speed up CPU computations.

W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use SSE4.2 instructions, but these are available on your machine and could speed up CPU computations.

W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use AVX instructions, but these are available on your machine and could speed up CPU computations.

Π˜Ρ‚Π°ΠΊ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Ρƒ anaconda Π΅ΡΡ‚ΡŒ ΡΠΏΠ΅Ρ†ΠΈΠ°Π»ΡŒΠ½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ ΠΊΠΎΠΌΠ°Π½Π΄, ΠΊΠ°ΠΊ Π·Π°ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ Ρ‚Π΅Π½Π·ΠΎΡ€Π½Ρ‹ΠΉ ΠΏΠΎΡ‚ΠΎΠΊ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ Π² SSE4.1, SSE4.2 ΠΈ AVX Ρ‡Π΅Ρ€Π΅Π· систСму ΠΊΠΎΠΌΠ°Π½Π΄ anaconda? Π― Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π½Π΅ понимаю, ΠΊΠ°ΠΊ это ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ.

Π‘Π°ΠΌΡ‹ΠΉ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹ΠΉ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ

Π­Ρ‚ΠΎ Π½Π΅ ошибка, Π° просто прСдупрСТдСния, говорящиС ΠΎ Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Ссли Π²Ρ‹ создадитС TensorFlow ΠΈΠ· исходного ΠΊΠΎΠ΄Π°, ΠΎΠ½ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ быстрСС Π½Π° вашСм ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Π΅.

ВАК вопрос ΠΎΠ± этом: http://stackoverflow.com/questions/41293077/how-to-compile-tensorflow-with-sse4-2-and-avx-instructions
Руководство TensorFlow ΠΏΠΎ сборкС ΠΈΠ· исходного ΠΊΠΎΠ΄Π°: https://www.tensorflow.org/install/install_sources

ВсС 44 ΠšΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ

Π­Ρ‚ΠΎ Π½Π΅ ошибка, Π° просто прСдупрСТдСния, говорящиС ΠΎ Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Ссли Π²Ρ‹ создадитС TensorFlow ΠΈΠ· исходного ΠΊΠΎΠ΄Π°, ΠΎΠ½ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ быстрСС Π½Π° вашСм ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Π΅.

ВАК вопрос ΠΎΠ± этом: http://stackoverflow.com/questions/41293077/how-to-compile-tensorflow-with-sse4-2-and-avx-instructions
Руководство TensorFlow ΠΏΠΎ сборкС ΠΈΠ· исходного ΠΊΠΎΠ΄Π°: https://www.tensorflow.org/install/install_sources

Как заявил @Carmezim, это просто ΠΏΡ€Π΅Π΄ΡƒΠΏΡ€Π΅ΠΆΠ΄Π°ΡŽΡ‰ΠΈΠ΅ сообщСния.
Для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΠ· Π²Π°ΡˆΠΈΡ… ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌ Π²Ρ‹ ΡƒΠ²ΠΈΠ΄ΠΈΡ‚Π΅ ΠΈΡ… Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΠ΄ΠΈΠ½ Ρ€Π°Π·.
И, ΠΊΠ°ΠΊ говорится Π² прСдупрСТдСниях, Π²Ρ‹ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΠΊΠΎΠΌΠΏΠΈΠ»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ TF с этими Ρ„Π»Π°Π³Π°ΠΌΠΈ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π² Ρ‚ΠΎΠΌ случаС, Ссли Π²Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ TF быстрСС.

Π’Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚ΡŒ Π½Π°ΡˆΠ΅ΠΌΡƒ руководству, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡƒΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚ΡŒ TensorFlow ΠΈΠ· исходников для компиляции TF с ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠΎΠΉ Π½Π°Π±ΠΎΡ€ΠΎΠ² инструкций SIMD.

Π₯ΠΎΡ€ΠΎΡˆΠΎ спасибо. Π― понял.

Π•ΡΡ‚ΡŒ Π»ΠΈ способ Π·Π°ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ это Π·Π°ΠΌΠΎΠ»Ρ‡Π°Ρ‚ΡŒ?

ЕдинствСнный способ Π·Π°Π³Π»ΡƒΡˆΠΈΡ‚ΡŒ эти ΠΏΡ€Π΅Π΄ΡƒΠΏΡ€Π΅ΠΆΠ΄Π°ΡŽΡ‰ΠΈΠ΅ сообщСния - ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ΠΈΠ· исходных ΠΊΠΎΠ΄ΠΎΠ² с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π° --config opt .

Π§Ρ‚ΠΎ-Ρ‚ΠΎ Π²Ρ€ΠΎΠ΄Π΅ Β«ΠΎΠ±Ρ…ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΠΏΡƒΡ‚ΠΈΒ» (хотя ΠΈ Π½Π΅ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½Π½ΠΎΠ³ΠΎ), ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ пСрСнаправляСт сообщСния Π² Unix / Linux / OSX:
python myscript.py 2> / dev / null

@CGTheLegend @ocampesato Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΡƒΡŽ срСды TF TF_CPP_MIN_LOG_LEVEL ΠΈ это Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ:

  • По ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ 0 , ΠΎΡ‚ΠΎΠ±Ρ€Π°ΠΆΠ°ΡŽΡ‚ΡΡ всС ΠΆΡƒΡ€Π½Π°Π»Ρ‹.
  • Π§Ρ‚ΠΎΠ±Ρ‹ ΠΎΡ‚Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΆΡƒΡ€Π½Π°Π»Ρ‹ INFO установитС для Π½Π΅Π³ΠΎ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ 1
  • WARNINGS Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ, 2
  • ΠΈ для Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΠΈ ΠΆΡƒΡ€Π½Π°Π»ΠΎΠ² ERROR установитС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ 3

Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅Π΅, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΡ‚ΠΊΠ»ΡŽΡ‡ΠΈΡ‚ΡŒ прСдупрСТдСния:

import os
os.environ['TF_CPP_MIN_LOG_LEVEL']='2'
import tensorflow as tf

@gunan @mrry Π― Π²ΠΈΠ΄Π΅Π» ΠΌΠ½ΠΎΠ³ΠΎ людСй, заинтСрСсованных Π² ΠΎΡ‚ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠΈ ΠΏΡ€Π΅Π΄ΡƒΠΏΡ€Π΅ΠΆΠ΄Π΅Π½ΠΈΠΉ, Π΅ΡΡ‚ΡŒ Π»ΠΈ интСрСс Π² Π΄ΠΎΠ±Π°Π²Π»Π΅Π½ΠΈΠΈ Ρ‚Π°ΠΊΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ Π² Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Ρ‹?

Π― ΡƒΡΡ‚Π°Π½Π°Π²Π»ΠΈΠ²Π°ΡŽ ΠΈΠ· руководства ΠΏΠΎ установкС tensorflow, Ρ‚Π°ΠΊΠΆΠ΅ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ» это ΠΏΡ€Π΅Π΄ΡƒΠΏΡ€Π΅ΠΆΠ΄Π΅Π½ΠΈΠ΅.

pip3 install --upgrade tensorflow

@jadeydi ВмСсто Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΊΠΎΠΌΠΏΠΈΠ»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΠ· исходного ΠΊΠΎΠ΄Π°, "pip" просто Ρ‚Π°ΠΊΠΆΠ΅ установитС Π΄Π²ΠΎΠΈΡ‡Π½Ρ‹ΠΉ Ρ„Π°ΠΉΠ», Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π²Ρ‹ ΠΏΠΎ-ΠΏΡ€Π΅ΠΆΠ½Π΅ΠΌΡƒ ΠΏΠΎΠ»ΡƒΡ‡Π°Π»ΠΈ эти прСдупрСТдСния.

Π― Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ‡Ρ‚ΠΎ скомпилировал Ρ‚Π΅Π½Π·ΠΎΡ€Π½Ρ‹ΠΉ ΠΏΠΎΡ‚ΠΎΠΊ с ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠΎΠΉ SSE4.1 SSE4.2 AVX AVX2 ΠΈ FMA. Π‘Π±ΠΎΡ€ΠΊΠ° доступна здСсь: https://github.com/lakshayg/tensorflow-build . НадСюсь, это Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΠΎΠ»Π΅Π·Π½ΠΎ.

ΠŸΡ€ΠΈΠ²Π΅Ρ‚ @lakshayg , спасибо, Ρ‡Ρ‚ΠΎ подСлились. Π’ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, Π²Ρ‹ Π·Π°Ρ…ΠΎΡ‚ΠΈΡ‚Π΅ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΡ‚ΡŒ https://github.com/yaroslavvb/tensorflow-community-wheels

ΠŸΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ Π½Π°ΠΌΠ½ΠΎΠ³ΠΎ быстрСС сборка ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ со стандартной pip install tensorflow-gpu Π½Π° Ubuntu? Π­Ρ‚ΠΎ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ быстрСС для вычислСний CPU ΠΈΠ»ΠΈ Π΅ΡΡ‚ΡŒ ΠΊΠ°ΠΊΠΈΠ΅-Ρ‚ΠΎ прСимущСства для вычислСний Π½Π° GPU?

http://www.anandtech.com/show/2362/5

Π­Ρ‚ΠΎ появилось Π² Google ΠΈ содСрТит Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΡ€ΠΈΠ»ΠΈΡ‡Π½Ρ‹Π΅ тСхничСскиС подробности.

test - это ΠΊΠΎΠ΄ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ DivX с использованиСм VirtualDub 1.7.6 ΠΈ DivX 6.7. SSE4 появляСтся, Ссли Π²Ρ‹ Ρ€Π΅ΡˆΠΈΡ‚Π΅ Π²ΠΊΠ»ΡŽΡ‡ΠΈΡ‚ΡŒ Π½ΠΎΠ²Ρ‹ΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΏΠΎΠ»Π½ΠΎΠ³ΠΎ поиска для ΠΎΡ†Π΅Π½ΠΊΠΈ двиТСния, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ускоряСтся двумя инструкциями SSE4: MPSADBW ΠΈ PHMINPOSUW . ИдСя состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΎΡ†Π΅Π½ΠΊΠ° двиТСния (выяснСниС Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΎΠΈΠ·ΠΎΠΉΠ΄Π΅Ρ‚ Π² ΠΏΠΎΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… ΠΊΠ°Π΄Ρ€Π°Ρ… Π²ΠΈΠ΄Π΅ΠΎ) Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ большого количСства вычислСний сумм Π°Π±ΡΠΎΠ»ΡŽΡ‚Π½Ρ‹Ρ… разностСй, Π° Ρ‚Π°ΠΊΠΆΠ΅ нахоТдСния ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² этих вычислСний. Π˜Π½ΡΡ‚Ρ€ΡƒΠΊΡ†ΠΈΡ SSE2 PSADBW ΠΌΠΎΠΆΠ΅Ρ‚ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚ΡŒ Π΄Π²Π΅ суммы разностСй ΠΈΠ· ΠΏΠ°Ρ€Ρ‹ 16B Ρ†Π΅Π»Ρ‹Ρ… чисСл Π±Π΅Π· Π·Π½Π°ΠΊΠ°; инструкция SSE4 MPSADBW ΠΌΠΎΠΆΠ΅Ρ‚ Π²Ρ‹ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ восСмь.

...

На нашСм QX9650 ΠΏΠΎΠ»Π½Ρ‹ΠΉ поиск с Π²ΠΊΠ»ΡŽΡ‡Π΅Π½Π½Ρ‹ΠΌ SSE4 выполняСтся ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ Π½Π° 45% быстрСС, Ρ‡Π΅ΠΌ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ с SSE2.

Π’Π΅ΠΏΠ΅Ρ€ΡŒ Π²Ρ‹ Π·Π½Π°Π΅Ρ‚Π΅, ΠΊΠ°ΠΊΠΈΠ΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ tensorflow, Π½ΠΎ, Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, ΠΎΠ½ΠΈ Ρ‚ΠΎΠ³ΠΎ стоят.

Π˜Π·Π²ΠΈΠ½ΠΈΡ‚Π΅, Π½ΠΎ ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ Π²Ρ‹Π²ΠΎΠ΄ΠΈΡ‚ΡŒ Π²ΠΎ всСх сцСнариях TF - это Π½Π΅Π»Π΅ΠΏΠΎ. Π‘ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ людСй, вСроятно, Π½Π΅ ΠΊΠΎΠΌΠΏΠΈΠ»ΠΈΡ€ΡƒΡŽΡ‚ TF ΠΈΠ· исходников ΠΈ Π½Π΅ хотят этого Π΄Π΅Π»Π°Ρ‚ΡŒ.

@ TomAshley303 , это

Π― ΠΏΡ€ΠΎΡˆΠ΅Π» Ρ‡Π΅Ρ€Π΅Π· вСсь процСсс ... Π‘Ρ‹Π» прямолинСйным ΠΈ совсСм Π½Π΅ Π·Π°Π½ΠΈΠΌΠ°Π» Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ. Π­Ρ‚ΠΎ Π½Π΅ ΠΎΠ±Ρ‹Ρ‡Π½Ρ‹ΠΉ ΠΊΠΎΡˆΠΌΠ°Ρ€ для cmake C ++.

Π£ мСня Π΅ΡΡ‚ΡŒ нСбольшой сцСнарий bash для компиляции TF ΠΏΠΎΠ΄ MacOS / Linux. Он динамичСски вычисляСт характСристики ЦП ΠΈ ΠΏΠΎΠΌΠ΅Ρ‰Π°Π΅Ρ‚ ΠΈΡ… Π² качСствС ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² сборки. Π”ΡƒΠΌΠ°Π» ΡΠΎΠ·Π΄Π°Ρ‚ΡŒ PR, Π½ΠΎ ΠΏΠ°ΠΏΠΊΠΈ со скриптами (Ρ…Π΅Π»ΠΏΠ΅Ρ€Π°ΠΌΠΈ) для Π»ΠΎΠΊΠ°Π»ΡŒΠ½Ρ‹Ρ… сборок Π½Π΅ нашСл, Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ci_build. Если Π΅ΡΡ‚ΡŒ смысл, я сдСлаю это

ΡΡƒΡ‚ΡŒ
https://gist.github.com/venik/9ba962c8b301b0e21f99884cbd35082f

ΠŸΡ€ΠΈΠΌΠ΅Ρ‡Π°Π½ΠΈΠ΅ для @gunan

Π― столкнулся с этой ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΎΠΉ, ΠΊΠΎΠ³Π΄Π° Π²ΠΏΠ΅Ρ€Π²Ρ‹Π΅ устанавливал TensorFlow. Π’Π΅ΠΏΠ΅Ρ€ΡŒ ΠΌΠ½Π΅ Π½ΡƒΠΆΠ½ΠΎ снова Π²Ρ‹ΡΡΠ½ΠΈΡ‚ΡŒ, ΠΊΠ°ΠΊ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ эту ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ, ΠΏΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ я ΡƒΡΡ‚Π°Π½Π°Π²Π»ΠΈΠ²Π°ΡŽ TensorFlow Π½Π° Π½ΠΎΠ²ΡƒΡŽ ΠΌΠ°ΡˆΠΈΠ½Ρƒ. Π­Ρ‚ΠΎ головная боль, Π° прСдоставлСнная Π²Π°ΠΌΠΈ докумСнтация совсСм Π½Π΅ ясна.

Π’ΠΎΡ‚ Ρ„Π°ΠΊΡ‚, Ρ‡Ρ‚ΠΎ ΠΌΠ½Π΅ приходится это Π΄Π΅Π»Π°Ρ‚ΡŒ со своСй стороны, смСшон ΠΈ ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ Π² Π±Π΅ΡˆΠ΅Π½ΡΡ‚Π²ΠΎ. БСсполСзно Π΄Π΅Π»Π°Ρ‚ΡŒ Ρ‡Ρ‚ΠΎ-Ρ‚ΠΎ доступным ΠΈΠ· pip / pip3, Ссли ΠΎΠ½ Π·Π°Ρ‚Π΅ΠΌ просто Π²Ρ‹Π΄Π°Π΅Ρ‚ Π²Π°ΠΌ прСдупрСТдСния Π² Ρ‚Π΅Ρ‡Π΅Π½ΠΈΠ΅ всСго дня.

По ΠΊΡ€Π°ΠΉΠ½Π΅ΠΉ ΠΌΠ΅Ρ€Π΅, Π²Ρ‹ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΠΎΡ‚Ρ€Π΅Π΄Π°ΠΊΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ https://www.tensorflow.org/install/install_sources ΠΈ явно ΠΎΠ±ΡŠΡΡΠ½ΠΈΡ‚ΡŒ, ΠΊΠ°ΠΊ ΡΠΊΠΎΠΌΠΏΠΈΠ»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π΅Π³ΠΎ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ SSE / AVX.

РСшСниС, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ сработало для мСня: Π²Π²Π΅Π΄ΠΈΡ‚Π΅ Β«-mavx -msse4.1 -msse4.2Β» ΠΏΡ€ΠΈ появлСнии запроса Π² процСссС настройки (ΠΏΡ€ΠΈ запускС ./configure).

НСуТСли слоТно Π΄ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ это Π² инструкции ΠΏΠΎ установкС?

Бпасибо, согласно ΠΎΡ‚Π²Π΅Ρ‚Ρƒ @Carmezim , я ΠΏΠΎΠ»ΡƒΡ‡Π°ΡŽ Π²Π΅Ρ€ΡΠΈΡŽ для ускорСния процСссора Π½Π° основС avx ΠΈ sse. Π― тСстировал fast-rcnn (resnet-101) Π½Π° Intel. Π‘Ρ‚ΠΎΠΈΠΌΠΎΡΡ‚ΡŒ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ увСличиваСтся ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ Π½Π° 30%, это Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΏΠΎΠ»Π΅Π·Π½ΠΎ.

Π’Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΎΡ‚ΠΊΠ»ΡŽΡ‡ΠΈΡ‚ΡŒ прСдупрСТдСния.
ΠŸΡ€ΠΎΡΡ‚ΠΎ Π΄ΠΎΠ±Π°Π²ΡŒΡ‚Π΅ эти ΠΊΠΎΠ΄Ρ‹ Π²Π²Π΅Ρ€Ρ…Ρƒ.
ΠΈΠΌΠΏΠΎΡ€Ρ‚ ОБ
os.environ ['TF_CPP_MIN_LOG_LEVEL'] = '2'
ΠΈΠΌΠΏΠΎΡ€Ρ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Ρ‚Π΅Π½Π·ΠΎΡ€Π½Ρ‹ΠΉ ΠΏΠΎΡ‚ΠΎΠΊ ΠΊΠ°ΠΊ tf
Как ΡƒΠΏΠΎΠΌΠΈΠ½Π°Π»ΠΎΡΡŒ здСсь: https://stackoverflow.com/a/44984610

Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π»Π΅Π³ΠΊΠΎ Π΄ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΡΠΊΡƒΡŽ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΡƒΡŽ Π² ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΡƒΡŽ систСмной срСды:
TF_CPP_MIN_LOG_LEVEL, value = 2. Π—Π°Ρ‚Π΅ΠΌ пСрСзапуститС IDE.

НСльзя ΠΎΠΆΠΈΠ΄Π°Ρ‚ΡŒ ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠΉ
ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ, Ссли Π²Ρ‹ сравнитС Π΄Π²Π° ΠΊΠΎΠ΄Π°, Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‰ΠΈΠ΅ (Π² ΠΈΠ΄Π΅Π°Π»Π΅) Π½Π° 100% Π½Π° графичСских процСссорах, ΠΎΠ΄ΠΈΠ½ Π½Π° экзСмплярС Tensorflow, скомпилированном с ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠΎΠΉ SIMD, Π° Π΄Ρ€ΡƒΠ³ΠΎΠΉ Π±Π΅Π· Π½Π΅Π³ΠΎ, Π²Ρ‹ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ Ρ‚Π΅ ΠΆΠ΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ с Ρ‚ΠΎΡ‡ΠΊΠΈ зрСния скорости (ΠΈ, надСюсь, ΠΈ Π² числовом ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠΈ).

IC: \ tf_jenkinshome \ workspace \ rel-win \ M \ windows \ PY \ 36 \ tensorflow \ core \ platform \ cpu_feature_guard.cc: 137] Π’Π°Ρˆ ЦП ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Π΅Ρ‚ инструкции, для использования ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… этот Π΄Π²ΠΎΠΈΡ‡Π½Ρ‹ΠΉ Ρ„Π°ΠΉΠ» TensorFlow Π½Π΅ Π±Ρ‹Π» скомпилирован: AVX AVX2

Как Π²ΠΈΠ΄ΠΈΡ‚Π΅, ΠΏΡ€Π΅Π΄ΡƒΠΏΡ€Π΅ΠΆΠ΄Π΅Π½ΠΈΠ΅ Ρ‚Π°ΠΊΠΆΠ΅ относится ΠΊ ΠΌΠΎΠ΅ΠΉ систСмС, Π½ΠΎ Π² этом случаС я Π½Π΅ ΠΌΠΎΠ³Ρƒ ΠΏΠΎΠ½ΡΡ‚ΡŒ Β«Π―Β» Π² Π½Π°Ρ‡Π°Π»Π΅ прСдупрСТдСния, поэтому Π² этом случаС ΠΊΡ‚ΠΎ-Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΌΠ½Π΅ ΠΏΠΎΠΌΠΎΡ‡ΡŒ.

Β«IΒ» - это просто сокращСниС ΠΎΡ‚ Β«INFOΒ». Π”Ρ€ΡƒΠ³ΠΈΠ΅ Π±ΡƒΠΊΠ²Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π²Ρ‹ Π²ΠΈΠ΄ΠΈΡ‚Π΅, это E для ошибки ΠΈΠ»ΠΈ F для Ρ„Π°Ρ‚Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ.

Π˜Ρ‚Π°ΠΊ, я установил с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ conda. Если я Ρ…ΠΎΡ‡Ρƒ Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ ΡΠΊΠΎΠΌΠΏΠΈΠ»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΠ· исходного ΠΊΠΎΠ΄Π°, Π° Π½Π΅ Π²ΠΎΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ ΠΊΠ°ΠΊΠΈΠΌ-Π»ΠΈΠ±ΠΎ ΠΏΠΎΠ²Ρ‹ΡˆΠ΅Π½ΠΈΠ΅ΠΌ скорости, Π½ΡƒΠΆΠ½ΠΎ Π»ΠΈ ΠΌΠ½Π΅ Ρ‡Ρ‚ΠΎ-Π½ΠΈΠ±ΡƒΠ΄ΡŒ Π΄Π΅Π»Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡƒΠ΄Π°Π»ΠΈΡ‚ΡŒ мою conda install tenorflow? Или ΠΎΠ½ находится Π² своСм собствСнном малСньком ΠΊΠΎΠ½Ρ‚Π΅ΠΉΠ½Π΅Ρ€Π΅, ΠΈ я ΠΌΠΎΠ³Ρƒ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎ ΡΠΊΠΎΠΌΠΏΠΈΠ»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΠ· исходного ΠΊΠΎΠ΄Π°?

Π― установил DeepSpeech, Π° Ρ‚Π°ΠΊΠΆΠ΅ сСрвСр DeepSpeech. ПошСл, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π·Π°ΠΏΡƒΡΡ‚ΠΈΡ‚ΡŒ сСрвСр, ΠΈ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ» сообщСниС ΠΎΠ± ошибкС - Β«2018-01-17 08: 21: 49.120154: F tensorflow / core / platform / cpu_feature_guard.cc: 35] Π‘ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ° TensorFlow Π±Ρ‹Π»Π° скомпилирована для использования инструкций AVX2, Π½ΠΎ это Π½Π΅ Ρ‚Π°ΠΊ. t доступно Π½Π° вашСй машинС.
ΠŸΡ€Π΅Ρ€Π²Π°Π½ΠΎ (ядро ΡΠ±Ρ€ΠΎΡˆΠ΅Π½ΠΎ) "

ΠžΡ‡Π΅Π²ΠΈΠ΄Π½ΠΎ, ΠΌΠ½Π΅ Π½ΡƒΠΆΠ½ΠΎ ΡΠΊΠΎΠΌΠΏΠΈΠ»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ TensorFlow Π½Π° Ρ‚ΠΎΠΌ ΠΆΠ΅ ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Π΅. Π•ΡΡ‚ΡŒ Π»ΠΈ список Π³Π΄Π΅-Π½ΠΈΠ±ΡƒΠ΄ΡŒ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΠΎΠΏΠΎΡΡ‚Π°Π²ΠΈΡ‚ΡŒ Kubuntu 17.10.1 ΠΈ HP Probook 4330S, поТалуйста?

ΠŸΠΎΡ‡Π΅ΠΌΡƒ Π½Π΅Ρ‚ компиляторов windows? Π£ мСня Ρ‚Π΅ ΠΆΠ΅ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹, Π½ΠΎ вмСсто ΠΎΡ‚ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΡ ΠΏΡ€Π΅Π΄ΡƒΠΏΡ€Π΅ΠΆΠ΄Π΅Π½ΠΈΠΉ ΠΎ Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ я Ρ…ΠΎΡ‚Π΅Π» Π±Ρ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ свой графичСский процСссор, Ρƒ мСня Ρ‚Π°ΠΊΠΆΠ΅ Π΅ΡΡ‚ΡŒ Π²ΠΈΠ΄Π΅ΠΎΠΊΠ°Ρ€Ρ‚Π° ΠΈ, Π° Π½Π΅ Nvidia. Π§Ρ‚ΠΎ ΠΌΠ½Π΅ Π΄Π΅Π»Π°Ρ‚ΡŒ?

* Π£ мСня Π½Π΅Ρ‚ Π²ΠΈΠ΄Π΅ΠΎΠΊΠ°Ρ€Ρ‚Ρ‹ Nvidia, Ρƒ мСня Π΅ΡΡ‚ΡŒ ΠΈ ΠΎΠ΄Π½Π°, Ρ‡Ρ‚ΠΎ ΠΌΠ½Π΅ Π΄Π΅Π»Π°Ρ‚ΡŒ?

* Π’ΠΈΠ΄Π΅ΠΎΠΊΠ°Ρ€Ρ‚Π° AMD .. Π°Π²Ρ‚ΠΎΠ·Π°ΠΌΠ΅Π½Π°

Π­Ρ‚ΠΎ Π½Π΅ просто прСдупрСТдСния, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ это ΡƒΠ±ΠΈΠ²Π°Π΅Ρ‚ процСсс Π½Π° ΠΌΠΎΠΈΡ… тСстовых Π±Π»ΠΎΠΊΠ°Ρ…. ΠŸΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ я Ρ‚Π°ΠΊΠΆΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽ графичСскиС процСссоры AMD, я создал ΠΊΠΎΡ€ΠΎΠ±ΠΊΡƒ Tenorflow Digital Ocean, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠΏΡ€ΠΎΠ±ΠΎΠ²Π°Ρ‚ΡŒ, Π½ΠΎ, ΠΏΠΎΡ…ΠΎΠΆΠ΅, Ρ‚Π°ΠΌ Ρ‚ΠΎΠΆΠ΅ Π½Π΅Ρ‚ ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠΈ графичСских процСссоров, ΠΈ это с трСском проваливаСтся.

`# Job id 0

Π—Π°Π³Ρ€ΡƒΠ·ΠΊΠ° hparams ΠΈΠ· / home / science / tf-demo / models / nmt-chatbot / model / hparams

сохранСниС hparams Π² / home / science / tf-demo / models / nmt-chatbot / model / hparams
сохранСниС hparams Π² / home / science / tf-demo / models / nmt-chatbot / model / best_bleu / hparams
Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ = scaled_luong
Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅_Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π° = стандарт
batch_size = 128
beam_width = 10
best_bleu = 0
best_bleu_dir = / главная / Π½Π°ΡƒΠΊΠ° / tf-demo / models / nmt-chatbot / model / best_bleu
check_special_token = ΠŸΡ€Π°Π²Π΄Π°
colocate_gradients_with_ops = Π’Π΅Ρ€Π½ΠΎ
decay_factor = 1.0
decay_steps = 10000
dev_prefix = / главная / Π½Π°ΡƒΠΊΠ° / tf-demo / ΠΌΠΎΠ΄Π΅Π»ΠΈ / nmt-chatbot / data / tst2012
Π²Ρ‹ΠΏΠ°Π΄Π΅Π½ΠΈΠ΅ = 0,2
encoder_type = bi
eos =
epoch_step = 0
Forgot_bias = 1.0
infer_batch_size = 32
init_op = ΡƒΠ½ΠΈΡ„ΠΎΡ€ΠΌΠ°
init_weight = 0,1
learning_rate = 0,001
learning_rate_decay_scheme =
length_penalty_weight = 1.0
log_device_placement = Π›ΠΎΠΆΡŒ
max_gradient_norm = 5.0
max_train = 0
ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ = ['bleu']
num_buckets = 5
num_embeddings_partitions = 0
num_gpus = 1
num_layers = 2
num_residual_layers = 0
num_train_steps = 500000
num_translations_per_input = 10
num_units = 512
ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ‚ΠΎΡ€ = Π°Π΄Π°ΠΌ
out_dir = / главная / Π½Π°ΡƒΠΊΠ° / tf-demo / ΠΌΠΎΠ΄Π΅Π»ΠΈ / nmt-chatbot / модСль
output_attention = ΠŸΡ€Π°Π²Π΄Π°
override_loaded_hparams = Π’Π΅Ρ€Π½ΠΎ
pass_hidden_state = Π’Π΅Ρ€Π½ΠΎ
random_seed = НСт
остаток = Π›ΠΎΠΆΡŒ
share_vocab = Π›ΠΎΠΆΡŒ
sos =
source_reverse = Π›ΠΎΠΆΡŒ
src = ΠΎΡ‚
src_max_len = 50
src_max_len_infer = НСт
src_vocab_file = / главная / Π½Π°ΡƒΠΊΠ° / tf-demo / ΠΌΠΎΠ΄Π΅Π»ΠΈ / nmt-chatbot / data / vocab.from
src_vocab_size = 15003
start_decay_step = 0
steps_per_external_eval = НСт
steps_per_stats = 100
subword_option =
test_prefix = / главная / Π½Π°ΡƒΠΊΠ° / tf-demo / ΠΌΠΎΠ΄Π΅Π»ΠΈ / nmt-chatbot / data / tst2013
tgt = to
tgt_max_len = 50
tgt_max_len_infer = НСт
tgt_vocab_file = / главная / Π½Π°ΡƒΠΊΠ° / tf-demo / ΠΌΠΎΠ΄Π΅Π»ΠΈ / nmt-chatbot / data / vocab.to
tgt_vocab_size = 15003
time_major = Π’Π΅Ρ€Π½ΠΎ
train_prefix = / главная / Π½Π°ΡƒΠΊΠ° / tf-demo / ΠΌΠΎΠ΄Π΅Π»ΠΈ / nmt-chatbot / data / train
unit_type = lstm
Dictionary_prefix = / главная / Π½Π°ΡƒΠΊΠ° / tf-Π΄Π΅ΠΌΠΎ / ΠΌΠΎΠ΄Π΅Π»ΠΈ / nmt-Ρ‡Π°Ρ‚-Π±ΠΎΡ‚ / Π΄Π°Π½Π½Ρ‹Π΅ / ΡΠ»ΠΎΠ²Π°Ρ€ΡŒ
Warmup_scheme = t2t
Warmup_steps = 0

созданиС Π³Ρ€Π°Ρ„ΠΈΠΊΠ° ΠΏΠΎΠ΅Π·Π΄ΠΎΠ² ...

num_bi_layers = 1, num_bi_residual_layers = 0
ячСйка 0 LSTM, Forgot_bias = 1 DropoutWrapper, dropout = 0.2 DeviceWrapper, device = / gpu: 0
ячСйка 0 LSTM, Forgot_bias = 1 DropoutWrapper, dropout = 0.2 DeviceWrapper, device = / gpu: 0
ячСйка 0 LSTM, Forgot_bias = 1 DropoutWrapper, dropout = 0.2 DeviceWrapper, device = / gpu: 0
ячСйка 1 LSTM, Forgot_bias = 1 DropoutWrapper, dropout = 0.2 DeviceWrapper, device = / gpu: 0
ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ обучСния = 0,001, шаги_Ρ€Π°Π·ΠΌΠΈΠ½ΠΊΠΈ = 0, схСма_Ρ€Π°Π·ΠΌΠΈΠ½ΠΊΠΈ = t2t
decay_scheme =, start_decay_step = 0, decay_steps 10000, decay_factor 1

ΠžΠ±ΡƒΡ‡Π°Π΅ΠΌΡ‹Π΅ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅

влоТСния / ΠΊΠΎΠ΄ΠΈΡ€ΠΎΠ²Ρ‰ΠΈΠΊ / ΠΊΠΎΠ΄ΠΈΡ€ΠΎΠ²Ρ‰ΠΈΠΊ_встраиваний: 0 , (15003, 512),
влоТСния / Π΄Π΅ΠΊΠΎΠ΄Π΅Ρ€ / встраиваниС_ Π΄Π΅ΠΊΠΎΠ΄Π΅Ρ€: 0 , (15003, 512),
dynamic_seq2seq / encoder / twoirectional_rnn / fw / basic_lstm_cell / kernel: 0 , (1024, 2048), / устройство: GPU : 0
dynamic_seq2seq / encoder / twoirectional_rnn / fw / basic_lstm_cell / bias: 0 , (2048,), / устройство: GPU : 0
dynamic_seq2seq / ΠΊΠΎΠ΄ΠΈΡ€ΠΎΠ²Ρ‰ΠΈΠΊ / Π΄Π²ΡƒΠ½Π°ΠΏΡ€Π°Π²Π»Π΅Π½Π½Ρ‹ΠΉ_rnn / bw / basic_lstm_cell / ядро: 0 , (1024, 2048), / устройство: графичСский процСссор : 0
dynamic_seq2seq / encoder / twoirectional_rnn / bw / basic_lstm_cell / bias: 0 , (2048,), / устройство: GPU : 0
dynamic_seq2seq / decoder / memory_layer / kernel: 0 , (1024, 512),
dynamic_seq2seq / decoder / Π’Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ / multi_rnn_cell / cell_0 / basic_lstm_cell / kernel: 0 , (1536, 2048), / устройство: GPU : 0
dynamic_seq2seq / decoder / Π’Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ / multi_rnn_cell / cell_0 / basic_lstm_cell / bias: 0 , (2048,), / устройство: GPU : 0
dynamic_seq2seq / decoder / Π’Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ / multi_rnn_cell / cell_1 / basic_lstm_cell / kernel: 0 , (1024, 2048), / устройство: GPU : 0
dynamic_seq2seq / decoder / Π’Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ / multi_rnn_cell / cell_1 / basic_lstm_cell / bias: 0 , (2048,), / device: GPU : 0
динамичСский_seq2seq / Π΄Π΅ΠΊΠΎΠ΄Π΅Ρ€ / Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ / luong_attention / Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅_g: 0, (), / устройство: графичСский процСссор : 0
динамичСский_seq2seq / Π΄Π΅ΠΊΠΎΠ΄Π΅Ρ€ / Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ / ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ внимания / ядро: 0 , (1536, 512), / устройство: графичСский процСссор : 0
dynamic_seq2seq / decoder / output_projection / kernel: 0 , (512, 15003), / устройство: GPU : 0

созданиС ΠΎΡ†Π΅Π½ΠΎΡ‡Π½ΠΎΠ³ΠΎ Π³Ρ€Π°Ρ„ΠΈΠΊΠ° ...

num_bi_layers = 1, num_bi_residual_layers = 0
ячСйка 0 LSTM, Forgot_bias = 1 DeviceWrapper, device = / gpu: 0
ячСйка 0 LSTM, Forgot_bias = 1 DeviceWrapper, device = / gpu: 0
ячСйка 0 LSTM, Forgot_bias = 1 DeviceWrapper, device = / gpu: 0
ячСйка 1 LSTM, Forgot_bias = 1 DeviceWrapper, device = / gpu: 0

ΠžΠ±ΡƒΡ‡Π°Π΅ΠΌΡ‹Π΅ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅

влоТСния / ΠΊΠΎΠ΄ΠΈΡ€ΠΎΠ²Ρ‰ΠΈΠΊ / ΠΊΠΎΠ΄ΠΈΡ€ΠΎΠ²Ρ‰ΠΈΠΊ_встраиваний: 0 , (15003, 512),
влоТСния / Π΄Π΅ΠΊΠΎΠ΄Π΅Ρ€ / встраиваниС_ Π΄Π΅ΠΊΠΎΠ΄Π΅Ρ€: 0 , (15003, 512),
dynamic_seq2seq / encoder / twoirectional_rnn / fw / basic_lstm_cell / kernel: 0 , (1024, 2048), / устройство: GPU : 0
dynamic_seq2seq / encoder / twoirectional_rnn / fw / basic_lstm_cell / bias: 0 , (2048,), / устройство: GPU : 0
dynamic_seq2seq / ΠΊΠΎΠ΄ΠΈΡ€ΠΎΠ²Ρ‰ΠΈΠΊ / Π΄Π²ΡƒΠ½Π°ΠΏΡ€Π°Π²Π»Π΅Π½Π½Ρ‹ΠΉ_rnn / bw / basic_lstm_cell / ядро: 0 , (1024, 2048), / устройство: графичСский процСссор : 0
dynamic_seq2seq / encoder / twoirectional_rnn / bw / basic_lstm_cell / bias: 0 , (2048,), / устройство: GPU : 0
dynamic_seq2seq / decoder / memory_layer / kernel: 0 , (1024, 512),
dynamic_seq2seq / decoder / Π’Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ / multi_rnn_cell / cell_0 / basic_lstm_cell / kernel: 0 , (1536, 2048), / устройство: GPU : 0
dynamic_seq2seq / decoder / Π’Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ / multi_rnn_cell / cell_0 / basic_lstm_cell / bias: 0 , (2048,), / устройство: GPU : 0
dynamic_seq2seq / decoder / Π’Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ / multi_rnn_cell / cell_1 / basic_lstm_cell / kernel: 0 , (1024, 2048), / устройство: GPU : 0
dynamic_seq2seq / decoder / Π’Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ / multi_rnn_cell / cell_1 / basic_lstm_cell / bias: 0 , (2048,), / device: GPU : 0
динамичСский_seq2seq / Π΄Π΅ΠΊΠΎΠ΄Π΅Ρ€ / Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ / luong_attention / Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅_g: 0, (), / устройство: графичСский процСссор : 0
динамичСский_seq2seq / Π΄Π΅ΠΊΠΎΠ΄Π΅Ρ€ / Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ / ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ внимания / ядро: 0 , (1536, 512), / устройство: графичСский процСссор : 0
dynamic_seq2seq / decoder / output_projection / kernel: 0 , (512, 15003), / устройство: GPU : 0

созданиС логичСского Π³Ρ€Π°Ρ„ΠΈΠΊΠ° ...

num_bi_layers = 1, num_bi_residual_layers = 0
ячСйка 0 LSTM, Forgot_bias = 1 DeviceWrapper, device = / gpu: 0
ячСйка 0 LSTM, Forgot_bias = 1 DeviceWrapper, device = / gpu: 0
ячСйка 0 LSTM, Forgot_bias = 1 DeviceWrapper, device = / gpu: 0
ячСйка 1 LSTM, Forgot_bias = 1 DeviceWrapper, device = / gpu: 0

ΠžΠ±ΡƒΡ‡Π°Π΅ΠΌΡ‹Π΅ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅

влоТСния / ΠΊΠΎΠ΄ΠΈΡ€ΠΎΠ²Ρ‰ΠΈΠΊ / ΠΊΠΎΠ΄ΠΈΡ€ΠΎΠ²Ρ‰ΠΈΠΊ_встраиваний: 0 , (15003, 512),
влоТСния / Π΄Π΅ΠΊΠΎΠ΄Π΅Ρ€ / встраиваниС_ Π΄Π΅ΠΊΠΎΠ΄Π΅Ρ€: 0 , (15003, 512),
dynamic_seq2seq / encoder / twoirectional_rnn / fw / basic_lstm_cell / kernel: 0 , (1024, 2048), / устройство: GPU : 0
dynamic_seq2seq / encoder / twoirectional_rnn / fw / basic_lstm_cell / bias: 0 , (2048,), / устройство: GPU : 0
dynamic_seq2seq / ΠΊΠΎΠ΄ΠΈΡ€ΠΎΠ²Ρ‰ΠΈΠΊ / Π΄Π²ΡƒΠ½Π°ΠΏΡ€Π°Π²Π»Π΅Π½Π½Ρ‹ΠΉ_rnn / bw / basic_lstm_cell / ядро: 0 , (1024, 2048), / устройство: графичСский процСссор : 0
dynamic_seq2seq / encoder / twoirectional_rnn / bw / basic_lstm_cell / bias: 0 , (2048,), / устройство: GPU : 0
dynamic_seq2seq / decoder / memory_layer / kernel: 0 , (1024, 512),
dynamic_seq2seq / decoder / Π’Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ / multi_rnn_cell / cell_0 / basic_lstm_cell / kernel: 0 , (1536, 2048), / устройство: GPU : 0
dynamic_seq2seq / decoder / Π’Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ / multi_rnn_cell / cell_0 / basic_lstm_cell / bias: 0 , (2048,), / устройство: GPU : 0
dynamic_seq2seq / decoder / Π’Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ / multi_rnn_cell / cell_1 / basic_lstm_cell / kernel: 0 , (1024, 2048), / устройство: GPU : 0
dynamic_seq2seq / decoder / Π’Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ / multi_rnn_cell / cell_1 / basic_lstm_cell / bias: 0 , (2048,), / device: GPU : 0
динамичСский_seq2seq / Π΄Π΅ΠΊΠΎΠ΄Π΅Ρ€ / Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ / luong_attention / Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅_g: 0, (), / устройство: графичСский процСссор : 0
динамичСский_seq2seq / Π΄Π΅ΠΊΠΎΠ΄Π΅Ρ€ / Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ / ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ внимания / ядро: 0 , (1536, 512), / устройство: графичСский процСссор : 0
dynamic_seq2seq / decoder / output_projection / ядро: 0 , (512, 15003),

log_file = / home / science / tf-demo / models / nmt-chatbot / model / log_1519669184

2018-02-26 18: 19: 44.862736: I tensorflow / core / platform / cpu_feature_guard.cc: 137] Π’Π°Ρˆ ЦП ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Π΅Ρ‚ инструкции, для использования ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… этот Π΄Π²ΠΎΠΈΡ‡Π½Ρ‹ΠΉ Ρ„Π°ΠΉΠ» TensorFlow Π½Π΅ Π±Ρ‹Π» скомпилирован: SSE4.1 SSE4.2 AVX AVX2 FMA
Π£Π±ΠΈΡ‚

ΠΊΠ°ΠΊΡƒΡŽ ΠΊΠΎΠΌΠ°Π½Π΄Ρƒ Π½ΡƒΠΆΠ½ΠΎ Π·Π°ΠΏΡƒΡΠΊΠ°Ρ‚ΡŒ ΠΈ Π³Π΄Π΅ Π·Π°ΠΏΡƒΡΠΊΠ°Ρ‚ΡŒ эти ΠΊΠΎΠΌΠ°Π½Π΄Ρ‹ ΠΈ ΠΊΠ°ΠΊ скаТитС, поТалуйста. МнС отчаянно Π½ΡƒΠΆΠ½Π° ΠΏΠΎΠΌΠΎΡ‰ΡŒ.

Но ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚ Π»ΠΈ это, Ρ‡Ρ‚ΠΎ систСма Π½Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ графичСский процСссор для этого процСсса?

Π§Ρ‚ΠΎ ΠΆ, Π²Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ эту ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ, Ссли Π²Ρ‹ создаСтС Ρ‚Π΅Π½Π·ΠΎΡ€Π½Ρ‹ΠΉ ΠΏΠΎΡ‚ΠΎΠΊ Π² срСдС ускорСния, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ k-fold Π² KerasClassifier.
Π§Ρ‚ΠΎΠ±Ρ‹ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ эту ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ, Π²Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ Π±ΡƒΠ΄Π΅Ρ‚ ΡΠΎΠ·Π΄Π°Ρ‚ΡŒ Ρ‚Π΅Π½Π·ΠΎΡ€Π½Ρ‹ΠΉ ΠΏΠΎΡ‚ΠΎΠΊ ΠΈΠ· исходного ΠΊΠΎΠ΄Π°, ΠΊΠ°ΠΊ всС Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄ΡƒΡŽΡ‚.
Π§Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ Ρ‚Π΅Π½Π·ΠΎΡ€Π½Ρ‹ΠΉ ΠΏΠΎΡ‚ΠΎΠΊ ΠΈΠ· исходного ΠΊΠΎΠ΄Π°, Π²Π°ΠΌ понадобится ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΉ инструмСнт

  1. УстановитС git Π½Π° свой ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€, Ссли Π²Ρ‹ Π΅Ρ‰Π΅ этого Π½Π΅ сдСлали - Π½Π° машинС с Ubuntu просто Π²Π²Π΅Π΄ΠΈΡ‚Π΅ Β«sudo apt-get install gitΒ».
  2. Π’Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ Π±ΡƒΠ΄Π΅Ρ‚ ΡƒΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚ΡŒ Π±Π°Π·Π΅Π». ΠΠ°ΡΡ‚ΠΎΡΡ‚Π΅Π»ΡŒΠ½ΠΎ рСкомСндуСтся ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ собствСнный Ρ€Π΅ΠΏΠΎΠ·ΠΈΡ‚ΠΎΡ€ΠΈΠΉ APT. Π‘Π»Π΅Π΄ΡƒΠΉΡ‚Π΅ инструкциям ΠΏΠΎ этой ссылкС, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡƒΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚ΡŒ bazel https://docs.bazel.build/versions/master/install-ubuntu.html.
  3. Π’Π°ΠΌ Π½ΡƒΠΆΠ½Ρ‹ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ зависимости Python ... ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΊΠΎΠΌΠ°Π½Π΄Ρƒ Π½ΠΈΠΆΠ΅
    numpy, dev и колСсо
    sudo apt-get install python-numpy python-dev python-pip python-wheel
    4.Как Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρƒ вас установлСны всС зависимости, ΠΊΠ»ΠΎΠ½ΠΈΡ€ΡƒΠΉΡ‚Π΅ tenorflow github Π½Π° свой Π»ΠΎΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΉ диск.
    git clone https://github.com/tensorflow/tensorflow
  4. ΠŸΠ΅Ρ€Π΅ΠΉΠ΄ΠΈΡ‚Π΅ Π² мСсто для клонирования tensorflow ΠΈ cd Π² Ρ„Π°ΠΉΠ» tensorflow ΠΈ запуститС Ρ„Π°ΠΉΠ» ΠΊΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€Π°Ρ†ΠΈΠΈ.
    CD Ρ‚Π΅Π½Π·ΠΎΡ€
    ./configure

ΠŸΡ€ΠΎΡΡ‚ΠΎ слСдуйтС инструкциям Π½Π° экранС, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π·Π°Π²Π΅Ρ€ΡˆΠΈΡ‚ΡŒ установку tenorflow.
Π― Π½Π°ΡΡ‚ΠΎΡΡ‚Π΅Π»ΡŒΠ½ΠΎ Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄ΡƒΡŽ ΠΎΠ±Π½ΠΎΠ²ΠΈΡ‚ΡŒ Π²Π°ΡˆΡƒ ΠΌΠ°ΡˆΠΈΠ½Ρƒ послС установки tenorflow
sudo apt-get update

Π£Π΄Π°Ρ‡ΠΈ ΠΈ Π½Π°ΡΠ»Π°ΠΆΠ΄Π°ΠΉΡ‚Π΅ΡΡŒ ...

ΠŸΡ€ΠΎΡΡ‚ΠΎ напомню Π² этой Ρ‚Π΅ΠΌΠ΅, Ρ‡Ρ‚ΠΎ Π²Ρ‹ Π½Π΅ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ просто Π·Π°Π³Π»ΡƒΡˆΠ°Ρ‚ΡŒ эти прСдупрСТдСния - я ΠΏΠΎΠ»ΡƒΡ‡Π°ΡŽ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ Π½Π° 43% мСньшС Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ Π½Π° ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅, создавая ΠΈΠ· исходников, я Π΄ΡƒΠΌΠ°ΡŽ, Ρ‡Ρ‚ΠΎ это Ρ‚ΠΎΠ³ΠΎ стоит.

  • Π˜Π½ΡΡ‚Ρ€ΡƒΠΊΡ†ΠΈΠΈ Tensorflow ΠΏΠΎ сборкС ΠΈΠ· исходников довольно ясны ...
  • ... Π½ΠΎ ΠΎΠ½ΠΈ Π½Π° самом Π΄Π΅Π»Π΅ Π½Π΅ ΠΎΠ±ΡŠΡΡΠ½ΡΡŽΡ‚, ΠΊΠ°ΠΊ Π²ΠΊΠ»ΡŽΡ‡ΠΈΡ‚ΡŒ SSE / AVX / FMA ΠΈ Ρ‚. Π΄. - поэтому ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠΉΡ‚Π΅ этот ΠΏΠΎΡ‚ΠΎΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ прСдставлСниС ΠΎ Ρ‚ΠΎΠΌ, ΠΊΠ°ΠΊ ΡƒΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚ΡŒ Ρ„Π»Π°Π³ΠΈ сборки Bazel

ΠΊΠ°ΠΊ ΡƒΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚ΡŒ tenorflow с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ этого Ρ„Π°ΠΉΠ»Π° "tensorflow-1.6.0-cp36-cp36m-win_amd64.whl"

@anozele pip3 install --upgrade *path to wheel file*

@gunan --config = opt нСдостаточно, Π²Π°ΠΌ Ρ‚Π°ΠΊΠΆΠ΅ слСдуСт Π΄ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, --copt = "- msse4.2", ΠΊΠΎΠ³Π΄Π° Π²Ρ‹ собираСтС TensorFlow ΠΈΠ· исходного ΠΊΠΎΠ΄Π°.

Богласно Intel, https://software.intel.com/en-us/articles/intel-optimization-for-tensorflow-installation-guide , Ссли Π²Ρ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚Π΅ построСнный Intel Tensorflow, Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΈΠ³Π½ΠΎΡ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ это ΠΏΡ€Π΅Π΄ΡƒΠΏΡ€Π΅ΠΆΠ΄Π΅Π½ΠΈΠ΅, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ вСсь доступный Π½Π°Π±ΠΎΡ€ инструкций Π±ΡƒΠ΄Π΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ сСрвСрной Ρ‡Π°ΡΡ‚ΡŒΡŽ MKL. ΠšΡ‚ΠΎ-Π½ΠΈΠ±ΡƒΠ΄ΡŒ ΠΈΠ· Tensorflow ΠΌΠΎΠΆΠ΅Ρ‚ это ΠΏΠΎΠ΄Ρ‚Π²Π΅Ρ€Π΄ΠΈΡ‚ΡŒ?

Π­Ρ‚ΠΎ Π½Π΅ ошибка, Π° просто прСдупрСТдСния, говорящиС ΠΎ Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Ссли Π²Ρ‹ создадитС TensorFlow ΠΈΠ· исходного ΠΊΠΎΠ΄Π°, ΠΎΠ½ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ быстрСС Π½Π° вашСм ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Π΅.

ВАК вопрос ΠΎΠ± этом: http://stackoverflow.com/questions/41293077/how-to-compile-tensorflow-with-sse4-2-and-avx-instructions
Руководство TensorFlow ΠΏΠΎ сборкС ΠΈΠ· исходного ΠΊΠΎΠ΄Π°: https://www.tensorflow.org/install/install_sources

Однако, это Π½Π΅ быстрСС , Ρ‡Π΅ΠΌ я Π½Π΅ ΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡΡŒ -FMA -AVX -sse https://stackoverflow.com/questions/57197854/fma-avx-sse-flags-did-not-bring-me-good-performance

ΠŸΡ€ΠΈΠ²Π΅Ρ‚. Π˜Π·Π²ΠΈΠ½ΠΈΡ‚Π΅, Ссли я бью ΠΌΠ΅Ρ€Ρ‚Π²ΡƒΡŽ лошадь. ΠŸΡ€ΠΎΡΡ‚ΠΎ интСрСсно, ΠΏΠΎΡ‡Π΅ΠΌΡƒ колСсо пипса ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ Π½Π΅ являСтся Π΄Π²ΠΎΠΈΡ‡Π½Ρ‹ΠΌ Ρ„Π°ΠΉΠ»ΠΎΠΌ, скомпилированным с ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ инструкциями?

ΠŸΡ€ΠΈΠ²Π΅Ρ‚. Π˜Π·Π²ΠΈΠ½ΠΈΡ‚Π΅, Ссли я бью ΠΌΠ΅Ρ€Ρ‚Π²ΡƒΡŽ лошадь. ΠŸΡ€ΠΎΡΡ‚ΠΎ интСрСсно, ΠΏΠΎΡ‡Π΅ΠΌΡƒ колСсо пипса ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ Π½Π΅ являСтся Π΄Π²ΠΎΠΈΡ‡Π½Ρ‹ΠΌ Ρ„Π°ΠΉΠ»ΠΎΠΌ, скомпилированным с ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ инструкциями?

Π­Ρ‚ΠΎ связано с Ρ‚Π΅ΠΌ, Ρ‡Ρ‚ΠΎ старыС Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρ‹ процСссоров Π½Π΅ ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°ΡŽΡ‚ Ρ€Π°ΡΡˆΠΈΡ€Π΅Π½Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ инструкций. Π‘ΠΌ. Π’ΠΈΠΊΠΈ для ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½ΠΎΠ³ΠΎ списка процСссоров, ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°ΡŽΡ‰ΠΈΡ… AVX, AVX2 ΠΈΠ»ΠΈ AVX512. Если Π΄Π²ΠΎΠΈΡ‡Π½Ρ‹ΠΉ Ρ„Π°ΠΉΠ» pip ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ скомпилирован с этими Π½Π°Π±ΠΎΡ€Π°ΠΌΠΈ инструкций, Ρ‚Π΅Π½Π·ΠΎΡ€Π½Ρ‹ΠΉ ΠΏΠΎΡ‚ΠΎΠΊ Π½Π΅ ΠΌΠΎΠΆΠ΅Ρ‚ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ Π½Π° старых процСссорах.

Но ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚ Π»ΠΈ это, Ρ‡Ρ‚ΠΎ систСма Π½Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ графичСский процСссор для этого процСсса?

НСт, это ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚, Π΄Π°ΠΆΠ΅ Ссли Π²Ρ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚Π΅ графичСский процСссор, Ссли Π²Ρ‹ Π½Π΅ ΠΎΡ‚ΠΊΠ»ΡŽΡ‡ΠΈΠ»ΠΈ Π·Π²ΡƒΠΊ сообщСний, Π²Ρ‹ Ρ‚Π°ΠΊΠΆΠ΅ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΡƒΠ²ΠΈΠ΄Π΅Ρ‚ΡŒ, ΠΊΠ°ΠΊ Tensorflor Π·Π°Π³Ρ€ΡƒΠΆΠ°Π΅Ρ‚ вашС устройство с графичСским процСссором Π² ΠΊΠΎΠΌΠ°Π½Π΄Π½ΠΎΠΉ строкС.

Если Π²Ρ‹ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΡ‚Π΅ с этим Ρ€Π΅ΠΏΠΎ:
ΠŸΠΎΠΆΠ°Π»ΡƒΠΉΡΡ‚Π°, ΠΏΡ€ΠΎΠ²Π΅Ρ€ΡŒΡ‚Π΅ ΠΊΠΎΠ΄ Π½ΠΈΠΆΠ΅:

https://github.com/fo40225/tensorflow-windows-wheel

Он скомпилировал ΠΏΠΎΡ‡Ρ‚ΠΈ всС вСрсии TF с SSE ΠΈ AVX.
Он собрал ΠΏΠΎΡ‡Ρ‚ΠΈ всС вСрсии TF!

Π­Ρ‚Π° ΡΡ‚Π°Ρ‚ΡŒΡ Π±Ρ‹Π»Π° Ρ…ΠΎΡ€ΠΎΡˆΠΈΠΌ руководством ΠΏΠΎ сборкС ΠΈΠ· исходного ΠΊΠΎΠ΄Π°, Π²ΠΊΠ»ΡŽΡ‡Π°Ρ Ρ„Π»Π°Π³ΠΈ.
https://medium.com/@pierreontech/setup -a-high-performance-conda-tensorflow-environment-976995158cb1

ΠΏΠΎΠΏΡ€ΠΎΠ±ΡƒΠΉΡ‚Π΅ ΠΏΡ€ΠΈΠ½ΡƒΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π²ΠΊΠ»ΡŽΡ‡ΠΈΡ‚ΡŒ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠ΅ Ρ€Π°ΡΡˆΠΈΡ€Π΅Π½ΠΈΡ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ базСля, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ --copt=-mavx --copt=-msse4.1 --copt=-msse4.2

Π‘Ρ‹Π»Π° Π»ΠΈ эта страница ΠΏΠΎΠ»Π΅Π·Π½ΠΎΠΉ?
0 / 5 - 0 Ρ€Π΅ΠΉΡ‚ΠΈΠ½Π³ΠΈ