Tensorflow: import tensorflowを実行した後の不正な命令(コアダンプ)

作成日 2018年03月04日  ·  100コメント  ·  ソース: tensorflow/tensorflow

システムインフォメーション

  • カスタムコードを作成しましたか(TensorFlowで提供されているストックサンプルスクリプトを使用するのではなく) :いいえ
  • OSプラットフォームとディストリビューション(例:Linux Ubuntu 16.04) :Linux Ubuntu 16.04
  • (ソースまたはバイナリ)からインストールされたTensorFlow :バイナリ
  • TensorFlowバージョン(以下のコマンドを使用)
    1.6.0-cp27-cp27mu-manylinux1_x86_64( python -c "import tensorflow as tf; print(tf.GIT_VERSION, tf.VERSION)"はすでにエラーを出しているので、推測することしかできません)
  • Pythonバージョン:Python 2.7.12
  • 再現する正確なコマンドimport tensorflow

新しい仮想環境を作成しました: virtualenv -p python2 test_venv/
そしてインストールされたテンソルフロー: pip install --upgrade --no-cache-dir tensorflow
import tensorflowは私にIllegal instruction (core dumped)与えます

何が起こっているのか、どうすれば修正できるのかを理解するのを手伝ってください。 ありがとうございました。

CPU情報:

          description: CPU
          product: Intel(R) Core(TM) i3 CPU       M 330  @ 2.13GHz
          bus info: cpu<strong i="31">@0</strong>
          version: CPU Version
          capabilities: x86-64 fpu fpu_exception wp vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp constant_tsc arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc aperfmperf pni dtes64 monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr pdcm sse4_1 sse4_2 popcnt lahf_lm tpr_shadow vnmi flexpriority ept vpid dtherm arat cpufreq

編集
gdbで取得したスタックトレース:

#0  0x00007fffe5793880 in std::pair<std::__detail::_Node_iterator<std::pair<tensorflow::StringPiece const, std::function<bool (tensorflow::Variant*)> >, false, true>, bool> std::_Hashtable<tensorflow::StringPiece, std::pair<tensorflow::StringPiece const, std::function<bool (tensorflow::Variant*)> >, std::allocator<std::pair<tensorflow::StringPiece const, std::function<bool (tensorflow::Variant*)> > >, std::__detail::_Select1st, std::equal_to<tensorflow::StringPiece>, tensorflow::StringPieceHasher, std::__detail::_Mod_range_hashing, std::__detail::_Default_ranged_hash, std::__detail::_Prime_rehash_policy, std::__detail::_Hashtable_traits<true, false, true> >::_M_emplace<std::pair<tensorflow::StringPiece, std::function<bool (tensorflow::Variant*)> > >(std::integral_constant<bool, true>, std::pair<tensorflow::StringPiece, std::function<bool (tensorflow::Variant*)> >&&) ()
   from /media/gerry/hdd_1/ws_hdd/test_venv/local/lib/python2.7/site-packages/tensorflow/python/../libtensorflow_framework.so
#1  0x00007fffe5795735 in tensorflow::UnaryVariantOpRegistry::RegisterDecodeFn(std::string const&, std::function<bool (tensorflow::Variant*)> const&) () from /media/gerry/hdd_1/ws_hdd/test_venv/local/lib/python2.7/site-packages/tensorflow/python/../libtensorflow_framework.so
#2  0x00007fffe5770a7c in tensorflow::variant_op_registry_fn_registration::UnaryVariantDecodeRegistration<tensorflow::Tensor>::UnaryVariantDecodeRegistration(std::string const&) ()
   from /media/gerry/hdd_1/ws_hdd/test_venv/local/lib/python2.7/site-packages/tensorflow/python/../libtensorflow_framework.so
#3  0x00007fffe56ea165 in _GLOBAL__sub_I_tensor.cc ()
   from /media/gerry/hdd_1/ws_hdd/test_venv/local/lib/python2.7/site-packages/tensorflow/python/../libtensorflow_framework.so
#4  0x00007ffff7de76ba in call_init (l=<optimized out>, argc=argc@entry=2, argv=argv@entry=0x7fffffffd5c8, env=env@entry=0xa7b4d0)
    at dl-init.c:72
#5  0x00007ffff7de77cb in call_init (env=0xa7b4d0, argv=0x7fffffffd5c8, argc=2, l=<optimized out>) at dl-init.c:30
#6  _dl_init (main_map=main_map@entry=0xa11920, argc=2, argv=0x7fffffffd5c8, env=0xa7b4d0) at dl-init.c:120
#7  0x00007ffff7dec8e2 in dl_open_worker (a=a@entry=0x7fffffffb5c0) at dl-open.c:575
#8  0x00007ffff7de7564 in _dl_catch_error (objname=objname@entry=0x7fffffffb5b0, errstring=errstring@entry=0x7fffffffb5b8, 
    mallocedp=mallocedp@entry=0x7fffffffb5af, operate=operate@entry=0x7ffff7dec4d0 <dl_open_worker>, args=args@entry=0x7fffffffb5c0)
    at dl-error.c:187
#9  0x00007ffff7debda9 in _dl_open (
    file=0x7fffea7cbc34 "/media/gerry/hdd_1/ws_hdd/test_venv/local/lib/python2.7/site-packages/tensorflow/python/_pywrap_tensorflow_internal.so", mode=-2147483646, caller_dlopen=0x51ad19 <_PyImport_GetDynLoadFunc+233>, nsid=-2, argc=<optimized out>, argv=<optimized out>, env=0xa7b4d0)
    at dl-open.c:660
#10 0x00007ffff75ecf09 in dlopen_doit (a=a@entry=0x7fffffffb7f0) at dlopen.c:66
#11 0x00007ffff7de7564 in _dl_catch_error (objname=0x9b1870, errstring=0x9b1878, mallocedp=0x9b1868, operate=0x7ffff75eceb0 <dlopen_doit>, 
    args=0x7fffffffb7f0) at dl-error.c:187
#12 0x00007ffff75ed571 in _dlerror_run (operate=operate@entry=0x7ffff75eceb0 <dlopen_doit>, args=args@entry=0x7fffffffb7f0) at dlerror.c:163
#13 0x00007ffff75ecfa1 in __dlopen (file=<optimized out>, mode=<optimized out>) at dlopen.c:87
#14 0x000000000051ad19 in _PyImport_GetDynLoadFunc ()
#15 0x000000000051a8e4 in _PyImport_LoadDynamicModule ()
#16 0x00000000005b7b1b in ?? ()
#17 0x00000000004bc3fa in PyEval_EvalFrameEx ()
#18 0x00000000004c136f in PyEval_EvalFrameEx ()
#19 0x00000000004b9ab6 in PyEval_EvalCodeEx ()
#20 0x00000000004b97a6 in PyEval_EvalCode ()
#21 0x00000000004b96df in PyImport_ExecCodeModuleEx ()
#22 0x00000000004b2b06 in ?? ()
#23 0x00000000004a4ae1 in ?? ()

編集2
Bazelバージョン:N / A
CUDA / cuDNNバージョン:N / A
GPUモデルとメモリ:N / A

古いバージョンのテンソルフローにダウングレードすると、エラーはなくなります。 私のCPU(上記の情報を参照)は、新しいAPIのいくつかの改善では機能しない可能性があるとアドバイスされています。 この場合、私の問題に対する解決策はないと思います。 したがって、このスレッドを閉じます。 でも、遠慮なく訂正してください。 ご支援いただきありがとうございます

awaiting response

最も参考になるコメント

実行してみてください
pipアンインストールtensorflow
その後
pip install tensorflow == 1.5

編集
ただ信用を与えるために、解決策はここからです:
https://stackoverflow.com/questions/49094597/illegal-instruction-core-dumped-after-running-import-tensorflow

全てのコメント100件

投稿ありがとうございます。 課題テンプレートの次のフィールドに入力していないことに気づきました。 それらがあなたのケースに関連している場合、それらを更新できますか、それともN / Aのままにしますか? ありがとう。
バゼルバージョン
CUDA / cuDNNバージョン
GPUモデルとメモリ

実行すると、同じ(または類似の)「不正な命令」の問題が発生します

import tensorflow as tf

私は64ビットのUbuntuLinuxでCPU1.6バージョンのみを使用しています。

CPU 1.5バージョンにダウングレードした後は、この問題は発生しません。

CPU 1.5バージョンにダウングレードするにはどうすればよいですか?

実行してみてください
pipアンインストールtensorflow
その後
pip install tensorflow == 1.5

編集
ただ信用を与えるために、解決策はここからです:
https://stackoverflow.com/questions/49094597/illegal-instruction-core-dumped-after-running-import-tensorflow

konnerthgに感謝します、私でさえ同じ問題を抱えていました。 あなたのコマンドは私がこの問題を分類するのを助けました。 再度、感謝します。

こっちも一緒。
最新のホイールでは、Ubuntu 16.04で不正な命令の問題が発生しましたが、tensorflow-gpu == 1.5にダウングレードすると、機能します。

1.5へのダウングレードも私のために働いた

@konnerthg 1.5へのダウングレードは
どのコミット/ PRがこの問題を解決しましたか?

Python3.6でもこのエラーが発生します

おい !
あなたの解決策をありがとう! 本当。 私は今一週間この問題を抱えていて、私は夢中になり始めていました! THX !

ソリューションに感謝します。Ubuntu16.04、64ビット、python3.5で動作しました。

解決してくれてありがとう! バージョン1.5にダウングレードすると、問題が修正されました。 Python2.7を搭載したUbuntu16.04サーバーでテスト済み

同じ問題で、Tensorflow1.6から1.5にダウングレードすると問題が解決しました。 Xubuntu 16.04 64ビット、Python3.5を実行しています。

これがすべてPython3.6の私の問題を解決してくれてありがとう

_(tensorflow) naniny @ Aspire-E5-573 :〜$ pip unistall tensorflow

_(tensorflow) naniny @ Aspire-E5-573 :〜$ pip install tensorflow == 1.5

_(tensorflow) naniny @ Aspire-E5-573 :〜$ python

_(tensorflow) naniny @ Aspire-E5-573 :〜$ tensorflowをtfとしてインポート

今は問題なく動作します...

これは本当に奇妙です。 誰かが問題の原因を知っていますか? TensorFlow1.6にこれほど大きなバグがあることに驚いています。

Linuxのtensorflow-gpu1.6.0でも、Python3.6.4を使用してこの問題が発生しています。 pip自体を使用してtensorflowをインストールしました。 これを実行するだけでSIGILLが生成されます。

$ python3 -m tensorflow
zsh: illegal hardware instruction  python3 -m tensorflow

このチケットの説明に記載されているものと同様のスタックトレースを取得します。

これは、pipにアップロードされた最新のTensorflowパッケージでAVX命令が使用されているために発生しているようです。 GDBを介してpython3を実行し、クラッシュする関数を逆アセンブルすると、次の命令が示されます。

=> 0x00007fffb9689660 <+80>:    vmovdqu 0x10(%r13),%xmm1

これは、AVXをサポートしていない古いCPUや機能の少ないCPUではサポートされていないAVX命令です。 tensorflow(-gpu)1.5.0 pipパッケージはAVX命令を使用しないため、これらのCPUで問題なく使用できます。

解決策は、公開されるAVX命令でコンパイルされていないtensorflow(-gpu)のビルド(またはローカルでコピーをビルドすること)です。 提供されているインストール手順には、特定のCPU要件や、提供されているバイナリとの互換性を判断する方法については記載されていません。

それまでの間、上記の@NinemillaKAのようなものを使用してtensorflow(-gpu)1.5.0に戻すことは、効果的な回避策です。

同じ問題があり、多くの人がコメントしているように、 1.6.0から1.5.0にダウングレードします。

記録のために、2台の異なるコンピューターでtensorflow(CPUのみのバージョン)を実行してみました。

コンピューター1:

OS = Ubuntu 16.04 x64 LTS
Python = Python 3.6
pip version = 9.0.1
tensorflow version = TensorFlow 1.6.0
CPU = Intel Core 2 Quad Q6600  @2.40GHz

コンピューター2:

OS = Ubuntu 16.04 x64 LTS
Python = Python 3.6
pip version = 9.0.1
tensorflow version = TensorFlow 1.6.0
CPU = Intel Celeron N2820 @2.413GHz

私は@naclに同意します。命令セットに関するこれらの要件をより明確にし、可能であれば、AVX命令をサポートしないプロセッサ用に分離された更新されたビルドを用意する必要があります。 正直なところ、古いバージョンのテクノロジーを使用しなければならないのは少しがっかりします。多くの人が同じように感じていると思います。

アーキテクチャタイプごとに異なるビルドを使用する代わりに、動的ディスパッチを使用することもできます。 IE、PyTorchはすべてのアーキテクチャに1つのバイナリを持ち、実行時に最も効率的なopsを選択します@caisq

ありがとう

私も同じ問題に遭遇します。 2台のマシンで試しましたが、そのうちの1台で動作します。

まず、MacBookProにインストールしました。 そして、私は何の問題もありませんでした。

MacBook Pro (Retina, Mid 2012)
CPU = 2.3 GHz Intel Core i7
OS = MacOS 10.13.3
Python = Python 3.6.4
pip version = 9.0.3
TensorFlow version = 1.6.0

そこで、MacProをアップグレードしました。 しかし今回は、テンソルフローをインポートしようとするとIllegal instruction: 4が表示されます。

Mac Pro (Mid 2010)
CPU = 2 x 2.4 GHz Quad-Core Intel Xeon
OS = MacOS 10.13.3
Python = Python 3.6.4
pip version = 9.0.3
TensorFlow version = 1.6.0

(2018年3月30日に更新)
TensorFlow1.7でも同じ問題が発生します。 だから私はTensorFlow1.5を使用していると思います。

これは1.6でも、潜在的には1.7でも問題です。 なぜこれが閉鎖されているのですか? @yaroslavvbのソリューションは妥当なようです。 今のところ1.5にダウングレードしました。

確かではありませんが、このリンクから、ver1.6.0以降、IntelCPU命令オプティマイザーがtensorflowに導入されました。 おそらくこれが原因だと思います。
https://software.intel.com/en-us/articles/intel-optimized-tensorflow-wheel-now-available

@captainstはIntel固有のリリースであり、 pip installを実行して取得する公式リリースとは異なります。 1.6アップグレード後のSIGILLの問題は、AVXの追加が原因である可能性があります

同じ問題があります。
Ubuntu 18.04 x64
Python 3.6.5rc1
TensorFlow 1.7.0

私も同じ問題を抱えていました。 1.5へのダウングレードは私のために働いた。

こっちも一緒。

私も。 ArchLinuxとIntelCPU。

ここではUbuntu17でも同じです。10.1VM、Slackware上のKVMハイパーバイザー、Intel KabyLake CPU

私はそれを理解したと思います。 AVXをサポートしていないG4600CPUがあり、これは1.6で追加されました。

はい、AVXサポートもロックします。

v1.6以降でこれを修正するには、ソースからtensorflowをコンパイルする必要があります。

最新のtensorflow-gpu(1.7)を使用したいのですが、1.5に固執したくありません。 では、AVXサポートを有効にせずにソースからテンソルフローを構築するソリューションはありますか? 古いXeonE5420を使用していますが、tensorflow-gpuを使用しています

dmoham1476 [email protected]于2018年4月7日周六上午2時28写道:

最新のtensorflow-gpu(1.7)を使用したいのですが、固執したくありません
1.5。 AVXをサポートせずにソースからテンソルフローを構築するソリューションもそうです
有効ですか? 古いXeonE5420を使用していますが、tensorflow-gpuを使用しています


あなたがコメントしたのであなたはこれを受け取っています。
このメールに直接返信し、GitHubで表示してください
https://github.com/tensorflow/tensorflow/issues/17411#issuecomment-379337106
またはスレッドをミュートします
https://github.com/notifications/unsubscribe-auth/AGeJnptN5yMdVaVdWTsIwcjOAJuJbUDQks5tl7PKgaJpZM4SbSGu

git clonemasterのソースからビルドできます。 自動調整する必要があります

urcpuに。

よろしく、

ジン

バージョン1.5にダウングレードすると、問題が修正されました。 私はPython2.7でUbuntu16.04を使用しています

同じ問題
Ubuntu = 16.10
python = 3.6
pip = 9.0.3
tensorflow-gpu = 1.7の場合
NVIDIA GTX 1070
CUDA 9.0

解決策:
pip3 install tensorflow-gpu == 1.5

同じ問題

同じ問題
Ubuntu 16.04
tensorflow-gpu1.7および1.6を使用

Paperspaceノートブックで実行されているこのDockerイメージでも同じ問題が発生します。

問題はバージョン1.6および1.7にあります

同じ問題が発生し、1.5にダウングレードされました。 Tensorflowは現在インポートされていますが、tensorflow_hubを必要とするスクリプトを実行しています。 スクリプトがRuntimeErrorをスローしています:TensorFlow Hubは、20180308以降の「tf-nightly」ビルドまたは「tensorflow〜 = 1.7」に依存しています。 見つかったtf.VERSION = 1.5.0

バージョン1.5に戻ってくれてありがとう私も働いた

CentOS 7、CPUのみのtf`1.8でも同じ問題が発生しました。 1.5へのダウングレードが機能しました。

ソースからビルドする場合にダウングレードしたくない場合は、問題が解決されます。

同じ問題があり、1.5へのダウングレードがうまくいきました。

この問題も、tensorflow-gpu 1.8.0、paperspacefast.aiテンプレートマシンで発生しました

tensorflow-1.8.0でも同じ問題が発生します。 問題は、retrain.pyでトレーニングしたいので、バージョン1.5にダウングレードできないことです。このテンソルフローでは、1.7より大きいバージョンが必要です。 だから、何か提案はありますか? ソースからテンソルフローを構築すると役に立ちますか?!

ここで同じ問題:
fast.aiテンプレートを使用したペーパースペースVM
GPU:nvidia quadro P4000
https://www.tensorflow.org/install/install_linux#installing_with_virtualenvのようにvirtualenvにインストールされたtensorflow1.8.0は、上記のエラーを出しました(ページの下部に記載されている推奨ホイールをインストールする場合を含む)
ubuntu 16.04、python 3.6.3
pip uninstall tensorflow && pip install tensorflow-gpu==1.5.0で問題が修正されました。 ソースからのコンパイルはまだ試していません。

ちなみに、 grep avx /proc/cpuinfoは何も返さないため、VMのCPUはavx命令をサポートしていません。

みなさん、こんにちは。ソースからビルドすることで問題が解決しました。

درتاریخیکشنبه13مه2018、午前1時47 laurentS [email protected] نوشت:

ここで同じ問題:
fast.aiテンプレートを使用したペーパースペースVM
GPU:nvidia quadro P4000
tensorflow1.8.0がvirtualenvにインストールされています
https://www.tensorflow.org/install/install_linux#installing_with_virtualenv
上記のエラーを出しました
ubuntu 16.04、python 3.6.3
pip install tensorflow && pip install tensorflow-gpu == 1.5.0修正されました
問題。 ソースからのコンパイルはまだ試していません。


あなたがコメントしたのであなたはこれを受け取っています。
このメールに直接返信し、GitHubで表示してください
https://github.com/tensorflow/tensorflow/issues/17411#issuecomment-388583280
またはスレッドをミュートします
https://github.com/notifications/unsubscribe-auth/APaJX3BUFgxCemEueanuAXMfqboX5MNqks5tx1FugaJpZM4SbSGu

私は同じ問題を段階的に進めますが、tensorflow-1.5に移行した後はうまくいきました。
私の問題:-エラー->コアダンプ
プロセッサー:AMD®A4-3330mxapu、radeon(tm)hdグラフィックス×2
グラフィック:AMD®相撲
GNOME:3.28.1
OSタイプ:64ビット、Ubuntu 18.04 LTS

クレジット:-https ://github.com/konnerthg

もちろん、以前のバージョンのtensorflowで動作しますが、より具体的には、新しいtensorflowjsと互換性のある1.7.0バージョンが必要です。 どのようにすることができます?

@mctrjallohは新しいCPUを購入すると思います

私はそれを解決しました。 新しいCPUを購入することではありません😏

あなたはそれがそれほど複雑ではないソースから構築する必要があります

tensorflow-gpu1.8.0でも同じ問題

OS:Ubuntu 18.04
Python:3.6.5

わたしも:

OS:Ubuntu 16.04
Python:3.5
NVIDIAドライバーバージョン:384.130

編集:ソースからの構築は機能します

どうもありがとう!!!

CUDA9.0 + cuDNN7.1 + Tensorflow-gpu1.5が機能しています

同じ問題。 Ubuntu16とUbuntu17で、それぞれ8GB以上のRAMと4GHz以上のCPUを搭載した3台の異なるマシンでテストしました。 GPUマシンでも問題が発生します。

私のUbuntuサーバー16.04でも同じ問題が発生します。 ソースからTensorFlow(r1.8)をコンパイルし、ローカルからpip installをコンパイルすることで解決しました:+1:

この問題には、Dockerイメージも含まれます。 ソースからコンパイルしたくありません。 それを回避する方法はありますか? 私もダウングレードしたくありません。

私の場合、Bazelを使用してTensorFlow(Ubuntu 18.04)をコンパイルすると、問題が解決しました。 しかし、コンパイルには時間がかかりました。

私の場合も、TensorFlow1.9を再コンパイルすることで問題が解決しました。 しかし、numpy1.15に関連する別の問題が発生しました。 numpy 1.14.5にダウングレードするとコンパイルが機能し、pipパッケージをインストールできるようになりました。

この問題が解決されたのはなぜですか? TensorFlow1.10でも引き続き発生しています。

ソースからビルドする必要をなくすのに役立つ可能性のある、テンソルフローのいくつかのコミュニティビルドへのリンクをここに投稿し

実際、私はhttps://www.tensorflow.org/install/install_linuxにある指示に従い、そのインストールページで要求されたとおりにテストすると、「不正な指示(コアダンプ)」しか得られませんでした。

この問題を解決するか、意味のある実際の解決策を用意する(つまり、バージョン1.5をインストールしない)必要があります。

Ubuntu18.04で動作しました。 繰り返しになりますが、インストールページでバージョンについて言及することは、何が機能し、何が機能しないかについての解決策としては良い考えかもしれません。

まあ、この問題はまだ続いているようです..しかし私は非常に簡単な解決策を持っています
それはあなたが同時にトレンドに従うようになります:-)。

CONDAをインストールしてください!!!
condaをインストールするには、グーグルで検索してください:-)

必要に応じて、コンダ環境を作成します。

コンダクリエイト

そして単に実行します:

conda install tensorflow

最後のコマンドが機能しない場合は、次の方法で別のチャネルを検索してください
ランニング:

anaconda検索テンソルフロー

これにより、ダウンロードできるチャネルのリストが出力されます。
1つのチャネルを選択して実行します。

アナコンダショー

これにより、ダウンロードするために入力する必要のあるコマンドが表示されます
テンソルフロー。
そのコマンドを実行します。

それでおしまい !

コンダに移動!!!

22:38アレクシスウィルケの木、2018年8月23日には[email protected]
書きました:

確かに、私はで見つかった指示に従いました
https://www.tensorflow.org/install/install_linuxそしてそれ以上何も得られない
要求どおりにテストする場合の「不正な命令(コアダンプ)」よりも
そのインストールページ。

この問題は解決されるべきではないか、実際の解決策があります。
理にかなっています(つまり、バージョン1.5をインストールしていません)


あなたが言及されたのであなたはこれを受け取っています。
このメールに直接返信し、GitHubで表示してください
https://github.com/tensorflow/tensorflow/issues/17411#issuecomment-415592389
またはスレッドをミュートします
https://github.com/notifications/unsubscribe-auth/AWESkUXD-4XomnnPgF6D5QToWVH74JzAks5uTy7PgaJpZM4SbSGu

根本的な問題は、protobufとpthread_onceおよびstd :: call_once周辺の非互換性に関係している可能性があります。 センテンスピースと呼ばれる別のグーグルパッケージの直後にテンソルフローをインポートするときに自分でセグメンテーション違反に遭遇し、センテンスピースのメーカーは、std :: call_once実装を別のものに置き換えるprotobufのパッチを作成することでそれを修正しました。

https://github.com/google/sentencepiece/issues/186

この問題をより建設的にするために、TensorFlowが最初にCPUで必要な命令をチェックし、それらが欠落している場合はエラーを出力すると便利だと思います。 同様に、現在、いくつかの命令は利用可能であるがコンパイルされていないということです。 そうすれば、バグを区別するのが簡単になり、特定のCPUに正しいバイナリを使用しないほうが簡単になります。

royyannick氏..実際、私は何度もgoogleを検索していて、KerasとTensoflowの両方の勉強に影響を与えましたが、今日は私の一日を過ごしました。あなたは素晴らしいです。
ありがとう

同じエラーで、Ubuntu16.04のtensorflow1.10.1(最新)で仮想環境と(f ... ing)conda(あなた、アップストリーム、go fys!)の両方を試しました。 以前のバージョン1.9に切り替えました-すべてが正常に動作します。

古いCPUを実行しているマシンでこの問題を再現しました。 これは、問題を解決するための可能なオプションを説明する記事です

AVXをサポートせずに古いCPU用の最新のTensorFlowをインストールしたいが、ソースからビルドする時間がない場合は、このGithubリポジトリからWHLファイルをダウンロードすることもでき

BSです。 インストールを1.9にロールバックし(この記事で言うように「1.6より前」ではありません)、バイナリは機能しました(一昨日)。

これをコマンドラインで実行する場合:

1)

$ lsb_release -a| grep "Release" | awk '{print $2}'

2)

$ grep flags -m1 /proc/cpuinfo | cut -d ":" -f 2 | tr '[:upper:]' '[:lower:]' | { read FLAGS; OPT="-march=native"; for flag in $FLAGS; do case "$flag" in "sse4_1" | "sse4_2" | "ssse3" | "fma" | "cx16" | "popcnt" | "avx" | "avx2") OPT+=" -m$flag";; esac; done; MODOPT=${OPT//_/\.}; echo "$MODOPT"; }

1)の場合は16.04 、2)の場合は-mavxまたは-mavx2

それらのフラグがない場合は、それをメモに追加する必要があります。ありがとうございます。

ここで同じエラー、

CentOS 7、Python 3.6.5、Intel CPUcore2デュオe8500。 ピップインストール。

バージョン1.9は機能しません。 バージョン1.5は問題なくインポートします。

バージョン1.10は、Ubuntu18.04とInteli5-6200Uを搭載した私のラップトップでは問題ないようです。

これはhttps://www.tensorflow.org/install/install_sourcesに記載されてい
注:1.6リリース以降、ビルド済みのバイナリはAVX命令を使用します。

それはもっと目立つ場所で言及されたかもしれないと思います!

これで私の問題は解決しました:
NVIDIAドライバー、CUDA Toolkit、およびCUDNNをインストールした後。
最初にtensorflow-gpuアンインストールします:

$ pip uninstall tensorflow-gpu

次に、 Anacondaを使用してtensorflow-gpuをインストールします。

$ conda create -n tensorflow
$ conda install tensorflow-gpu -n tensorflow

実行してみてください
pipアンインストールtensorflow
その後
pip install tensorflow == 1.5

編集
ただ信用を与えるために、解決策はここからです:
https://stackoverflow.com/questions/49094597/illegal-instruction-core-dumped-after-running-import-tensorflow

それが機能するおかげで

多分AVX命令に関連しています。 pip prebuilt tensorflow-1.6以降のバージョンはAVX命令でビルドされ、一部のCPUにはAVX命令がありません。 pip prebuilttensorflow-1.5はAVX命令でビルドされていません。
提案:1):テンソルフローの下位バージョンを使用する
2):ソースから上位バージョンのtensorflowをコンパイルします

はい。 それはそう。 ただし、ソフトウェアが単にクラッシュするのではなく、教えてくれるのであれば、それは良いことです。 要件に問題はありません。処理方法だけです... Linuxでは、 avx flags行の/proc/cpuinfoをチェックインするのは非常に簡単です。 avxが表示される必要があります。 そうでない場合は、エラーとexit(1)生成します。

これがAVXのない古いコンピューターのフラグです

フラグ:fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good tm2 ssse3 cx16 xtpr pdcm sse4_1 sse4_2 popcnt lahf_lm ssbd ibrs ibpb stibp kaiser tpr_shadow vnmi flexpriority ept vpid dtherm ida flush_l1d

システムインフォメーション

-
Lenovo-G500 8GB RAMの説明:CPU
製品:Intel(R)Core(TM)i3 CPU M 330 @ 2.13GHz
バス情報: cpu @ 0
バージョン:CPUバージョン
OS; Ubuntu-16.05
ピップ:最新バージョン18
私はGPUを持っていません

また、不正な命令コアがダンプされます。 tensorforflow 1.5は私のために働いています、
しかし
プロジェクトに最新のtensorflowv1.100rをインストールする必要があります。

さまざまな方法でテンソルフローにインストールしようとしましたが、

  1. anacodaなし、python 2.7、pipを使用... pip install --upgrade tensorflow
    2 anacodaなし、python 3.5、pip ""を使用
    3. anacodaなし、python 3.6、pip ""を使用
    4. anacoda、python 2.7、conda conda install -c conda-forgetensorflowを使用
    5. anacodaなし、python 2.7、pip ""を使用
    6. anacodaなし、python 2.7、pip ""を使用

どちらも私のために働いた、
問題は何ですか。

@bandarikanth

tensorflowをインストールする方法は重要ではありません。 問題は、tensorflow 1.6以降のビルド済みバイナリにはAVX命令セット拡張が必要であり、プロセッサがAVXをサポートしていないことです。 ソースからビルドするか、新しい十分なプロセッサを搭載したコンピュータに移動するか、1.5を使用することができます。

ありがとう

2018年12月30日、日曜日の午前12:24にDan Stine < [email protected]は次のように書いています。

@bandarikanth https://github.com/bandarikanth

tensorflowをインストールする方法は重要ではありません。 問題
tensorflow1.6以降のビルド済みバイナリにはAVXが必要です
https://en.m.wikipedia.org/wiki/Advanced_Vector_Extensions命令
拡張機能を設定すると、プロセッサはAVXをサポートしません。 あなたはどちらかをすることができます
ソースからビルドするか、新しい十分なプロセッサを搭載したコンピュータに移動するか、スティックします
1.5で。


あなたが言及されたのであなたはこれを受け取っています。
このメールに直接返信し、GitHubで表示してください
https://github.com/tensorflow/tensorflow/issues/17411#issuecomment-450512554
またはスレッドをミュートします
https://github.com/notifications/unsubscribe-auth/AZf77RdABm0uQsxiPx0uxd45q_rz9pUVks5u97pPgaJpZM4SbSGu

1.5にダウングレードすると機能します(pip install tensorflow == 1.5)

関連: https

tensorflow-gpu2.0でこの問題が発生しました

▶ uname -r; pacman -Q linux
5.0.10-arch1-1-ARCH
linux 5.0.10.arch1-1

▶ conda env export
name: Science
channels:
  - defaults
dependencies:
  - cudatoolkit=10.0.130=0
  - cudnn=7.3.1=cuda10.0_0
prefix: /home/archangel/anaconda3/envs/Science
▶ pip freeze | ack "tensor"
tensorflow-gpu==2.0.0a0
▶ ipython                                                          
Python 3.7.3 (default, Mar 27 2019, 22:11:17)                      
Type 'copyright', 'credits' or 'license' for more information      
IPython 7.4.0 -- An enhanced Interactive Python. Type '?' for help.

In [1]: import tensorflow as tf                                    
[1]    25429 illegal hardware instruction (core dumped)  ipython   



md5-b2492dc6f0518a4ba524a15157565fb3



[18556.882892] traps: ipython[25429] trap invalid opcode ip:7fc41cde1a22 sp:7ffe68904500 error:0 in libtensorflow_framework.so[7fc41c877000+104c000]
[18556.885033] audit: type=1701 audit(1556951396.587:43): auid=4294967295 uid=1000 gid=1000 ses=4294967295 pid=25429 comm="ipython" exe="/home/archangel/anaconda3/bin/python3.7" sig=4 res=1
[18556.894046] audit: type=1130 audit(1556951396.594:44): pid=1 uid=0 auid=4294967295 ses=4294967295 msg='unit=systemd-coredump@4-25462-0 comm="systemd" exe="/usr/lib/systemd/systemd" hostname=? addr=? terminal=?
 res=success'
[18557.506049] audit: type=1131 audit(1556951397.204:45): pid=1 uid=0 auid=4294967295 ses=4294967295 msg='unit=systemd-coredump@4-25462-0 comm="systemd" exe="/usr/lib/systemd/systemd" hostname=? addr=? terminal=?
 res=success'


AVXをサポートするi7-3520Mでこのクラッシュが発生します。

編集:気にしないでください、クラッシュはAVX2の一部であるshlx命令で発生します。 少なくとも、バニラAVXのサポートだけでは不十分であることを示しています。

tensorflow1.14.0および2.0.0b1にはまだ問題があります。

Linux Mint19と2.0.0b1でも同じエラーが発生します。
公式サイトのインストールページから指示されたようにpip3でインストールしただけ

tf1.5は、Debian8.8リポジトリでは使用できません。

avxを試す時間です。

OSが関連するPythonプロセスを強制終了してから、この「不正な命令」行を出力ログファイルに書き込んでフラッシュする前に、これを見つけるのは途方もなく困難でした。Pythonプロセスの終了コードは0のようです。 。

私も2.0.0-beta1を使用していましたが、現在、2.0.0に置き換えるとこれが修正されるかどうかを調べています。

私もこの問題を抱えています。 python2ます。 CPU1.5バージョンへのダウングレードが役立ちました。

Ubuntu18.04の仮想環境で実行されているTensorflow2でこの問題が発生しています。 Tensorflowの開発者がTF2を準備ができており、このがらくたが発生したときに利用できるようにすることは、私の心を打つだけです。 感心しません、あなたはTF開発者です。

dmesg出力(bashから):
[333908.854310]トラップ:python [12862]トラップ無効なオペコードip:7f8c46e6d820 sp:7ffc87609f78 error:0 in _pywrap_tensorflow_internal.so [7f8c3e250000 + a9f8000]
linuxmint 19
Intel(R)Pentium(R)CPU P6200 @ 2.13GHz
8Gbラム(キングストン)

これはCPUに関連する大きな問題です。

このスレッドを読んで同じ経験をした後、私の問題は、私のLinuxコンピューターが古く、AVX命令セットをサポートしないCPUを搭載していることです。 別の仮想環境にtensorflow1.5がありますが、tensorflow 2を使用するには、GoogleColabでスクリプトを実行する必要があります。

AVXの要件が理にかなっているかどうかを言う知識がありません。 私が知っているのは、この問題は古いCPUだけでなく、私のIntelN5000のようなかなり最近のCPUでも発生するということです。 N5000でディープラーニングを行うのは少し難しいと思いますが、テンソルフローがRaspberryPiでもサポートされている場合は、問題は発生しません。

とにかく、ソースからコンパイルして、Intel N5000に最後のバージョンのTensorFlow(2.0)をインストールしました。 大量のRAMが必要で、パーティーに招待されたのは4Gbしかないため、シングルコアでコンパイルを実行する必要があったため、14時間かかりました。

ここでこのガイドからインスピレーションを得

楽しんで、面倒に感謝します。 非AVX用にすでにコンパイルされているバイナリをpipを介して提供することは、継続的インテグレーションワークフローに追加するには明らかに多すぎます

返信ありがとうございます、ルカ。 私は本当に古いUbuntu18.04デスクトップを持っています
これは、TF2を実行する場合を除いて、実際には非常にうまく機能します。
最新のPyTorch(1.3.0)だと思います。
Torch 1.1.0は私にとっては問題なく動作し、TF2に関してはGoogleColabを使用しています。
正常に動作します。 引退したデータアナリストであり、私の趣味のプロフィールを維持しています

あなたの投稿のためのThans

6:52 PMルカOlivieriの土曜、2019年12月7日には[email protected]
書きました:

AVXの要件が理にかなっているのか、それとも
いいえ。 私が知っているのは、問題は古いものだけでなく、それ自体が現れるということです
CPUだけでなく、私のIntelN5000のようなかなり最近のものもあります。 わかった
N5000でディープラーニングを行うのは少し難しいですが、テンソルフローの場合
RaspberryPiでもサポートされていますが、問題はありません。

とにかく、Intel N5000に最新バージョンのTensorFlow(2.0)をインストールしました
ソースからコンパイルすることによって。 私は実行しなければならなかったので14時間かかりました
大量のRAMが必要で、私が持っているのは1つのコアだけなので、シングルコアでのコンパイル
4Gbがパーティーに招待されました。

ここでこのガイドからインスピレーションを得ました
https://tech.amikelive.com/node-882/how-to-build-and-install-the-latest-tensorflow-without-cuda-gpu-and-with-optimized-cpu-performance-on-ubuntu/
しかし、経験は決してスムーズではなく、常に依存関係がありました
コンパイルをインストールして再起動する必要があることを見逃しています。 いくつかの
コンパイルがクラッシュしたときに私が解決した他のことも。

楽しんで、面倒に感謝します。 すでにバイナリのpipを介して提供する
非AVX用にコンパイルされたものは明らかに多すぎて継続的に追加できませんでした
統合ワークフロー


あなたがコメントしたのであなたはこれを受け取っています。
このメールに直接返信し、GitHubで表示してください
https://github.com/tensorflow/tensorflow/issues/17411?email_source=notifications&email_token=ACYHH362LGI5EZY3G74CMVLQXQZKDA5CNFSM4ETNEGXKYY3PNVWWK3TUL52HS4DFVREXG43VMVBW63LNMVXHJKTDN5
または購読を解除する
https://github.com/notifications/unsubscribe-auth/ACYHH3YLNAER6NGNLKYNMPDQXQZKDANCNFSM4ETNEGXA

-
Clive DaSilva CPA、CMA
ホーム:416-421-2480 |モバイル:416-560-8820
メール:clive。 [email protected]
LinkedIN: http ://ca.linkedin.com/pub/clive-dasilva/3/197/b89

GitlabサーバーでCIパイプラインを実行するときにも同じ問題が発生しました。 ランナーの(エミュレートされた)CPUはAVX命令を提供しませんでした。

PyPIのホイールを使用する代わりにCondaを使用してTensorflowをインストールすると、問題が修正されました。 :+1:

Tensorflow2.1.0でも同じ問題が発生します。 何をすべきか?

Architecture:        x86_64
CPU op-mode(s):      32-bit, 64-bit
Byte Order:          Little Endian
CPU(s):              48
On-line CPU(s) list: 0-47
Thread(s) per core:  1
Core(s) per socket:  12
Socket(s):           4
NUMA node(s):        8
Vendor ID:           AuthenticAMD
CPU family:          16
Model:               9
Model name:          AMD Opteron(tm) Processor 6176
Stepping:            1
CPU MHz:             800.000
CPU max MHz:         2300.0000
CPU min MHz:         800.0000
BogoMIPS:            4599.77
Virtualization:      AMD-V
L1d cache:           64K
L1i cache:           64K
L2 cache:            512K
L3 cache:            5118K
NUMA node0 CPU(s):   0-5
NUMA node1 CPU(s):   6-11
NUMA node2 CPU(s):   12-17
NUMA node3 CPU(s):   18-23
NUMA node4 CPU(s):   24-29
NUMA node5 CPU(s):   30-35
NUMA node6 CPU(s):   36-41
NUMA node7 CPU(s):   42-47
Flags:               fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm 3dnowext 3dnow constant_tsc rep_good nopl nonstop_tsc cpuid extd_apicid amd_dcm pni monitor cx16 popcnt lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw ibs skinit wdt nodeid_msr hw_pstate vmmcall npt lbrv svm_lock nrip_save pausefilter

bazelを使用してソースからビルドすることで、問題を解決することができました。 whlファイルを作成しました。 次に、pip installwhlファイルパスを実行しました

はい、CPUがAVXをサポートしていない場合( Illegal instruction (core dumped)エラーの原因となる可能性があります)、ソースからコンパイルする必要があります。 これにより、AVX命令なしでコードが生成され、使用できるようになります。

さらに、これにより、ピップがプラットフォームで利用可能な最高の最適化レベルで構築されることが保証されるため、別のプラットフォームで構築されたピップを使用する場合と比較して、実際にある程度のスピードアップが見られる場合があります。 力に焦点を当てます。

condaでtensorflowをインストールするには、次のコマンドを実行します。
conda install -c conda-forgetensorflow
わたしにはできる。

このページは役に立ちましたか?
0 / 5 - 0 評価