Pytorch: masalah dengan obor.util.tensorboard add_graph()

Dibuat pada 11 Agu 2019  ·  61Komentar  ·  Sumber: pytorch/pytorch

kode

import torch
import torch.nn as nn
from torch.utils.tensorboard import SummaryWriter

class LeNet(nn.Module):
    def __init__(self):
        super(LeNet, self).__init__()
        self.conv1 = nn.Sequential(     #input_size=(1*28*28)
            nn.Conv2d(1, 6, 5, 1, 2),
            nn.ReLU(),      #(6*28*28)
            nn.MaxPool2d(kernel_size=2, stride=2),  #output_size=(6*14*14)
        )
        self.conv2 = nn.Sequential(
            nn.Conv2d(6, 16, 5),
            nn.ReLU(),      #(16*10*10)
            nn.MaxPool2d(2, 2)  #output_size=(16*5*5)
        )
        self.fc1 = nn.Sequential(
            nn.Linear(16 * 5 * 5, 120),
            nn.ReLU()
        )
        self.fc2 = nn.Sequential(
            nn.Linear(120, 84),
            nn.ReLU()
        )
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = self.conv1(x)
        x = self.conv2(x)
        x = x.view(x.size()[0], -1)
        x = self.fc1(x)
        x = self.fc2(x)
        x = self.fc3(x)
        return x

dummy_input = torch.rand(13, 1, 28, 28)
model = LeNet()
with SummaryWriter(comment='Net', log_dir='/output') as w:
    w.add_graph(model, (dummy_input, ))

Bug

log_dir benar
Tapi tensorboard tidak menunjukkan apa-apa
Apakah ada yang mengalami masalah yang sama?

Untuk Mereproduksi

Perilaku yang diharapkan

Lingkungan

  • Versi PyTorch (misalnya, 1.0): 1.2.0
  • OS (misalnya, Linux): ubuntu16.04
  • Bagaimana Anda menginstal PyTorch ( conda , pip , sumber): pip
  • Perintah build yang Anda gunakan (jika dikompilasi dari sumber): pip install torch -U
  • Versi Python: 3.6
  • Versi CUDA/cuDNN: CUDA 10.0.130
  • Model dan konfigurasi GPU: GTX1080Ti
  • Informasi lain yang relevan:

konteks tambahan

tensorboard triaged

Komentar yang paling membantu

Saya juga mendapatkan halaman grafik yang kosong. Saya melakukan flush dan menutup SummaryWriter.
Melampirkan tangkapan layar termasuk konsol Chrome yang menunjukkan kesalahan yang mungkin terkait.

Catatan:

  • Saya memang melihat grafik tekstual dibuang ke konsol baris perintah dan sepertinya benar di sana.

Konfigurasi:

  • PyTorch 1.2.0
  • TensoBoard 1.14.0
  • Python 3.5.2

image

Semua 61 komentar

Anda perlu menutup penulis atau menyiramnya.

    w.flush()
    w.close()

Saya menghadapi masalah yang sama dan mempostingnya di StackOverflow
Itu akan menghasilkan log, tetapi dalam kasus saya masih tidak dapat memuatnya di tensorboard, memberikan

Penolakan Janji yang Tidak Tertangani: TypeError: null bukan objek (mengevaluasi 'Fa.node')

Kesalahan di konsol browser saat memuat grafik. Saya telah mencoba grafik yang dihasilkan di tensorflow dan berhasil, hanya dengan grafik pytorch, bahkan grafik yang disediakan dalam tutorial untuk tensorboard di pytorch ( yang menggunakan torchvision ). File log memang berisi grafik, seperti yang saya lihat di isinya, dan skrip tidak mengeluh saat menyimpannya, itu hanya saat memvisualisasikan waktu di tensorboard. Beri tahu saya jika Anda dapat memvisualisasikan grafik Anda.

Saya dapat mengonfirmasi bahwa masalah dengan Penolakan Janji yang Tidak Tertangani tidak terjadi di 1.1, saya menurunkannya ke 1.1 dan berhasil, grafik sekarang ditampilkan di Tensorboard. Anehnya, grafik yang dihasilkan oleh 1.1 hanya memiliki 124 elemen, sedangkan satu dengan 1.2, ada 507. Ini ditunjukkan ketika verbose adalah True, dan saya melampirkan output dalam file txt yang dihasilkan oleh keduanya.
verbose_graph_1.1.txt
verbose_graph_1.2.txt

Masih kosong setelah menyegarkan

import torch
import torchvision.models as models
from torch.utils.tensorboard import SummaryWriter
resnet18 = models.resnet18(pretrained=True)
x = torch.randn(1, 3, 224, 224)
writer = SummaryWriter()
writer.add_graph(resnet18, x)
writer.close()

Mengumpulkan informasi lingkungan...
Versi PyTorch: 1.2.0
Apakah debug build: Tidak
CUDA digunakan untuk membangun PyTorch: Tidak ada

OS: Mac OSX 10.14.6
Versi GCC: Tidak dapat mengumpulkan
Versi CMake: versi 3.13.4

Versi Python: 3.7
Apakah CUDA tersedia: Tidak
Versi runtime CUDA: Tidak ada CUDA
Model dan konfigurasi GPU: Tanpa CUDA
Versi driver Nvidia: Tidak ada CUDA
versi cuDNN: Tidak ada CUDA

Versi perpustakaan yang relevan:
[pip3] numpy==1.15.4
[conda] blas 1.0 mkl
[conda] mkl 2019.4 233
[conda] mkl_fft 1.0.12 py37h5e564d8_0
[conda] mkl_random 1.0.2 py37h27c97d8_0
[conda] pytorch 1.2.0 py3.7_0 pytorch
[conda] pytorch-nightly 1.2.0.dev20190629 py3.7_0 pytorch
[conda] pytorch-transformers 1.0.0 pypi_0 pypi
[conda] torchaudio 0.3.0 py37 pytorch
[conda] torchsummary 1.5.1 pypi_0 pypi
[conda] torchvision 0.4.0 py37_cpu pytorch

Jika Anda memeriksa file log Anda, Anda akan melihatnya berisi grafik, itu adalah kesalahan yang berbeda dari yang pertama disebutkan oleh Ginsoda.

Apakah Anda mendapatkan halaman grafik di Tensorboard tetapi grafiknya tidak dimuat? Jika Anda memeriksa konsol browser Anda apakah itu mengatakan

Penolakan Janji yang Tidak Tertangani: TypeError: null bukan objek (mengevaluasi 'Fa.node')

Karena dalam hal itu adalah masalah yang sama yang saya hadapi. Saya harus menurunkan versi ke v1.1, tetapi grafik di sana jauh lebih sederhana dan tidak berisi semua model.

Halo semua,
@ LittlePea13 dalam kasus saya, saya memiliki masalah yang sama persis seperti Anda (tab muncul, tetapi model tidak memuat dan saya memiliki kesalahan browser yang sama)! Belum diturunkan ke v1.1.

Saya juga mendapatkan halaman grafik yang kosong. Saya melakukan flush dan menutup SummaryWriter.
Melampirkan tangkapan layar termasuk konsol Chrome yang menunjukkan kesalahan yang mungkin terkait.

Catatan:

  • Saya memang melihat grafik tekstual dibuang ke konsol baris perintah dan sepertinya benar di sana.

Konfigurasi:

  • PyTorch 1.2.0
  • TensoBoard 1.14.0
  • Python 3.5.2

image

Perhatikan bahwa saya juga mendapatkan kesalahan yang sama saat menyalin contoh yang diberikan dalam dokumentasi PyTorch:
https://pytorch.org/docs/stable/tensorboard.html

Satu-satunya perbedaan adalah saya tidak menggunakan TensorBoard setiap malam, tetapi TensorBoard 1.14.0 yang dirilis.

Saya mengalami masalah yang sama - adakah keberuntungan dalam melacak masalah?

saya juga.
informasi lingkungan saya:
Windows 10
python3.6
pytorch 1.2 Apakah CUDA tersedia: Tidak
tensorboard 1.14 atau tb-nightly 1.14.0a20190614 atau tb-nightly 1.15.0a20190826
aliran tensor 1.14
tensorboardX 1.8
numpy 1.17.0
blank

Mendapatkan masalah yang sama dengan @alqbib dan @rfejgin , saya menjalankan kode tutorial yang terletak di https://pytorch.org/tutorials/intermediate/tensorboard_tutorial.html

@apaszke @orionr , @lanpa - ada ide? Terima kasih!

Petunjuk saya adalah bahwa ini karena masalah compat TensorBoard (kasus non-TensorFlow) yang kami lihat di mana direktori log tidak diperbarui dengan benar. Diperbaiki di https://github.com/tensorflow/tensorboard/pull/2342. Sayangnya ini tidak berhasil untuk TensorBoard 1.14, jadi Anda memiliki tiga opsi - (1) gunakan TensorBoard setiap malam dengan perbaikannya, (2) instal TensorFlow untuk memanfaatkan jalur kode itu di TensorBoard atau (3) mulai ulang TensorBoard secara berkala untuk itu mengambil perubahan.

Harap beri tahu kami jika salah satu dari opsi tersebut menanganinya.

Masalah yang sama dengan TB setiap malam. Saya tidak berpikir itu (3) karena ini terjadi bahkan ketika saya me-restart TB setelah dump grafik selesai. Akan mencoba (2).

Masalah yang sama dengan TensorFlow 1.14.0

Mungkin terkait - lihat tangkapan layar kesalahan di konsol Chrome di atas
https://github.com/pytorch/pytorch/issues/24157#issuecomment -525055887

Menarik - Anda benar bahwa keluaran konsol Chrome tidak biasa. Saya ingin tahu apakah proto grafik kami entah bagaimana salah dalam kasus ini. @lanpa dapatkah Anda mengonfirmasi bahwa kode tutorial berfungsi untuk Anda? Terima kasih.

@lanpa : Saya tidak yakin apa yang Anda maksud dengan acungan jempol - apakah kode tutorial berfungsi untuk Anda?
Saya telah melihat masalah ini (grafik tidak ditampilkan) baik dengan kode tutorial dan model saya sendiri. Mengingat bahwa orang lain telah mengamati hal yang sama, tampaknya ada sesuatu yang rusak dalam fungsi grafik...

cc @sanekmelnikov @natalialunova

Dapat mengkonfirmasi masalah yang sama dengan kode tutorial serta model khusus.
Output verbose terlihat baik-baik saja, grafik tidak dimuat dengan kesalahan konsol di chromium:

(index):24242 Uncaught (in promise) TypeError: Cannot read property 'node' of null
    at (index):24242
    at arrayEach ((index):13920)
    at Function.forEach ((index):14082)
    at B.buildSubhierarchy ((index):24242)
    at new B ((index):24229)
    at HTMLElement.<anonymous> ((index):25062)
    at Object.d.time ((index):24285)
    at HTMLElement._buildRenderHierarchy ((index):25061)
    at HTMLElement._buildNewRenderHierarchy ((index):25061)
    at Object.runMethodEffect [as fn] ((index):3714)

tb-malam (1.15.0a20190902)
pytorch (paket obor terbaru melalui pip)

Terjebak oleh masalah yang sama, ada berita?

Sepertinya beberapa grafik menyebabkan masalah ini. Perbaikan potensial ada di https://github.com/pytorch/pytorch/pull/25599/ tetapi kami masih mengonfirmasi. Jika Anda ingin menerapkan perubahan itu secara lokal dan mengonfirmasi bahwa itu memperbaiki masalah Anda, itu bagus.

Hai @orionr , saya dapat mengonfirmasi bahwa tensorboard memang menampilkan grafik sekarang! Terima kasih!

Hai @orionr , saya dapat mengonfirmasi bahwa tensorboard memang menampilkan grafik sekarang! Terima kasih!

Gerakan mengungkap kekerasan seksual demi menghapuskannya! Terima kasih!

Dalam hal ini, arahkan perubahan sehingga ada di pytorch-nightly . Kami kemudian akan menambahkan pengujian yang lebih kuat di sekitar kasus ini. Terima kasih!

Bekerja di sini juga, terima kasih atas perbaikannya.

Perbaiki mendarat. Harap konfirmasi diperbaiki di pytorch-nightly setelah build malam ini, tetapi ditutup.

Bekerja pada pytorch-nightly terakhir. Terima kasih!

@orionr Tidak berfungsi untuk saya, saya masih memiliki persegi panjang kosong setelah memperbarui ke versi malam. Saya memiliki pesan berikut di konsol web (ketika mencoba memuat grafik), sama seperti https://github.com/pytorch/pytorch/issues/24157#issuecomment -525055887

:formatted:85668 Uncaught (in promise) TypeError: Cannot read property 'node' of null
    at :formatted:85668
    at arrayEach (:formatted:22625)
    at Function.forEach (:formatted:25823)
    at B.buildSubhierarchy (:formatted:85666)
    at new B (:formatted:85398)
    at HTMLElement.<anonymous> (:formatted:87876)
    at Object.d.time (:formatted:86482)
    at HTMLElement._buildRenderHierarchy (:formatted:87866)
    at HTMLElement._buildNewRenderHierarchy (:formatted:87858)
    at Object.runMethodEffect [as fn] (:formatted:11682)
  • papan tensor: 1.15.0 setiap malam
  • obor: 1.3.0 setiap malam
  • ular piton: 3.7

Saya akan mencoba pytorch-nightly hari ini - masalah saya adalah gambar grafik kosong, dengan dua persegi panjang kosong.

Aku juga, halaman kosong dengan dua persegi panjang kosong!!
obor: 1.2.0
papan nsor: 2.0.0
ular piton:3.5

Sama, halaman kosong dengan dua persegi panjang kosong. terlepas dari menggunakan paket pip atau andaconda.
obor 1.2.0
papan tensor: 1.14.0
ular piton: 3.7
ubuntu 16.04

@zhyj3038 dan @dnovischi apakah Anda mencoba pytorch-nightly? Harap konfirmasi bahwa itu memperbaiki masalah Anda. Jika demikian, ini akan diperbaiki dalam rilis 1.3.0.

@zhyj3038 dan @dnovischi apakah Anda mencoba pytorch-nightly? Harap konfirmasi bahwa itu memperbaiki masalah Anda. Jika demikian, ini akan diperbaiki dalam rilis 1.3.0.

Sudah baik sekarang.
obor: 1.3.0 setiap malam
papan nsor: 2.0.0
ular piton:3.5
ubuntu:16.04

Maaf, torch:1.3.0 nightly tidak memperbaiki masalah pada python 3.7. Saya akan menurunkan kelas ke python 3.5 akhir pekan ini, untuk melihat apakah itu masih menjadi masalah.

@dnovischi , terima kasih telah memberi tahu kami bahwa 1.3 tidak berfungsi. Bisakah Anda memposting sepotong kode contoh yang menunjukkan masalahnya? cc @lanpa @sanekmelnikov

@orionr Ini dia dan terima kasih atas tanggapan cepatnya.

contoh-obor-malam.zip

Memperbarui:
Menginstal paket masa depan memecahkan masalah untuk pengaturan berikut:
obor 1.3.0.dev2019091
papan tensor 1.14.0
ular piton 3.6
ubuntu 16.04

Namun, saya sekarang mendapatkan peringatan saat meluncurkan server tensorboard:
"FutureWarning: Melewati (tipe, 1) atau '1tipe' sebagai sinonim dari tipe tidak digunakan lagi; ..."
Tentu saja, ini adalah masalah tensorflow.

Perhatikan juga bahwa dalam contoh kode di atas, saya lupa menutup penulis ringkasan, tb.close()

Sedang mengalami masalah yang sama.

Saya pikir itu perlu untuk memiliki tensorboard-2.0.0. Saya tidak bisa membuatnya bekerja dengan tensorboard-1.14 dan pytorch nightly build.

Edit: Apakah sekarang bekerja dengan Python 3.6, tensorboard-2.0.0, pytorch-1.3.0dev20190925, Mac OS 10.14.6.

@orionr Terima kasih atas bimbingan Anda,Saya baru saja memecahkan masalah ini.
Versi: kapan:
obor 1.3.0.dev20191002
papan tensor 1.14.0
Python 3.7

image

Juga bekerja dengan

  • pytorch 1.3.0.dev20190917
  • papan tensor dari tf 2.0.0

saya perbarui ke

  • obor setiap malam 1.3.0.dev20191003
  • masih menggunakan tensorflow 1.14.0
  • python 3.7.2

dan itu masih tidak berhasil untuk saya. (Dengan log konsol web yang sama).

image

Selama pembuatan grafik, saya mendapatkan jejak berikut:

.../MEDeA/medea/models/transformer/cells.py:17: TracerWarning: Converting a tensor to a Python index might cause the trace to be incorrect. We can't record the data flow of Python values, so this value will be treated as a constant in the future. This means that the trace might not generalize to other inputs!
  mask[i, :tensor.size(0)] = 1
.../MEDeA/medea/models/transformer/cells.py:131: TracerWarning: Converting a tensor to a Python index might cause the trace to be incorrect. We can't record the data flow of Python values, so this value will be treated as a constant in the future. This means that the trace might not generalize to other inputs!
  x = x + self.pe[:x.size(0), :, :x.size(-1)]
.../MEDeA/medea/models/transformer/cells.py:64: TracerWarning: Converting a tensor to a Python boolean might cause the trace to be incorrect. We can't record the data flow of Python values, so this value will be treated as a constant in the future. This means that the trace might not generalize to other inputs!
  assert e == self.input_dim, f'Input dim ({e}) should match layer input dim ({self.input_dim})'
.../MEDeA/medea/models/transformer/cells.py:83: TracerWarning: Converting a tensor to a Python float might cause the trace to be incorrect. We can't record the data flow of Python values, so this value will be treated as a constant in the future. This means that the trace might not generalize to other inputs!
  scores = torch.matmul(query, key.transpose(-1, -2)) / math.sqrt(key_dim)  # matrix multi and scale
.../MEDeA/medea/models/transformer/decoder.py:79: TracerWarning: torch.tensor results are registered as constants in the trace. You can safely ignore this warning if you use this function to create tensors out of constant variables that would be the same every time you call this function. In any other case, this might cause the trace to be incorrect.
  decoder_outputs = [torch.tensor(first_item).float().view(self.batch_size, -1)]  # first item is not predicted
.../MEDeA/medea/models/transformer/decoder.py:108: TracerWarning: torch.tensor results are registered as constants in the trace. You can safely ignore this warning if you use this function to create tensors out of constant variables that would be the same every time you call this function. In any other case, this might cause the trace to be incorrect.
  prev_predictions = torch.tensor([target_lang_token] * self.batch_size).long().view(self.batch_size, -1)
.../MEDeA/medea/models/transformer/decoder.py:109: TracerWarning: torch.tensor results are registered as constants in the trace. You can safely ignore this warning if you use this function to create tensors out of constant variables that would be the same every time you call this function. In any other case, this might cause the trace to be incorrect.
  eow = torch.tensor([eow_token] * self.batch_size).long().view(self.batch_size)
.../MEDeA/medea/models/transformer/decoder.py:111: TracerWarning: Converting a tensor to a Python boolean might cause the trace to be incorrect. We can't record the data flow of Python values, so this value will be treated as a constant in the future. This means that the trace might not generalize to other inputs!
  while not torch.all(torch.eq(prev_predictions[:, -1], eow)) and i < memory.shape[1]:
.../MEDeA/medea/models/transformer/cells.py:85: TracerWarning: Converting a tensor to a Python integer might cause the trace to be incorrect. We can't record the data flow of Python values, so this value will be treated as a constant in the future. This means that the trace might not generalize to other inputs!
  indices = torch.triu_indices(key_dim, key_dim, offset=1)
.../MEDeA/medea/models/transformer/cells.py:17: TracerWarning: There are 2 live references to the data region being modified when tracing in-place operator copy_ (possibly due to an assignment). This might cause the trace to be incorrect, because all other views that also reference this data will not reflect this change in the trace! On the other hand, if all other views use the same memory chunk, but are disjoint (e.g. are outputs of torch.split), this might still be safe.
  mask[i, :tensor.size(0)] = 1
.../MEDeA/medea/models/transformer/cells.py:86: TracerWarning: There are 2 live references to the data region being modified when tracing in-place operator index_put_. This might cause the trace to be incorrect, because all other views that also reference this data will not reflect this change in the trace! On the other hand, if all other views use the same memory chunk, but are disjoint (e.g. are outputs of torch.split), this might still be safe.
  scores[:, :, indices[0], indices[1]] = -1e-32
.../builds/onnx-tensorflow/onnx_tf/common/handler_helper.py:37: UserWarning: Unknown op ConstantFill in domain `ai.onnx`.
  handler.ONNX_OP, handler.DOMAIN or "ai.onnx"))
.../builds/onnx-tensorflow/onnx_tf/common/handler_helper.py:37: UserWarning: Unknown op ImageScaler in domain `ai.onnx`.
  handler.ONNX_OP, handler.DOMAIN or "ai.onnx"))
.../builds/onnx-tensorflow/onnx_tf/common/handler_helper.py:34: UserWarning: Fail to get since_version of IsInf in domain `` with max_inclusive_version=9. Set to 1.
  handler.ONNX_OP, handler.DOMAIN, version))
.../builds/onnx-tensorflow/onnx_tf/common/handler_helper.py:34: UserWarning: Fail to get since_version of Mod in domain `` with max_inclusive_version=9. Set to 1.
  handler.ONNX_OP, handler.DOMAIN, version))
.../builds/onnx-tensorflow/onnx_tf/common/handler_helper.py:37: UserWarning: Unknown op Range in domain `ai.onnx`.
  handler.ONNX_OP, handler.DOMAIN or "ai.onnx"))
.../builds/onnx-tensorflow/onnx_tf/common/handler_helper.py:34: UserWarning: Fail to get since_version of Resize in domain `` with max_inclusive_version=9. Set to 1.
  handler.ONNX_OP, handler.DOMAIN, version))
.../builds/onnx-tensorflow/onnx_tf/common/handler_helper.py:34: UserWarning: Fail to get since_version of ReverseSequence in domain `` with max_inclusive_version=9. Set to 1.
  handler.ONNX_OP, handler.DOMAIN, version))
.../builds/onnx-tensorflow/onnx_tf/common/handler_helper.py:37: UserWarning: Unknown op Round in domain `ai.onnx`.
  handler.ONNX_OP, handler.DOMAIN or "ai.onnx"))
.../builds/onnx-tensorflow/onnx_tf/common/handler_helper.py:34: UserWarning: Fail to get since_version of ThresholdedRelu in domain `` with max_inclusive_version=9. Set to 1.
  handler.ONNX_OP, handler.DOMAIN, version))
W1003 20:30:03.961869 4491834816 deprecation.py:323] From .../builds/onnx-tensorflow/onnx_tf/handlers/backend/reshape.py:26: add_dispatch_support.<locals>.wrapper (from tensorflow.python.ops.array_ops) is deprecated and will be removed in a future version.
Instructions for updating:
Use tf.where in 2.0, which has the same broadcast rule as np.where
W1003 20:30:03.964736 4491834816 deprecation.py:323] From .../builds/onnx-tensorflow/onnx_tf/handlers/backend/reshape.py:31: sparse_to_dense (from tensorflow.python.ops.sparse_ops) is deprecated and will be removed in a future version.
Instructions for updating:
Create a `tf.sparse.SparseTensor` and use `tf.sparse.to_dense` instead.
W1003 20:30:04.010443 4491834816 deprecation.py:323] From .../builds/onnx-tensorflow/onnx_tf/handlers/backend_handler.py:182: div (from tensorflow.python.ops.math_ops) is deprecated and will be removed in a future version.
Instructions for updating:
Deprecated in favor of operator or tf.math.divide.

@clefourrier dapatkah Anda mencoba menginstal TensorBoard (belum tentu TensorFlow) v2.0 dan melihat apakah itu memperbaikinya untuk Anda?

Seperti yang disebutkan oleh orang lain, saya pikir kita masih membutuhkan py 3.6. Ini berhasil untuk saya:

  • python 3.6.9
  • papan tensor 2.0.0
  • obor 1.3.0.dev20191003

py 3.5 berfungsi. py 3.7 tidak berfungsi.
Tidak mencoba tensorboard 1.14.0

@sanekmelnikov dan @lanpa bisakah kita mencoba py 3.7? Terima kasih.

@clefourrier dapatkah Anda mencoba menginstal TensorBoard (belum tentu TensorFlow) v2.0 dan melihat apakah itu memperbaikinya untuk Anda?

@orionr Saya seharusnya menyebutkan bahwa saya menjalankan tensorboard setiap malam, maaf (tb-nightly - 2.0.0a20190915 )

Baru saja mencoba dengan py3.7 dan tb 2.0 secara lokal dengan Mac dan contoh di https://pytorch.org/docs/stable/tensorboard.html bekerja untuk saya. @clefourrier dan @ysono dapatkah Anda mencoba dan mengisolasi kesalahan Anda masing-masing? Mungkin coba contoh ResNet sederhana di atas untuk melihat apakah itu cocok untuk Anda. Pada titik ini sepertinya kami tidak bisa mendapatkan perbaikan apa pun untuk rilis PyTorch 1.3 segera hadir, tetapi senang untuk memperbaiki apa pun di malam hari setelah kami mengisolasi berbagai hal.

Saya menggunakan 3.7 juga dan tidak memiliki masalah. Mungkin ada operasi khusus yang menyebabkan masalah?

Bagi saya, Tensorboard bukanlah masalahnya tetapi PyTorch IS.

Diuji dengan Pytorch 1.3.0.dev20190917 dan membuat grafik dalam mode horizontal.
Screenshot_2019-10-04_23-32-16

Pytorch 1.1 membuat arsitektur yang sama dengan,
Screenshot_2019-10-04_23-36-38

Versi yang lebih lama adalah yang kami harapkan(?) dan lebih mudah dibaca. Dengan 1,13, tidak mungkin membaca grafik ResNet.

Saya mendapatkan rendering yang sama untuk kedua file ringkasan dengan dua versi Tensorboard yang berbeda

  • 1.14.0
  • 2.1.0a2019100

Terima kasih untuk detailnya. @lanpa , @J0Nreynolds dan @sanekmelnikov mencari untuk meningkatkan visualisasi ini dengan https://github.com/pytorch/pytorch/pull/26639 di 1.4

@orionr Terima kasih atas bimbingan Anda,Saya baru saja memecahkan masalah ini.
di Windows
Versi: kapan:
obor 1.3.1
papan tensor 2.0.1
Python 3.7.4

@shayan113 Masalah apa yang telah Anda pecahkan?
Menghubungkan masalah visualisasi dengan Resnet, saya masih mendapatkan plot yang cukup sulit dibaca:
image

Ubuntu dengan
Obor: 1.3.1
Papan tensor: 2.0.2
Python: 3.7.4

Berhasil. Saya harus menginstal tensorboardX dan mengimpor SummaryWriter dari sana. Juga, saya menginstal semuanya melalui conda.
allVersions
graph

Sayang sekali Anda harus menggunakan tensorboardX alih-alih torch.utils.tensorboard, tetapi senang Anda dapat membuka blokir. @ jonas154 apakah Anda mencoba dengan 1.4? Terima kasih.

@shschong Terima kasih telah berbagi solusi Anda!

@orionr Sejauh ini 1.4 tidak dirilis atau? Saya ingin menunggu sampai rilis versi terbaru. Sejauh ini saya menggunakan alat Hiddenlayer https://github.com/waleedka/hiddenlayer

Terima kasih semua, saya pikir semuanya diselesaikan dengan PyTorch termasuk visualisasi dari atas ke bawah, bukan dari kiri ke kanan. Ini adalah spesifikasi saya

Ubuntu 18.04.3 LTS
obor 1.5.0.dev20200113
papan tensor 2.0.1
Python 3.7

Perbarui ke pytorch 1.4 dan tensorboard 2.1.0 dengan python 3.6, berfungsi dengan baik.

saya menggunakan
obor 1.4.0
papan tensor 2.0.2
Python 3.7.4
TensorBoard masih menampilkan dua persegi panjang untuk grafik.

Hai @orionr @ptrblck
Saya baru saja mengalami masalah lain dengan add_graph .

Paket saya:

pytorch==1.4.0
ypthon==3.7.6

Ketika saya menggunakan

...
train_data_sample, _, _ = iter(dataloader_train).next()
writer.add_graph(model,train_data_sample) 
...

Terjadi kesalahan:

*** RuntimeError: Cannot insert a Tensor that requires grad as a constant. Consider making it a parameter or input, or detaching the gradient

Dan traceback dengan jelas menunjukkan kesalahan yang terjadi saat dipanggil add_graph . Juga, saya mencoba menggunakan change input_to_model menjadi FloatTensor atau LongTensor , semuanya tidak akan berfungsi.


Baru saja dikonfirmasi, itu ada hubungannya dengan DataParallel . Jadi, apakah ada cara untuk menghindari masalah seperti itu tanpa tidak menggunakan DataParallel ?

Hai @orionr @ptrblck
Saya baru saja mengalami masalah lain dengan add_graph .

Paket saya:

pytorch==1.4.0
ypthon==3.7.6

Ketika saya menggunakan

...
train_data_sample, _, _ = iter(dataloader_train).next()
writer.add_graph(model,train_data_sample) 
...

Terjadi kesalahan:

*** RuntimeError: Cannot insert a Tensor that requires grad as a constant. Consider making it a parameter or input, or detaching the gradient

Dan traceback dengan jelas menunjukkan kesalahan yang terjadi saat dipanggil add_graph . Juga, saya mencoba menggunakan change input_to_model menjadi FloatTensor atau LongTensor , semuanya tidak akan berfungsi.

Baru saja dikonfirmasi, itu ada hubungannya dengan DataParallel . Jadi, apakah ada cara untuk menghindari masalah seperti itu tanpa tidak menggunakan DataParallel ?

[Masalah terpecahkan]

Saya menemukan itu DataParallel saat menggunakan multi GPU yang menyebabkan masalah. Kita perlu mengambil model sebelum membungkusnya dengan DataParallel .

Jadi, inilah metode bagi mereka yang mengalami masalah yang sama:

 # setup the summary writer
train_data_sample, label_sample = iter(dataloader_train).next()
writer = SummaryWriter(args.summary_path, flush_secs=120)

with writer:
    writer.add_graph(model.module,train_data_sample.to(device))  # model graph, with input

Perbarui ke pytorch 1.4 dan tensorboard 2.1.0 dengan python 3.6, berfungsi dengan baik.

Saya dapat mengonfirmasi - setelah pembaruan ke pytorch 1.4 semuanya berfungsi untuk saya.

Sepertinya kita berada di tempat yang bagus dengan PyTorch 1.4, jadi tutup. Silakan buka edisi baru jika Anda terus mengalami masalah dan terima kasih.

Apakah halaman ini membantu?
0 / 5 - 0 peringkat

Masalah terkait

ikostrikov picture ikostrikov  ·  3Komentar

bartvm picture bartvm  ·  3Komentar

dablyo picture dablyo  ·  3Komentar

soumith picture soumith  ·  3Komentar

miguelvr picture miguelvr  ·  3Komentar