Linux: Driver jaringan pada RPi3 B Plus menyebabkan tugas macet saat mengerjakan pemasangan NFS

Dibuat pada 30 Mar 2018  ·  113Komentar  ·  Sumber: raspberrypi/linux

Platform/Distro: RPi 3B+ menjalankan Arch ARM (armv7h).
Versi kernel: 4.14.31 (https://github.com/raspberrypi/linux/commit/b36f4e9e198477803d29861e02d3ea00fe5e09ab)
Versi firmware: terbaru saat saya menulis ini (https://github.com/raspberrypi/firmware/commit/c14a90333c13f507ab219d583b74a998ec11a6e7)

Bug: Kernel oops yang sering terjadi karena tugas yang diblokir saat menulis file ke NFS mount.

Detail : Saat kompilasi, dmesg penuh dengan kernel oops seperti di bawah ini saat melakukannya di NFS mount. Kompilasi ke kartu micro SD baik-baik saja. Saya percaya bahwa perangkat lunak (disto) pada kartu micro SD TIDAK dapat disalahkan... jika saya memasukkan kartu micro SD yang sama ke dalam RPi3 atau RPi2, saya dapat mengkompilasi tanpa kesalahan.

Sekali lagi, saya menggunakan partisi yang dipasang NFS (/ awal) untuk dikompilasi, jadi saya berhipotesis bahwa masalah ini terkait dengan driver jaringan.

% dmesg ... [ 2455.534291] INFO: task ld:24879 blocked for more than 120 seconds. [ 2455.538489] Tainted: G C 4.14.31-1-ARCH #1 [ 2455.542688] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. [ 2455.550990] ld D 0 24879 24804 0x00000000 [ 2455.555379] [<80a87848>] (__schedule) from [<80a88018>] (schedule+0x3c/0xa0) [ 2455.559662] [<80a88018>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c) [ 2455.563990] [<8015c138>] (io_schedule) from [<80230be4>] (wait_on_page_bit+0x110/0x15c) [ 2455.572326] [<80230be4>] (wait_on_page_bit) from [<80230d0c>] (__filemap_fdatawait_range+0xdc/0x128) [ 2455.580865] [<80230d0c>] (__filemap_fdatawait_range) from [<80233190>] (filemap_write_and_wait_range+0x54/0x88) [ 2455.589272] [<80233190>] (filemap_write_and_wait_range) from [<803db1c4>] (nfs_file_fsync+0x30/0x280) [ 2455.597837] [<803db1c4>] (nfs_file_fsync) from [<802d5dcc>] (vfs_fsync+0x24/0x2c) [ 2455.606295] [<802d5dcc>] (vfs_fsync) from [<8029d758>] (filp_close+0x2c/0x80) [ 2455.610675] [<8029d758>] (filp_close) from [<8029d7cc>] (SyS_close+0x20/0x48) [ 2455.614999] [<8029d7cc>] (SyS_close) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c) [ 2547.695051] nfs: server ease not responding, still trying [ 2548.735626] nfs: server ease not responding, still trying [ 2548.768826] nfs: server ease OK [ 2548.796748] nfs: server ease OK [ 2701.296329] INFO: task ld:24879 blocked for more than 120 seconds. [ 2701.300214] Tainted: G C 4.14.31-1-ARCH #1 [ 2701.304061] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. [ 2701.311642] ld D 0 24879 24804 0x00000000 [ 2701.315536] [<80a87848>] (__schedule) from [<80a88018>] (schedule+0x3c/0xa0) [ 2701.319458] [<80a88018>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c) [ 2701.323355] [<8015c138>] (io_schedule) from [<80230be4>] (wait_on_page_bit+0x110/0x15c) [ 2701.330878] [<80230be4>] (wait_on_page_bit) from [<80230d0c>] (__filemap_fdatawait_range+0xdc/0x128) [ 2701.338447] [<80230d0c>] (__filemap_fdatawait_range) from [<80233190>] (filemap_write_and_wait_range+0x54/0x88) [ 2701.345916] [<80233190>] (filemap_write_and_wait_range) from [<803db1c4>] (nfs_file_fsync+0x30/0x280) [ 2701.353469] [<803db1c4>] (nfs_file_fsync) from [<802d5dcc>] (vfs_fsync+0x24/0x2c) [ 2701.360953] [<802d5dcc>] (vfs_fsync) from [<8029d758>] (filp_close+0x2c/0x80) [ 2701.364740] [<8029d758>] (filp_close) from [<8029d7cc>] (SyS_close+0x20/0x48) [ 2701.368593] [<8029d7cc>] (SyS_close) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c) [ 2772.976750] nfs: server ease not responding, still trying [ 2774.331264] nfs: server ease OK [ 2947.057892] INFO: task ld:24879 blocked for more than 120 seconds. [ 2947.061907] Tainted: G C 4.14.31-1-ARCH #1 [ 2947.066031] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. [ 2947.074107] ld D 0 24879 24804 0x00000000 [ 2947.078244] [<80a87848>] (__schedule) from [<80a88018>] (schedule+0x3c/0xa0) [ 2947.081483] [<80a88018>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c) [ 2947.084348] [<8015c138>] (io_schedule) from [<80230be4>] (wait_on_page_bit+0x110/0x15c) [ 2947.090033] [<80230be4>] (wait_on_page_bit) from [<80230d0c>] (__filemap_fdatawait_range+0xdc/0x128) [ 2947.095898] [<80230d0c>] (__filemap_fdatawait_range) from [<80233190>] (filemap_write_and_wait_range+0x54/0x88) [ 2947.101751] [<80233190>] (filemap_write_and_wait_range) from [<803db1c4>] (nfs_file_fsync+0x30/0x280) [ 2947.107513] [<803db1c4>] (nfs_file_fsync) from [<802d5dcc>] (vfs_fsync+0x24/0x2c) [ 2947.113352] [<802d5dcc>] (vfs_fsync) from [<8029d758>] (filp_close+0x2c/0x80) [ 2947.116350] [<8029d758>] (filp_close) from [<8029d7cc>] (SyS_close+0x20/0x48) [ 2947.119289] [<8029d7cc>] (SyS_close) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c) [ 2998.258064] nfs: server ease not responding, still trying [ 2999.352463] nfs: server ease OK [ 3192.819075] INFO: task ld:24879 blocked for more than 120 seconds. [ 3192.823185] Tainted: G C 4.14.31-1-ARCH #1 [ 3192.827330] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. [ 3192.835447] ld D 0 24879 24804 0x00000000 [ 3192.839604] [<80a87848>] (__schedule) from [<80a88018>] (schedule+0x3c/0xa0) [ 3192.842832] [<80a88018>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c) [ 3192.845750] [<8015c138>] (io_schedule) from [<80230be4>] (wait_on_page_bit+0x110/0x15c) [ 3192.851476] [<80230be4>] (wait_on_page_bit) from [<80230d0c>] (__filemap_fdatawait_range+0xdc/0x128) [ 3192.857318] [<80230d0c>] (__filemap_fdatawait_range) from [<80233190>] (filemap_write_and_wait_range+0x54/0x88) [ 3192.863126] [<80233190>] (filemap_write_and_wait_range) from [<803db1c4>] (nfs_file_fsync+0x30/0x280) [ 3192.868837] [<803db1c4>] (nfs_file_fsync) from [<802d5dcc>] (vfs_fsync+0x24/0x2c) [ 3192.874594] [<802d5dcc>] (vfs_fsync) from [<8029d758>] (filp_close+0x2c/0x80) [ 3192.877558] [<8029d758>] (filp_close) from [<8029d7cc>] (SyS_close+0x20/0x48) [ 3192.880466] [<8029d7cc>] (SyS_close) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c) [ 3223.539141] nfs: server ease not responding, still trying [ 3224.579687] nfs: server ease not responding, still trying [ 3224.612015] nfs: server ease OK [ 3224.626000] nfs: server ease OK [ 3438.580109] INFO: task objcopy:24916 blocked for more than 120 seconds. [ 3438.583905] Tainted: G C 4.14.31-1-ARCH #1 [ 3438.587697] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. [ 3438.595231] objcopy D 0 24916 24912 0x00000000 [ 3438.599109] [<80a87848>] (__schedule) from [<80a88018>] (schedule+0x3c/0xa0) [ 3438.603019] [<80a88018>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c) [ 3438.606896] [<8015c138>] (io_schedule) from [<80230be4>] (wait_on_page_bit+0x110/0x15c) [ 3438.614435] [<80230be4>] (wait_on_page_bit) from [<80230d0c>] (__filemap_fdatawait_range+0xdc/0x128) [ 3438.622018] [<80230d0c>] (__filemap_fdatawait_range) from [<80233190>] (filemap_write_and_wait_range+0x54/0x88) [ 3438.629666] [<80233190>] (filemap_write_and_wait_range) from [<803db1c4>] (nfs_file_fsync+0x30/0x280) [ 3438.637259] [<803db1c4>] (nfs_file_fsync) from [<802d5dcc>] (vfs_fsync+0x24/0x2c) [ 3438.644894] [<802d5dcc>] (vfs_fsync) from [<8029d758>] (filp_close+0x2c/0x80) [ 3438.648704] [<8029d758>] (filp_close) from [<8029d7cc>] (SyS_close+0x20/0x48) [ 3438.652599] [<8029d7cc>] (SyS_close) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c) [ 3448.820081] nfs: server ease not responding, still trying [ 3450.148878] nfs: server ease OK [ 3674.100906] nfs: server ease not responding, still trying [ 3675.141506] nfs: server ease not responding, still trying [ 3675.174279] nfs: server ease OK [ 3675.202048] nfs: server ease OK [ 3807.221430] INFO: task objcopy:24916 blocked for more than 120 seconds. [ 3807.225253] Tainted: G C 4.14.31-1-ARCH #1 [ 3807.229007] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. [ 3807.236459] objcopy D 0 24916 24912 0x00000000 [ 3807.240428] [<80a87848>] (__schedule) from [<80a88018>] (schedule+0x3c/0xa0) [ 3807.244393] [<80a88018>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c) [ 3807.248202] [<8015c138>] (io_schedule) from [<80230be4>] (wait_on_page_bit+0x110/0x15c) [ 3807.255540] [<80230be4>] (wait_on_page_bit) from [<80230d0c>] (__filemap_fdatawait_range+0xdc/0x128) [ 3807.263030] [<80230d0c>] (__filemap_fdatawait_range) from [<80233190>] (filemap_write_and_wait_range+0x54/0x88) [ 3807.270494] [<80233190>] (filemap_write_and_wait_range) from [<803db1c4>] (nfs_file_fsync+0x30/0x280) [ 3807.277992] [<803db1c4>] (nfs_file_fsync) from [<802d5dcc>] (vfs_fsync+0x24/0x2c) [ 3807.285364] [<802d5dcc>] (vfs_fsync) from [<8029d758>] (filp_close+0x2c/0x80) [ 3807.289292] [<8029d758>] (filp_close) from [<8029d7cc>] (SyS_close+0x20/0x48) [ 3807.293169] [<8029d7cc>] (SyS_close) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c) [ 3899.381659] nfs: server ease not responding, still trying [ 3900.422241] nfs: server ease not responding, still trying [ 3900.461112] nfs: server ease OK [ 3900.474540] nfs: server ease OK [ 4011.372575] nf_conntrack: default automatic helper assignment has been turned off for security reasons and CT-based firewall rule not found. Use the iptables CT target to attach helpers instead. [ 4052.982250] INFO: task as:25088 blocked for more than 120 seconds. [ 4052.986324] Tainted: G C 4.14.31-1-ARCH #1 [ 4052.990389] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. [ 4052.998504] as D 0 25088 25086 0x00000000 [ 4053.002785] [<80a87848>] (__schedule) from [<80a88018>] (schedule+0x3c/0xa0) [ 4053.006065] [<80a88018>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c) [ 4053.008960] [<8015c138>] (io_schedule) from [<80230be4>] (wait_on_page_bit+0x110/0x15c) [ 4053.014564] [<80230be4>] (wait_on_page_bit) from [<80230d0c>] (__filemap_fdatawait_range+0xdc/0x128) [ 4053.020330] [<80230d0c>] (__filemap_fdatawait_range) from [<80233190>] (filemap_write_and_wait_range+0x54/0x88) [ 4053.026110] [<80233190>] (filemap_write_and_wait_range) from [<803db1c4>] (nfs_file_fsync+0x30/0x280) [ 4053.031705] [<803db1c4>] (nfs_file_fsync) from [<802d5dcc>] (vfs_fsync+0x24/0x2c) [ 4053.037527] [<802d5dcc>] (vfs_fsync) from [<8029d758>] (filp_close+0x2c/0x80) [ 4053.040507] [<8029d758>] (filp_close) from [<8029d7cc>] (SyS_close+0x20/0x48) [ 4053.043431] [<8029d7cc>] (SyS_close) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c) [ 4134.902727] nfs: server ease not responding, still trying [ 4135.997194] nfs: server ease OK [ 4529.145918] nfs: server ease not responding, still trying [ 4529.145923] nfs: server ease not responding, still trying [ 4529.145940] nfs: server ease not responding, still trying [ 4529.145978] nfs: server ease not responding, still trying [ 4529.146011] nfs: server ease not responding, still trying [ 4529.146028] nfs: server ease not responding, still trying [ 4529.146044] nfs: server ease not responding, still trying [ 4538.105971] nfs: server ease not responding, still trying [ 4538.109131] nfs: server ease not responding, still trying [ 4544.506128] INFO: task gcc:2854 blocked for more than 120 seconds. [ 4544.509193] Tainted: G C 4.14.31-1-ARCH #1 [ 4544.512157] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. [ 4544.517957] gcc D 0 2854 2852 0x00000000 [ 4544.520871] [<80a87848>] (__schedule) from [<80a88018>] (schedule+0x3c/0xa0) [ 4544.523830] [<80a88018>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c) [ 4544.526762] [<8015c138>] (io_schedule) from [<80230be4>] (wait_on_page_bit+0x110/0x15c) [ 4544.530980] [<80230be4>] (wait_on_page_bit) from [<80230d0c>] (__filemap_fdatawait_range+0xdc/0x128) [ 4544.534883] [<80230d0c>] (__filemap_fdatawait_range) from [<80233190>] (filemap_write_and_wait_range+0x54/0x88) [ 4544.538880] [<80233190>] (filemap_write_and_wait_range) from [<803db1c4>] (nfs_file_fsync+0x30/0x280) [ 4544.542873] [<803db1c4>] (nfs_file_fsync) from [<802d5dcc>] (vfs_fsync+0x24/0x2c) [ 4544.546949] [<802d5dcc>] (vfs_fsync) from [<8029d758>] (filp_close+0x2c/0x80) [ 4544.549173] [<8029d758>] (filp_close) from [<8029d7cc>] (SyS_close+0x20/0x48) [ 4544.551445] [<8029d7cc>] (SyS_close) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c) [ 4571.406855] nfs: server ease OK [ 4571.406996] nfs: server ease OK [ 4571.407031] nfs: server ease OK [ 4571.407691] nfs: server ease OK [ 4571.407701] nfs: server ease OK [ 4571.410844] nfs: server ease OK [ 4571.410877] nfs: server ease OK [ 4571.411761] nfs: server ease OK [ 4571.411810] nfs: server ease OK [ 4790.267644] INFO: task ld:7630 blocked for more than 120 seconds. [ 4790.270597] Tainted: G C 4.14.31-1-ARCH #1 [ 4790.273588] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. [ 4790.279563] ld D 0 7630 7628 0x00000000 [ 4790.282558] [<80a87848>] (__schedule) from [<80a88018>] (schedule+0x3c/0xa0) [ 4790.285531] [<80a88018>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c) [ 4790.288488] [<8015c138>] (io_schedule) from [<80230be4>] (wait_on_page_bit+0x110/0x15c) [ 4790.294136] [<80230be4>] (wait_on_page_bit) from [<80230d0c>] (__filemap_fdatawait_range+0xdc/0x128) [ 4790.299855] [<80230d0c>] (__filemap_fdatawait_range) from [<80233190>] (filemap_write_and_wait_range+0x54/0x88) [ 4790.305556] [<80233190>] (filemap_write_and_wait_range) from [<803db1c4>] (nfs_file_fsync+0x30/0x280) [ 4790.311366] [<803db1c4>] (nfs_file_fsync) from [<802d5dcc>] (vfs_fsync+0x24/0x2c) [ 4790.317112] [<802d5dcc>] (vfs_fsync) from [<8029d758>] (filp_close+0x2c/0x80) [ 4790.320380] [<8029d758>] (filp_close) from [<8029d7cc>] (SyS_close+0x20/0x48) [ 4790.323699] [<8029d7cc>] (SyS_close) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c) [ 4790.330500] INFO: task ld:7636 blocked for more than 120 seconds. [ 4790.334181] Tainted: G C 4.14.31-1-ARCH #1 [ 4790.338097] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. [ 4790.346223] ld D 0 7636 7633 0x00000000 [ 4790.350304] [<80a87848>] (__schedule) from [<80a88018>] (schedule+0x3c/0xa0) [ 4790.354463] [<80a88018>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c) [ 4790.358593] [<8015c138>] (io_schedule) from [<80230be4>] (wait_on_page_bit+0x110/0x15c) [ 4790.366494] [<80230be4>] (wait_on_page_bit) from [<80230d0c>] (__filemap_fdatawait_range+0xdc/0x128) [ 4790.374744] [<80230d0c>] (__filemap_fdatawait_range) from [<80233190>] (filemap_write_and_wait_range+0x54/0x88) [ 4790.383021] [<80233190>] (filemap_write_and_wait_range) from [<803db1c4>] (nfs_file_fsync+0x30/0x280) [ 4790.391236] [<803db1c4>] (nfs_file_fsync) from [<802d5dcc>] (vfs_fsync+0x24/0x2c) [ 4790.399371] [<802d5dcc>] (vfs_fsync) from [<8029d758>] (filp_close+0x2c/0x80) [ 4790.403607] [<8029d758>] (filp_close) from [<8029d7cc>] (SyS_close+0x20/0x48) [ 4790.407831] [<8029d7cc>] (SyS_close) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c)

Semua 113 komentar

Cara mudah untuk memicu bug ini (jika Anda tidak ingin mencoba mengkompilasi paket kernel) adalah dengan menggunakan dd untuk menulis dari /dev/zero ke mount NFS. Misalnya pada RPi3 B+ saya:

# mount ease:/scratch /scratch-nfs
% dd if=/dev/zero of=/scratch-nfs/fill bs=4M count=1000 status=progress
964689920 bytes (965 MB, 920 MiB) copied, 149 s, 6.5 MB/s

<<< it froze up after about 965 MB written >>>
<<< In dmesg I get another server not responding error >>>

[ 5112.824818] nfs: server ease not responding, still trying
[ 5149.707808] nfs: server ease OK

Sekarang, jika saya menukar micro SD dan boot ke RPi 2 yang saya miliki, kabel jaringan yang sama, catu daya yang sama, dan ulangi perintah, semuanya berfungsi seperti yang diharapkan. Saya pikir itu membantu mengesampingkan server NFS, perangkat keras jaringan, dll. Yang berpotensi disalahkan.

# mount ease:/scratch /scratch-nfs
% dd if=/dev/zero of=/scratch-nfs/fill bs=4M count=1000 status=progress
4194304000 bytes (4.2 GB, 3.9 GiB) copied, 346 s, 12.1 MB/s
1000+0 records in
1000+0 records out
4194304000 bytes (4.2 GB, 3.9 GiB) copied, 357.595 s, 11.7 MB/s
dd if=/dev/zero of=/scratch-nfs/fill bs=4M count=1000 status=progress  0.00s user 24.47s system 5% cpu 8:03.99 total

Apakah menonaktifkan Ethernet Hemat Energi membuat perbedaan? Tambahkan dtparam=eee=off ke config.txt dan reboot.

Tetapi sebelum mencobanya, Anda dapat mengonfirmasi apakah EEE aktif menggunakan ethtool --show-eee eth0 .

Saran yang bagus, @pelwell. Saya mendapatkan beberapa hasil yang sangat menggembirakan menggunakan tes dd yang membanjiri I/O dengan aliran data yang stabil. Itu "lulus" yang berarti tidak ada batas waktu penulisan dan tidak ada server yang tidak menanggapi pesan melalui dmesg. Saya mengkompilasi paket yang sama yang secara konsisten memberikan kesalahan sekarang dan akan memposting kembali dengan hasil tersebut.

Sebelum:

# ethtool --show-eee eth0
EEE Settings for eth0:
    EEE status: enabled - active
...

Setelah:

# ethtool --show-eee eth0
EEE Settings for eth0:
    EEE status: disabled
...

Tes dengan dd:

# mount ease:/scratch /scratch-nfs

% dd if=/dev/zero of=/scratch-nfs/fill bs=4M count=1000 status=progress && rm fill
4169138176 bytes (4.2 GB, 3.9 GiB) copied, 97 s, 42.9 MB/s 
1000+0 records in
1000+0 records out
4194304000 bytes (4.2 GB, 3.9 GiB) copied, 100.665 s, 41.7 MB/s
dd if=/dev/zero of=/scratch-nfs/fill bs=4M count=1000 status=progress  0.00s user 13.79s system 13% cpu 1:40.68 total

% dd if=/dev/zero of=/scratch-nfs/fill bs=4M count=2000 status=progress && rm fill
8380219392 bytes (8.4 GB, 7.8 GiB) copied, 198 s, 42.3 MB/s
2000+0 records in
2000+0 records out
8388608000 bytes (8.4 GB, 7.8 GiB) copied, 201.245 s, 41.7 MB/s
dd if=/dev/zero of=/scratch-nfs/fill bs=4M count=2000 status=progress  0.00s user 27.98s system 13% cpu 3:21.25 total

% dd if=/dev/zero of=/scratch-nfs/fill bs=4M count=2000 status=progress && rm fill
8380219392 bytes (8.4 GB, 7.8 GiB) copied, 198 s, 42.3 MB/s
2000+0 records in
2000+0 records out
8388608000 bytes (8.4 GB, 7.8 GiB) copied, 201.052 s, 41.7 MB/s
dd if=/dev/zero of=/scratch-nfs/fill bs=4M count=2000 status=progress  0.00s user 28.23s system 13% cpu 3:22.19 total

Sayangnya, ketika mengkompilasi yang dapat Anda rekonisasi, menulis data harus lebih jarang daripada dd , saya mengalami kesalahan yang sama:

[ 3315.685473] INFO: task gzip:29769 blocked for more than 120 seconds.
[ 3315.685636]       Tainted: G         C      4.14.31-1-ARCH #1
[ 3315.685767] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[ 3315.685955] gzip            D    0 29769  29767 0x00000000
[ 3315.686127] [<80a87848>] (__schedule) from [<80a88018>] (schedule+0x3c/0xa0)
[ 3315.686299] [<80a88018>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c)
[ 3315.686473] [<8015c138>] (io_schedule) from [<80230be4>] (wait_on_page_bit+0x110/0x15c)
[ 3315.686663] [<80230be4>] (wait_on_page_bit) from [<80230d0c>] (__filemap_fdatawait_range+0xdc/0x128)
[ 3315.686875] [<80230d0c>] (__filemap_fdatawait_range) from [<80233190>] (filemap_write_and_wait_range+0x54/0x88)
[ 3315.687121] [<80233190>] (filemap_write_and_wait_range) from [<803db1c4>] (nfs_file_fsync+0x30/0x280)
[ 3315.687349] [<803db1c4>] (nfs_file_fsync) from [<802d5dcc>] (vfs_fsync+0x24/0x2c)
[ 3315.687529] [<802d5dcc>] (vfs_fsync) from [<8029d758>] (filp_close+0x2c/0x80)
[ 3315.691478] [<8029d758>] (filp_close) from [<8029d7cc>] (SyS_close+0x20/0x48)
[ 3315.695540] [<8029d7cc>] (SyS_close) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c)
[ 3402.725251] nfs: server ease not responding, still trying
[ 3403.765783] nfs: server ease not responding, still trying
[ 3404.089089] nfs: server ease OK
[ 3404.089297] nfs: server ease OK
[ 3899.364008] nfs: server ease not responding, still trying
[ 3899.364013] nfs: server ease not responding, still trying
[ 3899.364028] nfs: server ease not responding, still trying
[ 3899.364060] nfs: server ease not responding, still trying
[ 3899.364071] nfs: server ease not responding, still trying
[ 3899.364076] nfs: server ease not responding, still trying
[ 3930.084023] INFO: task ld:13616 blocked for more than 120 seconds.
[ 3930.087086]       Tainted: G         C      4.14.31-1-ARCH #1
[ 3930.090229] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[ 3930.096312] ld              D    0 13616  13612 0x00000000
[ 3930.099422] [<80a87848>] (__schedule) from [<80a88018>] (schedule+0x3c/0xa0)
[ 3930.102523] [<80a88018>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c)
[ 3930.105566] [<8015c138>] (io_schedule) from [<80230be4>] (wait_on_page_bit+0x110/0x15c)
[ 3930.111351] [<80230be4>] (wait_on_page_bit) from [<80230d0c>] (__filemap_fdatawait_range+0xdc/0x128)
[ 3930.117264] [<80230d0c>] (__filemap_fdatawait_range) from [<80233190>] (filemap_write_and_wait_range+0x54/0x88)
[ 3930.123049] [<80233190>] (filemap_write_and_wait_range) from [<803db1c4>] (nfs_file_fsync+0x30/0x280)
[ 3930.129036] [<803db1c4>] (nfs_file_fsync) from [<802d5dcc>] (vfs_fsync+0x24/0x2c)
[ 3930.135044] [<802d5dcc>] (vfs_fsync) from [<8029d758>] (filp_close+0x2c/0x80)
[ 3930.138283] [<8029d758>] (filp_close) from [<8029d7cc>] (SyS_close+0x20/0x48)
[ 3930.141618] [<8029d7cc>] (SyS_close) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c)
[ 3941.625186] nfs: server ease OK
[ 3941.625295] nfs: server ease OK
[ 3941.625441] nfs: server ease OK
[ 3941.625829] nfs: server ease OK
[ 3941.635332] nfs: server ease OK
[ 3941.635549] nfs: server ease OK
[ 4170.727338] nfs: server ease not responding, still trying
[ 4170.727343] nfs: server ease not responding, still trying
[ 4170.727356] nfs: server ease not responding, still trying
[ 4170.727395] nfs: server ease not responding, still trying
[ 4170.727413] nfs: server ease not responding, still trying
[ 4170.727428] nfs: server ease not responding, still trying
[ 4170.727441] nfs: server ease not responding, still trying
[ 4170.727455] nfs: server ease not responding, still trying
[ 4170.727461] nfs: server ease not responding, still trying
[ 4170.727467] nfs: server ease not responding, still trying
[ 4175.847588] INFO: task gzip:22430 blocked for more than 120 seconds.
[ 4175.849590]       Tainted: G         C      4.14.31-1-ARCH #1
[ 4175.851594] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[ 4175.855516] gzip            D    0 22430  22391 0x00000000
[ 4175.857549] [<80a87848>] (__schedule) from [<80a88018>] (schedule+0x3c/0xa0)
[ 4175.859576] [<80a88018>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c)
[ 4175.861543] [<8015c138>] (io_schedule) from [<80230be4>] (wait_on_page_bit+0x110/0x15c)
[ 4175.865280] [<80230be4>] (wait_on_page_bit) from [<80230d0c>] (__filemap_fdatawait_range+0xdc/0x128)
[ 4175.869533] [<80230d0c>] (__filemap_fdatawait_range) from [<80230d70>] (filemap_fdatawait_range+0x18/0x28)
[ 4175.874352] [<80230d70>] (filemap_fdatawait_range) from [<802330f4>] (filemap_write_and_wait+0x58/0x7c)
[ 4175.879764] [<802330f4>] (filemap_write_and_wait) from [<803ea028>] (nfs_wb_all+0x14/0x15c)
[ 4175.885618] [<803ea028>] (nfs_wb_all) from [<803dd96c>] (nfs_setattr+0x280/0x2a4)
[ 4175.892223] [<803dd96c>] (nfs_setattr) from [<802bf8d4>] (notify_change+0x17c/0x410)
[ 4175.899511] [<802bf8d4>] (notify_change) from [<802d62fc>] (utimes_common+0xbc/0x188)
[ 4175.907605] [<802d62fc>] (utimes_common) from [<802d64c8>] (do_utimes+0x100/0x144)
[ 4175.916359] [<802d64c8>] (do_utimes) from [<802d6548>] (SyS_utimensat+0x3c/0xb0)
[ 4175.925462] [<802d6548>] (SyS_utimensat) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c)
[ 4175.934598] INFO: task cp:22444 blocked for more than 120 seconds.
[ 4175.939378]       Tainted: G         C      4.14.31-1-ARCH #1
[ 4175.944179] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[ 4175.953867] cp              D    0 22444  22422 0x00000000
[ 4175.958731] [<80a87848>] (__schedule) from [<80a88018>] (schedule+0x3c/0xa0)
[ 4175.963485] [<80a88018>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c)
[ 4175.968194] [<8015c138>] (io_schedule) from [<80230be4>] (wait_on_page_bit+0x110/0x15c)
[ 4175.977469] [<80230be4>] (wait_on_page_bit) from [<80230d0c>] (__filemap_fdatawait_range+0xdc/0x128)
[ 4175.986837] [<80230d0c>] (__filemap_fdatawait_range) from [<80233190>] (filemap_write_and_wait_range+0x54/0x88)
[ 4175.996147] [<80233190>] (filemap_write_and_wait_range) from [<803db1c4>] (nfs_file_fsync+0x30/0x280)
[ 4176.005282] [<803db1c4>] (nfs_file_fsync) from [<802d5dcc>] (vfs_fsync+0x24/0x2c)
[ 4176.014199] [<802d5dcc>] (vfs_fsync) from [<8029d758>] (filp_close+0x2c/0x80)
[ 4176.018723] [<8029d758>] (filp_close) from [<8029d7cc>] (SyS_close+0x20/0x48)
[ 4176.023212] [<8029d7cc>] (SyS_close) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c)
[ 4176.031736] INFO: task gzip:22446 blocked for more than 120 seconds.
[ 4176.036150]       Tainted: G         C      4.14.31-1-ARCH #1
[ 4176.040488] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[ 4176.048923] gzip            D    0 22446  22413 0x00000000
[ 4176.053120] [<80a87848>] (__schedule) from [<80a88018>] (schedule+0x3c/0xa0)
[ 4176.057319] [<80a88018>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c)
[ 4176.061492] [<8015c138>] (io_schedule) from [<80230be4>] (wait_on_page_bit+0x110/0x15c)
[ 4176.069486] [<80230be4>] (wait_on_page_bit) from [<80230d0c>] (__filemap_fdatawait_range+0xdc/0x128)
[ 4176.077824] [<80230d0c>] (__filemap_fdatawait_range) from [<80230d70>] (filemap_fdatawait_range+0x18/0x28)
[ 4176.086158] [<80230d70>] (filemap_fdatawait_range) from [<802330f4>] (filemap_write_and_wait+0x58/0x7c)
[ 4176.094434] [<802330f4>] (filemap_write_and_wait) from [<803ea028>] (nfs_wb_all+0x14/0x15c)
[ 4176.102722] [<803ea028>] (nfs_wb_all) from [<803dd96c>] (nfs_setattr+0x280/0x2a4)
[ 4176.111286] [<803dd96c>] (nfs_setattr) from [<802bf8d4>] (notify_change+0x17c/0x410)
[ 4176.119906] [<802bf8d4>] (notify_change) from [<802d62fc>] (utimes_common+0xbc/0x188)
[ 4176.128677] [<802d62fc>] (utimes_common) from [<802d64c8>] (do_utimes+0x100/0x144)
[ 4176.137604] [<802d64c8>] (do_utimes) from [<802d6548>] (SyS_utimensat+0x3c/0xb0)
[ 4176.146598] [<802d6548>] (SyS_utimensat) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c)
[ 4176.155652] INFO: task gzip:22448 blocked for more than 120 seconds.
[ 4176.160374]       Tainted: G         C      4.14.31-1-ARCH #1
[ 4176.165034] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[ 4176.174526] gzip            D    0 22448  22399 0x00000000
[ 4176.179330] [<80a87848>] (__schedule) from [<80a88018>] (schedule+0x3c/0xa0)
[ 4176.183995] [<80a88018>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c)
[ 4176.188703] [<8015c138>] (io_schedule) from [<80230be4>] (wait_on_page_bit+0x110/0x15c)
[ 4176.197969] [<80230be4>] (wait_on_page_bit) from [<80230d0c>] (__filemap_fdatawait_range+0xdc/0x128)
[ 4176.207204] [<80230d0c>] (__filemap_fdatawait_range) from [<80230d70>] (filemap_fdatawait_range+0x18/0x28)
[ 4176.216304] [<80230d70>] (filemap_fdatawait_range) from [<802330f4>] (filemap_write_and_wait+0x58/0x7c)
[ 4176.225376] [<802330f4>] (filemap_write_and_wait) from [<803ea028>] (nfs_wb_all+0x14/0x15c)
[ 4176.234297] [<803ea028>] (nfs_wb_all) from [<803dd96c>] (nfs_setattr+0x280/0x2a4)
[ 4176.243314] [<803dd96c>] (nfs_setattr) from [<802bf8d4>] (notify_change+0x17c/0x410)
[ 4176.252319] [<802bf8d4>] (notify_change) from [<802d62fc>] (utimes_common+0xbc/0x188)
[ 4176.261418] [<802d62fc>] (utimes_common) from [<802d64c8>] (do_utimes+0x100/0x144)
[ 4176.270386] [<802d64c8>] (do_utimes) from [<802d6548>] (SyS_utimensat+0x3c/0xb0)
[ 4176.279426] [<802d6548>] (SyS_utimensat) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c)
[ 4176.288484] INFO: task gzip:22449 blocked for more than 120 seconds.
[ 4176.293202]       Tainted: G         C      4.14.31-1-ARCH #1
[ 4176.297913] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[ 4176.307420] gzip            D    0 22449  22402 0x00000000
[ 4176.312234] [<80a87848>] (__schedule) from [<80a88018>] (schedule+0x3c/0xa0)
[ 4176.316976] [<80a88018>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c)
[ 4176.321712] [<8015c138>] (io_schedule) from [<80230be4>] (wait_on_page_bit+0x110/0x15c)
[ 4176.330930] [<80230be4>] (wait_on_page_bit) from [<80230d0c>] (__filemap_fdatawait_range+0xdc/0x128)
[ 4176.340209] [<80230d0c>] (__filemap_fdatawait_range) from [<80230d70>] (filemap_fdatawait_range+0x18/0x28)
[ 4176.349341] [<80230d70>] (filemap_fdatawait_range) from [<802330f4>] (filemap_write_and_wait+0x58/0x7c)
[ 4176.358392] [<802330f4>] (filemap_write_and_wait) from [<803ea028>] (nfs_wb_all+0x14/0x15c)
[ 4176.367284] [<803ea028>] (nfs_wb_all) from [<803dd96c>] (nfs_setattr+0x280/0x2a4)
[ 4176.376299] [<803dd96c>] (nfs_setattr) from [<802bf8d4>] (notify_change+0x17c/0x410)
[ 4176.385274] [<802bf8d4>] (notify_change) from [<802d62fc>] (utimes_common+0xbc/0x188)
[ 4176.394337] [<802d62fc>] (utimes_common) from [<802d64c8>] (do_utimes+0x100/0x144)
[ 4176.403276] [<802d64c8>] (do_utimes) from [<802d6548>] (SyS_utimensat+0x3c/0xb0)
[ 4176.412262] [<802d6548>] (SyS_utimensat) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c)
[ 4176.421295] INFO: task gzip:22452 blocked for more than 120 seconds.
[ 4176.425993]       Tainted: G         C      4.14.31-1-ARCH #1
[ 4176.430693] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[ 4176.440149] gzip            D    0 22452  22418 0x00000000
[ 4176.444909] [<80a87848>] (__schedule) from [<80a88018>] (schedule+0x3c/0xa0)
[ 4176.449585] [<80a88018>] (schedule) from [<80a8b3d4>] (rwsem_down_write_failed+0x12c/0x278)
[ 4176.458924] [<80a8b3d4>] (rwsem_down_write_failed) from [<80a8a6f0>] (down_write+0x58/0x60)
[ 4176.468288] [<80a8a6f0>] (down_write) from [<802afc48>] (path_openat+0x3b0/0x1150)
[ 4176.477766] [<802afc48>] (path_openat) from [<802b1954>] (do_filp_open+0x6c/0xdc)
[ 4176.487122] [<802b1954>] (do_filp_open) from [<8029edc4>] (do_sys_open+0x168/0x20c)
[ 4176.496594] [<8029edc4>] (do_sys_open) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c)
[ 4176.505990] INFO: task mkdir:22457 blocked for more than 120 seconds.
[ 4176.510857]       Tainted: G         C      4.14.31-1-ARCH #1
[ 4176.515599] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[ 4176.525022] mkdir           D    0 22457  22453 0x00000000
[ 4176.529774] [<80a87848>] (__schedule) from [<80a88018>] (schedule+0x3c/0xa0)
[ 4176.534358] [<80a88018>] (schedule) from [<80a8b3d4>] (rwsem_down_write_failed+0x12c/0x278)
[ 4176.543475] [<80a8b3d4>] (rwsem_down_write_failed) from [<80a8a6f0>] (down_write+0x58/0x60)
[ 4176.552568] [<80a8a6f0>] (down_write) from [<802b1118>] (filename_create+0x70/0x14c)
[ 4176.561851] [<802b1118>] (filename_create) from [<802b1d30>] (SyS_mkdirat+0x4c/0xec)
[ 4176.571295] [<802b1d30>] (SyS_mkdirat) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c)
[ 4176.580876] INFO: task mkdir:22458 blocked for more than 120 seconds.
[ 4176.585741]       Tainted: G         C      4.14.31-1-ARCH #1
[ 4176.590628] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[ 4176.600118] mkdir           D    0 22458  22450 0x00000000
[ 4176.604882] [<80a87848>] (__schedule) from [<80a88018>] (schedule+0x3c/0xa0)
[ 4176.609664] [<80a88018>] (schedule) from [<80a8b3d4>] (rwsem_down_write_failed+0x12c/0x278)
[ 4176.618855] [<80a8b3d4>] (rwsem_down_write_failed) from [<80a8a6f0>] (down_write+0x58/0x60)
[ 4176.628053] [<80a8a6f0>] (down_write) from [<802b1118>] (filename_create+0x70/0x14c)
[ 4176.637238] [<802b1118>] (filename_create) from [<802b1d30>] (SyS_mkdirat+0x4c/0xec)
[ 4176.646634] [<802b1d30>] (SyS_mkdirat) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c)
[ 4211.688544] nfs: server ease not responding, still trying
[ 4212.989190] nfs: server ease OK
[ 4212.989336] nfs: server ease OK
[ 4212.989372] nfs: server ease OK
[ 4212.992652] nfs: server ease OK
[ 4213.002084] nfs: server ease OK
[ 4213.002311] nfs: server ease OK
[ 4213.002416] nfs: server ease OK
[ 4213.017966] nfs: server ease OK
[ 4213.018012] nfs: server ease OK
[ 4213.018632] nfs: server ease OK
[ 4213.020006] nfs: server ease OK
[ 4401.133010] nfs: server ease not responding, still trying
[ 4401.133014] nfs: server ease not responding, still trying
[ 4401.133030] nfs: server ease not responding, still trying
[ 4401.133067] nfs: server ease not responding, still trying
[ 4401.133110] nfs: server ease not responding, still trying
[ 4401.133120] nfs: server ease not responding, still trying
[ 4401.133124] nfs: server ease not responding, still trying
[ 4401.133139] nfs: server ease not responding, still trying
[ 4401.133156] nfs: server ease not responding, still trying
[ 4401.133171] nfs: server ease not responding, still trying
[ 4401.133187] nfs: server ease not responding, still trying
[ 4401.133202] nfs: server ease not responding, still trying
[ 4401.133233] nfs: server ease not responding, still trying
[ 4401.133245] nfs: server ease not responding, still trying
[ 4401.133251] nfs: server ease not responding, still trying
[ 4443.397196] nfs: server ease OK
[ 4443.397213] nfs: server ease OK
[ 4443.397291] nfs: server ease OK
[ 4443.397316] nfs: server ease OK
[ 4443.397343] nfs: server ease OK
[ 4443.397410] nfs: server ease OK
[ 4443.397505] nfs: server ease OK
[ 4443.397580] nfs: server ease OK
[ 4443.397605] nfs: server ease OK
[ 4443.397714] nfs: server ease OK
[ 4443.399097] nfs: server ease OK
[ 4443.405096] nfs: server ease OK
[ 4443.405772] nfs: server ease OK
[ 4443.406117] nfs: server ease OK
[ 4443.406398] nfs: server ease OK
[ 4667.377155] nfs: server ease not responding, still trying
[ 4668.417708] nfs: server ease not responding, still trying
[ 4668.700017] nfs: server ease OK
[ 4668.700524] nfs: server ease OK
[ 4856.819062] nfs: server ease not responding, still trying
[ 4856.819067] nfs: server ease not responding, still trying
[ 4856.819082] nfs: server ease not responding, still trying
[ 4856.819130] nfs: server ease not responding, still trying
[ 4856.819135] nfs: server ease not responding, still trying
[ 4856.819142] nfs: server ease not responding, still trying
[ 4856.819154] nfs: server ease not responding, still trying
[ 4856.819174] nfs: server ease not responding, still trying
[ 4856.819188] nfs: server ease not responding, still trying
[ 4856.819209] nfs: server ease not responding, still trying
[ 4856.819216] nfs: server ease not responding, still trying
[ 4893.959982] nfs: server ease OK
[ 4893.960172] nfs: server ease OK
[ 4893.960210] nfs: server ease OK
[ 4893.960311] nfs: server ease OK
[ 4893.960640] nfs: server ease OK
[ 4893.960770] nfs: server ease OK
[ 4893.960780] nfs: server ease OK
[ 4893.961280] nfs: server ease OK
[ 4893.966452] nfs: server ease OK
[ 4893.967131] nfs: server ease OK
[ 4893.969369] nfs: server ease OK
[ 5123.060914] nfs: server ease not responding, still trying
[ 5124.101425] nfs: server ease not responding, still trying
[ 5124.376882] nfs: server ease OK
[ 5124.381100] nfs: server ease OK
[ 5353.461931] nfs: server ease not responding, still trying
[ 5354.784753] nfs: server ease OK
[ 5588.982673] nfs: server ease not responding, still trying
[ 5590.077559] nfs: server ease OK
[ 5814.263180] nfs: server ease not responding, still trying
[ 5815.303698] nfs: server ease not responding, still trying
[ 5815.334003] nfs: server ease OK
[ 5815.360538] nfs: server ease OK
[ 6044.663615] nfs: server ease not responding, still trying
[ 6045.721789] nfs: server ease OK
[ 6285.305546] nfs: server ease not responding, still trying
[ 6286.346054] nfs: server ease not responding, still trying
[ 6286.376999] nfs: server ease OK
[ 6286.403761] nfs: server ease OK
[ 6510.587277] nfs: server ease not responding, still trying
[ 6511.627865] nfs: server ease not responding, still trying
[ 6511.674761] nfs: server ease OK
[ 6511.686188] nfs: server ease OK
[ 6735.868562] nfs: server ease not responding, still trying
[ 6736.909076] nfs: server ease not responding, still trying
[ 6736.940771] nfs: server ease OK
[ 6736.967038] nfs: server ease OK
[ 6940.669438] nfs: server ease not responding, still trying
[ 6977.551872] nfs: server ease OK

Saya menggabungkan beberapa balasan menjadi satu (di atas) dan mencoba membuatnya sedikit lebih ringkas. Versi TL;DR adalah menonaktifkan EEE tidak membantu.

Jika memungkinkan, dan jika belum aktif, dapatkah Anda mengaktifkan kontrol aliran pada port sakelar yang terhubung ke Pi?

@pelwell - Semua koneksi kabel melalui sakelar yang tidak dikelola. Tidak ada pengaturan untuk diubah :/

Bug: Kernel oops yang sering terjadi karena tugas yang diblokir saat menulis file ke NFS mount.

Saya memiliki masalah serupa pada pemasangan SAMBA. Tetapi saat ini saya tidak dapat menjalankan tes lagi, karena saya mengirim kembali Pi3B+ saya.

Revisi IMO saat ini dari Pi3B + memiliki masalah perangkat keras yang serius dan saya tidak percaya bahwa itu dapat diselesaikan melalui perangkat lunak (Akhirnya, saya tidak pernah dapat memutar video lebih dari 15 menit tanpa Kodi crash, kernel Ups, atau freeze)

@pelwell dan rekan:
Pi3B+ (revisi) mana yang sedang Anda gunakan? Bagian dari seri 0 atau suku cadang dari lini produksi saat ini, yang digunakan pelanggan sekarang.

Saya masih tidak percaya bahwa kalian tidak pernah memiliki masalah seperti itu sebelumnya

Produksi saat ini saya percaya. Meskipun saya tidak berpikir ada
banyak/perubahan apa pun sejak prototipe.

Tampaknya masalahnya tidak menentu, dan tergantung pada kemampuan
jaringan yang terhubung dengan perangkat. Kami mencoba untuk mencari tahu
keadaan yang tepat. Saya menduga ada sejumlah masalah yang terlihat, seperti
sering terjadi ketika pengemudi yang sebelumnya bekerja tiba-tiba karena digunakan oleh
250 ribu orang tambahan selama akhir pekan, dalam segala hal yang baru dan tidak dapat diprediksi
cara. Saya sangat berharap ada solusi perangkat lunak untuk ini, kami selalu
dapat menemukannya di masa lalu.

Pada 31 Maret 2018 pukul 19:29, Manfred Kreisl [email protected] menulis:

Bug: Kernel oops yang sering karena tugas yang diblokir saat menulis file ke NFS
Gunung.

Saya memiliki masalah serupa pada pemasangan SAMBA. Tetapi saat ini saya tidak dapat menjalankan tes
lagi, karena saya mengirim kembali Pi3B+ saya.

Revisi IMO saat ini dari Pi3B+ memiliki masalah perangkat keras yang serius dan saya tidak
percaya bahwa mereka dapat diselesaikan melalui perangkat lunak (Akhirnya, saya tidak pernah bisa
memutar video lebih dari 15 menit tanpa kodi crash, kernel Ups, atau
membekukan)

@pelwell https://github.com/pelwell dan rekan:
Pi3B+ (revisi) mana yang sedang Anda gunakan? Bagian dari 0-series atau bagian
dari lini produksi saat ini, yang digunakan pelanggan sekarang.

Saya masih tidak percaya bahwa kalian tidak pernah memiliki masalah seperti itu sebelumnya


Anda menerima ini karena Anda berlangganan utas ini.
Balas email ini secara langsung, lihat di GitHub
https://github.com/raspberrypi/linux/issues/2482#issuecomment-377713477 ,
atau matikan utasnya
https://github.com/notifications/unsubscribe-auth/ADqrHV52f7xwHg74CUm3wYPAGFDuyvYZks5tj8sFgaJpZM4TB_lw
.

--
James Hughes
Insinyur Perangkat Lunak utama,
Raspberry Pi (Perdagangan) Ltd

Perso saya kembali pada pi 2b ...
(Dia boot lebih cepat dengan kartu SD yang sama...)

@mkreisl ketika pi Anda kembali jika berfungsi normal, saya juga mengirim pi saya

+1 Saya juga memperhatikan masalah ini saat membaca samba mount. RPI 3B+ baru.

@pelwell - Dari saran @popcornmix di https://github.com/raspberrypi/linux/issues/2442 , saya membuat:

Saya mengotomatiskan tes dd yang saya jelaskan di atas dalam skrip sederhana yang mengulangi penulisan file yang diisi nol senilai 1G melalui share NFS 32 kali. Saya kemudian menggunakan histogram.py untuk menghitung statistik.

Dengan set parameter dtparam=eee=off di /boot/config.txt Saya mendapatkan beberapa hasil yang konsisten:

% histogram.py -p < results_no_eee.csv
# NumSamples = 32; Min = 25.46; Max = 25.75
# Mean = 25.687864; Variance = 0.002705; SD = 0.052009; Median 25.693114

Ketika saya menghapus baris itu (mengembalikan ke status default, 1 dari 32 run sangat panjang:

% histogram.py -p < results.csv
# NumSamples = 36; Min = 25.34; Max = 139.44
# Mean = 28.763650; Variance = 350.005030; SD = 18.708421; Median 25.599488

Karena menggunakan dd akan memaksimalkan bus, saya akan mencoba mengkompilasi kernel yang jauh lebih lembut untuk IO jaringan dan jauh lebih rentan terhadap kesalahan dalam pengalaman saya. Pikiran?

OK... masih mengalami batas waktu saat kompilasi ke berbagi NFS dengan eee diaktifkan meskipun replika berhasil menggunakan dd di atas. Saat ini saya sedang membangun https://github.com/raspberrypi/linux/commit/c2eb30683b43b13b931bd9cfef6a2a09ac7b7c1e dan akan mengujinya dengan mengkompilasi kernel ke NFS dengan eee diaktifkan dan dengan itu dinonaktifkan.

Untuk referensi, berikut adalah skrip untuk mengotomatiskan pekerjaan kompilasi replika.

@pelwell - Saya masih mendapatkan batas waktu jaringan... di bawah ini dengan dtparam=eee=off set yang di-boot ke kernel terbaru.

[11786.758187] nfs: server ease not responding, still trying
[11786.758192] nfs: server ease not responding, still trying
[11786.758206] nfs: server ease not responding, still trying
[11786.758225] nfs: server ease not responding, still trying
[11794.438353] INFO: task ld:25967 blocked for more than 120 seconds.
[11794.441599]       Tainted: G         C      4.14.32-2-ARCH #1
[11794.444867] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[11794.451496] ld              D    0 25967  25966 0x00000000
[11794.454918] [<80a87c48>] (__schedule) from [<80a88418>] (schedule+0x3c/0xa0)
[11794.458408] [<80a88418>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c)
[11794.461670] [<8015c138>] (io_schedule) from [<80230be4>] (wait_on_page_bit+0x110/0x15c)
[11794.468043] [<80230be4>] (wait_on_page_bit) from [<80230d0c>] (__filemap_fdatawait_range+0xdc/0x128)
[11794.474533] [<80230d0c>] (__filemap_fdatawait_range) from [<80233190>] (filemap_write_and_wait_range+0x54/0x88)
[11794.481165] [<80233190>] (filemap_write_and_wait_range) from [<803db254>] (nfs_file_fsync+0x30/0x280)
[11794.487571] [<803db254>] (nfs_file_fsync) from [<802d5dcc>] (vfs_fsync+0x24/0x2c)
[11794.494001] [<802d5dcc>] (vfs_fsync) from [<8029d758>] (filp_close+0x2c/0x80)
[11794.497339] [<8029d758>] (filp_close) from [<8029d7cc>] (SyS_close+0x20/0x48)
[11794.500698] [<8029d7cc>] (SyS_close) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c)
[11831.579322] nfs: server ease OK
[11831.579326] nfs: server ease OK
[11831.583067] nfs: server ease OK
[11831.583118] nfs: server ease OK
[12040.199240] INFO: task ld:27693 blocked for more than 120 seconds.
[12040.202836]       Tainted: G         C      4.14.32-2-ARCH #1
[12040.206449] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[12040.213627] ld              D    0 27693  27692 0x00000000
[12040.217311] [<80a87c48>] (__schedule) from [<80a88418>] (schedule+0x3c/0xa0)
[12040.220971] [<80a88418>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c)
[12040.223568] [<8015c138>] (io_schedule) from [<80230be4>] (wait_on_page_bit+0x110/0x15c)
[12040.228677] [<80230be4>] (wait_on_page_bit) from [<80230d0c>] (__filemap_fdatawait_range+0xdc/0x128)
[12040.233740] [<80230d0c>] (__filemap_fdatawait_range) from [<80233190>] (filemap_write_and_wait_range+0x54/0x88)
[12040.238903] [<80233190>] (filemap_write_and_wait_range) from [<803db254>] (nfs_file_fsync+0x30/0x280)
[12040.244189] [<803db254>] (nfs_file_fsync) from [<802d5dcc>] (vfs_fsync+0x24/0x2c)
[12040.249445] [<802d5dcc>] (vfs_fsync) from [<8029d758>] (filp_close+0x2c/0x80)
[12040.252070] [<8029d758>] (filp_close) from [<8029d7cc>] (SyS_close+0x20/0x48)
[12040.254713] [<8029d7cc>] (SyS_close) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c)
[12101.639302] nfs: server ease not responding, still trying
[12101.639311] nfs: server ease not responding, still trying
[12101.639328] nfs: server ease not responding, still trying
[12142.599536] nfs: server ease not responding, still trying
[12143.639966] nfs: server ease not responding, still trying
[12143.900616] nfs: server ease OK
[12143.900633] nfs: server ease OK
[12143.909707] nfs: server ease OK
[12143.917548] nfs: server ease OK
[12143.917848] nfs: server ease OK
[12408.840196] nfs: server ease not responding, still trying
[12408.840200] nfs: server ease not responding, still trying
[12408.840228] nfs: server ease not responding, still trying
[12408.840248] nfs: server ease not responding, still trying
[12408.840274] nfs: server ease not responding, still trying
[12408.840412] INFO: task ld:29538 blocked for more than 120 seconds.
[12408.840421]       Tainted: G         C      4.14.32-2-ARCH #1
[12408.840424] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[12408.840430] ld              D    0 29538  29537 0x00000000
[12408.840493] [<80a87c48>] (__schedule) from [<80a88418>] (schedule+0x3c/0xa0)
[12408.840514] [<80a88418>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c)
[12408.840541] [<8015c138>] (io_schedule) from [<80230be4>] (wait_on_page_bit+0x110/0x15c)
[12408.840559] [<80230be4>] (wait_on_page_bit) from [<80230d0c>] (__filemap_fdatawait_range+0xdc/0x128)
[12408.840574] [<80230d0c>] (__filemap_fdatawait_range) from [<80233190>] (filemap_write_and_wait_range+0x54/0x88)
[12408.840596] [<80233190>] (filemap_write_and_wait_range) from [<803db254>] (nfs_file_fsync+0x30/0x280)
[12408.840618] [<803db254>] (nfs_file_fsync) from [<802d5dcc>] (vfs_fsync+0x24/0x2c)
[12408.840635] [<802d5dcc>] (vfs_fsync) from [<8029d758>] (filp_close+0x2c/0x80)
[12408.840648] [<8029d758>] (filp_close) from [<8029d7cc>] (SyS_close+0x20/0x48)
[12408.840665] [<8029d7cc>] (SyS_close) from [<80107ce0>] (ret_fast_syscall+0x0/0x4c)

Sama di sini, tidak ada yang berubah. Masih benar-benar tidak stabil, tidak dapat diandalkan, dan sama sekali tidak dapat digunakan, Pi3B+

Aneh, ada satu di meja saya yang berfungsi dengan baik. Saya pikir Anda lupa menambahkan "Dalam keadaan saya menggunakannya".

Bagaimanapun, masalah masih dilihat di sini dan di Microchip. Ada tambalan di daftar netdev linux hari ini untuk driver chip ini (lan78xxx) untuk EEE yang mungkin membantu, yang perlu dicoba. Ini tidak seperti kita hanya duduk di sini sambil memutar-mutar ibu jari kita.

Bagaimanapun, masalah masih dilihat di sini dan di Microchip. Ada tambalan di daftar netdev linux hari ini untuk driver chip ini (lan78xxx) untuk EEE yang mungkin membantu, yang perlu dicoba. Ini tidak seperti kita hanya duduk di sini sambil memutar-mutar ibu jari kita.

Sepertinya Anda mendapatkan api di bawah a.. sekarang :senyum:

IMO Anda melihat tempat yang salah. Masalah LAN hanyalah puncak gunung es

Saya sudah melaporkan, bahwa sistem masih tidak stabil setelah microchip dump dimatikan dan semua lalu lintas melewati perangkat wlan. Sistem masih membeku secara acak. Jadi, sebelum saya mendapat informasi yang lebih baik, saya akan mengatakan bahwa desain lubang Pi3B+ adalah masalah besar

Beberapa pengguna yang melaporkan masalah (dan sejujurnya tidak sebanyak itu, tetapi mereka berteriak keras) telah berhasil menambahkan sdram_freq=450 ke config.txt. Saya akan merekomendasikan siapa pun dengan masalah stabilitas (apa pun yang tidak jelas terkait jaringan) untuk melakukan hal yang sama.

Beberapa pengguna yang melaporkan masalah (dan sejujurnya tidak sebanyak itu, tetapi mereka berteriak keras) telah berhasil menambahkan sdram_freq=450 ke config.txt. Saya akan merekomendasikan siapa pun dengan masalah stabilitas (apa pun yang tidak jelas terkait jaringan) untuk melakukan hal yang sama.

Apa default untuk Pi3B+. Tidak dapat menemukannya di sini

500 turbo, 400 biasa

Untuk referensi, berikut adalah skrip untuk mengotomatiskan pekerjaan kompilasi replika.

@pelwell - Saya memiliki beberapa data keras sekarang. Saya menjalankan penulisan benchmark make ke share NFS dalam 2 kondisi, sekali dengan eee dinonaktifkan dan sekali dengan itu diaktifkan. Ada tren yang jelas: eee menyebabkan masalah.

Menjalankan make zImage

Berikut adalah 9 atau 10 ulangan yang menjalankan make zImage dengan semua waktu dilaporkan dalam hitungan menit.

% histogram.py < eee_on_zimage 
# NumSamples = 9; Min = 9.77; Max = 29.07
# Mean = 18.573025; Variance = 86.102905; SD = 9.279165; Median 10.764777

vs

% histogram.py < eee_off_zimage
# NumSamples = 10; Min = 9.91; Max = 10.87
# Mean = 10.178291; Variance = 0.067048; SD = 0.258936; Median 10.166035

Beberapa tren dari data ini:

  • Waktu rata-rata untuk mengkompilasi hampir dua kali lipat dengan eee diaktifkan.
  • Standar deviasi dan varians jauh lebih buruk dengan eee diaktifkan (waktu kompilasi lebih tak terduga).
  • Dari ulangan, waktu kompilasi terlama diamati dengan eee diaktifkan dan hampir tiga kali lipat.

Menjalankan make modules

Berikut adalah 9 atau 10 ulangan yang menjalankan make modules dengan semua waktu dilaporkan dalam hitungan menit.

% histogram.py < eee_on_modules 
# NumSamples = 9; Min = 25.21; Max = 67.19
# Mean = 51.765753; Variance = 218.212739; SD = 14.772026; Median 46.494882

vs

% histogram.py < eee_off_modules
# NumSamples = 9; Min = 26.33; Max = 49.60
# Mean = 33.328529; Variance = 42.429103; SD = 6.513763; Median 32.126122

Tren yang sama dari data ini:

  • Waktu rata-rata untuk mengkompilasi adalah sekitar 1,5x lebih lama dengan eee diaktifkan.
  • Standar deviasi dan varians jauh lebih buruk dengan eee diaktifkan (waktu kompilasi lebih tak terduga).
  • Dari ulangan, waktu kompilasi terlama diamati dengan eee diaktifkan dan sekitar 33% lebih lama.

Saya senang menguji patch/firmware di masa mendatang, apa pun untuk membantu mengoptimalkan ini. Saya pikir patokan make zImage akan cukup untuk ini karena jauh lebih cepat dari make modules dan memberikan hasil yang serupa. Kabari saja.

EDIT: Saya melihat @popcornmix didorong https://github.com/raspberrypi/firmware/commit/3aa806091dc57b757790b026c01754883cee2abc beberapa jam yang lalu ... waktu untuk menguji ulang?

@mkreisl - Harap pertahankan masalah ini pada tugas ... ini dicakup untuk penulisan jaringan bukan untuk stabilitas umum. Buka tugas baru untuk itu.

@graysky2 Ups, maaf telah

Solusi potensial: jangan menonaktifkan EEE sepenuhnya, tetapi tetapkan dtparam=tx_lpi_timer=10000 di /boot/config.txt yang saya lakukan dan menemukan hasil yang hampir sama dalam benchmark make zImage untuk menonaktifkan EEE sepenuhnya .

Sekali lagi, nilai yang dilaporkan adalah waktu kompilasi dalam hitungan menit.

dtparam=tx_lpi_timer=10000

# NumSamples = 12; Min = 9.90; Max = 10.19
# Mean = 10.089245; Variance = 0.007412; SD = 0.086094; Median 10.119596

dtparam=eee=off

# NumSamples = 10; Min = 9.91; Max = 10.87
# Mean = 10.178291; Variance = 0.067048; SD = 0.258936; Median 10.166035

EDIT: lihat https://github.com/raspberrypi/linux/issues/2482#issuecomment -379551481 yang menunjukkan bahwa masalahnya masih ada.

Semua pengaturan EEE itu tidak membantu saya, karena router/switch saya tidak mendukung EEE (kebanyakan router dengan sakelar terintegrasi tidak mendukungnya) dan saya masih mendapatkan batas waktu nfs bahkan jika EEE sepenuhnya dinonaktifkan, atau saya mendapatkan

Apr  6 16:11:14 kmxbilr2 kernel: [  837.345227] CIFS VFS: sends on sock aa2921c0 stuck for 15 seconds
Apr  6 16:11:14 kmxbilr2 kernel: [  837.345261] CIFS VFS: Error -11 sending data on socket to server
Apr  6 16:11:30 kmxbilr2 kernel: [  852.705497] CIFS VFS: sends on sock aa2921c0 stuck for 15 seconds
Apr  6 16:11:30 kmxbilr2 kernel: [  852.705532] CIFS VFS: Error -11 sending data on socket to server
Apr  6 16:11:30 kmxbilr2 kernel: [  852.833704] CIFS VFS: Free previous auth_key.response = 99685c00
Apr  6 16:11:55 kmxbilr2 kernel: [  878.305932] CIFS VFS: sends on sock aa29c380 stuck for 15 seconds
Apr  6 16:11:55 kmxbilr2 kernel: [  878.305972] CIFS VFS: Error -11 sending data on socket to server
Apr  6 16:12:11 kmxbilr2 kernel: [  893.666123] CIFS VFS: sends on sock aa29c380 stuck for 15 seconds
Apr  6 16:12:11 kmxbilr2 kernel: [  893.666156] CIFS VFS: Error -11 sending data on socket to server
Apr  6 16:12:26 kmxbilr2 kernel: [  909.026351] CIFS VFS: sends on sock aa29c380 stuck for 15 seconds
Apr  6 16:12:26 kmxbilr2 kernel: [  909.026382] CIFS VFS: Error -11 sending data on socket to server
Apr  6 16:12:41 kmxbilr2 kernel: [  924.386541] CIFS VFS: sends on sock aa29c380 stuck for 15 seconds
Apr  6 16:12:41 kmxbilr2 kernel: [  924.386573] CIFS VFS: Error -11 sending data on socket to server
Apr  6 16:12:41 kmxbilr2 kernel: [  924.484318] CIFS VFS: Free previous auth_key.response = a7910f00

jika menggunakan mount SAMBA alih-alih mount NFS dan setelah beberapa waktu proses yang menulis untuk berbagi macet dan menjadi status 'D' yang tidak dapat terputus selamanya

@graysky2
Kernel: ya (XBian dibangun berdasarkan bcm2709_defconfig)
Firmware: ya, versi yang sama persis

@mkreisl - tidak yakin harus berkata apa.... mungkin Anda memiliki masalah yang berbeda. Sebagai kontrol, sudahkah Anda mencoba hal yang sama dengan RPi lama lainnya? Seperti 2 atau 3?

@ greysky2 Tentu, saya menjalankan prosedur yang sama pada Pi1, 2 dan 3 (tanpa +) sejak bertahun-tahun tanpa masalah.

@ greysky2 Singkatnya, saya bisa menjelaskan apa fungsinya

1) pasang jaringan berbagi (sshfs, nfs atau samba)
2) buat gambar di share ini, cukup besar untuk mem-backup data dari root/boot fs ke dalamnya
3) buat partisi dalam gambar (vfat untuk boot, btrfs untuk root)
4) salin partisi boot ke gambar yang dipasang (perangkat loop)
5) salin semua subvolume ke gambar yang dipasang (menggunakan btrfs send/receive atau tar, keduanya diuji)
6) tutup semuanya dan umount share

Dari 1 hingga 4 selalu berfungsi, dan dalam 5 selalu macet, tetapi tidak pada subvolume yang sama
Dan, tidak masalah jika sumber fs ada di sd, disk usb, atau target iSCSI

Apa NFS atau server samba Anda? Bagaimana ini dikonfigurasi? Saya dapat menyelesaikan langkah-langkah ini pada saya tanpa kesalahan kecuali saya tidak berbuat banyak dengan BTRFS. Bisakah Anda menyelesaikan langkah-langkah dengan ext4? Saya bisa:

# mount nfs share
mount -t nfs4 ease:/scratch /opt/armv7h/scratch
mount | grep opt
ease:/scratch on /opt/armv7/scratch type nfs4 
(rw,relatime,vers=4.2,rsize=1048576,wsize=1048576,namlen=255,hard,proto=tcp,timeo=600,retrans=2,sec=sys,clientaddr=10.9.8.108,local_lock=none,addr=10.9.8.128)

# make image and format it
cd /opt/armv7h/scratch
truncate -s 5G image.img
mkfs.ext4 -F image.img
mkdir mp

# mount it
mount -o loop image.img mp
chown facade:users mp

# add 1.0 GB of data to image
dd if=/dev/zero of=/opt/armv7/scratch/mp/zerofill bs=4M count=250 status=progress

ls -l mp
total 1024020
drwx------ 2 facade users      16384 Apr  7 12:30 lost+found
-rw-r--r-- 1 facade users 1048576000 Apr  7 12:32 zerofill

umount mp

Apa NFS atau server samba Anda? Bagaimana ini dikonfigurasi? Saya dapat menyelesaikan langkah-langkah ini pada saya tanpa kesalahan kecuali saya tidak berbuat banyak dengan BTRFS. Bisakah Anda menyelesaikan langkah-langkah dengan ext4?

Menjalankan Debian Stretch sebagai server NFS dan SAMBA. Tidak ada AFAIR yang dikonfigurasi secara khusus
Saat ini tidak mungkin menjalankan tes dengan ext4, tidak memiliki konfigurasi apa pun berdasarkan ext4. Akan melakukan lebih banyak pengujian hari berikutnya, sebenarnya saya hanya menguji konfigurasi wlan.

Anda belum mengatakan apakah Anda telah mengubah sdram_freq atau arm_freq.

@pelwell

Anda belum mengatakan apakah Anda telah mengubah sdram_freq atau arm_freq.

Ehm @graysky2 mengatakan kepada saya bahwa saya tidak boleh memposting topik seperti itu di sini :kecewa:

Ya, mengubah jam sdram menjadi 450 berhasil, menyetel jam lengan ke 1200 Saya menguji 2 minggu yang lalu tanpa hasil

Tetapi, mengurangi jam sdram tidak menyelesaikan masalah jaringan ethernet yang dibahas di sini

Ehm @graysky2 memberi tahu saya bahwa saya tidak boleh memposting topik seperti itu di sini dengan kecewa

Tidak, hanya mengingatkan Anda bahwa tugas ini adalah tentang masalah penulisan jaringan, jika salah satu pengembang meminta Anda untuk mencoba sesuatu, lakukan saja, jangan tambahkan banyak masalah yang tidak terkait di atas yang ini.

Tepat. Tampaknya ada dua kelas kesalahan - masalah jaringan dan kerusakan memori. Saya puas ini murni masalah jaringan.

EEE tampaknya memperburuk jaringan di seluruh jaringan, mengaktifkan kontrol aliran meningkatkannya, dan kami tidak mengesampingkan masalah driver lebih lanjut.

Berdasarkan pengamatan @mkreisl tentang pembagian samba, saya melakukan benchmark make zImage pada pembagian samba (samba versi 4.7.6) dan menemukan kinerja yang tidak konsisten (tidak ada dalam dmesg). Ini dengan set dtparam=tx_lpi_timer=10000 :

# NumSamples = 4; Min = 462.65; Max = 1251.20
# Mean = 895.113710; Variance = 124647.496919; SD = 353.054524; Median 933.305226

1,zImage,631.770020346
2,zImage,462.645222405
3,zImage,1251.199164634
4,zImage,1234.840431102

Setelah saya mendapatkan hasil ini, saya mengganti NFS dan menemukan proses yang sangat konsisten seperti sebelumnya. Tidak yakin apa yang harus dilakukan.

@mkreisl - Anda ingin mencoba benchmark di sistem Anda? Anda hanya memerlukan sumber kernel yang berisi beberapa .config yang siap digunakan. Lihat di sini .

@ greysky2 memodifikasi skrip Anda sebagai berikut dan biarkan berjalan

#!/bin/bash

cd /srv/backup
mount | grep /srv/backup

truncate -s 8G image.img
mkfs.ext4 -F image.img
mkdir -p img

mount -o loop image.img img

to='--warning=none --acls --xattrs'
tar c --one-file-system $to -C / . | tar x $to -v -C /srv/backup/img

ls -l img

umount img && rmdir img && rm -f image.img

Tujuan adalah ext4, tetapi sumbernya masih BTRFS

Itu selalu berakhir dengan nfs: server kmcubie not responding, timed out

[ 1692.649145] INFO: task loop0:9479 blocked for more than 120 seconds.
[ 1692.649159]       Tainted: G         C      4.14.32+ #1
[ 1692.649167] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[ 1692.649175] loop0           D    0  9479      2 0x00000000
[ 1692.649219] [<808c4124>] (__schedule) from [<808c47d4>] (schedule+0x58/0xb8)
[ 1692.649240] [<808c47d4>] (schedule) from [<8014be98>] (io_schedule+0x20/0x40)
[ 1692.649262] [<8014be98>] (io_schedule) from [<80221fb8>] (wait_on_page_bit+0x108/0x128)
[ 1692.649279] [<80221fb8>] (wait_on_page_bit) from [<802220bc>] (__filemap_fdatawait_range+0xe4/0x114)
[ 1692.649297] [<802220bc>] (__filemap_fdatawait_range) from [<80224614>] (filemap_write_and_wait_range+0x68/0xa4)
[ 1692.649316] [<80224614>] (filemap_write_and_wait_range) from [<803a0184>] (nfs_file_fsync+0x3c/0x308)
[ 1692.649335] [<803a0184>] (nfs_file_fsync) from [<802c7644>] (vfs_fsync_range+0x68/0xbc)
[ 1692.649356] [<802c7644>] (vfs_fsync_range) from [<802c76cc>] (vfs_fsync+0x34/0x3c)
[ 1692.649383] [<802c76cc>] (vfs_fsync) from [<7f007e80>] (loop_queue_work+0x574/0xb98 [loop])
[ 1692.649438] [<7f007e80>] (loop_queue_work [loop]) from [<8013dff4>] (kthread_worker_fn+0xbc/0x1e0)
[ 1692.649459] [<8013dff4>] (kthread_worker_fn) from [<7f005738>] (loop_kthread_worker_fn+0x34/0x194 [loop])
[ 1692.649480] [<7f005738>] (loop_kthread_worker_fn [loop]) from [<8013dec4>] (kthread+0x13c/0x16c)
[ 1692.649502] [<8013dec4>] (kthread) from [<8010834c>] (ret_from_fork+0x14/0x28)
[ 1784.809482] nfs: server kmcubie not responding, timed out
[ 1784.809540] nfs: server kmcubie not responding, timed out
[ 1784.809563] nfs: server kmcubie not responding, timed out
[ 1813.481779] INFO: task kworker/u8:2:7543 blocked for more than 120 seconds.
[ 1813.481794]       Tainted: G         C      4.14.32+ #1
[ 1813.481801] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[ 1813.481810] kworker/u8:2    D    0  7543      2 0x00000000
[ 1813.481844] Workqueue: writeback wb_workfn (flush-7:0)
[ 1813.481885] [<808c4124>] (__schedule) from [<808c47d4>] (schedule+0x58/0xb8)
[ 1813.481903] [<808c47d4>] (schedule) from [<8014be98>] (io_schedule+0x20/0x40)
[ 1813.481923] [<8014be98>] (io_schedule) from [<805688c8>] (blk_mq_get_tag+0x1a4/0x2fc)
[ 1813.481944] [<805688c8>] (blk_mq_get_tag) from [<805634e8>] (blk_mq_get_request+0x134/0x43c)
[ 1813.481961] [<805634e8>] (blk_mq_get_request) from [<805661a8>] (blk_mq_make_request+0xec/0x758)
[ 1813.481980] [<805661a8>] (blk_mq_make_request) from [<80558d50>] (generic_make_request+0xe8/0x260)
[ 1813.481999] [<80558d50>] (generic_make_request) from [<80558f80>] (submit_bio+0xb8/0x1a8)
[ 1813.482018] [<80558f80>] (submit_bio) from [<8035dec8>] (ext4_io_submit+0x58/0x64)
[ 1813.482038] [<8035dec8>] (ext4_io_submit) from [<80342b6c>] (ext4_writepages+0x718/0x998)
[ 1813.482056] [<80342b6c>] (ext4_writepages) from [<80234668>] (do_writepages+0x30/0x9c)
[ 1813.482074] [<80234668>] (do_writepages) from [<802c20d8>] (__writeback_single_inode+0x44/0x554)
[ 1813.482092] [<802c20d8>] (__writeback_single_inode) from [<802c2b74>] (writeback_sb_inodes+0x238/0x4c0)
[ 1813.482111] [<802c2b74>] (writeback_sb_inodes) from [<802c2e8c>] (__writeback_inodes_wb+0x90/0xd0)
[ 1813.482128] [<802c2e8c>] (__writeback_inodes_wb) from [<802c31b8>] (wb_writeback+0x2ec/0x3bc)
[ 1813.482144] [<802c31b8>] (wb_writeback) from [<802c3c24>] (wb_workfn+0x1d4/0x570)
[ 1813.482167] [<802c3c24>] (wb_workfn) from [<80137b18>] (process_one_work+0x140/0x4c4)
[ 1813.482187] [<80137b18>] (process_one_work) from [<80137ef8>] (worker_thread+0x5c/0x568)
[ 1813.482206] [<80137ef8>] (worker_thread) from [<8013dec4>] (kthread+0x13c/0x16c)
[ 1813.482226] [<8013dec4>] (kthread) from [<8010834c>] (ret_from_fork+0x14/0x28)
[ 1813.482258] INFO: task jbd2/loop0-8:9482 blocked for more than 120 seconds.
[ 1813.482266]       Tainted: G         C      4.14.32+ #1
[ 1813.482272] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[ 1813.482278] jbd2/loop0-8    D    0  9482      2 0x00000000
[ 1813.482303] [<808c4124>] (__schedule) from [<808c47d4>] (schedule+0x58/0xb8)
[ 1813.482318] [<808c47d4>] (schedule) from [<8014be98>] (io_schedule+0x20/0x40)
[ 1813.482333] [<8014be98>] (io_schedule) from [<808c525c>] (bit_wait_io+0x1c/0x70)
[ 1813.482350] [<808c525c>] (bit_wait_io) from [<808c4ee8>] (__wait_on_bit+0x94/0xd4)
[ 1813.482368] [<808c4ee8>] (__wait_on_bit) from [<808c4fb0>] (out_of_line_wait_on_bit+0x88/0x90)
[ 1813.482385] [<808c4fb0>] (out_of_line_wait_on_bit) from [<802c988c>] (__wait_on_buffer+0x34/0x38)
[ 1813.482404] [<802c988c>] (__wait_on_buffer) from [<803838a0>] (jbd2_journal_commit_transaction+0x145c/0x191c)
[ 1813.482428] [<803838a0>] (jbd2_journal_commit_transaction) from [<80388e40>] (kjournald2+0x110/0x2a0)
[ 1813.482446] [<80388e40>] (kjournald2) from [<8013dec4>] (kthread+0x13c/0x16c)
[ 1813.482464] [<8013dec4>] (kthread) from [<8010834c>] (ret_from_fork+0x14/0x28)
[ 1813.482477] INFO: task tar:9486 blocked for more than 120 seconds.
[ 1813.482487]       Tainted: G         C      4.14.32+ #1
[ 1813.482493] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[ 1813.482500] tar             D    0  9486   9454 0x00000000
[ 1813.482523] [<808c4124>] (__schedule) from [<808c47d4>] (schedule+0x58/0xb8)
[ 1813.482538] [<808c47d4>] (schedule) from [<8014be98>] (io_schedule+0x20/0x40)
[ 1813.482553] [<8014be98>] (io_schedule) from [<805688c8>] (blk_mq_get_tag+0x1a4/0x2fc)
[ 1813.482570] [<805688c8>] (blk_mq_get_tag) from [<805634e8>] (blk_mq_get_request+0x134/0x43c)
[ 1813.482586] [<805634e8>] (blk_mq_get_request) from [<805661a8>] (blk_mq_make_request+0xec/0x758)
[ 1813.482602] [<805661a8>] (blk_mq_make_request) from [<80558d50>] (generic_make_request+0xe8/0x260)
[ 1813.482619] [<80558d50>] (generic_make_request) from [<80558f80>] (submit_bio+0xb8/0x1a8)
[ 1813.482635] [<80558f80>] (submit_bio) from [<802cca70>] (submit_bh_wbc+0x190/0x1c0)
[ 1813.482653] [<802cca70>] (submit_bh_wbc) from [<802cd268>] (submit_bh+0x24/0x2c)
[ 1813.482672] [<802cd268>] (submit_bh) from [<8031fe1c>] (ext4_read_block_bitmap_nowait+0x354/0x80c)
[ 1813.482691] [<8031fe1c>] (ext4_read_block_bitmap_nowait) from [<8034b544>] (ext4_mb_init_cache+0x128/0x750)
[ 1813.482709] [<8034b544>] (ext4_mb_init_cache) from [<8034bd2c>] (ext4_mb_init_group+0x1c0/0x2b0)
[ 1813.482725] [<8034bd2c>] (ext4_mb_init_group) from [<8034bfb4>] (ext4_mb_good_group+0x198/0x1a8)
[ 1813.482744] [<8034bfb4>] (ext4_mb_good_group) from [<8034ee20>] (ext4_mb_regular_allocator+0x2b8/0x408)
[ 1813.482761] [<8034ee20>] (ext4_mb_regular_allocator) from [<80351124>] (ext4_mb_new_blocks+0x854/0xe8c)
[ 1813.482781] [<80351124>] (ext4_mb_new_blocks) from [<803299b0>] (ext4_ext_map_blocks+0xccc/0x13b8)
[ 1813.482799] [<803299b0>] (ext4_ext_map_blocks) from [<8033e0e0>] (ext4_map_blocks+0x114/0x600)
[ 1813.482814] [<8033e0e0>] (ext4_map_blocks) from [<8033f0e8>] (ext4_getblk+0x4c/0x184)
[ 1813.482829] [<8033f0e8>] (ext4_getblk) from [<8033f23c>] (ext4_bread+0x1c/0xac)
[ 1813.482845] [<8033f23c>] (ext4_bread) from [<80356cf4>] (ext4_append+0x68/0x10c)
[ 1813.482863] [<80356cf4>] (ext4_append) from [<8035b050>] (ext4_mkdir+0x210/0x414)
[ 1813.482883] [<8035b050>] (ext4_mkdir) from [<8029e14c>] (vfs_mkdir+0x100/0x154)
[ 1813.482908] [<8029e14c>] (vfs_mkdir) from [<802a261c>] (SyS_mkdirat+0x74/0xc0)
[ 1813.482927] [<802a261c>] (SyS_mkdirat) from [<801082a0>] (ret_fast_syscall+0x0/0x28)

Tapi itu tidak selalu memblokir semuanya tanpa batas karena perangkat loop yang dipasang secara acak akan menjadi ro (setelah lama tidak melakukan apa-apa) dan tar tidak melanjutkan penyalinan, hanya melemparkan banyak pesan kesalahan ke layar atau tar terus menyalin hingga nfs diblokir lagi atau kasus ketiga memblokir tanpa batas

root<strong i="6">@kmxbilr2</strong> ~/bin # ps ax | grep tar\ 
13829 pts/3    S+     0:18 tar c --one-file-system --warning=none --acls --xattrs -C / .
13830 pts/3    D+     0:20 tar x --warning=none --acls --xattrs -C /srv/backup/img
15679 pts/1    S+     0:00 grep --color=auto tar 
root<strong i="7">@kmxbilr2</strong> ~/bin # 

Ini adalah pengaturan eee saya:

root<strong i="11">@kmxbilr2</strong> ~/bin # ethtool --show-eee eth0
EEE Settings for eth0:
        EEE status: disabled
        Tx LPI: disabled
        Supported EEE link modes:  100baseT/Full 
                                   1000baseT/Full 
        Advertised EEE link modes:  Not reported
        Link partner advertised EEE link modes:  Not reported

root<strong i="12">@kmxbilr2</strong> ~/bin # 

Jadi, saya menjalankan tes di atas tiga kali:

Jalankan pertama: perangkat loop menjadi r/o
2nd run: tes selesai
Jalankan ketiga: tes diblokir tanpa batas

tetapi selalu mendapatkan pesan seperti ini: NFO: task loop0:9479 blocked for more than 120 seconds.

Ah, lupa, folder tujuan di-mount sebagai berikut

kmcubie:/media/system/backup/kmxbilr2 on /srv/backup type nfs4 (rw,nosuid,relatime,vers=4.1,rsize=131072,wsize=131072,namlen=255,soft,proto=tcp,timeo=600,retrans=2,sec=sys,clientaddr=192.168.1.24,local_lock=none,addr=192.168.1.6)

Dipasang melalui autofs

EDIT:

Setelah 45 menit pemblokiran loop fs menjadi r/o di run ke-3 dan skrip selesai

Tujuan adalah ext4, tetapi sumbernya masih BTRFS
Itu selalu berakhir dengan nfs: server kmcubie tidak merespons, waktu habis

Saya tidak menggunakan BTRFS dan saya juga tidak memiliki akses ke sistem file spesifik Anda, jadi mari buat skrip standar yang dapat digunakan siapa pun asalkan mereka memiliki server NFS dan dapat dipasang ke sana.

Berikut adalah skrip seperti itu.

Percobaan

Jalankan skrip ini pada RPi3B+ dan _menggunakan kartu micro SD yang sama_, pada papan yang dikenal baik yang dalam kasus saya adalah RPi2.

rincian

Kesimpulan

@pelwell

  • Ketika saya menjalankannya di 3B+ saya, saya melihat bahwa bug asli yang saya buka dengan tiket ini MASIH ada.
  • Berjalan pada RPi2 menghasilkan 4 penyelesaian yang berhasil dalam waktu berjalan yang sangat mirip. Kegagalan alokasi halaman terjadi pada run ke-2 (lihat output di bawah/dmesg timestamp 759.7). Terkait? Tidak berhubungan?

Detail: RPi3B+

% mount | grep nfs
ease:/scratch on /scratch type nfs4 (rw,relatime,vers=4.2,rsize=1048576,wsize=1048576,namlen=255,hard,proto=tcp,timeo=600,retrans=2,sec=sys,clientaddr=10.9.8.108,local_lock=none,addr=10.9.8.128)

Keluaran skrip:

# /root/bin/nfstest 
Writting round 1
4194304000 bytes (4.2 GB, 3.9 GiB) copied, 605 s, 6.9 MB/s 
1000+0 records in
1000+0 records out
4194304000 bytes (4.2 GB, 3.9 GiB) copied, 605.129 s, 6.9 MB/s
total 4096020
drwx------ 2 root root      16384 Apr  8 12:54 lost+found
-rw-r--r-- 1 root root 4194304000 Apr  8 13:04 rnd.1
Round 1 done
Writting round 2
4194304000 bytes (4.2 GB, 3.9 GiB) copied, 930 s, 4.5 MB/s 
1000+0 records in
1000+0 records out
4194304000 bytes (4.2 GB, 3.9 GiB) copied, 929.514 s, 4.5 MB/s
total 4096020
drwx------ 2 root root      16384 Apr  8 13:05 lost+found
-rw-r--r-- 1 root root 4194304000 Apr  8 13:20 rnd.2
Round 2 done
Writting round 3
2990538752 bytes (3.0 GB, 2.8 GiB) copied, 679 s, 4.4 MB/s 

Saat ini macet di putaran 3. Sistem masih menyala tetapi tidak terlalu responsif.
Dari dmsg:

[   90.991309] EXT4-fs (loop0): mounted filesystem with ordered data mode. Opts: (null)
[  699.983054] EXT4-fs (loop0): mounted filesystem with ordered data mode. Opts: (null)
[  858.079796] INFO: task jbd2/loop0-8:633 blocked for more than 120 seconds.
[  858.079980]       Tainted: G         C      4.14.32-2-ARCH #1
[  858.080112] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[  858.080290] jbd2/loop0-8    D    0   633      2 0x00000000
[  858.080451] [<80a87c48>] (__schedule) from [<80a88418>] (schedule+0x3c/0xa0)
[  858.080627] [<80a88418>] (schedule) from [<8015c138>] (io_schedule+0x14/0x3c)
[  858.080801] [<8015c138>] (io_schedule) from [<80a88d28>] (bit_wait_io+0xc/0x60)
[  858.080975] [<80a88d28>] (bit_wait_io) from [<80a8899c>] (__wait_on_bit+0x60/0xb8)
[  858.081158] [<80a8899c>] (__wait_on_bit) from [<80a88a68>] (out_of_line_wait_on_bit+0x74/0xa0)
[  858.085451] [<80a88a68>] (out_of_line_wait_on_bit) from [<803be5b4>] (jbd2_journal_commit_transaction+0xf6c/0x17d8)
[  858.094108] [<803be5b4>] (jbd2_journal_commit_transaction) from [<803c3ea4>] (kjournald2+0xe0/0x2e4)
[  858.102800] [<803c3ea4>] (kjournald2) from [<8014e708>] (kthread+0x138/0x150)
[  858.107318] [<8014e708>] (kthread) from [<80107db8>] (ret_from_fork+0x14/0x3c)
[ 1633.827852] EXT4-fs (loop0): mounted filesystem with ordered data mode. Opts: (null)

Detail: RPi2

Keluaran skrip:

# /root/bin/nfstest
Writting round 1
4185915392 bytes (4.2 GB, 3.9 GiB) copied, 373 s, 11.2 MB/s
1000+0 records in
1000+0 records out
4194304000 bytes (4.2 GB, 3.9 GiB) copied, 373.4 s, 11.2 MB/s
total 4096020
drwx------ 2 root root      16384 Apr  8 09:44 lost+found
-rw-r--r-- 1 root root 4194304000 Apr  8 09:51 rnd.1
Round 1 done
Writting round 2
4194304000 bytes (4.2 GB, 3.9 GiB) copied, 373 s, 11.3 MB/s
1000+0 records in
1000+0 records out
4194304000 bytes (4.2 GB, 3.9 GiB) copied, 372.777 s, 11.3 MB/s
total 4096020
drwx------ 2 root root      16384 Apr  8 09:51 lost+found
-rw-r--r-- 1 root root 4194304000 Apr  8 09:57 rnd.2
Round 2 done
Writting round 3
4190109696 bytes (4.2 GB, 3.9 GiB) copied, 369 s, 11.3 MB/s
1000+0 records in
1000+0 records out
4194304000 bytes (4.2 GB, 3.9 GiB) copied, 369.738 s, 11.3 MB/s
total 4096020
drwx------ 2 root root      16384 Apr  8 09:57 lost+found
-rw-r--r-- 1 root root 4194304000 Apr  8 10:03 rnd.3
Round 3 done
Writting round 4
4194304000 bytes (4.2 GB, 3.9 GiB) copied, 368 s, 11.4 MB/s
1000+0 records in
1000+0 records out
4194304000 bytes (4.2 GB, 3.9 GiB) copied, 367.684 s, 11.4 MB/s
total 4096020
drwx------ 2 root root      16384 Apr  8 10:04 lost+found
-rw-r--r-- 1 root root 4194304000 Apr  8 10:10 rnd.4
Round 4 done
nfstest  0.64s user 157.45s system 10% cpu 25:36.18 total

Dari dmesg:

[   26.240546] EXT4-fs (loop0): mounted filesystem with ordered data mode. Opts: (null)
[  411.226606] EXT4-fs (loop0): mounted filesystem with ordered data mode. Opts: (null)
[  759.730166] kworker/0:1H: page allocation failure: order:0, mode:0x1080020(GFP_ATOMIC), nodemask=(null)
[  759.739788] kworker/0:1H cpuset=/ mems_allowed=0
[  759.744512] CPU: 0 PID: 196 Comm: kworker/0:1H Tainted: G         C      4.14.32-2-ARCH #1
[  759.752917] Hardware name: BCM2835
[  759.756391] Workqueue: xprtiod xs_tcp_data_receive_workfn
[  759.761905] [<8010ef14>] (unwind_backtrace) from [<8010bbc0>] (show_stack+0x10/0x14)
[  759.769790] [<8010bbc0>] (show_stack) from [<80a71e3c>] (dump_stack+0x9c/0xc8)
[  759.777144] [<80a71e3c>] (dump_stack) from [<8023bea4>] (warn_alloc+0xd0/0x194)
[  759.784584] [<8023bea4>] (warn_alloc) from [<8023cf98>] (__alloc_pages_nodemask+0xf98/0x10ec)
[  759.817701] [<8023cf98>] (__alloc_pages_nodemask) from [<8023d2f0>] (page_frag_alloc+0x168/0x198)
[  759.877932] [<8023d2f0>] (page_frag_alloc) from [<8096695c>] (__netdev_alloc_skb+0x90/0x10c)
[  759.938928] [<8096695c>] (__netdev_alloc_skb) from [<8080d36c>] (rx_submit+0x34/0x214)
[  760.001476] [<8080d36c>] (rx_submit) from [<8080d8fc>] (rx_complete+0x138/0x220)
[  760.065467] [<8080d8fc>] (rx_complete) from [<80819888>] (__usb_hcd_giveback_urb+0x98/0x154)
[  760.131215] [<80819888>] (__usb_hcd_giveback_urb) from [<808424f0>] (completion_tasklet_func+0x78/0xbc)
[  760.198174] [<808424f0>] (completion_tasklet_func) from [<80134f44>] (tasklet_hi_action+0x64/0xf8)
[  760.264776] [<80134f44>] (tasklet_hi_action) from [<80101574>] (__do_softirq+0xc4/0x328)
[  760.331823] [<80101574>] (__do_softirq) from [<801349e8>] (do_softirq.part.4+0x48/0x50)
[  760.400468] [<801349e8>] (do_softirq.part.4) from [<80134aa8>] (__local_bh_enable_ip+0xb8/0xd8)
[  760.471671] [<80134aa8>] (__local_bh_enable_ip) from [<80a47024>] (xs_tcp_data_receive_workfn+0x88/0x194)
[  760.543912] [<80a47024>] (xs_tcp_data_receive_workfn) from [<801487f0>] (process_one_work+0x210/0x4fc)
[  760.617849] [<801487f0>] (process_one_work) from [<80149718>] (worker_thread+0x34/0x5d0)
[  760.691146] [<80149718>] (worker_thread) from [<8014e708>] (kthread+0x138/0x150)
[  760.763687] [<8014e708>] (kthread) from [<80107db8>] (ret_from_fork+0x14/0x3c)
[  760.803499] Mem-Info:
[  760.838097] active_anon:2032 inactive_anon:2748 isolated_anon:0
                active_file:8207 inactive_file:204480 isolated_file:0
                unevictable:0 dirty:8517 writeback:28663 unstable:2
                slab_reclaimable:6216 slab_unreclaimable:3548
                mapped:4648 shmem:56 pagetables:200 bounce:0
                free:4508 free_pcp:242 free_cma:1299
[  761.056841] Node 0 active_anon:8128kB inactive_anon:10992kB active_file:32828kB inactive_file:817920kB unevictable:0kB isolated(anon):0kB isolated(file):0kB mapped:18592kB dirty:34068kB writeback:114652kB shmem:224kB writeback_tmp:0kB unstable:8kB all_unreclaimable? no
[  761.198936] Normal free:18032kB min:3884kB low:4852kB high:5820kB active_anon:8128kB inactive_anon:10992kB active_file:32828kB inactive_file:817948kB unevictable:0kB writepending:148628kB present:983040kB managed:958392kB mlocked:0kB kernel_stack:896kB pagetables:800kB bounce:0kB free_pcp:968kB local_pcp:108kB free_cma:5196kB
[  761.376256] lowmem_reserve[]: 0 0
[  761.408452] Normal: 95*4kB (UMEC) 155*8kB (UMEHC) 152*16kB (UME) 218*32kB (MEH) 15*64kB (UMC) 2*128kB (MH) 0*256kB 1*512kB (H) 1*1024kB (C) 0*2048kB 1*4096kB (C) = 17876kB
[  761.509861] 212750 total pagecache pages
[  761.541672] 0 pages in swap cache
[  761.572101] Swap cache stats: add 0, delete 0, find 0/0
[  761.603884] Free swap  = 1191420kB
[  761.633321] Total swap = 1191420kB
[  761.661755] 245760 pages RAM
[  761.688868] 0 pages HighMem/MovableOnly
[  761.716659] 6162 pages reserved
[  761.743400] 2048 pages cma reserved
[  796.738005] EXT4-fs (loop0): mounted filesystem with ordered data mode. Opts: (null)
[ 1180.359713] EXT4-fs (loop0): mounted filesystem with ordered data mode. Opts: (null)

@graysky2

Ketika saya menjalankannya di 3B+ saya, saya melihat bahwa bug asli yang saya buka tiket ini MASIH ada

Bisa konfirmasi ini...

4194304000 byte (4,2 GB, 3,9 GiB) disalin, 605 dtk, 6,9 MB/dtk

... dan kinerja jaringan Anda sangat lambat

btw, saya mendapatkan hasil yang lebih baik jika saya mematikan kontrol aliran sepenuhnya

ethtool -A eth0 tx off rx off autoneg off && ethtool -r eth0

Kunci tak terbatas hilang, tetapi tentu saja, kunci yang mengganggu itu masih ada

Nah, yang penting Anda bisa mereproduksi bug ini secara mandiri.

... dan kinerja jaringan Anda sangat lambat

Hanya di 3B+ dan saya yakin itu karena kunci ... jaringannya semua cat6 melalui SG100-16. Ini adalah kotak x86_64 yang melakukan penulisan 4G yang sama:

% dd if=/dev/zero of=/mnt/media/test/fill bs=4M count=1000 status=progress
4177526784 bytes (4.2 GB, 3.9 GiB) copied, 31 s, 135 MB/s
1000+0 records in
1000+0 records out
4194304000 bytes (4.2 GB, 3.9 GiB) copied, 35.8983 s, 117 MB/s

@ greysky2 Untuk mengidentifikasi masalah penguncian, Anda dapat mencoba mengkompilasi ulang kernel Anda dengan opsi berikut:

Kernel hacking  --->
  Lock Debugging (spinlocks, mutexes, etc...)  --->
     Lock debugging: prove locking correctness (CONFIG_PROVE_LOCKING=y)
     Sleep inside atomic section checking (CONFIG_DEBUG_ATOMIC_SLEEP=y)

Anda bertaruh. Membangun sekarang. Untuk referensi, konfigurasi yang saya gunakan.

@lategoodbye @pelwell - Saya tidak pernah berpikir untuk melihat apa yang terjadi di sisi server nfs. Server NFS saya berjalan pada mesin i7-4790K. Log dmesg di sana mendapat spam dengan ratusan baris seperti ini di bawah ini yang bertepatan dengan pembekuan pada RPi3BPlus:

[ 3624.508074] nfsd4_validate_stateid: 119 callbacks suppressed
[ 3624.508074] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 3624.508938] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 3624.509754] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 3624.510577] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 3624.511396] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 3624.512229] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 3624.513059] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 3624.513872] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 3624.514688] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 3624.515514] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 3767.535787] nfsd4_validate_stateid: 119 callbacks suppressed
[ 3767.535788] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 4105.423284] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 4105.423887] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 4105.424487] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 4105.425385] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 4105.425979] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 4105.426585] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 4105.427501] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 4105.428322] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 4105.429125] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 4218.046249] NFSD: client 10.9.8.108 testing state ID with incorrect client ID
[ 4218.047093] NFSD: client 10.9.8.108 testing state ID with incorrect client ID

@lategoodbye - Saya tidak berpikir kernel memiliki apa yang Anda butuhkan ... Saya

[  532.399675] EXT4-fs (loop0): mounted filesystem with ordered data mode. Opts: (null)
[  858.099808] INFO: task jbd2/loop0-8:859 blocked for more than 120 seconds.
[  858.100037]       Tainted: G        WC      4.14.32-3-ARCH #1
[  858.100215] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[  858.100453] jbd2/loop0-8    D    0   859      2 0x00000000
[  858.100665] [<80baebf0>] (__schedule) from [<80baf72c>] (schedule+0x50/0xc0)
[  858.100892] [<80baf72c>] (schedule) from [<80168230>] (io_schedule+0x14/0x3c)
[  858.101124] [<80168230>] (io_schedule) from [<80bb00f4>] (bit_wait_io+0xc/0x60)
[  858.101354] [<80bb00f4>] (bit_wait_io) from [<80bafd68>] (__wait_on_bit+0x60/0xb8)
[  858.101594] [<80bafd68>] (__wait_on_bit) from [<80bafe34>] (out_of_line_wait_on_bit+0x74/0xa0)
[  858.101868] [<80bafe34>] (out_of_line_wait_on_bit) from [<80420fe0>] (jbd2_journal_commit_transaction+0x1470/0x1ef8)
[  858.102191] [<80420fe0>] (jbd2_journal_commit_transaction) from [<80426e70>] (kjournald2+0xdc/0x2d0)
[  858.102472] [<80426e70>] (kjournald2) from [<80157430>] (kthread+0x148/0x164)
[  858.102697] [<80157430>] (kthread) from [<8010824c>] (ret_from_fork+0x14/0x28)
[  858.102923] INFO: lockdep is turned off.

@ greysky2 Ini berarti Anda membangun kernel dengan opsi-opsi ini, tetapi itu tidak memicu peringatan apa pun kecuali hang? Saya pikir itu akan layak untuk dicoba.

@lategoodbye -

[ 858.102923] INFO: lockdep dimatikan.

Mungkin saya tidak mengkompilasi dengan cukup banyak opsi ini diaktifkan? Ini nconfignya... more?

                .config - Linux/arm 4.14.32-3 Kernel Configuration
 ┌── Lock Debugging (spinlocks, mutexes, etc...) ────────────────────────────────┐
 │                                                                               │
 │         -*- RT Mutex debugging, deadlock detection                            │
 │         -*- Spinlock and rw-lock debugging: basic checks                      │
 │         -*- Mutex debugging: basic checks                                     │
 │         [ ] Wait/wound mutex debugging: Slowpath testing                      │
 │         -*- Lock debugging: detect incorrect freeing of live locks            │
 │         [*] Lock debugging: prove locking correctness                         │
 │         [ ] Lock usage statistics                                             │
 │         [ ] Lock dependency engine debugging (NEW)                            │
 │         [*] Sleep inside atomic section checking                              │
 │         [ ] Locking API boot-time self-tests                                  │
 │         < > torture tests for locking                                         │
 │         < > Wait/wound mutex selftests                                        │
 │                                                                               │

@graysky2 Jika Anda ingin

Sunting: Konfigurasi di atas terlihat bagus.
Sunting2: lockdep dinonaktifkan karena digantung.

Jika Anda ingin memeriksa ulang, cari "Kunci validator ketergantungan" di dalam dmesg. Kernel RPI default tidak memilikinya.

Itu ada di sana:

% dmesg | grep -i validator
[    0.004391] Lock dependency validator: Copyright (c) 2006 Red Hat, Inc., Ingo Molnar

Sunting: Konfigurasi di atas terlihat bagus.
Sunting2: lockdep dinonaktifkan karena digantung.

OK... jadi tidak perlu mengkompilasi ulang... dan kita kembali ke titik 1 :(

@ greysky2 Saya berencana untuk mengirimkan dukungan RPi 3+ ke Linux Mainline segera. Adakah kesempatan bagi Anda untuk mencobanya?

@lategoodbye - Jangka panjang, saya memerlukan pustaka vendor yang disediakan oleh paket raspberrypi-firmware yang saya yakini terkait dengan kernel 4.14.x. Saya mungkin punya waktu selama akhir pekan untuk mengkompilasi/menggunakan kernel versi arus utama. Saya percaya itu akan menjadi aarch64 di Arch ARM.

@graysky2 Tentu. Ini akan membantu untuk mempersempit, jika ini adalah masalah khusus hilir. Akan lebih baik menggunakan rootf yang sama, yang saat ini menyebabkan masalah ini dan hanya mengganti kernel dan BLOB pohon perangkat. Kernel arus utama mendukung 32 dan 64 bit.

Terima kasih sebelumnya
Stefan

@ greysky2 Saya telah membuat cabang berdasarkan pohon Linus (sebelum 4.17) yang mencakup perubahan yang diperlukan untuk RPi 3B+

https://github.com/lategoodbye/rpi-zero/tree/bcm2837-rpi3-plus-4.17

Berikut adalah skrip seperti itu.

@pelwell @mkreisl - Lebih banyak bukti bahwa bug yang kami cari ada di driver LAN kabel: jika saya menggunakan Wi-Fi terpasang, saya dapat menyelesaikan ini dengan sukses tanpa kernel oops atau lockup.

Koneksi 5GHz:

% cat /proc/net/wireless
Inter-| sta-|   Quality        |   Discarded packets               | Missed | WE
 face | tus | link level noise |  nwid  crypt   frag  retry   misc | beacon | 22
 wlan0: 0000   56.  -54.  -256        0      0      0     19      0        0

Menjalankan skrip:

# /root/bin/nfstest
Writting round 1
4194304000 bytes (4.2 GB, 3.9 GiB) copied, 358 s, 11.7 MB/s
1000+0 records in
1000+0 records out
4194304000 bytes (4.2 GB, 3.9 GiB) copied, 358.232 s, 11.7 MB/s
total 4096020
drwx------ 2 root root      16384 Apr 12 15:03 lost+found
-rw-r--r-- 1 root root 4194304000 Apr 12 15:09 rnd.1
Round 1 done
Writting round 2
4185915392 bytes (4.2 GB, 3.9 GiB) copied, 358 s, 11.7 MB/s
1000+0 records in
1000+0 records out
4194304000 bytes (4.2 GB, 3.9 GiB) copied, 357.618 s, 11.7 MB/s
total 4096020
drwx------ 2 root root      16384 Apr 12 15:09 lost+found
-rw-r--r-- 1 root root 4194304000 Apr 12 15:15 rnd.2
Round 2 done
Writting round 3
4181721088 bytes (4.2 GB, 3.9 GiB) copied, 357 s, 11.7 MB/s
1000+0 records in
1000+0 records out
4194304000 bytes (4.2 GB, 3.9 GiB) copied, 357.173 s, 11.7 MB/s
total 4096020
drwx------ 2 root root      16384 Apr 12 15:15 lost+found
-rw-r--r-- 1 root root 4194304000 Apr 12 15:21 rnd.3
Round 3 done
Writting round 4
4181721088 bytes (4.2 GB, 3.9 GiB) copied, 357 s, 11.7 MB/s
1000+0 records in
1000+0 records out
4194304000 bytes (4.2 GB, 3.9 GiB) copied, 357.512 s, 11.7 MB/s
total 4096020
drwx------ 2 root root      16384 Apr 12 15:21 lost+found
-rw-r--r-- 1 root root 4194304000 Apr 12 15:27 rnd.4
Round 4 done
/root/bin/nfstest  0.35s user 105.39s system 7% cpu 24:31.40 total

Dan dmesg:

[  +2.033113] brcmfmac: brcmf_c_preinit_dcmds: Firmware version = wl0: Feb 27 2018 03:15:32 version 7.45.154 (r684107 CY) FWID 01-4fbe0b04
[  +0.001800] brcmfmac: brcmf_c_preinit_dcmds: CLM version = API: 12.2 Data: 9.10.105 Compiler: 1.29.4 ClmImport: 1.36.3 Creation: 2018-03-09 18:56:28 
[  +0.081575] IPv6: ADDRCONF(NETDEV_UP): wlan0: link is not ready
[  +0.000902] brcmfmac: power management disabled
[  +3.238507] IPv6: ADDRCONF(NETDEV_CHANGE): wlan0: link becomes ready
[Apr12 15:03] EXT4-fs (loop0): mounted filesystem with ordered data mode. Opts: (null)
[Apr12 15:08] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[  +0.000132] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[  +0.000100] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[  +0.000093] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0xfb
[  +0.000117] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[  +0.000106] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[  +0.000090] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[  +0.000090] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[  +0.000089] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[  +0.000086] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[Apr12 15:09] EXT4-fs (loop0): mounted filesystem with ordered data mode. Opts: (null)
[Apr12 15:10] net_ratelimit: 73 callbacks suppressed
[  +0.000008] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[  +0.013994] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0xfb
[  +0.009320] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0xff
[  +0.010984] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[  +0.009323] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[  +0.008868] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[  +0.008751] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[  +0.008961] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[Apr12 15:14] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[  +0.009775] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[  +0.008504] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[  +0.008744] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[  +0.008674] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[  +0.008638] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0x0
[  +0.008662] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0xfb
[  +0.008604] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0xfb
[  +0.008401] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0xfb
[  +0.008542] brcmfmac: brcmf_proto_bcdc_hdrpull: wlan0: non-BCDC packet received, flags 0xfb

@graysky2 Terima kasih telah mengonfirmasi bahwa wlan baik-baik saja
Saya sudah memposting ini beberapa kali :smile:

Tidak ada berita tentang masalah yang mengganggu ini. Hmmm, sepertinya kalian dari Raspberry Pi foundation sama sekali tidak tahu cara memperbaikinya :marah:

Sangat mengecewakan

Kau tahu ini akhir pekan, kan? Bahkan karyawan RPF(T) memiliki libur akhir pekan. Kami memiliki banyak insinyur yang mengerjakan ini. Saya yakin akan ada kemajuan dalam waktu dekat. Sementara itu, mungkin menghilangkan sarkasme mungkin bisa membantu.

Betulkah? Saya merasa sangat memotivasi.

@mkreisl - Tidak tahu mengapa Anda akan mengencingi orang-orang yang membantu Anda...

@pelwell - Saya perhatikan bahwa tugas yang digantung tampaknya bergantung pada jumlah data yang coba ditulis dan saya bertanya-tanya apakah itu membantu Anda mengetahui penyebabnya?

Misalnya, lihat skrip ini . Saya mulai menulis 10 MB (total 10x), kemudian meningkatkan dalam peningkatan 1/4-log (yaitu 10, 18, 32, 56, 100, 178, 316, 563, 1000) hingga tugas yang digantung terjadi. Dalam pengujian saya, semua ukuran di bawah 563 baik-baik saja; kesalahan terjadi pada iterasi ke-5 menulis 563 MB.. Signifikan?

Misalnya, lihat skrip ini. Saya mulai menulis 10 MB (total 10x), kemudian meningkatkan dalam peningkatan 1/4-log (yaitu 10, 18, 32, 56, 100, 178, 316, 563, 1000) hingga tugas yang digantung terjadi. Dalam pengujian saya, semua ukuran di bawah 563 baik-baik saja; kesalahan terjadi pada iterasi ke-5 menulis 563 MB.. Signifikan?

Bagi saya tidak apa-apa selama data benar-benar masuk ke dalam cache (tulis-)

Dalam pengujian saya, semua ukuran di bawah 563 baik-baik saja; kesalahan terjadi pada iterasi ke-5 menulis 563 MB..

Saya menjalankannya lagi dengan 30 iterasi per ukuran dan menemukan kesalahan pada penulisan 316 MB ... mungkin itu berbicara tentang sifat bug yang tidak dapat diprediksi?

EDIT: Ketika bug memanifestasikan dirinya, kode yang saya gunakan untuk melacak waktu antara berjalan juga membeku sehingga merekam waktu yang tidak benar untuk diselesaikan. Apakah itu menyiratkan bahwa jam internal pada RPi juga?
membeku?

    start=$(date +%s.%N)
    dd if=/dev/zero of="$MP/rnd.$x" bs=1M count=$size status=progress
    finish=$(date +%s.%N)
    diff=$(echo "scale=6; $finish - $start" | bc)

Microchip mengarahkan kami ke patch yang seharusnya mencegah link drop saat menggunakan EEE dengan kabel panjang. Pengujian di sini telah menunjukkan bahwa itu benar-benar memperbaiki masalah throughput terkait EEE (disebabkan oleh penurunan tautan) yang saya amati (kabel yang dimaksud panjangnya sekitar 40 meter). Karena tambalan mengubah banyak register PHY, itu juga dapat membuat perbedaan dengan kabel yang lebih pendek. Patch (dan beberapa prasyarat) ada di cabang rpi-4.14.y dan akan diambil oleh firmware build berikutnya.

@pelwell - Senang mendengarnya! Kabel saya tidak sejauh 40 m, tetapi saya senang untuk mengujinya. Untuk lebih jelasnya, jika saya membuat dua komit berikut, apakah saya akan memiliki tambalan yang dimaksud?

Ya, itu benar - kernel komit yang Anda referensikan adalah yang signifikan.

@pelwell - Bagus, bangun sekarang. Akan memberi tahu Anda.

@pelwell -

/root/bin/nfstest                   
 ==> Writting round 1 for 500 MB
349175808 bytes (349 MB, 333 MiB) copied, 7 s, 49.8 MB/s^C^C^C

Terminal terkunci pada saat ini :/

Tautan ke skrip.

@graysky2
Tentu, bug ini masih ada, tetapi bug lain (tidak dilaporkan? [1]) tampaknya telah diperbaiki (tidak pernah terlihat hari ini)

Ini hanya memancing di tempat yang membosankan :kecewa:

[1] reset tautan yang tidak termotivasi

Masalah EEE ditemukan secara internal ketika kami pertama kali mulai menguji masalah ethernet/Nirkabel setelah rilis dan laporan mulai masuk. Masalah ini diperbaiki oleh Cypress dan diposting ke milis linux-net, dan kami telah mengambilnya dan mem-backportnya ke 4.14. Karena sifatnya, kemungkinan itu mungkin memiliki efek di luar masalah EEE yang diperbaiki secara khusus, oleh karena itu kami menyarankan orang-orang mencobanya untuk berjaga-jaga. kami tidak berhenti melihat masalah lain.

@ JamesH65 - Terima kasih atas ketekunan yang

@ greysky2 Saya ingin menyebutkan bahwa dukungan Raspberry Pi 3 B+ sekarang ada di linux-next . Jadi akan sangat membantu jika ada yang dapat mereproduksi masalah ini, coba juga upstream linux-next. Ini mungkin memberi kita kesempatan untuk mengecualikan kemungkinan masalah dalam kombinasi dengan driver dwc_otg (upstream menggunakan dwc2).

@lategoodbye
Saya menggunakan dwc2 dengan pohon kernel 4.14 dari sini, cukup atur

# CONFIG_USB_DWCOTG is not set
CONFIG_USB_DWC2=y
CONFIG_USB_DWC2_HOST=y

dan mengaktifkan dwc2 di /boot/config.txt

dtoverlay=dwc2,dr_mode=host

Tampaknya driver ini bekerja sedikit lebih baik [1] tetapi tidak menyelesaikan masalah ini

[1] intr status -5 pesan kesalahan yang dihasilkan di sini hilang. Tetapi harus menguji sedikit lebih banyak karena itu tidak sering terjadi
EDIT: Tidak, masih di sana, terjadi segera setelah posting

Jadi, dwc2 tidak ada bedanya

Hanya ingin tahu apakah ada pemikiran baru seputar penyebab bug ini. Masih ada di 4.14.44.

Saya percaya ini masalah yang sama dengan #2449, mungkin beberapa yang lain juga. Secara aktif mencarinya, tetapi mengalami kesulitan untuk mereplikasi.

@ JamesH65 - Terima kasih atas ketekunannya yang skrip ini yang memicu kesalahan bagi saya dengan sangat reproduktif.

@graysky2 Bisakah Anda memberikan output lsusb -t dari RPI 3B+ Anda?

Rupanya saya memiliki masalah yang sama menggunakan Pi 3 B+ (dilaporkan sebagai #2576 ). Ini adalah kotak tanpa kepala yang hanya menjalankan daemon transmisi dan monquitto. Torrent diunduh pada NAS menggunakan CIFS v3. Kartu SD yang sama persis bekerja dengan sempurna pada Raspberry Pi 2 dan Raspberry Pi 3 tetapi hang setelah satu jam bekerja pada Raspberry Pi 3 B+ yang membutuhkan restart.

Ini adalah contoh hang:
8 Juni 15:49:59 kernel raspberrypi: [58120.469383] INFO: task transmission-da:799 diblokir selama lebih dari 120 detik.
8 Juni 15:49:59 kernel raspberrypi: [58120.471927] Tercemar: GC 4.14.44-v7+ #1117
8 Juni 15:49:59 kernel raspberrypi: [58120.474426] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" menonaktifkan pesan ini.
8 Juni 15:49:59 kernel raspberrypi: [58120.479425] transmission-da D 0 799 1 0x00000000
8 Juni 15:50:00 kernel raspberrypi: [58120.482071] [<8079b418>] (__schedule) dari [<8079ba90>] (schedule+0x50/0xa8)
8 Juni 15:50:00 kernel raspberrypi: [58120.484626] [<8079ba90>] (jadwal) dari [<8014b148>] (io_schedule+0x20/0x40)
8 Juni 15:50:00 kernel raspberrypi: [58120.487156] [<8014b148>] (io_schedule) dari [<8021cb74>] (wait_on_page_bit+0x110/0x130)
8 Juni 15:50:00 kernel raspberrypi: [58120.492127] [<8021cb74>] (wait_on_page_bit) dari [<8021cc74>] (__filemap_fdatawait_range+0xe0/0x114)
8 Juni 15:50:00 kernel raspberrypi: [58120.497281] [<8021cc74>] (__filemap_fdatawait_range) dari [<8021ccd0>] (filemap_fdatawait_range+0x28/0x38)
8 Juni 15:50:00 kernel raspberrypi: [58120.502536] [<8021ccd0>] (filemap_fdatawait_range) dari [<8021f084>] (filemap_write_and_wait+0x68/0x9c)
8 Juni 15:50:00 kernel raspberrypi: [58120.508125] [<8021f084>] (filemap_write_and_wait) dari [<7f545028>] (cifs_reopen_file+0x364/0x430 [cifs])
8 Juni 15:50:00 kernel raspberrypi: [58120.514027] [<7f545028>] (cifs_reopen_file [cifs]) dari [<7f54a3b4>] (cifs_readpages+0x408/0x6d0 [cifs])
8 Juni 15:50:00 kernel raspberrypi: [58120.519917] [<7f54a3b4>] (cifs_readpages [cifs]) dari [<8022f63c>] (__do_page_cache_readahead+0x17c/0x284)
8 Juni 15:50:00 kernel raspberrypi: [58120.525833] [<8022f63c>] (__do_page_cache_readahead) dari [<8022fb34>] (force_page_cache_readahead+0xb8/0x12c)
8 Juni 15:50:00 kernel raspberrypi: [58120.531787] [<8022fb34>] (force_page_cache_readahead) dari [<80267934>] (SyS_fadvise64_64+0x2d4/0x314)
8 Juni 15:50:00 kernel raspberrypi: [58120.537790] [<80267934>] (SyS_fadvise64_64) dari [<8010be18>] (sys_arm_fadvise64_64+0x28/0x30)
8 Juni 15:50:00 kernel raspberrypi: [58120.543911] [<8010be18>] (sys_arm_fadvise64_64) dari [<80108060>] (ret_fast_syscall+0x0/0x28)

6 Juni 22:58:38 kernel raspberrypi: [ 980.956292] INFO: task transmission-da:696 diblokir selama lebih dari 120 detik.
6 Juni 22:58:38 kernel raspberrypi: [ 980.959486] Tercemar: GC 4.14.44-v7+ #1117
6 Juni 22:58:38 kernel raspberrypi: [ 980.962627] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" menonaktifkan pesan ini.
6 Juni 22:58:38 kernel raspberrypi: [ 980.968999] transmission-da D 0 696 1 0x00000000
6 Juni 22:58:38 kernel raspberrypi: [ 980.972262] [<8079b418>] (__schedule) dari [<8079ba90>] (schedule+0x50/0xa8)
6 Juni 22:58:38 kernel raspberrypi: [ 980.975402] [<8079ba90>] (jadwal) dari [<8014b148>] (io_schedule+0x20/0x40)
6 Juni 22:58:38 kernel raspberrypi: [ 980.978538] [<8014b148>] (io_schedule) dari [<8021cb74>] (wait_on_page_bit+0x110/0x130)
6 Juni 22:58:38 kernel raspberrypi: [ 980.984608] [<8021cb74>] (wait_on_page_bit) dari [<8021cc74>] (__filemap_fdatawait_range+0xe0/0x114)
6 Juni 22:58:38 kernel raspberrypi: [ 980.990671] [<8021cc74>] (__filemap_fdatawait_range) dari [<8021ccd0>] (filemap_fdatawait_range+0x28/0x38)
6 Juni 22:58:38 kernel raspberrypi: [ 980.996670] [<8021ccd0>] (filemap_fdatawait_range) dari [<8021f084>] (filemap_write_and_wait+0x68/0x9c)
6 Juni 22:58:38 kernel raspberrypi: [ 981.002760] [<8021f084>] (filemap_write_and_wait) dari [<7f4ed028>] (cifs_reopen_file+0x364/0x430 [cifs])
6 Juni 22:58:38 kernel raspberrypi: [ 981.008991] [<7f4ed028>] (cifs_reopen_file [cifs]) dari [<7f4f23b4>] (cifs_readpages+0x408/0x6d0 [cifs])
6 Juni 22:58:38 kernel raspberrypi: [ 981.015576] [<7f4f23b4>] (cifs_readpages [cifs]) dari [<8022f63c>] (__do_page_cache_readahead+0x17c/0x284)
6 Juni 22:58:38 kernel raspberrypi: [ 981.022136] [<8022f63c>] (__do_page_cache_readahead) dari [<8022fb34>] (force_page_cache_readahead+0xb8/0x12c)
6 Juni 22:58:38 kernel raspberrypi: [ 981.029398] [<8022fb34>] (force_page_cache_readahead) dari [<80267934>] (SyS_fadvise64_64+0x2d4/0x314)
6 Juni 22:58:38 kernel raspberrypi: [ 981.036036] [<80267934>] (SyS_fadvise64_64) dari [<8010be18>] (sys_arm_fadvise64_64+0x28/0x30)
6 Juni 22:58:38 kernel raspberrypi: [ 981.042513] [<8010be18>] (sys_arm_fadvise64_64) dari [<80108060>] (ret_fast_syscall+0x0/0x28)

31 Mei 23:45:25 kernel raspberrypi: [91052.516033] INFO: task kworker/u8:0:4705 diblokir selama lebih dari 120 detik.
31 Mei 23:45:25 kernel raspberrypi: [91052.518051] Tercemar: GC 4.14.34-v7+ #1110
31 Mei 23:45:25 kernel raspberrypi: [91052.519995] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" menonaktifkan pesan ini.
31 Mei 23:45:25 kernel raspberrypi: [91052.523674] kworker/u8:0 D 0 4705 2 0x00000000
31 Mei 23:45:25 kernel raspberrypi: [91052.525645] Antrean kerja: writeback wb_workfn (flush-cifs-27)
31 Mei 23:45:25 kernel raspberrypi: [91052.527692] [<8079a0b8>] (__schedule) dari [<8079a730>] (schedule+0x50/0xa8)
31 Mei 23:45:25 kernel raspberrypi: [91052.529785] [<8079a730>] (jadwal) dari [<8079aba8>] (schedule_preempt_disabled+0x18/0x1c)
31 Mei 23:45:25 kernel raspberrypi: [91052.533927] [<8079aba8>] (schedule_preempt_disabled) dari [<8079c4b0>] (__mutex_lock.constprop.3+0x190/0x58c)
31 Mei 23:45:25 kernel raspberrypi: [91052.538273] [<8079c4b0>] (__mutex_lock.constprop.3) dari [<8079c9c8>] (__mutex_lock_slowpath+0x1c/0x20)
31 Mei 23:45:25 kernel raspberrypi: [91052.542856] [<8079c9c8>] (__mutex_lock_slowpath) dari [<8079ca28>] (mutex_lock+0x5c/0x60)
31 Mei 23:45:25 kernel raspberrypi: [91052.548351] [<8079ca28>] (mutex_lock) dari [<7f521ce4>] (cifs_reopen_file+0x34/0x430 [cifs])
31 Mei 23:45:25 kernel raspberrypi: [91052.554206] [<7f521ce4>] (cifs_reopen_file [cifs]) dari [<7f525904>] (find_writable_file+0x188/0x28c [cifs])
31 Mei 23:45:25 kernel raspberrypi: [91052.560495] [<7f525904>] (find_writable_file [cifs]) dari [<7f526128>] (cifs_writepages+0x720/0xa40 [cifs])
31 Mei 23:45:25 kernel raspberrypi: [91052.566693] [<7f526128>] (cifs_writepages [cifs]) dari [<8022ea5c>] (do_writepages+0x30/0x8c)
31 Mei 23:45:25 kernel raspberrypi: [91052.572661] [<8022ea5c>] (do_writepages) dari [<802bb198>] (__writeback_single_inode+0x44/0x430)
31 Mei 23:45:25 kernel raspberrypi: [91052.578850] [<802bb198>] (__writeback_single_inode) dari [<802bba8c>] (writeback_sb_inodes+0x20c/0x4c4)
31 Mei 23:45:25 kernel raspberrypi: [91052.585180] [<802bba8c>] (writeback_sb_inodes) dari [<802bbdd4>] (__writeback_inodes_wb+0x90/0xd0)
31 Mei 23:45:25 kernel raspberrypi: [91052.591646] [<802bbdd4>] (__writeback_inodes_wb) dari [<802bc058>] (wb_writeback+0x244/0x358)
31 Mei 23:45:25 kernel raspberrypi: [91052.598297] [<802bc058>] (wb_writeback) dari [<802bca58>] (wb_workfn+0x1d4/0x4d8)
31 Mei 23:45:25 kernel raspberrypi: [91052.605143] [<802bca58>] (wb_workfn) dari [<80137490>] (process_one_work+0x158/0x454)
31 Mei 23:45:25 kernel raspberrypi: [91052.612071] [<80137490>] (process_one_work) dari [<801377f0>] (worker_thread+0x64/0x5b8)
31 Mei 23:45:25 kernel raspberrypi: [91052.619175] [<801377f0>] (worker_thread) dari [<8013d860>] (kthread+0x13c/0x16c)
31 Mei 23:45:25 kernel raspberrypi: [91052.626322] [<8013d860>] (kthread) dari [<8010810c>] (ret_from_fork+0x14/0x28)

Banyak saran di utas ini agak terlalu teknis bagi saya, apakah ada konfigurasi ulang yang disarankan yang dapat saya lakukan?

Situasi yang sama persis di sini. 3B+ headless baru, menjalankan daemon transmisi dan lubang-pi. Setelah jangka waktu tertentu, transfer jaringan mulai macet. Menggunakan Samba dan SFTP, keduanya gagal.

@lategoodbye -

Bisakah Anda memberikan output lsusb -t dari RPI 3B+ Anda?

# lsusb -t
/:  Bus 01.Port 1: Dev 1, Class=root_hub, Driver=dwc_otg/1p, 480M
    |__ Port 1: Dev 2, If 0, Class=Hub, Driver=hub/4p, 480M
        |__ Port 1: Dev 3, If 0, Class=Hub, Driver=hub/3p, 480M
            |__ Port 1: Dev 4, If 0, Class=Vendor Specific Class, Driver=lan78xx, 480M

Sama di sini, sudah ada 3 RPi's 3B+ yang masing-masing dicari pada malam hari ketika saya memasang jaringan berbagi saya. Saat ini tidak dapat digunakan untuk saya ..,
RPi3 B+ rilis hampir 3 bulan dan masalah masih ada, kenapa belum diperbaiki?

@merdok
Ini adalah pendapat saya untuk masalah itu

Silakan jalankan sudo ethtool -K eth0 tx off setelah boot dan lihat apakah ada bedanya.

@pelwell -
Saya harus menyebutkan bahwa /etc/config.txt belum menyentuh pengaturan eee:

# See /boot/overlays/README for all available options

gpu_mem=64
initramfs initramfs-linux.img followkernel

#dtparam=eee=off
#dtparam=tx_lpi_timer=10000

Menonaktifkan pemeriksaan TX memperbaiki masalah setidaknya seperti yang diukur oleh skrip ini pada sistem pengujian saya. 30 iterasi menggunakan tes ukuran 1500 MB dan dan 30 iterasi lainnya menggunakan 5000 MB berjalan tanpa masalah :+1:

# ethtool -K eth0 tx off
Actual changes:
tx-checksumming: off
    tx-checksum-ip-generic: off
tcp-segmentation-offload: off
    tx-tcp-segmentation: off [requested on]
    tx-tcp6-segmentation: off [requested on]
# nfstest
 ==> Writting round 1 for 1500 MB
1551892480 bytes (1.6 GB, 1.4 GiB) copied, 43 s, 36.1 MB/s 
1500+0 records in
1500+0 records out
1572864000 bytes (1.6 GB, 1.5 GiB) copied, 43.5239 s, 36.1 MB/s
 ==> Run 1/30 took 43.549705810 seconds. ETA: 04:10:42 PM or about 21.04 min from now.
 ==> Writting round 2 for 1500 MB
1558183936 bytes (1.6 GB, 1.5 GiB) copied, 43 s, 36.2 MB/s
1500+0 records in
1500+0 records out
1572864000 bytes (1.6 GB, 1.5 GiB) copied, 43.6105 s, 36.1 MB/s
 ==> Run 2/30 took 43.623449720 seconds. ETA: 04:10:49 PM or about 20.35 min from now.
 ==> Writting round 3 for 1500 MB
...
 ==> Run 29/30 took 43.844378789 seconds. ETA: 04:13:00 PM or about .73 min from now.
 ==> Writting round 30 for 1500 MB
1566572544 bytes (1.6 GB, 1.5 GiB) copied, 43 s, 36.4 MB/s 
1500+0 records in
1500+0 records out
1572864000 bytes (1.6 GB, 1.5 GiB) copied, 43.6139 s, 36.1 MB/s
 ==> Run 30/30 took 43.620949933 seconds. ETA: 04:13:04 PM or about 0 min from now.
nfstest  3.00s user 240.57s system 16% cpu 24:13.16 total

EDIT: Tes 5G lulus 30 kali.

# ethtool -K eth0 tx off
Actual changes:
tx-checksumming: off
    tx-checksum-ip-generic: off
tcp-segmentation-offload: off
    tx-tcp-segmentation: off [requested on]
    tx-tcp6-segmentation: off [requested on]

# nfstest
 ==> Writting round 1 for 5000 MB
5225054208 bytes (5.2 GB, 4.9 GiB) copied, 155 s, 33.7 MB/s
5000+0 records in
5000+0 records out
5242880000 bytes (5.2 GB, 4.9 GiB) copied, 155.543 s, 33.7 MB/s
 ==> Run 1/30 took 155.561819965 seconds. ETA: 05:41:58 PM or about 75.18 min from now.
 ==> Writting round 2 for 5000 MB
5215617024 bytes (5.2 GB, 4.9 GiB) copied, 156 s, 33.4 MB/s
5000+0 records in
5000+0 records out
5242880000 bytes (5.2 GB, 4.9 GiB) copied, 156.407 s, 33.5 MB/s
 ==> Run 2/30 took 156.433706123 seconds. ETA: 05:42:29 PM or about 73.00 min from now.
...
 ==> Run 29/30 took 154.356966099 seconds. ETA: 05:44:22 PM or about 2.57 min from now.
 ==> Writting round 30 for 5000 MB
5220859904 bytes (5.2 GB, 4.9 GiB) copied, 155 s, 33.7 MB/s
5000+0 records in
5000+0 records out
5242880000 bytes (5.2 GB, 4.9 GiB) copied, 155.943 s, 33.6 MB/s
 ==> Run 30/30 took 155.953668009 seconds. ETA: 05:44:29 PM or about 0 min from now.
nfstest  4.49s user 790.78s system 16% cpu 1:20:23.19 total

@graysky2 Saya akan mencoba skrip Anda sebentar lagi, tetapi bisakah Anda juga mencoba dengan ethtool -K eth0 tx-tcp-segmentation off daripada tx off ? (silakan reboot terlebih dahulu untuk memastikan sistem bersih)

tx off (untuk menonaktifkan TCP checksum offload) memiliki efek samping menonaktifkan tcp segmentation offload juga - itu harus karena CPU tidak dapat menghitung checksum untuk setiap segmen yang akan diproduksi oleh adaptor LAN. Pemahaman saat ini adalah bahwa ada mekanisme kegagalan dalam segmentasi, tetapi checksumming tidak masalah.

Hal lain untuk dikatakan adalah bahwa kepercayaan saat ini adalah bahwa itu hanya mempengaruhi sesi TCP, bukan UDP.
Itu tergantung pada versi NFS yang digunakan, apakah default menggunakan UDP (<=NFSv2) atau TCP (>=NFSv3).

Kedua perintah memberikan peningkatan di sini membangun gambar pada sistem file IPv4 NFS (TCP) dengan Raspbian (4.14.44-v7+).

3b memakan waktu sekitar 80 menit
3b+ tanpa membutuhkan waktu sekitar 8 jam
3b+ "tx off" 60 menit
3b+ "segmentasi tx-tcp nonaktif" 60 menit

Sunting: Ini adalah waktu yang diambil untuk membuat gambar dan ketika saya mengatakan "tanpa" maksud saya tanpa menjalankan "ethtool" untuk mengubah apa pun.

@burtyb Tidak yakin apa yang diwakili oleh waktu Anda? Waktu sebelum kegagalan atau waktu keseluruhan untuk membangun? Sesuatu yang lain?

Dua menjalankan skrip @ greysky2 pada 1500, dan satu di 5000 semuanya bekerja dengan baik dengan pembongkaran diaktifkan.
Ini adalah masalah utama dalam masalah ini - kami tidak memiliki cara yang dapat diandalkan untuk mereproduksinya.

Saya ingin menambahkan bahwa saya dapat dengan andal menyebabkan sesi ethernet ssh saya gagal atau bertahan pada pemasangan Raspbian atau Fedora 28 yang diperbarui sepenuhnya. Cara paling sederhana saya untuk menyebabkan kegagalan adalah dengan membuat koneksi ssh bersama dan menjalankan beberapa rsync:

ssh -o serveraliveinterval=300 -o visualhostkey=yes -i ~/.ssh/id_rsa -M -S /tmp/control user@
rsync --progress --stats --inplace --delete -nave 'ssh -o controlpath=/tmp/control' user@host :/usr /tmp/usr

Selama rsync cukup menegangkan, koneksi saya akan hang. bendera -n rsync disertakan.

Yang mengatakan, saya senang melaporkan bahwa setelah menjalankan "ethtool -K eth0 tx off" di Raspbian, sesi ssh/rsync saya yang menegangkan belum gagal.

@gbugs Penyimpanan apa yang diakses di Pi?

@pelwell posting saya sebelumnya merujuk file pada penyimpanan usb, khususnya hard drive mandiri. Saya tidak dapat mereplikasi bug dengan mudah tanpa menggunakan penyimpanan eksternal, tetapi saya akan mencobanya.

Mengedit posting ini untuk menjaga bug tetap rapi. Saya mencoba menarik file setelah mengeluarkan "ethtool -K eth0 tx on" dan hasilnya tidak konsisten. Saya tidak berhak untuk mem-boot ulang tetapi ingin melakukannya dan menguji ulang.

Saya pikir tes ini akan bekerja seperti yang diharapkan, tetapi itu akan tetap menjadi titik data yang menarik.

@6by9 - Saya menggunakan mount NFSv4:

# mount | grep nfs
192.168.1.128:/scratch on /scratch type nfs4 (rw,relatime,vers=4.2,rsize=1048576,wsize=1048576,namlen=255,hard,proto=tcp,timeo=600,retrans=2,sec=sys,clientaddr=192.168.1.108,local_lock=none,addr=192.168.1.128)

Dua menjalankan skrip @ greysky2 pada 1500, dan satu di 5000 semuanya bekerja dengan baik dengan pembongkaran diaktifkan.
Ini adalah masalah utama dalam masalah ini - kami tidak memiliki cara yang dapat diandalkan untuk mereproduksinya.

Ketika saya menjalankan skrip dengan 30 iterasi, saya secara konsisten mendapatkan kesalahan. Terkadang pada yang pertama, terkadang dibutuhkan lebih dari 3. Silakan coba menggunakan semua 30 iterasi menggunakan nilai 1500 yang membuat terminal buntu untuk saya. Apakah Anda menggunakan dudukan NFSv4?

Saya akan mencoba skrip Anda sebentar lagi, tetapi bisakah Anda juga mencoba dengan ethtool -K eth0 tx-tcp-segmentation off daripada tx off? (silakan reboot terlebih dahulu untuk memastikan sistem bersih)

Saya akan mencoba 30 iterasi menggunakan 1500 dan 30 lainnya menggunakan 5000 dengan pengaturan ethtool -K eth0 tx-tcp-segmentation off sekarang. Akan memakan waktu beberapa jam.

EDIT: keduanya dinilai tanpa kesalahan dengan pengaturan ini! :+1:

# ethtool -K eth0 tx-tcp-segmentation off
# nfstest
 ==> Writting round 1 for 1500 MB
1524629504 bytes (1.5 GB, 1.4 GiB) copied, 42 s, 36.3 MB/s 
1500+0 records in
1500+0 records out
1572864000 bytes (1.6 GB, 1.5 GiB) copied, 42.8219 s, 36.7 MB/s
 ==> Run 1/30 took 42.840001143 seconds. ETA: 03:42:11 PM or about 20.70 min from now.
 ==> Writting round 2 for 1500 MB
1560281088 bytes (1.6 GB, 1.5 GiB) copied, 43 s, 36.3 MB/s 
1500+0 records in
1500+0 records out
1572864000 bytes (1.6 GB, 1.5 GiB) copied, 43.2013 s, 36.4 MB/s
 ==> Run 2/30 took 43.222090384 seconds. ETA: 03:42:27 PM or about 20.17 min from now.
 ==> Writting round 3 for 1500 MB
1569718272 bytes (1.6 GB, 1.5 GiB) copied, 44 s, 35.7 MB/s
1500+0 records in
1500+0 records out
...
And 30 iterations of 5000 MB passed as well.
# nfstest
 ==> Writting round 1 for 5000 MB
5239734272 bytes (5.2 GB, 4.9 GiB) copied, 162 s, 32.3 MB/s
5000+0 records in
5000+0 records out
5242880000 bytes (5.2 GB, 4.9 GiB) copied, 162.287 s, 32.3 MB/s
 ==> Run 1/30 took 162.309989933 seconds. ETA: 07:41:08 PM or about 78.44 min from now.
 ==> Writting round 2 for 5000 MB
5226102784 bytes (5.2 GB, 4.9 GiB) copied, 158 s, 33.1 MB/s
5000+0 records in
5000+0 records out
5242880000 bytes (5.2 GB, 4.9 GiB) copied, 158.736 s, 33.0 MB/s
 ==> Run 2/30 took 158.746751304 seconds. ETA: 07:39:30 PM or about 74.08 min from now.
...
 ==> Writting round 30 for 5000 MB
5233442816 bytes (5.2 GB, 4.9 GiB) copied, 157 s, 33.3 MB/s
5000+0 records in
5000+0 records out
5242880000 bytes (5.2 GB, 4.9 GiB) copied, 157.288 s, 33.3 MB/s
 ==> Run 30/30 took 157.298323510 seconds. ETA: 07:41:37 PM or about 0 min from now.
nfstest  3.86s user 858.38s system 17% cpu 1:21:44.14 total



md5-5c9c6133e89234f9218051b458107b9b



# nfstest
 ==> Writting round 1 for 15000 MB
15726542848 bytes (16 GB, 15 GiB) copied, 465 s, 33.8 MB/s 
15000+0 records in
15000+0 records out
15728640000 bytes (16 GB, 15 GiB) copied, 465.009 s, 33.8 MB/s
 ==> Run 1/30 took 465.043177736 seconds. ETA: 10:29:22 AM or about 224.77 min from now.

 ==> Writting round 2 for 15000 MB
15715008512 bytes (16 GB, 15 GiB) copied, 465 s, 33.8 MB/s 
15000+0 records in
15000+0 records out
15728640000 bytes (16 GB, 15 GiB) copied, 465.723 s, 33.8 MB/s
 ==> Run 2/30 took 465.736173930 seconds. ETA: 10:29:47 AM or about 217.34 min from now.
...
 ==> Writting round 26 for 15000 MB
15713959936 bytes (16 GB, 15 GiB) copied, 478 s, 32.9 MB/s 
15000+0 records in
15000+0 records out
15728640000 bytes (16 GB, 15 GiB) copied, 478.64 s, 32.9 MB/s
 ==> Run 26/30 took 478.648041431 seconds. ETA: 10:36:30 AM or about 31.90 min from now.
^C
nfstest  6.89s user 2014.35s system 16% cpu 3:27:52.89 total

Menggunakan mount IPv6 TCP NFS Saya juga tidak lagi melihat stalls/timeouts setelah menjalankan sudo ethtool -K eth0 tx-tcp6-segmentation off .

@burtyb Terima kasih - itu konfirmasi pertama yang saya lihat tentang masalah pada IPv6, tetapi sepertinya ini masalah yang sangat mirip dengan segmentasi offload.

Rincian lebih lanjut tentang penyelidikan ada di #2449.
Tampaknya mekanisme selektif mengakui (SACK) TCP tidak berperilaku seperti yang diharapkan, jadi jika ada paket yang dijatuhkan (untuk alasan apa pun) mereka tidak pernah mencoba lagi.

Diskusi internal telah menyimpulkan kami akan menonaktifkan offload segmentasi TCP (baik IPv4 dan IPv6) untuk saat ini. Overhead kinerja tidak dapat diukur menggunakan alat standar, jadi kerugiannya tidak terlalu besar.
Investigasi akan terus mencoba dan memahami mengapa SACK salah bagi kami, tetapi itu akan menyelesaikan masalah untuk saat ini.

@6by9 - Terima kasih untuk waktu yang satu ini. Bisakah Anda melakukan ping masalah ini ketika dengan komit penonaktifan segmentasi TCP yang Anda sebutkan saat diimplementasikan? Saya senang mengkompilasi kernel dengannya dan memverifikasi fungsionalitas.

Dengan menyebutkan masalah ini dalam teks komit, Github secara otomatis menambahkan tautan :-) Saya tidak percaya itu memberi tahu semua pengamat.

Saya sedang membangun kembali sekarang untuk memastikan itu menonaktifkannya.
Gangguan kecil: karena cara kerja perangkat jaringan, TSO tidak dapat dinonaktifkan, namun membiarkannya tersedia untuk diaktifkan melalui ethtool. Perubahan harus menonaktifkannya sepenuhnya, jadi ada parameter modul untuk membuatnya tersedia lagi.

Saya melihatnya... membangun https://github.com/raspberrypi/linux/commit/5762758699e1ddab22bf4c14eb225941761c52c8 sekarang dan akan melaporkan kembali.

Mem-boot komit yang saya rujuk di atas memang menyelesaikan masalah. Saya dapat menyelesaikan 30 iterasi 1500 MB dan 30 iterasi 5000 MB tanpa masalah. Terima kasih semuanya!

Kernel pembaruan rpi terbaru menyertakan solusi @6by9

@pelwell untuk kelengkapan, saya menyebabkan jaringan membeku hari ini menggunakan beberapa rsyncs untuk menarik file dari sdcard. Seperti sebelumnya, ini dibagikan dari koneksi ssh yang sama. Setelah menjalankan "Sudo ethtool -K eth0 tx-tcp-segmentation off" saya belum membekukan koneksi dengan kondisi yang sama.

@gbugs Terima kasih atas laporannya. Senang mengetahui bahwa kita sudah sampai di dasar yang satu ini.

Apakah kita senang kita telah memecahkan ini? Jika demikian, kita harus menutupnya (dan memecahkan sebotol sampanye, ini yang sulit - kerja bagus @6by9)

Dikerjakan, tidak diperbaiki.
Saya punya draf email untuk dikirim ke netdev, jadi perbaikannya tergantung pada apa yang mereka katakan.

Kecuali ada yang masih dapat mereproduksi ini, tutup yang ini, tetapi tetap #2449 terbuka karena info debugnya aktif.

Masalahnya masih TIDAK diperbaiki! Semua 3B+ saya mogok dalam semalam saat menggunakan Ethernet dan memasang jaringan berbagi.

Masalahnya masih TIDAK diperbaiki! Semua 3B+ saya mogok dalam semalam saat menggunakan Ethernet dan memasang jaringan berbagi.

Detail tentang berbagi jaringan, protokol, metode yang digunakan untuk memasang (fstab, systemd, dll.) akan sangat membantu.

Distribusi yang digunakan, versi kernel dan output panik juga diperlukan ...

Peregangan Raspbian dengan firmware terbaru. Menggunakan fstab dengan perintah berikut selama bertahun-tahun sekarang:
//ip/USB_Storage/ /home/pi/network_drive cifs vers=3.0,defaults,guest,uid=1000,iocharset=utf8,x-systemd.automount 0 0

Sejak 3B+ itu hanya membeku selalu semalaman setiap kali drive jaringan dipasang dan ethernet terhubung. Ketika drive jaringan tidak dipasang atau menggunakan WiFi maka Pi berjalan dengan baik.
3B dengan kartu sd yang sama dan menggunakan ethernet tidak macet dalam semalam.

Saya kira kernel tidak ada hubungannya dengan itu, saya memiliki masalah sejak rilis 3B + dan sudah ada beberapa pembaruan kernel pada waktu itu. Saya mendapatkan beberapa 3B+ dan setiap orang mengalami masalah yang sama.

Tidak ada kerusakan yang terlihat di /var/log/messages?
Jika tidak, adakah kesempatan untuk menghubungkan tampilan atau koneksi serial ke RPi 3B+?

Tidak ada crash log, 3B+ baru saja mati dan chip pengontrol jaringan menyala panas. Saya sudah takut bahwa rumah saya akan terbakar pada suatu malam karena ini ...
Sayangnya saya tidak dapat menghubungkan layar atau koneksi serial. Pi berjalan tanpa kepala sepanjang waktu.

Anda belum memberi tahu kami versi kernel yang Anda jalankan. Keluaran uname -a tolong. Patch AFAIK belum dirilis melalui Raspbian, oleh karena itu apa yang Anda anggap sebagai "firmware terbaru"?

Penguncian penuh dan chip ethernet panas tidak sama dengan tugas NFS yang menggantung, oleh karena itu tampaknya bukan masalah yang sama.
Silakan buka masalah baru jika Anda memiliki beberapa diagnostik yang dapat kami tangani. "Ini terkunci secara acak" tidak cukup karena tidak ada peluang untuk mereproduksi itu. Router/switch apa? Berapa kecepatan/dupleks tautan yang sebenarnya terhubung dengan ethernet? Apa yang sudah kamu coba? Apakah ini berfungsi jika Pi terhubung di ethernet tetapi tanpa berbagi jaringan terpasang? Apa lagi yang Anda telah terhubung ke Pi? Tolong semua hal di atas pada masalah baru itu.

Kernel versi 4.14.50. Dengan firmware terbaru saya menganggap "rpi-update".

Saya tidak mengatakan bahwa "Ini terkunci secara acak". Itu terkunci SELALU ketika saya menghubungkannya ke ethernet dan memasang jaringan berbagi.
Seperti yang sudah saya tulis di posting saya sebelumnya, ya itu bekerja melalui ethernet tanpa jaringan berbagi terpasang. Segera setelah saya memasang share, 3B+ mati dalam semalam. Saya tidak memiliki apa pun yang terhubung ke Pi, hanya kabel LAN.

masalah baru silahkan. Masalah yang dilaporkan ini adalah bahwa Pi responsif melalui SSH dll, tetapi pemasangan CIFS atau NFS mati.
Dan saya akan menambahkan pertanyaan "OS apa yang mengekspor bagian?" ke daftar informasi yang dibutuhkan.

Apakah halaman ini membantu?
0 / 5 - 0 peringkat