Zstd: Berapa skor Weissman untuk ini?

Dibuat pada 31 Mar 2018  ·  3Komentar  ·  Sumber: facebook/zstd

Saya ingin menggunakan algoritma ini untuk berbagai kasus penggunaan.
Saya hanya ingin menggunakannya jika skor weissman lebih baik dari batas teoritis.
Saya tidak melihat skor weissman tercantum di readme.

Komentar yang paling membantu

Penilaian Weissman memiliki sejumlah masalah:

  1. Ini adalah skor relatif. Anda perlu memilih kecepatan dan rasio referensi untuk dibandingkan.
  2. Ini menghasilkan jawaban yang tidak masuk akal dengan T <= 1 .
  3. Ini sensitif terhadap satuan waktu yang digunakan. ( log(T_ref / T_exp) mungkin akan lebih baik daripada log(T_ref) / log(T_exp) ). Seperti berdiri, mencetak kompresor menggunakan menit vs detik menghasilkan skor yang berbeda.
  4. Itu gagal untuk menangkap trade-off dunia nyata antara rasio dan waktu. Batas kemungkinan tradeoff antara kecepatan dan rasio dalam kompresi tidak berbentuk log.
  5. Itu tidak memperhitungkan kecepatan dekompresi sama sekali.

Meskipun demikian, dengan parameter berikut:

  • Menggunakan gzip (pada level default 6) sebagai kompresor referensi.
  • Benchmarking pada korpus Silesia.
  • Menggunakan sepersepuluh detik sebagai satuan waktu (karena beberapa kompresor yang lebih cepat membutuhkan waktu kurang dari satu detik, yang sebaliknya akan menghasilkan log negatif).
  • Menggunakan alfa satu.

Saya mendapatkan skor berikut:

Algo | Lvl | Skor
---- | --- | -----
gzip | 1 | 1.19
gzip | 2 | 1.20
gzip | 3 | 1.15
gzip | 4 | 1.16
gzip | 5 | 1.09
gzip | 6 | 1.00
gzip | 7 | 0,96
gzip | 8 | 0,87
gzip | 9 | 0.83
lz4 | 1 | 2.98
zstd | -5 | 2.97
zstd | -4 | 2.86
zstd | -3 | 2.77
zstd | -2 | 2.58
zstd | -1 | 2.54
zstd | 1 | 2.67
zstd | 2 | 2.34
zstd | 3 | 2.11
zstd | 4 | 1.98
zstd | 5 | 1.67
zstd | 6 | 1.55
zstd | 7 | 1.42
zstd | 8 | 1.34
zstd | 9 | 1.24
zstd | 10 | 1.18
zstd | 11 | 1.12
zstd | 12 | 1.03
zstd | 13 | 0,97
zstd | 14 | 0,94
zstd | 15 | 0,90
zstd | 16 | 0,89
zstd | 17 | 0,86
zstd | 18 | 0,84
zstd | 19 | 0.82
zstd | 20 | 0.82
zstd | 21 | 0,80
zstd | 22 | 0,79

Seperti yang Anda lihat, baik zstd dan lz4 melanggar batas teoretis 2,9.

Saya harap informasi ini bermanfaat!

Semua 3 komentar

Bertanya-tanya hal yang sama, apakah ada yang menjalankan tes yang cukup untuk menerbitkan skor weissman yang akurat?

Penilaian Weissman memiliki sejumlah masalah:

  1. Ini adalah skor relatif. Anda perlu memilih kecepatan dan rasio referensi untuk dibandingkan.
  2. Ini menghasilkan jawaban yang tidak masuk akal dengan T <= 1 .
  3. Ini sensitif terhadap satuan waktu yang digunakan. ( log(T_ref / T_exp) mungkin akan lebih baik daripada log(T_ref) / log(T_exp) ). Seperti berdiri, mencetak kompresor menggunakan menit vs detik menghasilkan skor yang berbeda.
  4. Itu gagal untuk menangkap trade-off dunia nyata antara rasio dan waktu. Batas kemungkinan tradeoff antara kecepatan dan rasio dalam kompresi tidak berbentuk log.
  5. Itu tidak memperhitungkan kecepatan dekompresi sama sekali.

Meskipun demikian, dengan parameter berikut:

  • Menggunakan gzip (pada level default 6) sebagai kompresor referensi.
  • Benchmarking pada korpus Silesia.
  • Menggunakan sepersepuluh detik sebagai satuan waktu (karena beberapa kompresor yang lebih cepat membutuhkan waktu kurang dari satu detik, yang sebaliknya akan menghasilkan log negatif).
  • Menggunakan alfa satu.

Saya mendapatkan skor berikut:

Algo | Lvl | Skor
---- | --- | -----
gzip | 1 | 1.19
gzip | 2 | 1.20
gzip | 3 | 1.15
gzip | 4 | 1.16
gzip | 5 | 1.09
gzip | 6 | 1.00
gzip | 7 | 0,96
gzip | 8 | 0,87
gzip | 9 | 0.83
lz4 | 1 | 2.98
zstd | -5 | 2.97
zstd | -4 | 2.86
zstd | -3 | 2.77
zstd | -2 | 2.58
zstd | -1 | 2.54
zstd | 1 | 2.67
zstd | 2 | 2.34
zstd | 3 | 2.11
zstd | 4 | 1.98
zstd | 5 | 1.67
zstd | 6 | 1.55
zstd | 7 | 1.42
zstd | 8 | 1.34
zstd | 9 | 1.24
zstd | 10 | 1.18
zstd | 11 | 1.12
zstd | 12 | 1.03
zstd | 13 | 0,97
zstd | 14 | 0,94
zstd | 15 | 0,90
zstd | 16 | 0,89
zstd | 17 | 0,86
zstd | 18 | 0,84
zstd | 19 | 0.82
zstd | 20 | 0.82
zstd | 21 | 0,80
zstd | 22 | 0,79

Seperti yang Anda lihat, baik zstd dan lz4 melanggar batas teoretis 2,9.

Saya harap informasi ini bermanfaat!

Apakah halaman ini membantu?
0 / 5 - 0 peringkat

Masalah terkait

indygreg picture indygreg  ·  3Komentar

sergeevabc picture sergeevabc  ·  3Komentar

rgdoliveira picture rgdoliveira  ·  3Komentar

scherepanov picture scherepanov  ·  3Komentar

itsnotvalid picture itsnotvalid  ·  3Komentar