Zstd: ¿Cuál es la puntuación de Weissman para esto?

Creado en 31 mar. 2018  ·  3Comentarios  ·  Fuente: facebook/zstd

Quiero usar este algoritmo para varios casos de uso.
Solo quiero usarlo si el puntaje Weissman fue mejor que el límite teórico.
No veo la puntuación de Weissman en el archivo Léame.

Comentario más útil

La puntuación de Weissman tiene una serie de problemas:

  1. Es una puntuación relativa. Debe elegir una velocidad de referencia y una relación para comparar.
  2. Produce respuestas sin sentido con T <= 1 .
  3. Es sensible a la unidad de tiempo utilizada. ( log(T_ref / T_exp) probablemente hubiera sido mejor que log(T_ref) / log(T_exp) ). Tal como está, puntuar un compresor usando minutos frente a segundos produce diferentes puntuaciones.
  4. No logra capturar la compensación del mundo real entre la proporción y el tiempo. La frontera de posibilidades de las compensaciones entre la velocidad y la relación de compresión no tiene forma logarítmica.
  5. No tiene en cuenta la velocidad de descompresión en absoluto.

Eso sí, con los siguientes parámetros:

  • Usando gzip (en su nivel predeterminado 6) como compresor de referencia.
  • Benchmarking en el corpus de Silesia.
  • Usar décimas de segundo como unidad de tiempo (dado que algunos de los compresores más rápidos tardan menos de un segundo, lo que de otro modo produciría registros negativos).
  • Usando un alfa de uno.

Obtengo las siguientes puntuaciones:

Algo | Nivel | Puntaje
---- | --- | -----
gzip | 1 | 1.19
gzip | 2 | 1.20
gzip | 3 | 1.15
gzip | 4 | 1.16
gzip | 5 | 1.09
gzip | 6 | 1.00
gzip | 7 | 0,96
gzip | 8 | 0.87
gzip | 9 | 0.83
lz4 | 1 | 2.98
zstd | -5 | 2.97
zstd | -4 | 2.86
zstd | -3 | 2.77
zstd | -2 | 2.58
zstd | -1 | 2.54
zstd | 1 | 2.67
zstd | 2 | 2.34
zstd | 3 | 2.11
zstd | 4 | 1.98
zstd | 5 | 1.67
zstd | 6 | 1.55
zstd | 7 | 1.42
zstd | 8 | 1.34
zstd | 9 | 1.24
zstd | 10 | 1.18
zstd | 11 | 1.12
zstd | 12 | 1.03
zstd | 13 | 0.97
zstd | 14 | 0,94
zstd | 15 | 0.90
zstd | 16 | 0.89
zstd | 17 | 0.86
zstd | 18 | 0.84
zstd | 19 | 0.82
zstd | 20 | 0.82
zstd | 21 | 0.80
zstd | 22 | 0.79

Como puede ver, tanto zstd como lz4 superan el límite teórico de 2,9.

¡Espero que esta información sea útil!

Todos 3 comentarios

Preguntándose lo mismo, ¿alguien ha realizado suficientes pruebas para publicar una puntuación Weissman precisa?

La puntuación de Weissman tiene una serie de problemas:

  1. Es una puntuación relativa. Debe elegir una velocidad de referencia y una relación para comparar.
  2. Produce respuestas sin sentido con T <= 1 .
  3. Es sensible a la unidad de tiempo utilizada. ( log(T_ref / T_exp) probablemente hubiera sido mejor que log(T_ref) / log(T_exp) ). Tal como está, puntuar un compresor usando minutos frente a segundos produce diferentes puntuaciones.
  4. No logra capturar la compensación del mundo real entre la proporción y el tiempo. La frontera de posibilidades de las compensaciones entre la velocidad y la relación de compresión no tiene forma logarítmica.
  5. No tiene en cuenta la velocidad de descompresión en absoluto.

Eso sí, con los siguientes parámetros:

  • Usando gzip (en su nivel predeterminado 6) como compresor de referencia.
  • Benchmarking en el corpus de Silesia.
  • Usar décimas de segundo como unidad de tiempo (dado que algunos de los compresores más rápidos tardan menos de un segundo, lo que de otro modo produciría registros negativos).
  • Usando un alfa de uno.

Obtengo las siguientes puntuaciones:

Algo | Nivel | Puntaje
---- | --- | -----
gzip | 1 | 1.19
gzip | 2 | 1.20
gzip | 3 | 1.15
gzip | 4 | 1.16
gzip | 5 | 1.09
gzip | 6 | 1.00
gzip | 7 | 0,96
gzip | 8 | 0.87
gzip | 9 | 0.83
lz4 | 1 | 2.98
zstd | -5 | 2.97
zstd | -4 | 2.86
zstd | -3 | 2.77
zstd | -2 | 2.58
zstd | -1 | 2.54
zstd | 1 | 2.67
zstd | 2 | 2.34
zstd | 3 | 2.11
zstd | 4 | 1.98
zstd | 5 | 1.67
zstd | 6 | 1.55
zstd | 7 | 1.42
zstd | 8 | 1.34
zstd | 9 | 1.24
zstd | 10 | 1.18
zstd | 11 | 1.12
zstd | 12 | 1.03
zstd | 13 | 0.97
zstd | 14 | 0,94
zstd | 15 | 0.90
zstd | 16 | 0.89
zstd | 17 | 0.86
zstd | 18 | 0.84
zstd | 19 | 0.82
zstd | 20 | 0.82
zstd | 21 | 0.80
zstd | 22 | 0.79

Como puede ver, tanto zstd como lz4 superan el límite teórico de 2,9.

¡Espero que esta información sea útil!

¿Fue útil esta página
0 / 5 - 0 calificaciones