Zstd: ما هي نتيجة Weissman لهذا؟

تم إنشاؤها على ٣١ مارس ٢٠١٨  ·  3تعليقات  ·  مصدر: facebook/zstd

أريد استخدام هذه الخوارزمية لحالات الاستخدام المختلفة.
أريد استخدامه فقط إذا كانت نتيجة ويسمان أفضل من الحد النظري.
لا أرى درجة ويسمان مدرجة في الملف التمهيدي.

التعليق الأكثر فائدة

هناك عدد من المشاكل في تسجيل ويسمان:

  1. إنها درجة نسبية. تحتاج إلى اختيار سرعة مرجعية ونسبة للمقارنة بينهما.
  2. ينتج إجابات هراء بـ T <= 1 .
  3. حساس للوحدة الزمنية المستخدمة. (ربما كان log(T_ref / T_exp) أفضل من log(T_ref) / log(T_exp) ). كما هو الحال ، فإن تسجيل الضاغط باستخدام الدقائق مقابل الثواني ينتج درجات مختلفة.
  4. فشل في التقاط المفاضلة في العالم الحقيقي بين النسبة والوقت. إن حدود احتمالية المقايضات بين السرعة والنسبة في الضغط ليست على شكل لوغاريتمي.
  5. لا تأخذ في الاعتبار سرعة تخفيف الضغط على الإطلاق.

ومع ذلك ، بالمعايير التالية:

  • استخدام gzip (بمستواه الافتراضي 6) كضاغط مرجعي.
  • قياس الأداء على مجموعة سيليزيا.
  • استخدام أجزاء من الثانية كوحدة زمنية (نظرًا لأن بعض الضواغط الأسرع تستغرق أقل من ثانية ، مما قد ينتج عنه سجلات سالبة).
  • باستخدام ألفا واحد.

أحصل على الدرجات التالية:

Algo | مستوى | نتيجة
---- | --- | -----
gzip | 1 | 1.19
gzip | 2 | 1.20
gzip | 3 | 1.15
gzip | 4 | 1.16
gzip | 5 | 1.09
gzip | 6 | 1.00
gzip | 7 | 0.96
gzip | 8 | 0.87
gzip | 9 | 0.83
lz4 | 1 | 2.98
zstd | -5 | 2.97
zstd | -4 | 2.86
zstd | -3 | 2.77
zstd | -2 | 2.58
zstd | -1 | 2.54
zstd | 1 | 2.67
zstd | 2 | 2.34
zstd | 3 | 2.11
zstd | 4 | 1.98
zstd | 5 | 1.67
zstd | 6 | 1.55
zstd | 7 | 1.42
zstd | 8 | 1.34
zstd | 9 | 1.24
zstd | 10 | 1.18
zstd | 11 | 1.12
zstd | 12 | 1.03
zstd | 13 | 0.97
zstd | 14 | 0.94
zstd | 15 | 0.90
zstd | 16 | 0.89
zstd | 17 | 0.86
zstd | 18 | 0.84
zstd | 19 | 0.82
zstd | 20 | 0.82
zstd | 21 | 0.80
zstd | 22 | 0.79

كما ترى ، فإن كلا من zstd و lz4 يكسران الحد النظري 2.9.

اتمنى ان تكون هذه المعلومات مفيدة!

ال 3 كومينتر

أتساءل نفس الشيء ، هل أجرى أي شخص اختبارات كافية لنشر نتيجة Weissman دقيقة؟

هناك عدد من المشاكل في تسجيل ويسمان:

  1. إنها درجة نسبية. تحتاج إلى اختيار سرعة مرجعية ونسبة للمقارنة بينهما.
  2. ينتج إجابات هراء بـ T <= 1 .
  3. حساس للوحدة الزمنية المستخدمة. (ربما كان log(T_ref / T_exp) أفضل من log(T_ref) / log(T_exp) ). كما هو الحال ، فإن تسجيل الضاغط باستخدام الدقائق مقابل الثواني ينتج درجات مختلفة.
  4. فشل في التقاط المفاضلة في العالم الحقيقي بين النسبة والوقت. إن حدود احتمالية المقايضات بين السرعة والنسبة في الضغط ليست على شكل لوغاريتمي.
  5. لا تأخذ في الاعتبار سرعة تخفيف الضغط على الإطلاق.

ومع ذلك ، بالمعايير التالية:

  • استخدام gzip (بمستواه الافتراضي 6) كضاغط مرجعي.
  • قياس الأداء على مجموعة سيليزيا.
  • استخدام أجزاء من الثانية كوحدة زمنية (نظرًا لأن بعض الضواغط الأسرع تستغرق أقل من ثانية ، مما قد ينتج عنه سجلات سالبة).
  • باستخدام ألفا واحد.

أحصل على الدرجات التالية:

Algo | مستوى | نتيجة
---- | --- | -----
gzip | 1 | 1.19
gzip | 2 | 1.20
gzip | 3 | 1.15
gzip | 4 | 1.16
gzip | 5 | 1.09
gzip | 6 | 1.00
gzip | 7 | 0.96
gzip | 8 | 0.87
gzip | 9 | 0.83
lz4 | 1 | 2.98
zstd | -5 | 2.97
zstd | -4 | 2.86
zstd | -3 | 2.77
zstd | -2 | 2.58
zstd | -1 | 2.54
zstd | 1 | 2.67
zstd | 2 | 2.34
zstd | 3 | 2.11
zstd | 4 | 1.98
zstd | 5 | 1.67
zstd | 6 | 1.55
zstd | 7 | 1.42
zstd | 8 | 1.34
zstd | 9 | 1.24
zstd | 10 | 1.18
zstd | 11 | 1.12
zstd | 12 | 1.03
zstd | 13 | 0.97
zstd | 14 | 0.94
zstd | 15 | 0.90
zstd | 16 | 0.89
zstd | 17 | 0.86
zstd | 18 | 0.84
zstd | 19 | 0.82
zstd | 20 | 0.82
zstd | 21 | 0.80
zstd | 22 | 0.79

كما ترى ، فإن كلا من zstd و lz4 يكسران الحد النظري 2.9.

اتمنى ان تكون هذه المعلومات مفيدة!

هل كانت هذه الصفحة مفيدة؟
0 / 5 - 0 التقييمات