وفقًا لتذكرة المناقشة هذه ، كان من الممكن إرجاع جميع النتائج من التجميع الفرعي بإعطاء 0
كخيار الحجم. يبدو أن هذه الوظيفة (سواء كانت مقصودة أم لا) لا تعمل في 5.0 لأنها ستنتقل إلى 0
كحجم ، بدلاً من تركها مغلقة. (انظر # 8339).
قد يكون من الجيد السماح للمستخدم بمسح هذا الحقل حتى لا يتم إرسال أي حجم إلى elasticsearch وسيتم إرجاع جميع النتائج.
كنت أفهم أن عدم السماح بتجميعات المصطلحات ذات الحجم غير المحدود كان تغييرًا مقصودًا للغاية على جانب Elasticsearch في الإصدار 5.0 ، من أجل الحد من التجمعات التي يمكن أن تزعزع استقرار المجموعة: https://github.com/elastic/elasticsearch/issues/18838
أيضًا ، لا أرى كيف يمكننا إضافة هذا الدعم مرة أخرى دون دعمه من جانب واجهة برمجة التطبيقات؟
في حالة تصور الجدول ، فهو في الواقع مشكلة كبيرة بالنسبة لي ، وذلك للسبب التالي:
لدي بضع مئات الآلاف من المستندات تحتوي جميعها على نفس الحقول. تحتوي إحدى لوحات المعلومات الخاصة بي على جدولين ، يحتوي كل منهما على مجموعة مختلفة من الأعمدة. تكمن المشكلة في أنهما يعيدان مبلغًا إجماليًا مختلفًا ، إذا كان حجم المصطلحات منخفضًا جدًا (لنقل 500). يصبح المبلغ الإجمالي متساويًا عندما أقوم بتغيير حجم المصطلحات إلى حوالي 50.000 ، والتي قد تصبح مشكلة عندما نصل إلى مليوني مستند أفترض ... أعتقد أن هذه المشكلة تكمن في حقيقة عدد المستندات التي لها قيم متساوية لمحددة المفاتيح المستخدمة للجدولين ، والتي قد تتسبب في اختلاف المبلغ الإجمالي للجدولين.
لذا ، سيكون من الرائع الحصول على مجموعات ذات حجم غير محدود ، لأنه في هذه اللحظة المناسبة لا يمكنني الوثوق بالنتائج. أو يجب أن يكون هناك حل آخر لهذا.
إغلاق هذا ، حيث تمت إزالة هذا السلوك في Elasticsearch (منذ وقت طويل).
التعليق الأكثر فائدة
في حالة تصور الجدول ، فهو في الواقع مشكلة كبيرة بالنسبة لي ، وذلك للسبب التالي:
لدي بضع مئات الآلاف من المستندات تحتوي جميعها على نفس الحقول. تحتوي إحدى لوحات المعلومات الخاصة بي على جدولين ، يحتوي كل منهما على مجموعة مختلفة من الأعمدة. تكمن المشكلة في أنهما يعيدان مبلغًا إجماليًا مختلفًا ، إذا كان حجم المصطلحات منخفضًا جدًا (لنقل 500). يصبح المبلغ الإجمالي متساويًا عندما أقوم بتغيير حجم المصطلحات إلى حوالي 50.000 ، والتي قد تصبح مشكلة عندما نصل إلى مليوني مستند أفترض ... أعتقد أن هذه المشكلة تكمن في حقيقة عدد المستندات التي لها قيم متساوية لمحددة المفاتيح المستخدمة للجدولين ، والتي قد تتسبب في اختلاف المبلغ الإجمالي للجدولين.
لذا ، سيكون من الرائع الحصول على مجموعات ذات حجم غير محدود ، لأنه في هذه اللحظة المناسبة لا يمكنني الوثوق بالنتائج. أو يجب أن يكون هناك حل آخر لهذا.