Согласно этой заявке на 0
качестве параметра размера. Похоже, что эта функция (преднамеренная или нет) не работает в 5.0, потому что она передала бы 0
в качестве размера, а не оставила бы его. (См. №8339).
Вероятно, было бы неплохо позволить пользователю очистить это поле, чтобы не отправлять размер в elasticsearch и возвращать все результаты.
Насколько я понимаю, запрещение агрегирования терминов неограниченного размера было намеренным изменением на стороне Elasticsearch в версии 5.0, чтобы ограничить агрегаты, которые могут дестабилизировать кластер: https://github.com/elastic/elasticsearch/issues/18838
Кроме того, я не понимаю, как мы можем добавить эту поддержку обратно, если она не поддерживается на стороне API?
В случае визуализации таблицы для меня это действительно большая проблема по следующей причине:
У меня есть пара сотен тысяч документов, содержащих одинаковые поля. Одна из моих информационных панелей содержит 2 таблицы, каждая из которых содержит разные наборы столбцов. Проблема в том, что они оба возвращают разную общую сумму, если размер терминов слишком мал (скажем, 500). Общая сумма становится равной, когда я изменяю размер терминов примерно на 50 000, что может стать проблемой, когда мы дойдем до пары миллионов документов, я полагаю ... Я предполагаю, что эта проблема заключается в том, сколько документов имеют одинаковые значения для конкретных ключи, которые используются для таблиц, что может привести к разной общей сумме для двух таблиц.
Поэтому было бы неплохо иметь агрегаты неограниченного размера, потому что в данный момент я не могу доверять результатам. Или для этого должно быть другое решение.
Закрытие, так как это поведение было удалено в Elasticsearch (давным-давно).
Самый полезный комментарий
В случае визуализации таблицы для меня это действительно большая проблема по следующей причине:
У меня есть пара сотен тысяч документов, содержащих одинаковые поля. Одна из моих информационных панелей содержит 2 таблицы, каждая из которых содержит разные наборы столбцов. Проблема в том, что они оба возвращают разную общую сумму, если размер терминов слишком мал (скажем, 500). Общая сумма становится равной, когда я изменяю размер терминов примерно на 50 000, что может стать проблемой, когда мы дойдем до пары миллионов документов, я полагаю ... Я предполагаю, что эта проблема заключается в том, сколько документов имеют одинаковые значения для конкретных ключи, которые используются для таблиц, что может привести к разной общей сумме для двух таблиц.
Поэтому было бы неплохо иметь агрегаты неограниченного размера, потому что в данный момент я не могу доверять результатам. Или для этого должно быть другое решение.