Elasticsearch: API de atualização: atualização por consulta

Criado em 12 jan. 2012 · 160Comentários · Fonte: elastic/elasticsearch

1583 permite atualizar documentos individuais. Atualizar por consulta reduzirá radicalmente as viagens de ida e volta da rede se você quiser atualizar vários documentos e enviar o trabalho do cliente para o ES.

curl -XPOST localhost:9200/index/type/_update -d '{
    "query" : { "constant_score" : { "filter" : { "term" : { "counter" : 0 } } } },
    "script" : "ctx._source.counter += count",
    "params" : {
        "count" : 4
    }
}'

:DistributeCRUD

Fonte

monken

👍3

Comentários muito úteis

A atualização por consulta está disponível em 2.3.0 e 5.0.0-alpha-1. Os documentos estão aqui .

nik9000 em 20 abr. 2016

🎉6

Todos 160 comentários

Eu realmente adoraria esse recurso também!

Mpdreamz em 12 abr. 2012

r10r em 3 jun. 2012

darklow em 5 jun. 2012

mrgautamsam em 14 jun. 2012

feridgurbuz em 16 jun. 2012

gc20 em 25 set. 2012

serpent403 em 15 nov. 2012

devilankur18 em 19 nov. 2012

willtrking em 1 dez. 2012

ignatiusreza em 10 dez. 2012

kenshin54 em 13 dez. 2012

noodlehaus em 3 jan. 2013

Aoseala em 3 jan. 2013

Eu realmente preciso desse recurso

timotta em 24 jan. 2013

: +1:

burzum em 4 fev. 2013

Enquanto esperava esse recurso ser oficialmente finalizado e lançado, empacotei a solicitação pull # 2231 como um plug-in: yakaz / elasticsearch-action-updatebyquery .
Divirta-se.

ofavre em 13 fev. 2013

bobbyrenwick em 27 fev. 2013

geoffwatts em 27 fev. 2013

AnSavvides em 28 fev. 2013

neogenix em 4 mar. 2013

scriby em 4 mar. 2013

gnurag em 7 mar. 2013

damienalexandre em 28 mar. 2013

paulsabou em 11 abr. 2013

acarrasco em 11 abr. 2013

steegi em 11 abr. 2013

thomasma em 17 abr. 2013

oowl em 28 abr. 2013

ttghr em 15 mai. 2013

acerb em 23 mai. 2013

lucaskatayama em 5 jun. 2013

: +1:: orar:

qw3r em 6 jun. 2013

sectronov em 11 jun. 2013

mguillermin em 13 jun. 2013

Existe uma maneira de passar a pontuação da consulta como um parâmetro para o script de atualização? Preciso atualizar as entradas com pontuações atualizadas com base nos campos de seus filhos.

scottc52-zz em 27 jun. 2013

thlawiczka em 2 jul. 2013

dalibor-frivaldsky em 9 jul. 2013

anderson-arlen em 11 jul. 2013

@ scottc52 Você conseguiu fazer isso? Também estou procurando uma maneira de fazer isso.

gboivin em 18 jul. 2013

jstray em 18 jul. 2013

@gboivin Não. Estou fazendo uma consulta has_child e enviando uma solicitação de atualização separada, mas é lenta.

scottc52-zz em 18 jul. 2013

esperando esse recurso também ..

bugbuilder em 19 jul. 2013

YannBrrd em 1 ago. 2013

khsibr em 1 ago. 2013

theorm em 14 ago. 2013

onokonem em 19 ago. 2013

consulthys em 22 ago. 2013

willtrking em 27 ago. 2013

scoolen em 27 ago. 2013

Acabei de escrever um pequeno script para ajudar a esperar por algo ... mais "pronto para produção" ;-)

https://github.com/YannBrrd/esNodeUpdater

Sinta-se à vontade para comentar / atualizar ...

YannBrrd em 2 set. 2013

denis-ryzhkov em 3 set. 2013

Existe um status oficial para este recurso da equipe de desenvolvimento? Não vejo nenhuma entrada deles. Existem planos para adicionar este recurso ao núcleo ou é preferível que os usuários usem um plugin como o listado acima ?

mastermatt em 25 set. 2013

Pretendemos voltar atrás, o principal motivo pelo qual colocamos isso em espera é que precisamos ter uma maneira de interromper a atualização existente por consultas, pois elas podem ser executadas por engano em uma grande quantidade de dados, causando problemas. .

kimchy em 25 set. 2013

+1. Obrigado pela atualização e por trabalhar nisso.

emanuil-tolev em 2 out. 2013

kapso em 16 out. 2013

preetiraj em 18 out. 2013

alexkoltun em 20 out. 2013

eyardimci em 27 out. 2013

+1, parece útil

kmarsh em 2 nov. 2013

olsp em 6 nov. 2013

pionize em 8 nov. 2013

dularion em 11 nov. 2013

abronner em 25 nov. 2013

Vineeth-Mohan em 25 nov. 2013

whatevercode em 4 dez. 2013

mishu- em 9 dez. 2013

kevinsteger em 10 dez. 2013

MrHash em 12 dez. 2013

kzachara em 12 dez. 2013

+10

anderson-arlen em 12 dez. 2013

Plasma em 28 dez. 2013

kiyanwang em 6 jan. 2014

vaidik em 10 jan. 2014

Você já pensou em implementar com uma chamada dupla de HTTP esse recurso? Eu penso em aquecedores que dão a possibilidade de armazenar a consulta e depois executar a consulta (não é realmente a mesma coisa, mas me faz pensar a respeito).

@kimchy você diz que pensa em uma maneira de interromper a atualização se ela foi lançada em uma grande quantidade de dados por engano. Se você pará-lo, talvez os dados indexados fiquem em estado inválido (talvez seja possível fazer rollback ...?). Talvez a melhor abordagem seja evitar erros.

Se você precisar de duas chamadas HTTP antes de acionar a atualização em massa real (1 para preparar e 1 para realmente acioná-la com um id de transação entre) e, em seguida, um manipulador de status de atualização (como o dataimporthandler em SolR) para saber quando a consulta está realmente concluída.

Não tenho certeza se ser muito claro, mas acho que pode ser uma solução para evitar chamadas incorretas ...

shulard em 23 jan. 2014

brsanthu em 28 jan. 2014

yarinm em 29 jan. 2014

Eu também gostaria de votar a favor disso.

fuwaneko em 29 jan. 2014

@kimchy : Perfomance não pode ser a questão: Atualmente estou executando milhares de consultas para pesquisar dados (por exemplo, pesquisa de endereço de índice OSM para localizações de GPS - pesquisas são rápidas, ei, eu tenho ElasticSearch!) e atualizo cada documento em outro índice (por exemplo, para adicionar um endereço de texto não criptografado). Minhas atualizações adicionam novos campos. Uma atualização em massa dentro do ES deve ser mais eficiente do que 10.000 consultas de pesquisa + 10.000 solicitações de atualização (também usando atualizações em massa ...). Do ponto de vista da codificação e do tempo de execução, seria mais eficiente, por exemplo, o arquivo de atualização em massa obtém 20.000 linhas e poderia ter apenas 2 com o novo recurso - todos os dados movidos pela rede e tornando o ES ocupado lendo arquivos de atualização em massa ...

Talvez você concorde em adicionar limites para a operação de atualização, por exemplo, _update / _query = some_conditions & size = 1000 de forma que evite atualizar um milhão de documentos - e nós, como desenvolvedores, podemos decidir se executaremos 1000 * 1000 atualizações para atualizar um milhão de registros ... É deve retornar o número de documentos atualizados para dar algum controle se outra chamada de atualização for necessária.

seti123 em 31 jan. 2014

dhruvbansal em 31 jan. 2014

Para o meu cenário (enriquecer registros após pesquisas em outros indicadores), posso fazer de outra maneira: inserir dados primeiro no mongoDb, fazer pesquisas nos registros de atualização do ElasticSearch no Mongo, usar o rio mongo para obter os resultados finais no ElasticSearch para mostrá-lo na GUI (compilar no topo do ES). Alguém já experimentou esses cenários? Eu esperava que eu pudesse ir apenas para o ES ... até agora, eu rejeitei o uso de um banco de dados no meu projeto.

seti123 em 3 fev. 2014

Oi,

você poderia simplesmente usar Couchbase + Elasticsearch para isso, pois Couchbase
oferece uma interface com Elasticsearch

Cordialement,
Yann Barraud

03/02/2014 seti123 [email protected] :

Para o meu cenário (enriquecer registros após pesquisas em outros indicadores), eu poderia
faça de outra maneira: insira dados primeiro no mongoDb, faça pesquisas em
ElasticSearch atualiza registros em Mongo, use o rio mongo para obter os resultados finais
no ElasticSearch para mostrá-lo na GUI (construído em cima do ES). Tem alguém
experiente com tais cenários? Eu esperava que eu pudesse ir apenas para o ES ... até
agora, rejeitei o uso de um banco de dados em meu projeto.
Responda a este e-mail diretamente ou visualize-o em Gi tHubhttps: //github.com/elasticsearch/elasticsearch/issues/1607#issuecomment -33917801
.

YannBrrd em 3 fev. 2014

weeyum em 11 fev. 2014

+100

girak em 11 fev. 2014

sulabhjain em 11 fev. 2014

ncammarata em 23 fev. 2014

Existe uma alternativa no ElasticSearch, por exemplo, acionar um script que executa uma ação quando novos dados são inseridos ou atualizados? Algum tipo antes do Index-Trigger poderia me ajudar a remover a cadeia de pré-processamento (fizemos agora Message Ques com REDIS e cadeia de processamento 0MQ antes de inserirmos Dados no ES - tudo isso custa largura de banda de rede para embaralhar dados para precessão paralela ... )

Gostaria de ver
http: // localhost : 9200 / index / type / _preprocessBeforeIndex? script = myDataAnalysisScript
http: // localhost : 9200 / index / type / _preprocessBeforeUpdate? script = myDataAnalysisScript
O Script deve ser capaz de adicionar novos campos ao registro atual antes que o ES o armazene / indexe (para evitar a ação de índice duplo após as alterações). Como trabalhamos muito com node.js, os scripts devem funcionar na linguagem necessária (em nosso Case JavaScript).

Melhor ainda se pudéssemos definir o Script no MAPEAMENTO por Tipo de dados ao invés de um indício gerado.
Qualquer plug-in disponível que seja capaz de acionar esses scripts? Qualquer documentação sobre o uso de ES API em Scripts?

seti123 em 23 fev. 2014

xreal em 24 fev. 2014

choonkeat em 12 mar. 2014

rotbackenpfeifdruesling em 12 mar. 2014

ghost em 17 mar. 2014

eirikgro em 17 mar. 2014

demockk em 18 mar. 2014

stormizin em 18 mar. 2014

ibagui em 19 mar. 2014

nkhare em 4 abr. 2014

Esperando por este recurso ... (+1)

gvolpe em 8 abr. 2014

cosmin-marginean em 15 abr. 2014

rpiccoli em 15 abr. 2014

shuperok em 21 abr. 2014

harishvolvoikar em 23 abr. 2014

JGailor em 23 abr. 2014

alari em 24 abr. 2014

gabrielgambarini em 29 abr. 2014

matheus2740 em 29 abr. 2014

matthiasfeist em 9 mai. 2014

bhabegger em 13 mai. 2014

Este recurso está em desenvolvimento?
Isso resolveria muitos problemas que são quase impossíveis de tratar de forma confiável no nível do aplicativo agora.

pmishev em 16 mai. 2014

fernandolins em 21 mai. 2014

fuyp em 23 mai. 2014

mvallebr em 30 mai. 2014

Só para lembrar que desde meados fevereiro 2013 eu embalado, e mantida desde então, a "solicitação de recebimento oficial" # 2231 via @martijnvg do ramo como um plugin: Yakaz / ElasticSearch-ação-updatebyquery .

ofavre em 30 mai. 2014

jalateras em 4 jun. 2014

ksaveras em 5 jun. 2014

MassiveMedia em 18 jun. 2014

jrots em 18 jun. 2014

+1
Como é possível que este recurso desde fevereiro de 2013 ainda não tenha mesclado com o master?

KrzysztofWilczek em 26 jun. 2014

+1
Idem no comentário de @KrzysztofWilczek . Por que o RP ficou estagnado no ano passado sem atualizações? Este é de longe o assunto mais comentado.

efuquen em 7 jul. 2014

dhanson358 em 9 jul. 2014

Recebemos esse problema há vários meses (veja minhas postagens como @ seti123 janeiro / fevereiro) e gostaria de compartilhar nossos resultados - depois de desistir do DB + ES River (muita preocupação com as dependências de versão) avaliamos nosso caso de uso com sucesso com Crate Data (que usa ES como biblioteca e adiciona uma interface SQL para mapeamento e consulta, incluindo "atualização por consulta" https://crate.io/docs/stable/sql/dml.html#updating-data).
Um bom ponto de partida para ler sobre semelhanças e diferenças: https://crate.io/blog/crate_data_elasticsearch

megastef em 14 jul. 2014

Fechado a favor de # 2230

clintongormley em 18 jul. 2014

leibale em 1 jan. 2015

niemyjski em 20 jan. 2015

rkleiren em 19 mar. 2015

idoshamun em 19 mar. 2015

fjarrett em 27 mar. 2015

raphaelMalie em 14 abr. 2015

bogdanovich em 29 abr. 2015

dbrambilla em 6 mai. 2015

binque em 15 mai. 2015

saval em 26 mai. 2015

artild em 29 mai. 2015

bn96 em 1 jun. 2015

vkopitsa em 7 jun. 2015

ifgh em 12 jun. 2015

fabriciomassula em 11 jul. 2015

irá atualizar por setPostFilter de suporte de consulta?
edição # 12295

Praveen82 em 17 jul. 2015

vitaliikapliuk em 20 jul. 2015

xelllee em 4 ago. 2015

IUnknownPtr em 14 ago. 2015

leonklinke em 24 ago. 2015

ispringer em 1 set. 2015

sapkalrohan em 2 set. 2015

fiserro em 4 set. 2015

mobalytics em 11 set. 2015

marioeu em 16 set. 2015

ogorun em 16 set. 2015

ron521 em 3 nov. 2015

alguém pode revisar isso e dar feedback.
https://discuss.elastic.co/t/updatebyqueryresponse-throwing-timeout/29176

A atualização por consulta falha durante a atualização de mais de 20 + milhões de registros.

Praveen82 em 3 nov. 2015

@ Praveen82 você está usando um plugin de terceiros. Este não é o lugar certo para solicitar suporte, você deve postar isso como um problema no repositório desse plugin.

rayward em 4 nov. 2015

https://github.com/elastic/elasticsearch/pull/15125 está implementando uma sintaxe que se parecerá um pouco com

curl -XPOST localhost:9200/index/type/_update_by_query -d '{
    "query" : { "term" : { "counter" : 0 } },
    "script" : {
      "inline": "ctx._source.counter += count",
      "params" : {
          "count" : 4
      }
  }
}'

O motivo pelo qual isso ficou parado por tanto tempo foi por causa dos tempos limite: até agora, havia uma maneira de iniciar trabalhos de longa execução no Elasticsearch e relatar seu status e outras coisas. Com a API de gerenciamento de tarefas (# 15347) eminente, peguei a tocha nas coisas do estilo "reindexar" e "atualizar por consulta" e iniciei-as novamente com a intenção de integrar com o gerenciamento de tarefas o mais rápido possível.

De qualquer forma, o # 15125 e quaisquer PRs subsequentes são o lugar para procurar esse recurso.

nik9000 em 19 dez. 2015

greg-symphony em 2 mar. 2016

YuriMarinkov em 15 mar. 2016

canyildiz em 22 mar. 2016

JohnTian em 22 mar. 2016

yossicahen em 20 abr. 2016

A atualização por consulta está disponível em 2.3.0 e 5.0.0-alpha-1. Os documentos estão aqui .

nik9000 em 20 abr. 2016

🎉6

A atualização por consulta em 2.3. + Ou 5. + é compatível com o plugin javascript?

scohenenator em 9 ago. 2016

A atualização por consulta em 2.3. + Ou 5. + é compatível com o plugin javascript?

Se você realmente quer, com certeza. No 2.3+ testamos update-by-query com o groovy e no 5.+ testamos com o indolor. Costumávamos testar contra o groovy e funcionou lá também. Espero que o javascript funcione bem.

nik9000 em 9 ago. 2016

O suporte a JS seria muito bom.

scohenenator em 9 ago. 2016

O suporte a JS seria muito bom.

Como falei, ele existe, basta instalar o plugin.

O problema com todas essas linguagens é que sua implementação na JVM não é orientada adequadamente para incorporação. É por isso que não o incluímos por padrão.

De qualquer forma, se você quiser falar mais sobre isso, acho que discuss.elastic.co é um lugar mais apropriado para isso.

nik9000 em 9 ago. 2016

Esta página foi útil?

0 / 5 - 0 avaliações

Questões relacionadas

Mais sugestões Lucene

clintongormley · 3Comentários

suporte à implantação de vários datacenters

ttaranov · 3Comentários

[solicitação de recurso] detecção de roteamento inteligente durante a pesquisa

makeyang · 3Comentários

Erro: curl (56) Falha de recebimento: Conexão redefinida pelo par

rpalsaxena · 3Comentários

Exibir a versão do ES como parte de index.version nas configurações de índice

ppf2 · 3Comentários

Elasticsearch: API de atualização: atualização por consulta

1583 permite atualizar documentos individuais. Atualizar por consulta reduzirá radicalmente as viagens de ida e volta da rede se você quiser atualizar vários documentos e enviar o trabalho do cliente para o ES.

Comentários muito úteis

Todos 160 comentários

Responda a este e-mail diretamente ou visualize-o em Gi tHubhttps: //github.com/elasticsearch/elasticsearch/issues/1607#issuecomment -33917801 .

Questões relacionadas

Responda a este e-mail diretamente ou visualize-o em Gi tHubhttps: //github.com/elasticsearch/elasticsearch/issues/1607#issuecomment -33917801
.