Elasticsearch: Actualizar API: actualizar por consulta

Creado en 12 ene. 2012 · 160Comentarios · Fuente: elastic/elasticsearch

1583 permite actualizar documentos individuales. La actualización por consulta reducirá radicalmente los viajes de ida y vuelta de la red si desea actualizar una serie de documentos y enviar el trabajo del cliente a ES.

curl -XPOST localhost:9200/index/type/_update -d '{
    "query" : { "constant_score" : { "filter" : { "term" : { "counter" : 0 } } } },
    "script" : "ctx._source.counter += count",
    "params" : {
        "count" : 4
    }
}'

:DistributeCRUD

Fuente

monken

👍3

Comentario más útil

La actualización por consulta está disponible en 2.3.0 y 5.0.0-alpha-1. Los doctores están aquí .

nik9000 en 20 abr. 2016

🎉6

Todos 160 comentarios

¡Realmente me encantaría esta función también!

Mpdreamz en 12 abr. 2012

r10r en 3 jun. 2012

darklow en 5 jun. 2012

mrgautamsam en 14 jun. 2012

feridgurbuz en 16 jun. 2012

gc20 en 25 sept. 2012

serpent403 en 15 nov. 2012

devilankur18 en 19 nov. 2012

willtrking en 1 dic. 2012

ignatiusreza en 10 dic. 2012

kenshin54 en 13 dic. 2012

noodlehaus en 3 ene. 2013

Aoseala en 3 ene. 2013

Realmente necesito esta característica

timotta en 24 ene. 2013

: +1:

burzum en 4 feb. 2013

Mientras esperaba que esta función se terminara y se lanzara oficialmente, empaqueté la solicitud de extracción # 2231 como un complemento: yakaz / elasticsearch-action-updatebyquery .
Divertirse.

ofavre en 13 feb. 2013

bobbyrenwick en 27 feb. 2013

geoffwatts en 27 feb. 2013

AnSavvides en 28 feb. 2013

neogenix en 4 mar. 2013

scriby en 4 mar. 2013

gnurag en 7 mar. 2013

damienalexandre en 28 mar. 2013

paulsabou en 11 abr. 2013

acarrasco en 11 abr. 2013

steegi en 11 abr. 2013

thomasma en 17 abr. 2013

oowl en 28 abr. 2013

ttghr en 15 may. 2013

acerb en 23 may. 2013

lucaskatayama en 5 jun. 2013

: +1:: rezar:

qw3r en 6 jun. 2013

sectronov en 11 jun. 2013

mguillermin en 13 jun. 2013

¿Hay alguna forma de pasar la puntuación de la consulta como parámetro al script de actualización? Necesito actualizar las entradas con puntuaciones actualizadas en función de los campos de sus hijos.

scottc52-zz en 27 jun. 2013

thlawiczka en 2 jul. 2013

dalibor-frivaldsky en 9 jul. 2013

anderson-arlen en 11 jul. 2013

@ scottc52 ¿

gboivin en 18 jul. 2013

jstray en 18 jul. 2013

@gboivin Nop . Estoy haciendo una consulta has_child y enviando una solicitud de actualización separada, pero es lenta.

scottc52-zz en 18 jul. 2013

esperando esta función también ...

bugbuilder en 19 jul. 2013

YannBrrd en 1 ago. 2013

khsibr en 1 ago. 2013

theorm en 14 ago. 2013

onokonem en 19 ago. 2013

consulthys en 22 ago. 2013

willtrking en 27 ago. 2013

scoolen en 27 ago. 2013

Solo escribí un pequeño guión para ayudar a esperar algo ... más "listo para producción" ;-)

https://github.com/YannBrrd/esNodeUpdater

No dude en comentar / actualizar ...

YannBrrd en 2 sept. 2013

denis-ryzhkov en 3 sept. 2013

¿Existe un estado oficial de esta función por parte del equipo de desarrollo? No veo ninguna entrada de ellos. ¿Hay planes para agregar esta función al núcleo o es preferible que los usuarios usen un complemento como el mencionado anteriormente ?

mastermatt en 25 sept. 2013

Planeamos volver a esto, la razón principal por la que lo dejamos en espera es que necesitamos tener una forma de detener la actualización existente mediante consultas, ya que pueden ejecutarse por error en una gran cantidad de datos, causando problemas. .

kimchy en 25 sept. 2013

+1. Gracias por la actualización y por trabajar en esto.

emanuil-tolev en 2 oct. 2013

kapso en 16 oct. 2013

preetiraj en 18 oct. 2013

alexkoltun en 20 oct. 2013

eyardimci en 27 oct. 2013

+1, suena útil

kmarsh en 2 nov. 2013

olsp en 6 nov. 2013

pionize en 8 nov. 2013

dularion en 11 nov. 2013

abronner en 25 nov. 2013

Vineeth-Mohan en 25 nov. 2013

whatevercode en 4 dic. 2013

mishu- en 9 dic. 2013

kevinsteger en 10 dic. 2013

MrHash en 12 dic. 2013

kzachara en 12 dic. 2013

+10

anderson-arlen en 12 dic. 2013

Plasma en 28 dic. 2013

kiyanwang en 6 ene. 2014

vaidik en 10 ene. 2014

¿Alguna vez ha pensado en implementar con una doble llamada HTTP esta función? Pienso en warmers que dan la posibilidad de almacenar la consulta y luego ejecutar la consulta (no es realmente lo mismo pero me hace pensar).

@kimchy dices que piensas en una manera de detener la actualización si se lanzó por error en una gran cantidad de datos. Si lo detiene, tal vez los datos indexados estén en un estado no válido (¿tal vez sea posible revertir ...?). Quizás un mejor enfoque sea evitar errores.

Si necesita dos llamadas HTTP antes de activar la actualización masiva real (1 para preparar y 1 para activarla realmente con un ID de transición entre) y luego un controlador de estado de actualización (como el controlador de importación de datos en SolR) para saber cuándo se realiza realmente la consulta.

No estoy seguro de ser muy claro, pero creo que puede ser una solución para evitar llamadas erróneas ...

shulard en 23 ene. 2014

brsanthu en 28 ene. 2014

yarinm en 29 ene. 2014

También me gustaría votar a favor de esto.

fuwaneko en 29 ene. 2014

@kimchy : Perfomance no puede ser la pregunta: actualmente estoy ejecutando miles de consultas para buscar datos (por ejemplo, búsqueda de direcciones de índice OSM para ubicaciones GPS; las búsquedas son rápidas, ¡hey obtuve ElasticSearch!) y actualizo cada documento en otro índice (por ejemplo, para agregar una dirección de texto sin cifrar). Mis actualizaciones agregan nuevos campos. Una actualización masiva dentro de ES debe ser más eficiente que 10.000 consultas de búsqueda + 10.000 solicitudes de actualización (también usando actualizaciones masivas ...). Desde el punto de vista de la codificación y el tiempo de ejecución, sería más eficiente, por ejemplo, el archivo de actualización masiva obtiene 20.000 líneas y solo podría tener 2 con la nueva función: todos los datos se mueven a través de la red y hacen que ES esté ocupado leyendo archivos de actualización masiva ...

Tal vez acepte agregar límites para la operación de actualización, por ejemplo, _update / _query = some_conditions & size = 1000 de esa manera se evita actualizar un millón de documentos, y nosotros, como desarrolladores, podemos decidir si ejecutamos 1000 * 1000 actualizaciones para actualizar un millón de registros ... debería devolver el número de documentos actualizados para dar cierto control si se requiere otra llamada de actualización.

seti123 en 31 ene. 2014

dhruvbansal en 31 ene. 2014

Para mi escenario (enriquecer los registros después de las búsquedas en otros índices), podría hacerlo de otra manera: inserte los datos primero en mongoDb, realice búsquedas en ElasticSearch actualice los registros en Mongo, use mongo river para obtener los resultados finales en ElasticSearch para mostrarlos en la GUI (build encima de ES). ¿Alguien ha experimentado con tales escenarios? Esperaba poder ir de la única manera ES ... hasta ahora, rechacé el uso de una base de datos en mi proyecto.

seti123 en 3 feb. 2014

Hola,

simplemente puede usar Couchbase + Elasticsearch para esto, ya que Couchbase
ofrece una interfaz con Elasticsearch

Cordialidad,
Yann Barraud

2014-02-03 seti123 [email protected] :

Para mi escenario (enriquecer registros después de búsquedas en otros índices) podría
hazlo de otra manera: inserta datos primero en mongoDb, haz búsquedas en
ElasticSearch actualiza los registros en Mongo, usa el río mongo para obtener los resultados finales
en ElasticSearch para mostrarlo en GUI (construido sobre ES). Tiene alguien
experimentado con tales escenarios? Esperaba poder seguir el único camino de ES ... hasta que
ahora, rechacé el uso de una base de datos en mi proyecto.
Responda a este correo electrónico directamente o véalo en Gi
.

YannBrrd en 3 feb. 2014

weeyum en 11 feb. 2014

+100

girak en 11 feb. 2014

sulabhjain en 11 feb. 2014

ncammarata en 23 feb. 2014

¿Existe una alternativa en ElasticSearch, por ejemplo, activar un script que realiza una acción cuando se insertan o actualizan nuevos datos? Algún tipo de antes de Index-Trigger podría ayudarme a eliminar la cadena de preprocesamiento (ahora hicimos Message Ques con REDIS y la cadena de procesamiento 0MQ antes de insertar Datos en ES; todo cuesta ancho de banda de la red para mezclar los datos para el preprocesamiento paralelo ... )

Me gustaría ver
http: // localhost : 9200 / index / type / _preprocessBeforeIndex? script = myDataAnalysisScript
http: // localhost : 9200 / index / type / _preprocessBeforeUpdate? script = myDataAnalysisScript
El script debe poder agregar nuevos campos al registro actual antes de que ES lo almacene / indexe (para evitar la acción de doble índice después de los cambios). Como trabajamos mucho con node.js, los scripts deberían funcionar en el idioma requerido (en nuestro caso JavaScript).

Aún mejor si pudiéramos definir el script en el MAPEO por tipo de datos en lugar de los índices generados.
¿Algún complemento disponible que pueda activar dichos scripts? ¿Alguna documentación sobre el uso de la API de ES en Scripts?

seti123 en 23 feb. 2014

xreal en 24 feb. 2014

choonkeat en 12 mar. 2014

rotbackenpfeifdruesling en 12 mar. 2014

ghost en 17 mar. 2014

eirikgro en 17 mar. 2014

demockk en 18 mar. 2014

stormizin en 18 mar. 2014

ibagui en 19 mar. 2014

nkhare en 4 abr. 2014

Esperando esta función ... (+1)

gvolpe en 8 abr. 2014

cosmin-marginean en 15 abr. 2014

rpiccoli en 15 abr. 2014

shuperok en 21 abr. 2014

harishvolvoikar en 23 abr. 2014

JGailor en 23 abr. 2014

alari en 24 abr. 2014

gabrielgambarini en 29 abr. 2014

matheus2740 en 29 abr. 2014

matthiasfeist en 9 may. 2014

bhabegger en 13 may. 2014

¿Está esta característica en desarrollo?
Esto resolvería tantos problemas que son casi imposibles de manejar de manera confiable a nivel de aplicación en este momento.

pmishev en 16 may. 2014

fernandolins en 21 may. 2014

fuyp en 23 may. 2014

mvallebr en 30 may. 2014

Solo para recordarles que desde mediados de febrero de 2013 he empaquetado, y mantenido desde entonces, la "solicitud de extracción oficial" # 2231 a través de la rama de @martijnvg como complemento: yakaz / elasticsearch-action-updatebyquery .

ofavre en 30 may. 2014

jalateras en 4 jun. 2014

ksaveras en 5 jun. 2014

MassiveMedia en 18 jun. 2014

jrots en 18 jun. 2014

+1
¿Cómo es posible que esta función desde febrero de 2013 aún no se haya fusionado con el maestro?

KrzysztofWilczek en 26 jun. 2014

+1
Lo mismo ocurre con el comentario de

efuquen en 7 jul. 2014

dhanson358 en 9 jul. 2014

Recibimos este problema hace varios meses (vea mis publicaciones como @ seti123 enero / febrero) y me gustaría compartir nuestros resultados; después de renunciar a DB + ES River (demasiadas preocupaciones sobre las dependencias de la versión) evaluamos nuestro caso de uso con éxito con Crate Data (que usa ES como biblioteca y agrega una interfaz SQL para mapeo y consulta que incluye "actualización por consulta" https://crate.io/docs/stable/sql/dml.html#updating-data).
Un buen punto de partida para leer sobre similitudes y diferencias: https://crate.io/blog/crate_data_elasticsearch

megastef en 14 jul. 2014

Cerrado a favor de # 2230

clintongormley en 18 jul. 2014

leibale en 1 ene. 2015

niemyjski en 20 ene. 2015

rkleiren en 19 mar. 2015

idoshamun en 19 mar. 2015

fjarrett en 27 mar. 2015

raphaelMalie en 14 abr. 2015

bogdanovich en 29 abr. 2015

dbrambilla en 6 may. 2015

binque en 15 may. 2015

saval en 26 may. 2015

artild en 29 may. 2015

bn96 en 1 jun. 2015

vkopitsa en 7 jun. 2015

ifgh en 12 jun. 2015

fabriciomassula en 11 jul. 2015

¿Se actualizará mediante el soporte de consultas setPostFilter?
edición # 12295

Praveen82 en 17 jul. 2015

vitaliikapliuk en 20 jul. 2015

xelllee en 4 ago. 2015

IUnknownPtr en 14 ago. 2015

leonklinke en 24 ago. 2015

ispringer en 1 sept. 2015

sapkalrohan en 2 sept. 2015

fiserro en 4 sept. 2015

mobalytics en 11 sept. 2015

marioeu en 16 sept. 2015

ogorun en 16 sept. 2015

ron521 en 3 nov. 2015

¿Alguien puede revisar esto y dar su opinión?
https://discuss.elastic.co/t/updatebyqueryresponse-throwing-timeout/29176

La actualización por consulta falla mientras actualiza más de 20 millones de registros.

Praveen82 en 3 nov. 2015

@ Praveen82 está utilizando un complemento de terceros. Este no es el lugar adecuado para solicitar soporte, debería publicarlo como un problema en el repositorio de ese complemento.

rayward en 4 nov. 2015

https://github.com/elastic/elasticsearch/pull/15125 está implementando una sintaxis que se verá un poco como

curl -XPOST localhost:9200/index/type/_update_by_query -d '{
    "query" : { "term" : { "counter" : 0 } },
    "script" : {
      "inline": "ctx._source.counter += count",
      "params" : {
          "count" : 4
      }
  }
}'

La razón por la que esto se estancó durante tanto tiempo es por esos tiempos de espera: hasta ahora ha habido una manera de lanzar trabajos de larga duración en Elasticsearch e informar sobre su estado y cosas. Con la api de administración de tareas (# 15347) eminente, tomé la antorcha en las cosas de estilo "reindexar" y "actualizar por consulta" y las comencé de nuevo con la intención de integrarlas con la administración de tareas lo antes posible.

De todos modos, # 15125 y cualquier PR de seguimiento son el lugar para buscar esta característica.

nik9000 en 19 dic. 2015

greg-symphony en 2 mar. 2016

YuriMarinkov en 15 mar. 2016

canyildiz en 22 mar. 2016

JohnTian en 22 mar. 2016

yossicahen en 20 abr. 2016

La actualización por consulta está disponible en 2.3.0 y 5.0.0-alpha-1. Los doctores están aquí .

nik9000 en 20 abr. 2016

🎉6

¿La actualización por consulta en 2.3. + O 5. + es compatible con el complemento javascript?

scohenenator en 9 ago. 2016

¿La actualización por consulta en 2.3. + O 5. + es compatible con el complemento javascript?

Si realmente lo quieres, seguro. En 2.3+ probamos actualización por consulta contra groovy y en 5. + probamos contra indoloro. Solíamos probar contra groovy y también funcionó allí. Espero que javascript funcione bien.

nik9000 en 9 ago. 2016

El soporte de JS sería bastante hábil.

scohenenator en 9 ago. 2016

El soporte de JS sería bastante hábil.

Como dije, existe, solo debes instalar el complemento.

El problema con todos estos lenguajes es que su implementación en la JVM no está correctamente orientada para la incrustación. Por eso no lo incluimos por defecto.

De todos modos, si quieres hablar más al respecto, creo que discutir.elastic.co es un lugar más apropiado para ello.

nik9000 en 9 ago. 2016

¿Fue útil esta página

0 / 5 - 0 calificaciones