Elasticsearch: API de mise à jour : mise à jour par requête

Créé le 12 janv. 2012 · 160Commentaires · Source: elastic/elasticsearch

1583 permet de mettre à jour des documents individuels. La mise à jour par requête réduira radicalement les allers-retours réseau si vous souhaitez mettre à jour un certain nombre de documents et transférer le travail du client vers ES.

curl -XPOST localhost:9200/index/type/_update -d '{
    "query" : { "constant_score" : { "filter" : { "term" : { "counter" : 0 } } } },
    "script" : "ctx._source.counter += count",
    "params" : {
        "count" : 4
    }
}'

:DistributeCRUD

Source

monken

👍3

Commentaire le plus utile

La mise à jour par requête est disponible dans les versions 2.3.0 et 5.0.0-alpha-1. Les docs sont ici .

nik9000 le 20 avr. 2016

🎉6

Tous les 160 commentaires

J'adorerais vraiment cette fonctionnalité aussi!

Mpdreamz le 12 avr. 2012

r10r le 3 juin 2012

darklow le 5 juin 2012

mrgautamsam le 14 juin 2012

feridgurbuz le 16 juin 2012

gc20 le 25 sept. 2012

serpent403 le 15 nov. 2012

devilankur18 le 19 nov. 2012

willtrking le 1 déc. 2012

ignatiusreza le 10 déc. 2012

kenshin54 le 13 déc. 2012

noodlehaus le 3 janv. 2013

Aoseala le 3 janv. 2013

j'ai vraiment besoin de cette fonctionnalité

timotta le 24 janv. 2013

:+1:

burzum le 4 févr. 2013

En attendant que cette fonctionnalité soit officiellement terminée et publiée, j'ai empaqueté la pull request #2231 en tant que plugin : yakaz/elasticsearch-action-updatebyquery .
S'amuser.

ofavre le 13 févr. 2013

bobbyrenwick le 27 févr. 2013

geoffwatts le 27 févr. 2013

AnSavvides le 28 févr. 2013

neogenix le 4 mars 2013

scriby le 4 mars 2013

gnurag le 7 mars 2013

damienalexandre le 28 mars 2013

paulsabou le 11 avr. 2013

acarrasco le 11 avr. 2013

steegi le 11 avr. 2013

thomasma le 17 avr. 2013

oowl le 28 avr. 2013

ttghr le 15 mai 2013

acerb le 23 mai 2013

lucaskatayama le 5 juin 2013

:+1: :prie:

qw3r le 6 juin 2013

sectronov le 11 juin 2013

mguillermin le 13 juin 2013

Existe-t-il un moyen de transmettre le score de la requête en paramètre au script de mise à jour ? J'ai besoin de mettre à jour les entrées avec les scores mis à jour en fonction des champs de ses enfants.

scottc52-zz le 27 juin 2013

thlawiczka le 2 juil. 2013

dalibor-frivaldsky le 9 juil. 2013

anderson-arlen le 11 juil. 2013

@scottc52 Avez-vous réussi à le faire? Je cherche aussi un moyen de le faire.

gboivin le 18 juil. 2013

jstray le 18 juil. 2013

@gboivin Non. Je fais une requête has_child et j'envoie une demande de mise à jour séparée, mais c'est lent.

scottc52-zz le 18 juil. 2013

en attendant cette fonctionnalité aussi ..

bugbuilder le 19 juil. 2013

YannBrrd le 1 août 2013

khsibr le 1 août 2013

theorm le 14 août 2013

onokonem le 19 août 2013

consulthys le 22 août 2013

willtrking le 27 août 2013

scoolen le 27 août 2013

Je viens d'écrire un petit script pour aider à attendre quelque chose... plus "prêt pour la production" ;-)

https://github.com/YannBrrd/esNodeUpdater

N'hésitez pas à commenter/mettre à jour...

YannBrrd le 2 sept. 2013

denis-ryzhkov le 3 sept. 2013

Y a-t-il un statut officiel sur cette fonctionnalité de la part de l'équipe de développement ? Je ne vois aucune contribution de leur part. Est-il prévu d'ajouter cette fonctionnalité au noyau ou préférez-vous que les utilisateurs utilisent un plugin comme celui répertorié ci-dessus ?

mastermatt le 25 sept. 2013

Nous prévoyons de revenir sur celui-ci, la principale raison pour laquelle nous avons mis cela en attente est que nous devons avoir un moyen d'arrêter la mise à jour existante par les requêtes, car elles peuvent être exécutées par erreur sur une grande quantité de données, provoquant des problèmes. .

kimchy le 25 sept. 2013

+1. Merci pour la mise à jour et le travail dessus.

emanuil-tolev le 2 oct. 2013

kapso le 16 oct. 2013

preetiraj le 18 oct. 2013

alexkoltun le 20 oct. 2013

eyardimci le 27 oct. 2013

+1, semble utile

kmarsh le 2 nov. 2013

olsp le 6 nov. 2013

pionize le 8 nov. 2013

dularion le 11 nov. 2013

abronner le 25 nov. 2013

Vineeth-Mohan le 25 nov. 2013

whatevercode le 4 déc. 2013

mishu- le 9 déc. 2013

kevinsteger le 10 déc. 2013

MrHash le 12 déc. 2013

kzachara le 12 déc. 2013

+10

anderson-arlen le 12 déc. 2013

Plasma le 28 déc. 2013

kiyanwang le 6 janv. 2014

vaidik le 10 janv. 2014

Avez-vous déjà pensé à implémenter avec un double appel HTTP cette fonctionnalité. Je pense aux réchauffeurs qui donnent la possibilité de stocker la requête puis d'exécuter la requête (c'est pas vraiment la même chose mais ça me fait réfléchir).

@kimchy vous dites que vous pensez à un moyen d'arrêter la mise à jour si elle a été lancée par erreur sur une grande quantité de données. Si vous l'arrêtez, les données indexées seront peut-être dans un état invalide (il est peut-être possible de revenir en arrière...?). Peut-être qu'une meilleure approche sera d'éviter les erreurs.

Si vous avez besoin de deux appels HTTP avant de déclencher la mise à jour en masse réelle (1 pour préparer et 1 pour la déclencher réellement avec un identifiant de transaction entre), puis un gestionnaire de statut de mise à jour (comme le dataimporthandler dans SolR) pour savoir quand la requête est vraiment terminée.

Je ne suis pas sûr d'être vraiment clair mais je pense que cela peut être une solution pour éviter les erreurs d'appels...

shulard le 23 janv. 2014

brsanthu le 28 janv. 2014

yarinm le 29 janv. 2014

J'aimerais également voter pour cela.

fuwaneko le 29 janv. 2014

@kimchy : Les performances ne peuvent pas être la question : actuellement, j'exécute des milliers de requêtes pour rechercher des données (par exemple, recherche d'adresses d'index OSM pour les emplacements GPS - les recherches sont rapides, hé, j'ai ElasticSearch !) et mets à jour chaque document dans un autre index (par exemple pour ajouter une adresse en texte clair). Mes mises à jour ajoutent de nouveaux champs. Une mise à jour en masse dans ES doit être plus efficace que 10.000 requêtes de recherche + 10.000 requêtes de mise à jour (utilisant également des mises à jour en masse...). Du point de vue du codage et de l'exécution, ce serait plus efficace, par exemple, le fichier de mise à jour en masse a 20 000 lignes et ne peut en avoir que 2 avec la nouvelle fonctionnalité - toutes les données sont déplacées sur le réseau et obligent ES à lire les fichiers de mise à jour en masse ...

Peut-être que vous acceptez d'ajouter des limites à l'opération de mise à jour, par exemple _update/_query=some_conditions&size=1000 de cette manière, cela évite de mettre à jour un million de documents - et nous, en tant que développeur, pouvons décider si nous exécutons 1000*1000 mises à jour pour mettre à jour un million d'enregistrements... Il devrait renvoyer le nombre de documents mis à jour pour donner un certain contrôle si un autre appel de mise à jour est requis.

seti123 le 31 janv. 2014

dhruvbansal le 31 janv. 2014

Pour mon scénario (enrichir les enregistrements après les recherches dans d'autres indices), je pourrais procéder d'une autre manière : insérer d'abord les données dans mongoDb, effectuer des recherches dans ElasticSearch mettre à jour les enregistrements dans Mongo, utiliser mongo river pour obtenir les résultats finaux dans ElasticSearch pour les afficher dans l'interface graphique (construire au-dessus de ES). Quelqu'un a-t-il connu de tels scénarios? J'espérais pouvoir utiliser ES uniquement... jusqu'à présent, j'ai refusé d'utiliser une base de données dans mon projet.

seti123 le 3 févr. 2014

Salut,

vous pouvez simplement utiliser Couchbase + Elasticsearch pour cela, comme Couchbase
propose une interface avec Elasticsearch

Cordialement,
Yann Barraud

03-02-2014 seti123 [email protected] :

Pour mon scénario (enrichir les enregistrements après des recherches dans d'autres indices), je pourrais
faites-le d'une autre manière : insérez d'abord les données dans mongoDb, effectuez des recherches dans
ElasticSearch met à jour les enregistrements dans Mongo, utilisez la rivière mongo pour obtenir les résultats finaux
dans ElasticSearch pour l'afficher dans l'interface graphique (construit sur ES). Quelqu'un a-t-il
expérimenté avec de tels scénarios? J'espérais que je pourrais aller ES seule façon ... jusqu'à ce que
maintenant, j'ai rejeté l'utilisation d'une base de données dans mon projet.
Répondez directement à cet e-mail ou consultez-le sur Gi tHubhttps://github.com/elasticsearch/elasticsearch/issues/1607#issuecomment -33917801
.

YannBrrd le 3 févr. 2014

weeyum le 11 févr. 2014

+100

girak le 11 févr. 2014

sulabhjain le 11 févr. 2014

ncammarata le 23 févr. 2014

Existe-t-il une alternative dans ElasticSearch, par exemple déclencher un script qui effectue une action lorsque de nouvelles données sont insérées ou mises à jour ? Une sorte d'avant Index-Trigger pourrait m'aider à supprimer la chaîne de pré-traitement (nous avons maintenant fait Message Ques avec REDIS et la chaîne de traitement 0MQ avant d'insérer des données dans ES - tout cela coûte la bande passante du réseau pour mélanger les données pour un traitement parallèle ... )

Je voudrais voir
http://localhost :9200/index/type/_preprocessBeforeIndex?script=myDataAnalysisScript
http://localhost :9200/index/type/_preprocessBeforeUpdate?script=myDataAnalysisScript
Le script doit pouvoir ajouter de nouveaux champs à l'enregistrement en cours avant que ES ne le stocke/l'indexe (pour éviter une double action d'indexation après les modifications). Comme nous travaillons beaucoup avec node.js, les scripts devraient fonctionner dans le langage requis (dans notre cas JavaScript).

Encore mieux si nous pouvions définir le script dans le MAPPING par type de données plutôt que sur un indice généré.
Existe-t-il un plug-in capable de déclencher de tels scripts ? Une documentation sur l'utilisation de l'API ES dans les scripts ?

seti123 le 23 févr. 2014

xreal le 24 févr. 2014

choonkeat le 12 mars 2014

rotbackenpfeifdruesling le 12 mars 2014

ghost le 17 mars 2014

eirikgro le 17 mars 2014

demockk le 18 mars 2014

stormizin le 18 mars 2014

ibagui le 19 mars 2014

nkhare le 4 avr. 2014

En attente de cette fonctionnalité... (+1)

gvolpe le 8 avr. 2014

cosmin-marginean le 15 avr. 2014

rpiccoli le 15 avr. 2014

shuperok le 21 avr. 2014

harishvolvoikar le 23 avr. 2014

JGailor le 23 avr. 2014

alari le 24 avr. 2014

gabrielgambarini le 29 avr. 2014

matheus2740 le 29 avr. 2014

matthiasfeist le 9 mai 2014

bhabegger le 13 mai 2014

Cette fonctionnalité est-elle en cours de développement ?
Cela résoudrait tant de problèmes qui sont presque impossibles à gérer de manière fiable au niveau de l'application en ce moment.

pmishev le 16 mai 2014

fernandolins le 21 mai 2014

fuyp le 23 mai 2014

mvallebr le 30 mai 2014

Juste pour vous rappeler que depuis la mi-février 2013, j'ai empaqueté, et maintenu depuis, la "demande de tirage officielle" #2231 via la branche de @martijnvg en tant que plugin : yakaz/elasticsearch-action-updatebyquery .

ofavre le 30 mai 2014

jalateras le 4 juin 2014

ksaveras le 5 juin 2014

MassiveMedia le 18 juin 2014

jrots le 18 juin 2014

+1
Comment est-il possible que cette fonctionnalité depuis février 2013 ne soit toujours pas fusionnée à master ?

KrzysztofWilczek le 26 juin 2014

+1
Idem sur le commentaire de @KrzysztofWilczek . Pourquoi le PR a-t-il stagné au cours de la dernière année sans aucune mise à jour ? C'est de loin la question la plus commentée.

efuquen le 7 juil. 2014

dhanson358 le 9 juil. 2014

Nous avons eu ce problème il y a plusieurs mois (voir mes messages comme @seti123 janvier/février) et j'aimerais partager nos résultats - après avoir abandonné DB+ES River (trop de soucis concernant les dépendances de version), nous avons évalué notre cas d'utilisation avec succès avec Crate Data (qui utilise ES comme bibliothèque et ajoute une interface SQL pour le mappage et la requête, y compris "mise à jour par requête" https://crate.io/docs/stable/sql/dml.html#updating-data ).
Un bon point de départ pour lire sur les similitudes et les différences : https://crate.io/blog/crate_data_elasticsearch

megastef le 14 juil. 2014

Fermé en faveur de #2230

clintongormley le 18 juil. 2014

leibale le 1 janv. 2015

niemyjski le 20 janv. 2015

rkleiren le 19 mars 2015

idoshamun le 19 mars 2015

fjarrett le 27 mars 2015

raphaelMalie le 14 avr. 2015

bogdanovich le 29 avr. 2015

dbrambilla le 6 mai 2015

binque le 15 mai 2015

saval le 26 mai 2015

artild le 29 mai 2015

bn96 le 1 juin 2015

vkopitsa le 7 juin 2015

ifgh le 12 juin 2015

fabriciomassula le 11 juil. 2015

mettra à jour par la prise en charge des requêtes setPostFilter ?
numéro n° 12295

Praveen82 le 17 juil. 2015

vitaliikapliuk le 20 juil. 2015

xelllee le 4 août 2015

IUnknownPtr le 14 août 2015

leonklinke le 24 août 2015

ispringer le 1 sept. 2015

sapkalrohan le 2 sept. 2015

fiserro le 4 sept. 2015

mobalytics le 11 sept. 2015

marioeu le 16 sept. 2015

ogorun le 16 sept. 2015

ron521 le 3 nov. 2015

quelqu'un peut-il examiner cela et donner son avis.
https://discuss.elastic.co/t/updatebyqueryresponse-throwing-timeout/29176

La mise à jour par requête échoue lors de la mise à jour de plus de 20 millions d'enregistrements.

Praveen82 le 3 nov. 2015

@Praveen82, vous utilisez un plugin tiers. Ce n'est pas le bon endroit pour demander de l'aide, vous devriez publier cela en tant que problème sur le référentiel de ce plugin.

rayward le 4 nov. 2015

https://github.com/elastic/elasticsearch/pull/15125 implémente une syntaxe qui ressemblera un peu à

curl -XPOST localhost:9200/index/type/_update_by_query -d '{
    "query" : { "term" : { "counter" : 0 } },
    "script" : {
      "inline": "ctx._source.counter += count",
      "params" : {
          "count" : 4
      }
  }
}'

La raison pour laquelle cela a été bloqué pendant si longtemps est à cause de ces délais d'attente : jusqu'à présent, il existait un moyen de lancer un travail de longue durée dans Elasticsearch et de rendre compte de leur statut et de leurs éléments. Avec l'API de gestion des tâches (#15347) éminente, j'ai repris le flambeau des choses de style "réindexation" et "mise à jour par requête" et les ai recommencées avec l'intention de les intégrer à la gestion des tâches dès que possible.

Quoi qu'il en soit, #15125 et tout PR de suivi sont l'endroit idéal pour rechercher cette fonctionnalité.

nik9000 le 19 déc. 2015

greg-symphony le 2 mars 2016

YuriMarinkov le 15 mars 2016

canyildiz le 22 mars 2016

JohnTian le 22 mars 2016

yossicahen le 20 avr. 2016

La mise à jour par requête est disponible dans les versions 2.3.0 et 5.0.0-alpha-1. Les docs sont ici .

nik9000 le 20 avr. 2016

🎉6

La mise à jour par requête en 2.3.+ ou 5.+ prend-elle en charge le plugin javascript ?

scohenenator le 9 août 2016

La mise à jour par requête en 2.3.+ ou 5.+ prend-elle en charge le plugin javascript ?

Si vous le voulez vraiment, bien sûr. Dans 2.3+, nous testons la mise à jour par requête contre groovy et dans 5.+, nous testons contre indolore. Nous avions l'habitude de tester contre groovy et cela fonctionnait aussi là-bas. J'espère que javascript fonctionnera bien.

nik9000 le 9 août 2016

Le support JS serait plutôt simple.

scohenenator le 9 août 2016

Le support JS serait plutôt simple.

Comme je l'ai dit, il existe, il suffit d'installer le plugin.

Le problème avec tous ces langages est que leur implémentation sur la JVM n'est pas correctement orientée pour l'intégration. C'est pourquoi nous ne l'incluons pas par défaut.

Quoi qu'il en soit, si vous voulez en parler davantage, je pense que Discuter.elastic.co est un endroit plus approprié pour cela.

nik9000 le 9 août 2016

Cette page vous a été utile?

0 / 5 - 0 notes

Questions connexes

Les agrégations de plage doivent-elles prendre en charge l'option "missing" ?

jpountz · 3Commentaires

Prise en charge des fichiers de configuration de nettoyage Elasticsearch

jasontedor · 3Commentaires

Erreur lors de la tentative de définition d'un chemin absolu pour le fichier de synonymes/mots vides.

abrahamduran · 3Commentaires

[demande de fonctionnalité] détection de routage intelligent lors de la recherche

makeyang · 3Commentaires

Le paramètre max_clause_count n'est pas documenté

dawi · 3Commentaires

Elasticsearch: API de mise à jour : mise à jour par requête

1583 permet de mettre à jour des documents individuels. La mise à jour par requête réduira radicalement les allers-retours réseau si vous souhaitez mettre à jour un certain nombre de documents et transférer le travail du client vers ES.

Commentaire le plus utile

Tous les 160 commentaires

Répondez directement à cet e-mail ou consultez-le sur Gi tHubhttps://github.com/elasticsearch/elasticsearch/issues/1607#issuecomment -33917801 .

Questions connexes

Répondez directement à cet e-mail ou consultez-le sur Gi tHubhttps://github.com/elasticsearch/elasticsearch/issues/1607#issuecomment -33917801
.