Elasticsearch: Update API: Update per Abfrage

Erstellt am 12. Jan. 2012 · 160Kommentare · Quelle: elastic/elasticsearch

1583 ermöglicht die Aktualisierung einzelner Dokumente. Die Aktualisierung per Abfrage reduziert die Netzwerk-Roundtrips radikal, wenn Sie eine Reihe von Dokumenten aktualisieren und Arbeit vom Client auf ES übertragen möchten.

curl -XPOST localhost:9200/index/type/_update -d '{
    "query" : { "constant_score" : { "filter" : { "term" : { "counter" : 0 } } } },
    "script" : "ctx._source.counter += count",
    "params" : {
        "count" : 4
    }
}'

:DistributeCRUD

Quelle

monken

👍3

Hilfreichster Kommentar

Update per Abfrage ist in 2.3.0 und 5.0.0-alpha-1 live. Die Dokumente sind hier .

nik9000 am 20. Apr. 2016

🎉6

Alle 160 Kommentare

Würde diese Funktion auch sehr lieben!

Mpdreamz am 12. Apr. 2012

r10r am 3. Juni 2012

darklow am 5. Juni 2012

mrgautamsam am 14. Juni 2012

feridgurbuz am 16. Juni 2012

gc20 am 25. Sept. 2012

serpent403 am 15. Nov. 2012

devilankur18 am 19. Nov. 2012

willtrking am 1. Dez. 2012

ignatiusreza am 10. Dez. 2012

kenshin54 am 13. Dez. 2012

noodlehaus am 3. Jan. 2013

Aoseala am 3. Jan. 2013

Ich brauche diese Funktion wirklich

timotta am 24. Jan. 2013

:+1:

burzum am 4. Feb. 2013

Während ich darauf warte, dass dieses Feature offiziell fertiggestellt und freigegeben wird, habe ich den Pull-Request #2231 als Plugin gepackt :
Habe Spaß.

ofavre am 13. Feb. 2013

bobbyrenwick am 27. Feb. 2013

geoffwatts am 27. Feb. 2013

AnSavvides am 28. Feb. 2013

neogenix am 4. März 2013

scriby am 4. März 2013

gnurag am 7. März 2013

damienalexandre am 28. März 2013

paulsabou am 11. Apr. 2013

acarrasco am 11. Apr. 2013

steegi am 11. Apr. 2013

thomasma am 17. Apr. 2013

oowl am 28. Apr. 2013

ttghr am 15. Mai 2013

acerb am 23. Mai 2013

lucaskatayama am 5. Juni 2013

:+1: :beten:

qw3r am 6. Juni 2013

sectronov am 11. Juni 2013

mguillermin am 13. Juni 2013

Gibt es eine Möglichkeit, die Bewertung der Abfrage als Parameter an das Aktualisierungsskript zu übergeben? Ich muss Einträge mit Bewertungen aktualisieren, die basierend auf den Feldern der untergeordneten Elemente aktualisiert wurden.

scottc52-zz am 27. Juni 2013

thlawiczka am 2. Juli 2013

dalibor-frivaldsky am 9. Juli 2013

anderson-arlen am 11. Juli 2013

@scottc52 Hast du es geschafft? Ich suche auch nach einer Möglichkeit, dies zu tun.

gboivin am 18. Juli 2013

jstray am 18. Juli 2013

@gboivin Nein. Ich mache eine has_child-Abfrage und sende eine separate Update-Anfrage, aber es ist langsam.

scottc52-zz am 18. Juli 2013

warte auch auf diese Funktion..

bugbuilder am 19. Juli 2013

YannBrrd am 1. Aug. 2013

khsibr am 1. Aug. 2013

theorm am 14. Aug. 2013

onokonem am 19. Aug. 2013

consulthys am 22. Aug. 2013

willtrking am 27. Aug. 2013

scoolen am 27. Aug. 2013

Habe nur ein kleines Drehbuch geschrieben, um auf etwas zu warten... mehr "Produktionsfertig" ;-)

https://github.com/YannBrrd/esNodeUpdater

Gerne kommentieren/aktualisieren...

YannBrrd am 2. Sept. 2013

denis-ryzhkov am 3. Sept. 2013

Gibt es einen offiziellen Status zu dieser Funktion vom Entwicklerteam? Ich sehe keine Eingaben von ihnen. Gibt es Pläne, diese Funktion zum Kern hinzuzufügen, oder wird es bevorzugt, dass Benutzer ein Plugin wie das oben aufgeführte verwenden ?

mastermatt am 25. Sept. 2013

Wir planen, zu diesem Thema zurückzukehren. Der Hauptgrund, warum wir dies auf Eis legen, ist, dass wir eine Möglichkeit haben müssen, vorhandene Aktualisierungen durch Abfragen zu stoppen, da sie versehentlich für eine große Datenmenge ausgeführt werden können, was zu Problemen führt. .

kimchy am 25. Sept. 2013

+1. Danke für das Update und die Arbeit daran.

emanuil-tolev am 2. Okt. 2013

kapso am 16. Okt. 2013

preetiraj am 18. Okt. 2013

alexkoltun am 20. Okt. 2013

eyardimci am 27. Okt. 2013

+1, hört sich nützlich an

kmarsh am 2. Nov. 2013

olsp am 6. Nov. 2013

pionize am 8. Nov. 2013

dularion am 11. Nov. 2013

abronner am 25. Nov. 2013

Vineeth-Mohan am 25. Nov. 2013

whatevercode am 4. Dez. 2013

mishu- am 9. Dez. 2013

kevinsteger am 10. Dez. 2013

MrHash am 12. Dez. 2013

kzachara am 12. Dez. 2013

+10

anderson-arlen am 12. Dez. 2013

Plasma am 28. Dez. 2013

kiyanwang am 6. Jan. 2014

vaidik am 10. Jan. 2014

Haben Sie schon einmal daran gedacht, diese Funktion mit einem doppelten HTTP-Aufruf zu implementieren. Ich denke an Wärmer, die die Möglichkeit bieten, die Abfrage zu speichern und dann auszuführen (es ist nicht wirklich dasselbe, aber es bringt mich zum Nachdenken).

@kimchy Sie sagen, dass Sie eine Möglichkeit finden, das Update zu stoppen, wenn es versehentlich mit einer großen Datenmenge gestartet wurde. Wenn Sie es stoppen, befinden sich möglicherweise indizierte Daten in einem ungültigen Zustand (vielleicht ist ein Rollback möglich ...?). Vielleicht ist ein besserer Ansatz, Fehler zu vermeiden.

Wenn Sie zwei HTTP-Aufrufe benötigen, bevor Sie das eigentliche Massenupdate auslösen (1 zum Vorbereiten und 1 zum wirklichen Auslösen mit einer Transaktions-ID dazwischen) und dann einen Update-Statushandler (wie den dataimporthandler in SolR), um zu wissen, wann die Abfrage wirklich abgeschlossen ist.

Ich bin mir nicht sicher, ob es wirklich klar ist, aber ich denke, es kann eine Lösung sein, um Fehlanrufe zu vermeiden...

shulard am 23. Jan. 2014

brsanthu am 28. Jan. 2014

yarinm am 29. Jan. 2014

Das möchte ich auch gerne bestätigen.

fuwaneko am 29. Jan. 2014

@kimchy : Leistung kann nicht die Frage sein: Derzeit führe ich Tausende von Abfragen durch, um Daten nachzuschlagen (z (zB um Klartextadresse hinzuzufügen). Meine Updates fügen neue Felder hinzu. Ein Bulk-Update innerhalb von ES muss effizienter sein als 10.000 Lookup-Abfragen + 10.000 Update-Anfragen (auch unter Verwendung von Bulk-Updates ...). Aus der Sicht der Codierung und der Laufzeit wäre es effizienter, zB die Bulk-Update-Datei bekommt 20.000 Zeilen und könnte mit der neuen Funktion nur 2 haben - alle Daten werden über das Netzwerk verschoben und ES ist damit beschäftigt, Bulk-Update-Dateien zu lesen ...

Vielleicht stimmen Sie zu, dem Update-Vorgang Grenzen hinzuzufügen, z. B. _update/_query=some_conditions&size=1000 auf diese Weise wird vermieden, dass eine Million Dokumente aktualisiert werden - und wir als Entwickler können entscheiden, ob wir 1000 * 1000 Updates ausführen, um eine Million Datensätze zu aktualisieren ... Es sollte die Anzahl der aktualisierten Dokumente zurückgeben, um eine gewisse Kontrolle zu haben, wenn ein weiterer Update-Aufruf erforderlich ist.

seti123 am 31. Jan. 2014

dhruvbansal am 31. Jan. 2014

Für mein Szenario (Records nach Lookups in anderen Indizes anreichern) könnte ich es anders machen: Daten zuerst in mongoDb einfügen, Lookups in ElasticSearch durchführen, Datensätze in Mongo aktualisieren, mongo river verwenden, um endgültige Ergebnisse in ElasticSearch zu erhalten, um sie in der GUI anzuzeigen (build auf ES). Hat jemand Erfahrung mit solchen Szenarien? Ich hoffte, ich könnte nur ES gehen ... bis jetzt habe ich die Verwendung einer DB in meinem Projekt abgelehnt.

seti123 am 3. Feb. 2014

Hallo,

du könntest dafür einfach Couchbase + Elasticsearch verwenden, als Couchbase
bietet eine Schnittstelle zu Elasticsearch

Herzliche Grüße,
Yann Barraud

2014-02-03 seti123 [email protected] :

Für mein Szenario (Anreicherung von Datensätzen nach Suchen in anderen Indizes) könnte ich
Machen Sie es anders: Fügen Sie zuerst Daten in mongoDb ein, suchen Sie in
ElasticSearch aktualisiert Datensätze in Mongo, verwenden Sie Mongo River, um endgültige Ergebnisse zu erhalten
in ElasticSearch, um es in der GUI anzuzeigen (auf ES aufbauen). Hat jemand
Erfahrung mit solchen Szenarien? Ich hoffte, ich könnte nur ES gehen ... bis
jetzt habe ich die Verwendung einer DB in meinem Projekt abgelehnt.
Antworten Sie direkt auf diese E-Mail oder zeigen Sie sie auf Gi tHub anhttps://github.com/elasticsearch/elasticsearch/issues/1607#issuecomment -33917801
.

YannBrrd am 3. Feb. 2014

weeyum am 11. Feb. 2014

+100

girak am 11. Feb. 2014

sulabhjain am 11. Feb. 2014

ncammarata am 23. Feb. 2014

Gibt es in ElasticSearch eine Alternative, zB ein Skript auszulösen, das eine Aktion ausführt, wenn neue Daten eingefügt oder aktualisiert werden? Eine Art Index-Trigger konnte mir helfen, die Vorverarbeitungskette zu entfernen (wir haben jetzt Message Ques mit REDIS- und 0MQ-Verarbeitungskette gemacht, bevor wir Daten in ES einfügen - all das kostet Netzwerkbandbreite, um Daten für die parallele Verarbeitung zu mischen ... )

Ich würde gerne ... sehen
http://localhost :9200/index/type/_preprocessBeforeIndex?script=myDataAnalysisScript
http://localhost :9200/index/type/_preprocessBeforeUpdate?script=myDataAnalysisScript
Das Skript muss in der Lage sein, dem aktuellen Datensatz neue Felder hinzuzufügen, bevor ES ihn speichert/indiziert (um eine doppelte Indexaktion nach Änderungen zu vermeiden). Da wir viel mit node.js arbeiten, sollten die Skripte in der gewünschten Sprache (in unserem Fall JavaScript) funktionieren.

Noch besser, wenn wir das Script im MAPPING pro Datentyp definieren könnten, anstatt auf einem generierten Indizes.
Gibt es ein Plug-In, das solche Skripte auslösen kann? Irgendeine Dokumentation zur Verwendung der ES API in Skripten?

seti123 am 23. Feb. 2014

xreal am 24. Feb. 2014

choonkeat am 12. März 2014

rotbackenpfeifdruesling am 12. März 2014

ghost am 17. März 2014

eirikgro am 17. März 2014

demockk am 18. März 2014

stormizin am 18. März 2014

ibagui am 19. März 2014

nkhare am 4. Apr. 2014

Warte auf diese Funktion... (+1)

gvolpe am 8. Apr. 2014

cosmin-marginean am 15. Apr. 2014

rpiccoli am 15. Apr. 2014

shuperok am 21. Apr. 2014

harishvolvoikar am 23. Apr. 2014

JGailor am 23. Apr. 2014

alari am 24. Apr. 2014

gabrielgambarini am 29. Apr. 2014

matheus2740 am 29. Apr. 2014

matthiasfeist am 9. Mai 2014

bhabegger am 13. Mai 2014

Ist diese Funktion überhaupt in Entwicklung?
Dies würde so viele Probleme lösen, die derzeit auf Anwendungsebene kaum zuverlässig zu bewältigen sind.

pmishev am 16. Mai 2014

fernandolins am 21. Mai 2014

fuyp am 23. Mai 2014

mvallebr am 30. Mai 2014

Nur um Sie daran zu erinnern, dass ich seit Mitte Februar 2013 den "offiziellen Pull-Request" #2231 über den Zweig von @martijnvg als Plugin gepackt und gepflegt habe:

ofavre am 30. Mai 2014

jalateras am 4. Juni 2014

ksaveras am 5. Juni 2014

MassiveMedia am 18. Juni 2014

jrots am 18. Juni 2014

+1
Wie ist es möglich, dass dieses Feature seit Februar 2013 immer noch nicht zum Master zusammengeführt wurde?

KrzysztofWilczek am 26. Juni 2014

+1
Dito auf

efuquen am 7. Juli 2014

dhanson358 am 9. Juli 2014

Wir haben dieses Problem vor einigen Monaten bekommen (siehe meine Beiträge als @seti123 Januar/Februar ) und ich möchte unsere Ergebnisse teilen - nachdem wir DB+ES River aufgegeben hatten (zu viele Sorgen über Versionsabhängigkeiten) haben wir unseren Anwendungsfall erfolgreich mit evaluiert Crate Data (das ES als Bibliothek verwendet und eine SQL-Schnittstelle für Mapping und Abfrage hinzufügt, einschließlich "Update by Query" https://crate.io/docs/stable/sql/dml.html#updating-data ).
Ein guter Ausgangspunkt, um über Ähnlichkeiten und Unterschiede zu lesen: https://crate.io/blog/crate_data_elasticsearch

megastef am 14. Juli 2014

Geschlossen zu Gunsten von #2230

clintongormley am 18. Juli 2014

leibale am 1. Jan. 2015

niemyjski am 20. Jan. 2015

rkleiren am 19. März 2015

idoshamun am 19. März 2015

fjarrett am 27. März 2015

raphaelMalie am 14. Apr. 2015

bogdanovich am 29. Apr. 2015

dbrambilla am 6. Mai 2015

binque am 15. Mai 2015

saval am 26. Mai 2015

artild am 29. Mai 2015

bn96 am 1. Juni 2015

vkopitsa am 7. Juni 2015

ifgh am 12. Juni 2015

fabriciomassula am 11. Juli 2015

wird durch Abfrageunterstützung setPostFilter aktualisiert?
Ausgabe # 12295

Praveen82 am 17. Juli 2015

vitaliikapliuk am 20. Juli 2015

xelllee am 4. Aug. 2015

IUnknownPtr am 14. Aug. 2015

leonklinke am 24. Aug. 2015

ispringer am 1. Sept. 2015

sapkalrohan am 2. Sept. 2015

fiserro am 4. Sept. 2015

mobalytics am 11. Sept. 2015

marioeu am 16. Sept. 2015

ogorun am 16. Sept. 2015

ron521 am 3. Nov. 2015

kann das jemand überprüfen und Feedback geben.
https://discuss.elastic.co/t/updatebyqueryresponse-throwing-timeout/29176

Aktualisierung durch Abfrage schlägt fehl, während mehr als 20+ Millionen Datensätze aktualisiert werden.

Praveen82 am 3. Nov. 2015

@ Praveen82 Sie verwenden ein Drittanbieter-Plugin. Dies ist nicht der richtige Ort, um Support anzufordern. Sie sollten dies als Problem im Repository dieses Plugins veröffentlichen.

rayward am 4. Nov. 2015

https://github.com/elastic/elasticsearch/pull/15125 implementiert eine Syntax, die ein wenig so aussieht

curl -XPOST localhost:9200/index/type/_update_by_query -d '{
    "query" : { "term" : { "counter" : 0 } },
    "script" : {
      "inline": "ctx._source.counter += count",
      "params" : {
          "count" : 4
      }
  }
}'

Der Grund, warum dies so lange ins Stocken geraten war

Wie auch immer, #15125 und alle Folge-PRs sind der richtige Ort, um nach dieser Funktion zu suchen.

nik9000 am 19. Dez. 2015

greg-symphony am 2. März 2016

YuriMarinkov am 15. März 2016

canyildiz am 22. März 2016

JohnTian am 22. März 2016

yossicahen am 20. Apr. 2016

Update per Abfrage ist in 2.3.0 und 5.0.0-alpha-1 live. Die Dokumente sind hier .

nik9000 am 20. Apr. 2016

🎉6

Unterstützt das Update per Abfrage in 2.3.+ oder 5.+ das Javascript-Plugin?

scohenenator am 9. Aug. 2016

Unterstützt das Update per Abfrage in 2.3.+ oder 5.+ das Javascript-Plugin?

Wenn du es wirklich willst, klar. In 2.3+ testen wir Update-by-Query gegen groovy und in 5.+ testen wir gegen schmerzlos. Wir haben früher gegen groovy getestet und es hat auch dort funktioniert. Ich gehe davon aus, dass Javascript gut funktioniert.

nik9000 am 9. Aug. 2016

JS-Unterstützung wäre ziemlich glatt.

scohenenator am 9. Aug. 2016

JS-Unterstützung wäre ziemlich glatt.

Wie gesagt, es existiert, man muss nur das Plugin installieren.

Das Problem bei all diesen Sprachen besteht darin, dass ihre Implementierung in der JVM nicht richtig auf die Einbettung ausgerichtet ist. Aus diesem Grund nehmen wir es nicht standardmäßig auf.

Wie auch immer, wenn Sie mehr darüber sprechen möchten, denke ich, dass diskussion.elastic.co der geeignetere Ort dafür ist.

nik9000 am 9. Aug. 2016

War diese Seite hilfreich?

0 / 5 - 0 Bewertungen

Elasticsearch: Update API: Update per Abfrage

1583 ermöglicht die Aktualisierung einzelner Dokumente. Die Aktualisierung per Abfrage reduziert die Netzwerk-Roundtrips radikal, wenn Sie eine Reihe von Dokumenten aktualisieren und Arbeit vom Client auf ES übertragen möchten.

Hilfreichster Kommentar

Alle 160 Kommentare

Antworten Sie direkt auf diese E-Mail oder zeigen Sie sie auf Gi tHub anhttps://github.com/elasticsearch/elasticsearch/issues/1607#issuecomment -33917801
.

Verwandte Themen

Elasticsearch: Update API: Update per Abfrage

1583 ermöglicht die Aktualisierung einzelner Dokumente. Die Aktualisierung per Abfrage reduziert die Netzwerk-Roundtrips radikal, wenn Sie eine Reihe von Dokumenten aktualisieren und Arbeit vom Client auf ES übertragen möchten.

Hilfreichster Kommentar

Alle 160 Kommentare

Antworten Sie direkt auf diese E-Mail oder zeigen Sie sie auf Gi tHub anhttps://github.com/elasticsearch/elasticsearch/issues/1607#issuecomment -33917801 .

Verwandte Themen

Antworten Sie direkt auf diese E-Mail oder zeigen Sie sie auf Gi tHub anhttps://github.com/elasticsearch/elasticsearch/issues/1607#issuecomment -33917801
.