Registry: Mit Index Herbariorum synchronisieren

Erstellt am 11. Dez. 2019  ·  9Kommentare  ·  Quelle: gbif/registry

Index Herbariorum ist ein maßgeblicher Katalog, der die Hauptquelle für Herbaria-Einheiten sein sollte. Herbaria-Einträge im Register sollten mit den laufenden Bearbeitungsbemühungen des IH synchron gehalten werden.

Diese erste Iteration der Arbeit ist absichtlich so angelegt, dass sie die minimale Funktionalität enthält, die dazu erforderlich ist. Nach Abschluss können zusätzliche Funktionsanfragen als neue Probleme geöffnet werden.

Es ist vorgesehen, dass die allgemeine Synchronisierung wie folgt funktioniert:

  • Rufen Sie alle Herbarien von IndexHerbariorum ab
  • Suchen Sie für jede Entität die entsprechende Institution oder Sammlung in GRSciColl mit dem IH IRN

    • Wenn die Entität vorhanden ist und sie sich unterscheiden, aktualisieren Sie GrSciColl

    • Wenn die Entität nicht existiert, fügen Sie sie als Institution und mit einer Kennung ein, die die IH IRN enthält

    • Wenn es einen Konflikt gibt (z. B. mehrere Optionen), benachrichtigen Sie die Redakteure zur Lösung

  • Erstellen, aktualisieren oder löschen Sie die assoziierten Mitarbeiter für die Entitäten

Eine zukünftige Version kann die Bearbeitung von IH-Entitäten in GRSciColl ermöglichen. In diesem Szenario ist bei unterschiedlichen Entitäten eine komplexere Logik erforderlich, die wahrscheinlich eine Benachrichtigung der Mitarbeiter von GRSciColl und IH erfordert, um die Unterschiede zu beheben.

GRSciColl

Hilfreichster Kommentar

Ich schlage vor, dass wir ORCID-bezogene Ideen in eine neue Ausgabe verschieben, um die Dinge nicht zu vermischen. Dieses Ticket dient speziell dazu, GrSciColl und IH zu synchronisieren (das Hinzufügen von Links zu ORCID-Konten ist wünschenswert, aber nicht erforderlich).

Am 8. Januar 2020 um 14:31 Uhr schrieb Kyle Copas [email protected] :

Außerdem könnten wir, wie Morten vorgeschlagen hat, die ORCiDs verwenden, wenn sie verfügbar sind, aber ich bezweifle, dass die meisten Leute eine erstellt haben.

Im Dezember 2017 gab es 454.000 Benutzer in den Biowissenschaften, die ORCID-IDs erstellt haben – eine der drei höchsten Akzeptanzraten aller Disziplinen. Tbh, wir sollten uns dazu verpflichten, die vorhandene Infrastruktur nutzen (einschließlich ORCID-Mitglied zu werden, imo) und Mitglieder der Community ermutigen, sich anzumelden – mit dem Versprechen, dass wir einen Mehrwert für den Service bieten können, wenn sie dies tun.

Beachten Sie, dass Bloodhound bereits ORCIDs verwendet, um sowohl vergangene als auch gegenwärtige institutionelle Zugehörigkeiten abzurufen, z. B. https://bloodhound-tracker.net/organization/Q1122595. Sie alle werden besser wissen, wie das funktioniert, aber wir könnten dies auch als (Teil?) unseres Ansatzes betrachten …


Sie erhalten dies, weil Sie erwähnt wurden.
Antworten Sie direkt auf diese E-Mail, zeigen Sie sie auf GitHub an oder kündigen Sie sie.

Alle 9 Kommentare

Die Institutionen von IH haben ein contact -Feld, das nur ein Telefon, eine E-Mail und eine WebUrl enthält (http://sweetgum.nybg.org/science/api/v1/institutions/UARK). In einer GrSciColl-Institution/Sammlung haben wir ein contacts -Feld, aber sie sind tatsächlich Personenentitäten (http://api.gbif.org/v1/grscicoll/institution/f7068d69-cf88-42d8-a984-0c4de6ce8579, deren Kontakt ist http://api.gbif.org/v1/grscicoll/person/118b48f0-9af9-45ac-8ea9-d8221d7fa2af ).

Was sollen wir mit dem IH-Kontakt machen? ignoriere es? als GrSciColl-Person hinzufügen und mit der Institution/Sammlung verknüpfen? für letzteres ist der Vorname erforderlich, also müssen wir uns in diesem Fall einen ausdenken.

Ich weiß nicht, wer das am besten beantworten kann @timrobertson100 @MortenHofft @ManonGros

Diese Kontaktfelder sind nicht für eine Person bestimmt. Sie sind für das Herbarium als Ganzes. Es ist also wichtig, wie die Leute kommen und gehen. Ich bin mir ziemlich sicher, dass dies vom IH-Standpunkt aus als wesentlich angesehen wird, und ich habe das Gefühl, dass es auch wichtig ist. Daher würde ich vorschlagen, dass wir stattdessen unser Modell erweitern. Aber erkundige dich besser auch bei anderen.

Apropos Leute/Personal. Auch dafür hat IH einen Endpunkt. Sie sind - soweit ich weiß - nur durch Institutionscodes verknüpft. Mit der Zeit sollten wir diese auch synchronisieren. Aber vielleicht möchten wir mehr über unser Ziel für den Umgang mit Kontakten dieser Art (ORCiD usw.) diskutieren. @ManonGros hast du dafür einen bevorzugten Ansatz?

Mir gefällt die Idee, unser Modell zu erweitern.

Was die Herbarkontakte betrifft, so stimme ich Ihnen @MortenHofft zu , sollten wir unser Modell so erweitern, dass es so etwas wie das gibt, was wir für die GBIF-Verlagsorganisationen haben (siehe zum Beispiel "email":["[email protected]"],"phone":["+47 99642071"] in http://api.gbif.org/ v1/organization/b670ea7c-48e7-45e4-ba66-5bf01ee4d398).

Bei Personen/Mitarbeitern stimme ich auch zu, wir sollten die Personen ebenfalls synchronisieren/importieren. Vielleicht sogar bevor wir die Institutionen synchronisieren? (Ich frage nur, weil es logisch erscheint, die Kontakte bei der Synchronisierung der IH-Institutionen zu aktualisieren, aber dies würde erfordern, dass die Mitarbeiter/Personen auf dem neuesten Stand sind).

Soweit ich weiß, können Mitarbeiter/Personen für uns eine Hauptinstitution haben, aber mehreren Sammlungen und Institutionen angegliedert sein. Während für IH eine Person mit einem Institutionscode verknüpft ist. Außerdem sind die Informationen etwas anders (http://api.gbif.org/v1/grscicoll/person/118b48f0-9af9-45ac-8ea9-d8221d7fa2af und http://sweetgum.nybg.org/science/ih/person- Details/?irn=131429).

Sollen wir bei der Synchronisierung von Personen/Personal so vorgehen wie bei der Institution? Das heißt, zuerst halbautomatisch die Übereinstimmung prüfen. Wenn ja, wie könnten wir sie verknüpfen? Es gibt keine Identifikatoren oder Maschinen-Tags für Personen. Außerdem könnten wir, wie Morten vorgeschlagen hat, die ORCiDs verwenden, wenn sie verfügbar sind, aber ich bezweifle, dass die meisten Leute eine erstellt haben. Und selbst diejenigen, die einen haben, müssen wir zuerst finden.

Ich weiß nicht, ob es überhaupt möglich ist, aber idealerweise stelle ich mir so etwas vor:

  1. Finden Sie potenzielle ORCiD für alle Mitarbeiter/Personen von GrSciColl (wenn wir eine Bestätigung haben, dass die ORCiD für eine bestimmte Person korrekt ist, synchronisieren Sie diese vorrangig)
  2. Matchen und verknüpfen Sie die IH-Personenliste mit den GrSciColl-Mitarbeitern/Personen
  3. Aktualisieren Sie die GrSciColl-Personaleinträge, wenn sie älter als IH sind
  4. Synchronisieren Sie die GrSciColl-Institutionen mit IH (basierend auf den Identifikatoren, die wir verwenden, um sie nach unserem Abgleich/Überprüfung zu verknüpfen, z. B. was wir in UAT getan haben)

Ich weiß, es ist nicht so einfach, lassen Sie mich wissen, was Sie denken.

Informationen zu den Mitarbeitern sind bereits in der Beschreibung dieser Aufgabe enthalten, daher hatte ich vor, sie in diesem Prozess zu synchronisieren. Ich glaube nicht, dass wir etwas manuell tun müssen.

BEARBEITEN: Als ich sagte, ich glaube nicht, dass wir etwas manuell tun müssen, meinte ich, ich werde versuchen, sie anhand des Namens, der E-Mail-Adresse oder eines anderen repräsentativen Felds abzugleichen (ich habe bei der letzten DB-Migration etwas Ähnliches getan, obwohl der Abgleich ist nicht perfekt, weil es viele Mitarbeiter gibt, die doppelt vorhanden sind, aber nur mit unterschiedlichen Adressen oder Telefonnummern) und wenn ich mit keinem vorhandenen übereinstimmen kann, erstelle ich ein neues. Trotzdem wird diese Übereinstimmung nicht perfekt sein, wie ich bereits erwähnt habe. Wenn wir möchten, dass sie genauer ist, müssen wir sie manuell bearbeiten.

Außerdem könnten wir, wie Morten vorgeschlagen hat, die ORCiDs verwenden, wenn sie verfügbar sind, aber ich bezweifle, dass die meisten Leute eine erstellt haben.

Im Dezember 2017 gab es 454.000 Benutzer in den Biowissenschaften, die ORCID-IDs erstellt haben – eine der drei höchsten Adoptionsraten aller Disziplinen (siehe Studie zur ORCID-Adoption über Disziplinen und Standorte hinweg ). Tbh, wir sollten uns dazu verpflichten, die vorhandene Infrastruktur nutzen (einschließlich ORCID-Mitglied zu werden, imo) und Mitglieder der Community ermutigen, sich anzumelden – mit dem Versprechen, dass wir einen Mehrwert für den Service bieten können, wenn sie dies tun.

Beachten Sie, dass Bloodhound bereits ORCIDs verwendet, um sowohl vergangene als auch gegenwärtige institutionelle Zugehörigkeiten abzurufen, z. B. https://bloodhound-tracker.net/organization/Q1122595. Sie alle werden besser wissen, wie das funktioniert, aber wir könnten dies auch als (Teil?) unseres Ansatzes betrachten …

Ich schlage vor, dass wir ORCID-bezogene Ideen in eine neue Ausgabe verschieben, um die Dinge nicht zu vermischen. Dieses Ticket dient speziell dazu, GrSciColl und IH zu synchronisieren (das Hinzufügen von Links zu ORCID-Konten ist wünschenswert, aber nicht erforderlich).

Am 8. Januar 2020 um 14:31 Uhr schrieb Kyle Copas [email protected] :

Außerdem könnten wir, wie Morten vorgeschlagen hat, die ORCiDs verwenden, wenn sie verfügbar sind, aber ich bezweifle, dass die meisten Leute eine erstellt haben.

Im Dezember 2017 gab es 454.000 Benutzer in den Biowissenschaften, die ORCID-IDs erstellt haben – eine der drei höchsten Akzeptanzraten aller Disziplinen. Tbh, wir sollten uns dazu verpflichten, die vorhandene Infrastruktur nutzen (einschließlich ORCID-Mitglied zu werden, imo) und Mitglieder der Community ermutigen, sich anzumelden – mit dem Versprechen, dass wir einen Mehrwert für den Service bieten können, wenn sie dies tun.

Beachten Sie, dass Bloodhound bereits ORCIDs verwendet, um sowohl vergangene als auch gegenwärtige institutionelle Zugehörigkeiten abzurufen, z. B. https://bloodhound-tracker.net/organization/Q1122595. Sie alle werden besser wissen, wie das funktioniert, aber wir könnten dies auch als (Teil?) unseres Ansatzes betrachten …


Sie erhalten dies, weil Sie erwähnt wurden.
Antworten Sie direkt auf diese E-Mail, zeigen Sie sie auf GitHub an oder kündigen Sie sie.

Bei der Synchronisation ist noch etwas zu beachten:
Langfristig möchten wir, dass IH-Datensätze direkt in IH bearbeitet und dann mit GrSciColl synchronisiert werden.
Aber im Moment haben wir eine Handvoll Redakteure, die ihre GrSciColl-Datensätze bereits bearbeitet haben. Das bedeutet, dass GrSciColl die aktuellsten Informationen über eine Sammlung/Institution enthält, die nicht IH ist.
Siehe dieses Beispiel:

Dies sind nur wenige Fälle, aber es wäre schön, diese Einträge nicht zu überschreiben. Vorerst sollten wir die geänderten Daten vor der Synchronisierung überprüfen und IH benachrichtigen, wenn die GrSciColl-Version aktueller ist.

In Produktion und soll wöchentlich ausgeführt werden.

War diese Seite hilfreich?
0 / 5 - 0 Bewertungen