Registry: Erstellen Sie eine DiSSCo-Netzwerkeinheit

Erstellt am 18. Jan. 2021  ·  17Kommentare  ·  Quelle: gbif/registry

DiSSCo möchte eine Netzwerkeinheit, die die Datensätze enthält, die von den relevanten Institutionen stammen.
Wouter A hat eine Tabelle mit den GBIF-Schlüsseln vorbereitet.

  • Wouter bittet darum, es sich vorher in UAT anzusehen. Wir sollten es erstellen, aber da UAT nicht groß genug ist, um alle Daten zu crawlen, bin ich mir über die Vorteile nicht sicher. Das Erstellen eines wiederholbaren SQL-Skripts zur Verwendung mit UAT und prod erscheint sinnvoll
  • Ich schlage vor, dass wir auch die ROR- und GRID-IDs als zusätzliche Identifikatoren zu den relevanten Einträgen in einem separaten SQL-Skript hinzufügen

Hilfreichster Kommentar

Da GrSciColl-Institutionen und GBIF-Organisationen derzeit völlig getrennt sind, würden Sie dies meines Wissens idealerweise in beiden tun.

Alle 17 Kommentare

Wie würden Sie die ROR- und GRID-IDs als „Tags“ oder als DwC-Feld (institutionID) hinzufügen, was ist mit dem (oft unterschiedlichen) Institutionsnamen im EML-Profil und wie wäre der Prozess bezüglich der Registrierung als Teil des Netzwerks und der Registrierung? diese IDs für neue Datensätze, die von DiSSCo-Partnern hinzugefügt wurden, oder für neue Partner, die GBIF-Datenanbieter werden?

Wie würden Sie die ROR- und GRID-IDs als "Tags" oder als DwC-Feld (Institutions-ID) hinzufügen?

Tags wären eine Option, aber ich würde den Entitäten nur ein identifier vorschlagen, wo es Sinn macht. Wir unterstützen mehrere Bezeichner auf allen Instanzen in der Registrierung. Dies hat keine Auswirkungen auf Ereignisaufzeichnungen, sondern ermöglicht lediglich das Auffinden der Organisation im Register anhand der ID.

Was ist mit dem (oft unterschiedlichen) Institutionsnamen im EML-Profil?

In GBIF wäre es nicht betroffen. Es sagt lediglich „dieser Eintrag in der Registrierung ist auch als eine andere ID bekannt“ und ändert nicht den Namen, unter dem die Organisation in GBIF registriert wurde. Der Name kann jedoch bei Bedarf jederzeit geändert werden.

und wie wäre der Prozess bezüglich der Registrierung als Teil des Netzwerks und der Registrierung dieser IDs für neue Datensätze, die von DiSSCo-Partnern hinzugefügt werden, oder für neue Partner, die GBIF-Datenanbieter werden?

Die Registrierung von Datensätzen und Institutionen in GBIF funktioniert wie gewohnt. Die Autorisierung zum Kuratieren der Mitgliedschaft für die Netzwerkeinträge (dh Hinzufügen oder Entfernen von GBIF-Datensätzen zum DiSSCo-Eintrag) kann nach Wunsch einem oder mehreren Konten erteilt werden. Mit der Zeit werden wir wahrscheinlich die Mitgliedschaft irgendwie automatisieren wollen.

Zum Netzwerk:

Zum Testen habe ich ein Netzwerk in UAT erstellt: https://registry.gbif-uat.org/network/9400230d-de38-4e0e-b44d-fcdb661f0519
Ich habe dafür ein Skript mit der API geschrieben, damit es in prod reproduziert werden kann.

Die Bestandteile des Netzwerks sind alle Datensätze, die von den in der Tabelle aufgeführten GBIF-Organisationen veröffentlicht werden, die DiSSCo-Mitglieder sind (disscoMember == "y").
NB: In UAT umfasst dies alle Arten von Testdatensätzen (jedoch nicht alle in Prod verfügbaren Datensätze).

Ich möchte diesen Thread nicht kapern, aber ist es nicht sinnvoller, ROR- und GRID-IDs mit GRSciColl-Institutionen zu verknüpfen, anstatt mit GBIF-Organisationen?

Ich möchte diesen Thread nicht kapern, aber ist es nicht sinnvoller, ROR- und GRID-IDs mit GRSciColl-Institutionen zu verknüpfen, anstatt mit GBIF-Organisationen?

Danke @rukayaj . Ja, beides macht jedoch Sinn, da GRSciColl immer nur eine Teilmenge der Verlagsorganisationen in GBIF enthalten wird

Da GrSciColl-Institutionen und GBIF-Organisationen derzeit völlig getrennt sind, würden Sie dies meines Wissens idealerweise in beiden tun.

Ok, ich hatte vergessen, dass GRSciColl für Institute mit physischen Sammlungen war ... Ich denke also, dass Sie sagen, dass einige Forschungseinrichtungen nicht in GRSciColl passen (da sie keine physischen Sammlungen haben), aber diese Institutionen hätten ROR und GRID IDs? Das macht dann Sinn, und in diesem Fall denke ich, dass es besser wäre, nur GRIDs/RORs an einem Ort zu haben.

@wouteraddink Sie werden in der Benutzeroberfläche des Portals irgendwie mit dem Fuzzy-Matching verknüpft, z. B. https://www.gbif.org/occurrence/2579432371?

GRID- und ROR-Diskussion zu diesem anderen Problem: https://github.com/gbif/registry/issues/274

Ich würde gerne sehen, dass ROR/GRID/ISNI pro Vorkommensdatensatz mit dwc:institutionID verwendet werden (um Institutions-IDs in der EML zu überschreiben - da sie anscheinend sogar innerhalb desselben DarwinCore-Archivs unterschiedlich sein könnten).

(Der Ereignisdatensatz bezieht sich auf das Ereignis; während der GRSciColl-Datensatz sich auf die Institution bezieht – die institutionID-Eigenschaft des Ereignisdatensatzes würde die beiden verbinden/überbrücken)

Ich denke, im Prinzip könnten Sie problemlos ein ROR/GRID/ISNI in dwc:institutionID verwenden, aber es widerspricht der aktuellen Empfehlung in der DwC-Dokumentation. Ich denke, als Community müssen wir diese Empfehlung ändern.

Danke Marie, ich sehe das Netzwerk jetzt in UAT, aber es wäre schön, wenn es standardmäßig nur für Beispieldatensätze gefiltert würde. Außerdem ist https://www.gbif-uat.org/network/9400230d-de38-4e0e-b44d-fcdb661f0519 noch leer?

Außerdem ist https://www.gbif-uat.org/network/9400230d-de38-4e0e-b44d-fcdb661f0519 noch leer?

Alle Datensätze müssen erneut verarbeitet werden, um die networkKey im Index aufzunehmen

+ die Übersichtsseite muss in einem anderen System bearbeitet werden (das können wir in der Produktion machen).

Soll ich die Datensätze einbeziehen, die einige konservierte Exemplare oder nur konservierte Exemplare enthalten?

Ich würde auch Datensätze einbeziehen, die einige erhaltene Exemplare enthalten. Sie sind sich nicht sicher, wie sich dies auf die Anzahl auf der Übersichtsseite auswirken würde. Basieren diese auf Datensätzen oder Datensätzen?

Die Metriken werden basierend auf den Datensätzen der zum Netzwerk gehörenden Datensätze generiert. Das bedeutet, wenn ich einen Datensatz tagge, der Beobachtungen enthält, werden diese Beobachtungen in die Metriken aufgenommen.

@wouteraddink bei GBIF Norwegen haben wir jetzt alle GBIF-Datenherausgeber des Universitätsmuseums (nicht für ROR und Grid berechtigt) auf die Universitätsebene (mit ROR und Grid) verschoben und mit den eventuellen GBIF-Datenherausgebern zusammengeführt (entsprechende Datensätze verschoben). erstellt für Universitätsfakultäten für Biologie und Geologie.

Unser Ziel ist es, dem Grundsatz zu folgen, dass norwegische GBIF-Datenherausgeber juristische Personen sein sollten, die sich für eine ROR und eine Grid-ID qualifizieren/berechtigt sind. (Und kurz damit begonnen, berechtigten Datenherausgebern, die noch kein ROR haben, vorzuschlagen, sich für diese ID zu registrieren).

Ich habe Ihre Tabelle „CETAF+DiSSCo-Institutionen“ mithilfe von „Kommentaren“ aktualisiert (wobei die Zeilen 121-122 zusammengeführt würden).

Danke für die Info @dagendresen. Ich habe sowohl mit GRID als auch mit ROR gesprochen, GRID verschärft ihre Richtlinien, die getrennte Identifikatoren für Institutionen, die in Universitäten verkörpert sind, nicht mehr zulassen. ROR ist immer noch 1:1 mit GRID synchronisiert, aber das kann sich später in diesem Jahr ändern und sie werden wahrscheinlich eine entspanntere Politik haben, auch eine ROR WG ​​arbeitet an einer Erweiterung für Abteilungen, aber das ist in einem frühen Entwicklungsstadium und ist es nicht noch entschieden, ob diese direkt über ROR oder über Wikidata oder Github geprägt werden. Für DiSSCo können wir jetzt mit ROR arbeiten, da es jetzt über ein vollständig implementiertes Metadatenschema verfügt, das Beziehungen zu übergeordneten Organisationen enthält, und wenn Institutionen kein ROR erhalten können, können wir Cetaf-Pass-Identifikatoren verwenden und sie bei Bedarf mit ihrem Universitäts-ROR verknüpfen. Orcid hat ROR noch nicht implementiert, plant dies aber.

War diese Seite hilfreich?
0 / 5 - 0 Bewertungen

Verwandte Themen

MortenHofft picture MortenHofft  ·  24Kommentare

marcos-lg picture marcos-lg  ·  11Kommentare

timrobertson100 picture timrobertson100  ·  9Kommentare

ManonGros picture ManonGros  ·  12Kommentare

rukayaj picture rukayaj  ·  14Kommentare