Registry: Créer une entité réseau DiSSCo

Créé le 18 janv. 2021  ·  17Commentaires  ·  Source: gbif/registry

DiSSCo souhaite une entité réseau contenant les ensembles de données provenant des institutions concernées.
Wouter A a préparé une feuille de calcul avec les clés GBIF.

  • Wouter demande à le voir en UAT au préalable. Nous devrions le créer, mais comme UAT n'est pas suffisamment dimensionné pour explorer toutes les données, je ne suis pas sûr des avantages. Créer un script SQL répétable à utiliser sur UAT et prod semble judicieux
  • Je propose que nous ajoutions également les identifiants ROR et GRID en tant qu'identifiants supplémentaires aux entrées pertinentes dans un script SQL séparé

Commentaire le plus utile

Étant donné que les institutions GrSciColl et les organisations GBIF sont complètement séparées pour le moment, pour autant que je sache, vous devriez idéalement le faire dans les deux.

Tous les 17 commentaires

Comment ajouteriez-vous les identifiants ROR et GRID, en tant que "balises" ou en tant que champ DwC (institutionID), qu'en est-il du nom de l'institution (souvent différent) dans le profil EML et quel serait le processus d'enregistrement dans le cadre du réseau et d'enregistrement ces identifiants, pour les nouveaux ensembles de données ajoutés par les partenaires DiSSCo ou les nouveaux partenaires devenant un fournisseur de données GBIF ?

Comment ajouteriez-vous les identifiants ROR et GRID, en tant que "tags" ou en tant que champ DwC (institutionID)

Les balises seraient une option, mais je proposerais juste un identifier aux entités où cela a du sens. Nous prenons en charge plusieurs identifiants sur toutes les instances du registre. Cela n'a aucun effet sur les enregistrements d'occurrences, mais permet simplement de trouver l'organisation dans le registre à l'aide de l'ID.

qu'en est-il du nom de l'établissement (souvent différent) dans le profil EML

Cela ne serait pas affecté dans le GBIF. Tout ce qu'il fait, c'est dire "cette entrée dans le registre est également connue sous le nom d'un ID différent" et ne changera pas le nom sous lequel l'organisation a été enregistrée dans le GBIF. Le nom peut être modifié à tout moment si cela est souhaitable.

et quel serait le processus concernant l'enregistrement en tant que membre du réseau et l'enregistrement de ces identifiants, pour les nouveaux ensembles de données ajoutés par les partenaires DiSSCo ou les nouveaux partenaires devenant un fournisseur de données GBIF ?

L'enregistrement des ensembles de données et des institutions dans le GBIF fonctionnera comme ils l'ont toujours fait. L'autorisation d'organiser l'adhésion pour les entrées du réseau (c'est-à-dire l'ajout ou la suppression d'ensembles de données GBIF à l'entrée DiSSCo) peut être accordée à un ou plusieurs comptes si nécessaire. Avec le temps, nous voudrons probablement automatiser l'adhésion d'une manière ou d'une autre.

Concernant le Réseau :

Pour tester, j'ai créé un réseau en UAT : https://registry.gbif-uat.org/network/9400230d-de38-4e0e-b44d-fcdb661f0519
J'ai écrit un script en utilisant l'API pour cela afin qu'il puisse être reproduit en prod.

Les constituants du réseau sont tous les ensembles de données publiés par les organisations GBIF répertoriées dans la feuille de calcul qui sont membres de DiSSCo (disscoMember == "y").
NB : dans UAT, cela inclut toutes sortes de jeux de données de test (mais pas tous les jeux de données disponibles en prod).

Cela ne veut pas dire détourner ce fil, mais n'est-il pas plus logique de lier les identifiants ROR et GRID aux institutions GRSciColl plutôt qu'aux organisations GBIF ?

Cela ne veut pas dire détourner ce fil, mais n'est-il pas plus logique de lier les identifiants ROR et GRID aux institutions GRSciColl plutôt qu'aux organisations GBIF ?

Merci @rukayaj . Oui, les deux ont du sens, car GRSciColl ne contiendra jamais qu'un sous-ensemble des organisations d'édition dans GBIF

Étant donné que les institutions GrSciColl et les organisations GBIF sont complètement séparées pour le moment, pour autant que je sache, vous devriez idéalement le faire dans les deux.

Ok, j'avais oublié que GRSciColl était destiné aux instituts avec des collections physiques ... Donc je pense que vous dites que certaines institutions de recherche ne rentrent pas dans GRSciColl (car elles ne détiennent pas de collections physiques), mais ces institutions auraient ROR et GRID identifiants ? Cela a du sens alors, et dans ce cas, je pense qu'il serait préférable d'avoir simplement les GRID/ROR au même endroit.

@wouteraddink Ils sont en quelque sorte liés dans l'interface utilisateur du portail avec la correspondance floue, par exemple https://www.gbif.org/occurrence/2579432371?

Discussion GRID et ROR liée à cet autre problème : https://github.com/gbif/registry/issues/274

J'aimerais voir ROR/GRID/ISNI utilisé par enregistrement d'occurrence avec dwc:institutionID (pour remplacer les identifiants d'institution dans l'EML - car ils pourraient apparemment être distincts même au sein de la même DarwinCore-Archive).

(l'enregistrement de l'occurrence concerne l'occurrence ; tandis que l'enregistrement GRSciColl concerne l'institution -- la propriété institutionID sur l'enregistrement de l'occurrence relierait/rapprocherait les deux)

Je pense qu'en principe, vous pouvez utiliser un ROR/GRID/ISNI dans dwc:institutionID sans problème, mais cela va à l'encontre de la recommandation actuelle dans la documentation DwC. Je pense qu'en tant que communauté, nous devons changer cette recommandation.

Merci Marie, je vois maintenant le réseau dans UAT, cependant, ce serait bien de l'avoir filtré par défaut pour les ensembles de données spécimen uniquement. De plus, https://www.gbif-uat.org/network/9400230d-de38-4e0e-b44d-fcdb661f0519 est toujours vide ?

De plus, https://www.gbif-uat.org/network/9400230d-de38-4e0e-b44d-fcdb661f0519 est toujours vide ?

Tous les ensembles de données doivent être retraités pour récupérer les networkKey dans l'index

+ la page de résumé doit être éditée dans un autre système (nous pouvons le faire en production).

Dois-je inclure les ensembles de données qui contiennent des spécimens conservés ou uniquement des spécimens conservés ?

J'inclurais également des ensembles de données contenant des spécimens préservés. Vous ne savez pas comment cela influencerait les décomptes sur la page de présentation, ces enregistrements ou ensembles de données sont-ils basés ?

Les métriques sont générées sur la base des enregistrements des jeux de données appartenant au réseau. Cela signifie que si je tague un jeu de données contenant des observations, ces observations seront incluses dans les métriques.

@wouteraddink au GBIF Norvège, nous avons maintenant déplacé tous les éditeurs de données GBIF du musée universitaire (non éligibles pour ROR et Grid) au niveau universitaire (avec ROR et Grid) et fusionné (ensembles de données respectifs déplacés) avec les éventuels éditeurs de données GBIF qui ont été créé pour les départements universitaires de biologie et de géologie.

Notre objectif est de suivre le principe selon lequel les éditeurs de données GBIF norvégiens doivent être des entités qui se qualifient/sont éligibles pour un ROR et un Grid ID. (Et brièvement commencé à suggérer aux éditeurs de données éligibles mais pas encore avec un ROR de s'inscrire pour cet ID).

J'ai mis à jour votre feuille de calcul "CETAF+DiSSCo institutions" en utilisant des "commentaires" (où les lignes 121-122 seraient fusionnées).

Merci pour l'info @dagendresen. J'ai parlé à la fois avec GRID et ROR, GRID resserre leurs politiques en n'autorisant plus les identifiants séparés pour les institutions incarnées dans les universités. ROR est toujours synchronisé 1: 1 avec GRID, mais cela pourrait changer plus tard cette année et ils auront probablement une politique plus détendue, un groupe de travail ROR travaille également sur une extension pour les départements, mais cela en est aux premiers stades de développement et ce n'est pas décidé encore si ceux-ci seront frappés directement via ROR ou via wikidata ou github. Pour DiSSCo, nous pouvons désormais travailler avec ROR car il dispose désormais d'un schéma de métadonnées entièrement mis en œuvre, y compris les relations avec l'organisation mère et si les institutions ne peuvent pas obtenir de ROR, nous pouvons utiliser les identifiants de passeport cetaf et les lier à leur ROR universitaire si nécessaire. Orcid n'a pas encore implémenté ROR mais le prévoit.

Cette page vous a été utile?
0 / 5 - 0 notes