Registry: Crear entidad de red DiSSCo

Creado en 18 ene. 2021  ·  17Comentarios  ·  Fuente: gbif/registry

A DiSSCo le gustaría una entidad de red que contenga los conjuntos de datos que se originan en las instituciones pertinentes.
Wouter A ha preparado una hoja de cálculo con las claves GBIF.

  • Wouter pide verlo en UAT de antemano. Deberíamos crearlo, pero dado que UAT no tiene el tamaño suficiente para rastrear todos los datos, no estoy seguro de los beneficios. Crear un script SQL repetible para usar en UAT y prod parece sensato
  • Propongo que también agreguemos los ID de ROR y GRID como identificadores adicionales a las entradas relevantes en un script SQL separado.

Comentario más útil

Dado que las instituciones de GrSciColl y las organizaciones de GBIF están completamente separadas en este momento, hasta donde yo sé, lo ideal sería hacerlo en ambas.

Todos 17 comentarios

¿Cómo agregaría los ID de ROR y GRID, como "etiquetas" o como campo DwC (ID de institución), qué pasa con el nombre de la institución (a menudo diferente) en el perfil de EML y cuál sería el proceso para registrarse como parte de la red y registrarse estos ID, para nuevos conjuntos de datos agregados por socios de DiSSCo o nuevos socios que se convierten en proveedores de datos de GBIF?

¿Cómo agregaría los ID de ROR y GRID, como "etiquetas" o como campo DwC (ID de institución)

Las etiquetas serían una opción, pero propondría solo un identifier a las entidades donde tiene sentido. Admitimos múltiples identificadores en todas las instancias del registro. Esto no afecta los registros de ocurrencia, sino que simplemente permite encontrar la organización en el registro utilizando la ID.

¿Qué pasa con el nombre de la institución (a menudo diferente) en el perfil EML?

No se vería afectado en GBIF. Todo lo que hace es decir "esta entrada en el registro también se conoce como una ID diferente" y no cambiará el nombre con el que se registró la organización en GBIF. El nombre se puede cambiar en cualquier momento, aunque si lo desea.

y ¿cuál sería el proceso para registrarse como parte de la red y registrar estas identificaciones, para nuevos conjuntos de datos agregados por socios de DiSSCo o nuevos socios que se conviertan en proveedores de datos de GBIF?

El registro de conjuntos de datos e instituciones en GBIF funcionará como siempre lo ha hecho. La autorización para curar la membresía para las entradas de la red (es decir, agregar o eliminar conjuntos de datos GBIF a la entrada de DiSSCo) se puede otorgar a una o más cuentas, según se desee. Con el tiempo, probablemente querremos automatizar la membresía de alguna manera.

En cuanto a la Red:

Para probar, creé una red en UAT: https://registry.gbif-uat.org/network/9400230d-de38-4e0e-b44d-fcdb661f0519
Escribí un script usando la API para que pueda reproducirse en prod.

Los constituyentes de la red son todos los conjuntos de datos que publican las organizaciones de GBIF enumeradas en la hoja de cálculo que son miembros de DiSSCo (disscoMember == "y").
NB: En UAT, esto incluye todo tipo de conjuntos de datos de prueba (pero no todos los conjuntos de datos disponibles en prod).

No es mi intención secuestrar este hilo, pero ¿no tiene más sentido vincular los ID de ROR y GRID a las instituciones de GRSciColl en lugar de a las organizaciones de GBIF?

No es mi intención secuestrar este hilo, pero ¿no tiene más sentido vincular los ID de ROR y GRID a las instituciones de GRSciColl en lugar de a las organizaciones de GBIF?

Gracias @rukayaj . Sí, ambos tienen sentido, ya que GRSciColl solo contendrá un subconjunto de las organizaciones editoriales en GBIF.

Dado que las instituciones de GrSciColl y las organizaciones de GBIF están completamente separadas en este momento, hasta donde yo sé, lo ideal sería hacerlo en ambas.

Ok, se me había olvidado que GRSciColl era para institutos con colecciones físicas... Entonces creo que estás diciendo que algunas instituciones de investigación no encajan en GRSciColl (ya que no tienen colecciones físicas), pero estas instituciones tendrían ROR y GRID identificaciones? Eso tiene sentido entonces, y en ese caso creo que sería mejor tener GRIDs/RORs en un solo lugar.

@wouteraddink Están vinculados en la interfaz de usuario del portal con la coincidencia aproximada, por ejemplo , https://www.gbif.org/occurrence/2579432371?

Discusión de GRID y ROR relacionada con este otro problema: https://github.com/gbif/registry/issues/274

Me encantaría ver ROR/GRID/ISNI usado por registro de ocurrencia con dwc:institutionID (para anular los ID de instituciones en el EML, porque aparentemente podrían ser distintos incluso dentro del mismo DarwinCore-Archive).

(el registro de ocurrencia es sobre la ocurrencia; mientras que el registro GRSciColl es sobre la institución, la propiedad de ID de institución en el registro de ocurrencia vincularía/uniría los dos)

Creo que, en principio, podría usar un ROR/GRID/ISNI en dwc:institutionID sin problemas, pero va en contra de la recomendación actual en la documentación de DwC. Creo que como comunidad necesitamos cambiar esta recomendación.

Gracias Marie, veo la red ahora en UAT, sin embargo, sería bueno tenerla filtrada de forma predeterminada solo para conjuntos de datos de muestras. Además, https://www.gbif-uat.org/network/9400230d-de38-4e0e-b44d-fcdb661f0519 todavía está vacío.

Además, https://www.gbif-uat.org/network/9400230d-de38-4e0e-b44d-fcdb661f0519 todavía está vacío.

Todos los conjuntos de datos deben volver a procesarse para recoger el networkKey en el índice

+ la página de resumen debe editarse en otro sistema (podemos hacerlo en producción).

¿Debo incluir los conjuntos de datos que tienen algunos especímenes preservados o solo especímenes preservados?

Incluiría también conjuntos de datos que tienen algunos especímenes preservados. No estoy seguro de cómo influiría eso en los conteos en la página de descripción general, ¿se basan en registros o conjuntos de datos?

Las métricas se generan en base a los registros de los conjuntos de datos pertenecientes a la red. Esto significa que si etiqueto un conjunto de datos que contiene observaciones, estas observaciones se incluirán en las métricas.

@wouteraddink en GBIF Noruega ahora hemos movido todos los publicadores de datos GBIF de museos universitarios (no elegibles para ROR y Grid) al nivel universitario (con ROR y Grid) y los hemos fusionado (movido conjuntos de datos respectivos) con los eventuales publicadores de datos GBIF que han sido creado para los departamentos universitarios de biología y geología.

Nuestro objetivo es seguir el principio de que los editores de datos GBIF noruegos deben ser entidades que califican/son elegibles para un ROR y Grid ID. (Y comencé a sugerir brevemente que los editores de datos elegibles pero que aún no tienen un ROR se registren para esta identificación).

Actualicé su hoja de cálculo "Instituciones CETAF+DiSSCo" utilizando "comentarios" (donde se fusionarían las filas 121-122).

Gracias por la información @dagendresen. He estado hablando con GRID y ROR, GRID está endureciendo sus políticas y ya no permite identificadores separados para instituciones incorporadas en universidades. ROR todavía está sincronizado 1:1 con GRID, pero eso puede cambiar más adelante este año y es probable que tengan una política más relajada, también un ROR WG ​​está trabajando en una extensión para los departamentos, pero eso está en las primeras etapas de desarrollo y no es decidido aún si estos se acuñarán a través de ROR directamente o a través de wikidata o github. Para DiSSCo, ahora podemos trabajar con ROR, ya que ahora tiene un esquema de metadatos completamente implementado que incluye las relaciones de la organización principal y, si las instituciones no pueden obtener un ROR, podemos usar identificadores de pasaporte Cetaf y vincularlos a su Universidad ROR si es necesario. Orcid aún no ha implementado ROR pero lo está planeando.

¿Fue útil esta página
0 / 5 - 0 calificaciones

Temas relacionados

MortenHofft picture MortenHofft  ·  5Comentarios

MortenHofft picture MortenHofft  ·  24Comentarios

ManonGros picture ManonGros  ·  12Comentarios

timrobertson100 picture timrobertson100  ·  20Comentarios

rukayaj picture rukayaj  ·  14Comentarios