Registry: Sincronizar con Index Herbariorum

Creado en 11 dic. 2019  ·  9Comentarios  ·  Fuente: gbif/registry

Index Herbariorum es un catálogo autorizado que debería ser la fuente maestra para las entidades de Herbario. Los registros de herbarios en el registro deben mantenerse sincronizados con los esfuerzos de edición en curso de IH.

Esta primera iteración del trabajo tiene un alcance deliberado para acomodar la funcionalidad mínima necesaria para lograrlo. Una vez completadas, las solicitudes de funciones adicionales se pueden abrir como nuevas ediciones.

Está previsto que la sincronización general funcione de la siguiente manera:

  • Recupera todos los herbarios de IndexHerbariorum
  • Para cada entidad localice la Institución o Colección equivalente en GRSciColl utilizando el IH IRN

    • Si la entidad existe y difieren, actualice GrSciColl

    • Si la entidad no existe, insértela como institución y con un identificador titular del IH IRN

    • Si hay un conflicto (por ejemplo, múltiples opciones), notifique a los editores para su resolución

  • Crear, actualizar o eliminar los miembros del personal asociado para las entidades

Una versión futura puede permitir la edición de entidades IH en GRSciColl. En ese escenario, cuando las entidades difieren, se requiere una lógica más compleja, que probablemente requiera una notificación al personal de GRSciColl y IH para resolver las diferencias.

GRSciColl

Comentario más útil

Sugiero que traslademos las ideas relacionadas con ORCID a un nuevo problema para no confundir las cosas. Este ticket es específicamente para sincronizar GrSciColl e IH (es deseable pero no necesario agregar enlaces a cuentas ORCID)

El 8 de enero de 2020, a las 14:31, Kyle Copas [email protected] escribió:

Además, como sugirió Morten, podríamos usar los ORCiD cuando estén disponibles, pero dudo que la mayoría de la gente haya creado uno.

A partir de diciembre de 2017, había 454 000 usuarios en las ciencias biológicas que crearon identificaciones ORCID, una de las tres tasas de adopción más altas de cualquier disciplina. A decir verdad, debemos comprometernos con esto, usar la infraestructura existente (lo que incluye convertirse en miembro de ORCID, en mi opinión) y alentar a los miembros de la comunidad a registrarse, con la promesa de que podemos brindar valor por el servicio si lo hacen.

Tenga en cuenta que Bloodhound ya está utilizando ORCID para extraer afiliaciones institucionales pasadas y presentes, por ejemplo, https://bloodhound-tracker.net/organization/Q1122595. Todos ustedes sabrán mejor cómo funciona eso, pero también podríamos considerar esto como (¿parte de?) Nuestro enfoque...


Estás recibiendo esto porque te mencionaron.
Responda a este correo electrónico directamente, véalo en GitHub o cancele la suscripción.

Todos 9 comentarios

Las instituciones de IH tienen un campo contact que tiene solo un teléfono, un correo electrónico y una webUrl (http://sweetgum.nybg.org/science/api/v1/institutions/UARK). En una institución/colección GrSciColl tenemos un campo contacts pero en realidad son entidades persona (http://api.gbif.org/v1/grscicoll/institution/f7068d69-cf88-42d8-a984-0c4de6ce8579 cuyo contacto es http://api.gbif.org/v1/grscicoll/person/118b48f0-9af9-45ac-8ea9-d8221d7fa2af).

¿Qué debemos hacer con el contacto IH? ¿ignoralo? agregarlo como persona GrSciColl y vincularlo a la institución/colección? para este último se requiere el primer nombre, por lo que en ese caso necesitamos inventar uno.

No sé quién puede responder mejor a esto @timrobertson100 @MortenHofft @ManonGros

Esos campos de contacto no son para una persona. Son para el herbario como entidad. Por eso es importante que la gente vaya y venga. Estoy bastante seguro de que esto se consideraría esencial desde el punto de vista de IH y creo que también es importante. Así que sugeriría que extendiéramos nuestro modelo en su lugar. Pero mejor consulte con otros también.

En cuanto a las personas/personal. IH también tiene un punto final para ellos. Están, hasta donde yo sé, solo vinculados por códigos de institución. Con el tiempo deberíamos sincronizarlos también. Pero es posible que queramos discutir más sobre nuestro objetivo para manejar contactos de este tipo (ORCiD, etc.). @ManonGros , ¿tiene un enfoque preferido para esto?

Me gusta la idea de ampliar nuestro modelo.

Para los contactos del herbario, estoy de acuerdo contigo @MortenHofft , deberíamos extender nuestro modelo para tener algo como lo que tenemos para las organizaciones editoriales de GBIF (ver por ejemplo "email":["[email protected]"],"phone":["+47 99642071"] en http://api.gbif.org/ v1/organización/b670ea7c-48e7-45e4-ba66-5bf01ee4d398).

Para las personas/el personal, también estoy de acuerdo, también debemos sincronizar/importar a las personas. ¿Quizás incluso antes de que sincronicemos las instituciones? (Solo pregunto porque parecería lógico actualizar los contactos al sincronizar las instituciones de IH, pero esto requeriría tener personal actualizado).

Según tengo entendido, para nosotros, el personal/las personas pueden tener una institución principal pero estar afiliados a varias colecciones e instituciones. Mientras que para IH, una persona está asociada con un código de institución. Además, la información es un poco diferente (http://api.gbif.org/v1/grscicoll/person/118b48f0-9af9-45ac-8ea9-d8221d7fa2af y http://sweetgum.nybg.org/science/ih/person- detalles/?irn=131429).

Para sincronizar personas/personal, ¿debemos proceder como lo hacemos para la institución? Es decir, verificar la coincidencia semiautomáticamente primero. En caso afirmativo, ¿cómo podríamos vincularlos? No hay identificadores o etiquetas de máquina para las personas. Además, como sugirió Morten, podríamos usar los ORCiD cuando estén disponibles, pero dudo que la mayoría de la gente haya creado uno. E incluso para aquellos que tienen uno, primero debemos encontrarlos.

No sé si es posible en absoluto, pero idealmente me imagino algo así:

  1. Buscar ORCiD potencial para todo el personal/personas del GrSciColl (si tenemos confirmación de que el ORCiD es correcto para una determinada persona, sincronizar con este en prioridad)
  2. Haga coincidir y vincule la lista de personas de IH con el personal / personas de GrSciColl
  3. Actualice las entradas del personal de GrSciColl si es anterior a IH
  4. Sincronizar las instituciones GrSciColl con IH (según los identificadores que usamos para vincularlas después de nuestra comparación/verificación, por ejemplo, lo que hicimos en UAT)

Sé que no es tan simple, déjame saber lo que piensas.

Acerca del personal ya está en la descripción de esta tarea, así que estaba planeando sincronizarlos en este proceso. No creo que tengamos que hacer algo manualmente.

EDITAR: cuando dije que no creo que debamos hacer algo manualmente, quise decir que intentaré emparejarlos usando el nombre, el correo electrónico o cualquier otro campo representativo (hice algo similar en la última migración de la base de datos, aunque la coincidencia no es perfecto porque hay mucho personal duplicado pero solo con una dirección o teléfono diferente) y si no puedo coincidir con ninguno existente, crearé uno nuevo. Aún así, esta coincidencia no será perfecta como mencioné antes, si queremos que sea más precisa, entonces necesitamos una edición manual.

Además, como sugirió Morten, podríamos usar los ORCiD cuando estén disponibles, pero dudo que la mayoría de la gente haya creado uno.

A partir de diciembre de 2017, había 454 000 usuarios en las ciencias biológicas que crearon ID de ORCID, una de las tres tasas de adopción más altas de cualquier disciplina (consulte el Estudio de adopción de ORCID en todas las disciplinas y ubicaciones ). A decir verdad, debemos comprometernos con esto, usar la infraestructura existente (lo que incluye convertirse en miembro de ORCID, en mi opinión) y alentar a los miembros de la comunidad a registrarse, con la promesa de que podemos brindar valor por el servicio si lo hacen.

Tenga en cuenta que Bloodhound ya está utilizando ORCID para extraer afiliaciones institucionales pasadas y presentes, por ejemplo, https://bloodhound-tracker.net/organization/Q1122595. Todos ustedes sabrán mejor cómo funciona eso, pero también podríamos considerar esto como (¿parte de?) Nuestro enfoque...

Sugiero que traslademos las ideas relacionadas con ORCID a un nuevo problema para no confundir las cosas. Este ticket es específicamente para sincronizar GrSciColl e IH (es deseable pero no necesario agregar enlaces a cuentas ORCID)

El 8 de enero de 2020, a las 14:31, Kyle Copas [email protected] escribió:

Además, como sugirió Morten, podríamos usar los ORCiD cuando estén disponibles, pero dudo que la mayoría de la gente haya creado uno.

A partir de diciembre de 2017, había 454 000 usuarios en las ciencias biológicas que crearon identificaciones ORCID, una de las tres tasas de adopción más altas de cualquier disciplina. A decir verdad, debemos comprometernos con esto, usar la infraestructura existente (lo que incluye convertirse en miembro de ORCID, en mi opinión) y alentar a los miembros de la comunidad a registrarse, con la promesa de que podemos brindar valor por el servicio si lo hacen.

Tenga en cuenta que Bloodhound ya está utilizando ORCID para extraer afiliaciones institucionales pasadas y presentes, por ejemplo, https://bloodhound-tracker.net/organization/Q1122595. Todos ustedes sabrán mejor cómo funciona eso, pero también podríamos considerar esto como (¿parte de?) Nuestro enfoque...


Estás recibiendo esto porque te mencionaron.
Responda a este correo electrónico directamente, véalo en GitHub o cancele la suscripción.

Algo más a tener en cuenta para la sincronización:
A largo plazo, queremos que los registros de IH se editen directamente en IH y luego se sincronicen con GrSciColl.
Pero en este momento, tenemos un puñado de editores que ya han estado editando sus registros GrSciColl. Lo que significa que GrSciColl contiene la información más actualizada sobre una colección/institución que no es IH.
Mira este ejemplo:

Estos son solo algunos casos, pero sería bueno no sobrescribir estas entradas. Por ahora deberíamos comprobar las fechas modificadas antes de sincronizar y avisar a IH si la versión de GrSciColl está más actualizada.

En producción y programado para ejecutarse semanalmente.

¿Fue útil esta página
0 / 5 - 0 calificaciones