Registry: Sincronize com Index Herbariorum

Criado em 11 dez. 2019  ·  9Comentários  ·  Fonte: gbif/registry

O Index Herbariorum é um catálogo oficial que deve ser a fonte principal para as entidades Herbaria. Os registros de herbários no registro devem ser mantidos em sincronia com os esforços contínuos de edição do IH.

Essa primeira iteração de trabalho é deliberadamente planejada para acomodar a funcionalidade mínima necessária para conseguir isso. Depois de concluídos, solicitações de recursos adicionais podem ser abertas como novos problemas.

Prevê-se que a sincronização geral funcionará da seguinte forma:

  • Recupere todos os Herbários do IndexHerbariorum
  • Para cada entidade localize a Instituição ou Coleção equivalente no GRSciColl usando o IH IRN

    • Se a entidade existir e forem diferentes, atualize o GrSciColl

    • Caso a entidade não exista, insira-a como instituição e com identificador titular do IH IRN

    • Se houver um conflito (por exemplo, várias opções) notifique os editores para resolução

  • Criar, atualizar ou excluir os funcionários associados das entidades

Uma versão futura poderá permitir a edição de entidades IH no GRSciColl. Nesse cenário, quando as entidades diferem, é necessária uma lógica mais complexa, provavelmente exigindo notificação à equipe da GRSciColl e do IH para resolver as diferenças.

GRSciColl

Comentários muito úteis

Sugiro que movamos as ideias relacionadas ao ORCID para uma nova edição para não confundir as coisas. Este ticket é especificamente para sincronizar GrSciColl e IH (adicionar links para contas ORCID é desejável, mas não necessário)

Em 8 de janeiro de 2020, às 14:31, Kyle Copas [email protected] escreveu:

Além disso, como o Morten sugeriu, poderíamos usar os ORCiDs quando disponíveis, mas duvido que a maioria das pessoas tenha criado um.

Em dezembro de 2017, havia 454.000 usuários nas ciências biológicas que criaram IDs ORCID – uma das três maiores taxas de adoção de qualquer disciplina. Tbh, devemos nos comprometer com isso, usar a infraestrutura existente (incluindo tornar-se um membro do ORCID, imo) e incentivar os membros da comunidade a se inscreverem - a promessa é que podemos fornecer valor pelo serviço se o fizerem.

Observe que o Bloodhound já está usando ORCIDs para obter afiliação institucional passada e presente, por exemplo, https://bloodhound-tracker.net/organization/Q1122595. Todos vocês saberão melhor como isso funciona, mas também podemos considerar isso como (parte?) de nossa abordagem…


Você está recebendo isso porque foi mencionado.
Responda a este e-mail diretamente, visualize-o no GitHub ou cancele a inscrição.

Todos 9 comentários

As instituições do IH possuem um campo contact que possui apenas telefone, e-mail e webUrl (http://sweetgum.nybg.org/science/api/v1/institutions/UARK). Em uma instituição/coleção GrSciColl temos um campo contacts mas na verdade são entidades pessoais (http://api.gbif.org/v1/grscicoll/institution/f7068d69-cf88-42d8-a984-0c4de6ce8579 cujo contato é http://api.gbif.org/v1/grscicoll/person/118b48f0-9af9-45ac-8ea9-d8221d7fa2af ).

O que devemos fazer com o contato do IH? ignore isto? adicioná-lo como uma pessoa GrSciColl e vinculá-lo à instituição/coleção? para este último, o primeiro nome é necessário, então, nesse caso, precisamos criar um.

Não sei quem pode responder melhor @timrobertson100 @MortenHofft @ManonGros

Esses campos de contato não são para uma pessoa. Eles são para o herbário como uma entidade. Por isso, é importante que as pessoas vêm e vão. Tenho certeza de que isso seria considerado essencial do ponto de vista do IH e meu sentimento é que também é importante. Então, sugiro que estendêssemos nosso modelo. Mas é melhor verificar com os outros também.

Quanto às pessoas/funcionários. IH tem um ponto final para eles também. Eles são - que eu saiba - apenas vinculados por códigos de instituições. Com o tempo, devemos sincronizá-los também. Mas podemos querer discutir mais sobre nosso objetivo para lidar com contatos desse tipo (ORCiD etc). @ManonGros você tem uma abordagem preferida para isso?

Eu gosto da ideia de estender nosso modelo.

Para os contatos do herbário, concordo com você @MortenHofft , devemos estender nosso modelo para ter algo parecido com o que temos para as organizações editoras do GBIF (veja por exemplo "email":["[email protected]"],"phone":["+47 99642071"] em http://api.gbif.org/ v1/organização/b670ea7c-48e7-45e4-ba66-5bf01ee4d398).

Para as pessoas/funcionários, também concordo, devemos sincronizar/importar as pessoas também. Talvez antes mesmo de sincronizarmos as instituições? (Só estou perguntando porque parece lógico atualizar os contatos ao sincronizar as instituições de IH, mas isso exigiria ter funcionários/pessoas atualizados).

Pelo que entendi, para nós funcionários/pessoas podemos ter uma instituição primária mas estar filiados a várias coleções e instituições. Enquanto para IH, uma pessoa está associada a um código de instituição. Além disso, as informações são um pouco diferentes (http://api.gbif.org/v1/grscicoll/person/118b48f0-9af9-45ac-8ea9-d8221d7fa2af e http://sweetgum.nybg.org/science/ih/person- detalhes/?irn=131429).

Para sincronizar pessoas/funcionários, devemos proceder como fazemos para a instituição? Ou seja, verificando a correspondência semi-automática primeiro. Se sim, como poderíamos vinculá-los? Não há identificador ou tags de máquina para pessoas. Além disso, como o Morten sugeriu, poderíamos usar os ORCiDs quando disponíveis, mas duvido que a maioria das pessoas tenha criado um. E mesmo para aqueles que têm um, precisamos encontrá-los primeiro.

Não sei se é possível, mas idealmente imagino algo assim:

  1. Encontre ORCiD potencial para todos os funcionários/pessoas da GrSciColl (se tivermos confirmação de que o ORCiD está correto para uma determinada pessoa, sincronize com isso em prioridade)
  2. Combine e vincule a lista de pessoas IH com a equipe/pessoas do GrSciColl
  3. Atualize as entradas de equipe do GrSciColl se forem mais antigas que IH
  4. Sincronize as instituições GrSciColl com IH (com base nos identificadores que usamos para vinculá-los após nossa correspondência/verificação, por exemplo, o que fizemos no UAT)

Eu sei que não é tão simples, deixe-me saber o que você pensa.

Sobre o pessoal já está na descrição desta tarefa, então eu estava planejando sincronizá-los neste processo. Acho que não precisamos fazer algo manualmente.

EDIT: quando eu disse que não acho que precisamos fazer algo manualmente, eu quis dizer que vou tentar combiná-los usando o nome, email ou qualquer outro campo representativo (fiz algo semelhante na última migração do banco de dados, mesmo que a correspondência não é perfeito porque há muitos funcionários duplicados, mas apenas com endereço ou telefone diferente) e se eu não conseguir corresponder a nenhum existente, criarei um novo. Ainda assim, essa correspondência não será perfeita, como mencionei antes, se quisermos que seja mais preciso, precisamos de alguma edição manual.

Além disso, como o Morten sugeriu, poderíamos usar os ORCiDs quando disponíveis, mas duvido que a maioria das pessoas tenha criado um.

Em dezembro de 2017, havia 454.000 usuários nas ciências biológicas que criaram ORCID IDs – uma das três maiores taxas de adoção de qualquer disciplina (consulte Estudo de adoção de ORCID entre disciplinas e locais ). Tbh, devemos nos comprometer com isso, usar a infraestrutura existente (incluindo tornar-se um membro do ORCID, imo) e incentivar os membros da comunidade a se inscreverem - a promessa é que podemos fornecer valor pelo serviço se o fizerem.

Observe que o Bloodhound já está usando ORCIDs para obter afiliação institucional passada e presente, por exemplo, https://bloodhound-tracker.net/organization/Q1122595. Todos vocês saberão melhor como isso funciona, mas também podemos considerar isso como (parte?) de nossa abordagem…

Sugiro que movamos as ideias relacionadas ao ORCID para uma nova edição para não confundir as coisas. Este ticket é especificamente para sincronizar GrSciColl e IH (adicionar links para contas ORCID é desejável, mas não necessário)

Em 8 de janeiro de 2020, às 14:31, Kyle Copas [email protected] escreveu:

Além disso, como o Morten sugeriu, poderíamos usar os ORCiDs quando disponíveis, mas duvido que a maioria das pessoas tenha criado um.

Em dezembro de 2017, havia 454.000 usuários nas ciências biológicas que criaram IDs ORCID – uma das três maiores taxas de adoção de qualquer disciplina. Tbh, devemos nos comprometer com isso, usar a infraestrutura existente (incluindo tornar-se um membro do ORCID, imo) e incentivar os membros da comunidade a se inscreverem - a promessa é que podemos fornecer valor pelo serviço se o fizerem.

Observe que o Bloodhound já está usando ORCIDs para obter afiliação institucional passada e presente, por exemplo, https://bloodhound-tracker.net/organization/Q1122595. Todos vocês saberão melhor como isso funciona, mas também podemos considerar isso como (parte?) de nossa abordagem…


Você está recebendo isso porque foi mencionado.
Responda a este e-mail diretamente, visualize-o no GitHub ou cancele a inscrição.

Outra coisa a ter em conta para a sincronização:
A longo prazo, queremos que os registros IH sejam editados diretamente no IH e depois sincronizados com o GrSciColl.
Mas agora, temos um punhado de editores que já estão editando seus registros GrSciColl. O que significa que o GrSciColl contém as informações mais atualizadas sobre uma coleção/instituição que não o IH.
Veja este exemplo:

Estes são apenas alguns casos, mas seria bom não substituir essas entradas. Por enquanto devemos verificar as datas modificadas antes de sincronizar e notificar o IH se a versão do GrSciColl estiver mais atualizada.

Em produção e programado para ser executado semanalmente.

Esta página foi útil?
0 / 5 - 0 avaliações

Questões relacionadas

MortenHofft picture MortenHofft  ·  5Comentários

ManonGros picture ManonGros  ·  12Comentários

timrobertson100 picture timrobertson100  ·  20Comentários

rukayaj picture rukayaj  ·  14Comentários

timrobertson100 picture timrobertson100  ·  17Comentários