Registry: Criar Entidade de Rede DisSCCo

Criado em 18 jan. 2021  ·  17Comentários  ·  Fonte: gbif/registry

A DiSSCo gostaria de uma entidade de rede contendo os conjuntos de dados provenientes das instituições relevantes.
Wouter A preparou uma planilha com as chaves GBIF.

  • Wouter pede para visualizá-lo no UAT de antemão. Devemos criá-lo, mas como o UAT não é dimensionado o suficiente para rastrear todos os dados, não tenho certeza dos benefícios. Criar um script SQL repetível para usar em UAT e prod parece sensato
  • Proponho que também adicionemos os IDs ROR e GRID como identificadores adicionais às entradas relevantes em um script SQL separado

Comentários muito úteis

Como as instituições GrSciColl e as organizações GBIF estão completamente separadas no momento, até onde eu sei, você idealmente faria isso em ambas.

Todos 17 comentários

Como você adicionaria os IDs ROR e GRID, como "tags" ou como campo DwC (institutionID), o nome da instituição (muitas vezes diferente) no perfil EML e qual seria o processo de registro como parte da rede e registro esses IDs, para novos conjuntos de dados adicionados por parceiros DiSSCo ou novos parceiros se tornando um provedor de dados GBIF?

Como você adicionaria os IDs ROR e GRID, como "tags" ou como campo DwC (institutionID)

Tags seriam uma opção, mas eu proporia apenas um identifier para as entidades onde isso faz sentido. Oferecemos suporte a vários identificadores em todas as instâncias no registro. Isso não afeta os registros de ocorrência, mas simplesmente permite encontrar a organização no registro usando o ID.

e o nome da instituição (muitas vezes diferente) no perfil EML

Não seria afetado no GBIF. Tudo o que está fazendo é dizer "esta entrada no registro também é conhecida como um ID diferente" e não altera o nome com o qual a organização foi registrada no GBIF. O nome pode ser alterado a qualquer momento, se desejado.

e qual seria o processo de registro como parte da rede e registro desses IDs, para novos conjuntos de dados adicionados por parceiros DiSSCo ou novos parceiros se tornando um provedor de dados GBIF?

O registro de conjuntos de dados e instituições no GBIF funcionará como sempre funcionou. A autorização para selecionar a associação para as entradas de rede (ou seja, adicionar ou remover conjuntos de dados GBIF à entrada DiSSCo) pode ser concedida a uma ou mais contas, conforme desejado. Com o tempo, provavelmente vamos querer automatizar a associação de alguma forma.

Sobre a Rede:

Para testar, criei uma rede em UAT: https://registry.gbif-uat.org/network/9400230d-de38-4e0e-b44d-fcdb661f0519
Eu escrevi um script usando a API para isso para que possa ser reproduzido em prod.

Os constituintes da rede são todos os conjuntos de dados publicados pelas organizações GBIF listadas na planilha que são membros DiSSCo (disscoMember == "y").
NB: No UAT, isso inclui todos os tipos de conjuntos de dados de teste (mas não todos os conjuntos de dados disponíveis em prod).

Não pretendo sequestrar este tópico, mas não faz mais sentido vincular os IDs ROR e GRID a instituições GRSciColl em vez de organizações GBIF?

Não pretendo sequestrar este tópico, mas não faz mais sentido vincular os IDs ROR e GRID a instituições GRSciColl em vez de organizações GBIF?

Obrigado @rukayaj . Sim, ambos fazem sentido, pois o GRSciColl conterá apenas um subconjunto das organizações editoras no GBIF

Como as instituições GrSciColl e as organizações GBIF estão completamente separadas no momento, até onde eu sei, você idealmente faria isso em ambas.

Ok, eu tinha esquecido que o GRSciColl era para institutos com acervo físico... Então acho que você está dizendo que algumas instituições de pesquisa não se enquadram no GRSciColl (pois não possuem acervo físico), mas essas instituições teriam ROR e GRID IDs? Isso faz sentido então, e nesse caso eu acho que seria melhor ter apenas GRIDs/RORs em um só lugar.

@wouteraddink Eles estão meio que vinculados na interface do usuário do portal com a correspondência difusa, por exemplo https://www.gbif.org/occurrence/2579432371?

Discussão GRID e ROR relacionada a esta outra questão: https://github.com/gbif/registry/issues/274

Eu adoraria ver ROR/GRID/ISNI usado por registro de ocorrência com dwc:institutionID (para substituir IDs de instituição no EML - porque aparentemente poderia ser distinto mesmo dentro do mesmo DarwinCore-Archive).

(o registro de ocorrência é sobre a ocorrência; enquanto o registro GRSciColl é sobre a instituição -- a propriedade InstitutionID no registro de ocorrência ligaria/ligaria os dois)

Eu acho que em princípio você poderia usar um ROR/GRID/ISNI em dwc:institutionID sem problemas, mas é contra a recomendação atual na documentação do DwC. Acho que, como comunidade, precisamos mudar essa recomendação.

Obrigado Marie, vejo a rede agora no UAT, no entanto, seria bom filtrá-la por padrão apenas para conjuntos de dados de espécimes. Além disso, https://www.gbif-uat.org/network/9400230d-de38-4e0e-b44d-fcdb661f0519 ainda está vazio?

Além disso, https://www.gbif-uat.org/network/9400230d-de38-4e0e-b44d-fcdb661f0519 ainda está vazio?

Todos os conjuntos de dados precisam ser reprocessados ​​para pegar o networkKey no índice

+ a página de resumo deve ser editada em outro sistema (podemos fazer isso em produção).

Devo incluir os conjuntos de dados que possuem alguns espécimes preservados ou apenas espécimes preservados?

Eu incluiria também conjuntos de dados que têm alguns espécimes preservados. Não tem certeza de como isso influenciaria as contagens na página de visão geral, esses registros ou conjuntos de dados são baseados?

As métricas são geradas com base nos registros dos conjuntos de dados pertencentes à rede. Isso significa que, se eu marcar um conjunto de dados contendo observações, essas observações serão incluídas nas métricas.

@wouteraddink no GBIF Noruega, agora movemos todos os editores de dados GBIF de museus universitários (não qualificados para ROR e Grid) para o nível universitário (com ROR e Grid) e mesclamos (movemos respectivos conjuntos de dados) com os eventuais editores de dados GBIF que foram criado para departamentos universitários de biologia e geologia.

Nosso objetivo é seguir o princípio de que os editores de dados GBIF noruegueses devem ser entidades que se qualificam/são elegíveis para um ROR e Grid ID. (E brevemente começou a sugerir que os editores de dados qualificados, mas ainda não com um ROR, se registrem para esse ID).

Atualizei sua planilha "Instituições CETAF+DiSSCo" usando "comentários" (onde as linhas 121-122 seriam mescladas).

Obrigado pela informação @dagendresen. Eu tenho conversado tanto com o GRID quanto com o ROR, o GRID está apertando suas políticas não permitindo mais identificadores separados para instituições incorporadas em universidades. ROR ainda é 1:1 sincronizado com GRID, mas isso pode mudar ainda este ano e eles provavelmente terão uma política mais relaxada, também um ROR WG ​​está trabalhando em uma extensão para departamentos, mas isso está em estágios iniciais de desenvolvimento e não é decidiu ainda se estes serão cunhados através do ROR diretamente ou através de wikidata ou github. Para o DiSSCo, agora podemos trabalhar com o ROR, pois agora possui um esquema de metadados totalmente implementado, incluindo relações com a organização pai e, se as instituições não puderem obter um ROR, podemos usar identificadores de passaporte cetaf e vinculá-los ao ROR da universidade, se necessário. Orcid ainda não implementou o ROR, mas está planejando isso.

Esta página foi útil?
0 / 5 - 0 avaliações

Questões relacionadas

timrobertson100 picture timrobertson100  ·  20Comentários

rukayaj picture rukayaj  ·  14Comentários

marcos-lg picture marcos-lg  ·  11Comentários

ahahn-gbif picture ahahn-gbif  ·  4Comentários

MortenHofft picture MortenHofft  ·  24Comentários