Registry: 创建 DiSSCo 网络实体

创建于 2021-01-18  ·  17评论  ·  资料来源: gbif/registry

DiSSCo 想要一个包含来自相关机构的数据集的网络实体。
Wouter A 准备了一个带有 GBIF 密钥的电子表格

  • Wouter 要求事先在 UAT 中查看它。 我们应该创建它,但由于 UAT 的大小不足以抓取所有数据,我不确定它的好处。 创建一个可重复的 SQL 脚本以在 UAT 和 prod 上使用似乎是明智的
  • 我建议我们还将 ROR 和 GRID ID 作为附加标识符添加到单独的 SQL 脚本中的相关条目中

最有用的评论

由于 GrSciColl 机构和 GBIF 组织目前是完全独立的,据我所知,理想情况下你会在两者中都这样做。

所有17条评论

您将如何添加 ROR 和 GRID ID,作为“标签”或作为 DwC 字段 (institutionID),EML 配置文件中的(通常不同的)机构名称如何,以及关于注册为网络的一部分和注册的过程是什么这些 ID 用于 DiSSCo 合作伙伴添加的新数据集或成为 GBIF 数据提供者的新合作伙伴?

您如何将 ROR 和 GRID ID 添加为“标签”或 DwC 字段 (institutionID)

标签是一种选择,但我建议对有意义的实体只使用identifier 。 我们支持注册表中所有实例的多个标识符。 这对发生记录没有影响,只是允许使用 ID 在注册表中查找组织。

EML 配置文件中的(通常不同的)机构名称呢?

它不会在 GBIF 中受到影响。 它所做的只是说“注册表中的此条目也称为不同的 ID”,并且不会更改组织在 GBIF 中注册的名称。 如果需要,可以随时更改名称。

对于 DiSSCo 合作伙伴添加的新数据集或成为 GBIF 数据提供者的新合作伙伴,注册成为网络的一部分并注册这些 ID 的流程是什么?

在 GBIF 中注册数据集和机构将一如既往地工作。 可以根据需要向一个或多个帐户授权管理网络条目的成员资格(即向 DiSSCo 条目添加或删除 GBIF 数据集)。 随着时间的推移,我们可能希望以某种方式自动化成员资格。

关于网络:

为了测试,我在 UAT 中创建了一个网络: https ://registry.gbif-uat.org/network/9400230d-de38-4e0e-b44d-fcdb661f0519
我为此使用 API 编写了一个脚本,以便可以在 prod 中复制它。

网络的组成部分是由电子表格中列出的作为 DiSSCo 成员 (disscoMember == "y") 的 GBIF 组织发布的所有数据集。
注意:在 UAT 中,这包括所有类型的测试数据集(但不是 prod 中可用的所有数据集)。

不是要劫持这个线程,但是将 ROR 和 GRID id 链接到 GRSciColl 机构而不是 GBIF 组织不是更有意义吗?

不是要劫持这个线程,但是将 ROR 和 GRID id 链接到 GRSciColl 机构而不是 GBIF 组织不是更有意义吗?

谢谢@rukayaj 。 是的,尽管两者都有意义,因为 GRSciColl 只会包含 GBIF 中出版组织的一个子集

由于 GrSciColl 机构和 GBIF 组织目前是完全独立的,据我所知,理想情况下你会在两者中都这样做。

好吧,我忘记了 GRSciColl 是为有实体馆藏的机构服务的……所以我认为你是说一些研究机构不适合 GRSciColl(因为他们不拥有实体馆藏),但是这些机构会有ROR 和 GRID身份证? 那是有道理的,在这种情况下,我认为将 GRID/ROR 放在一个地方会更好。

@wouteraddink他们在门户用户界面中通过模糊匹配链接,例如https://www.gbif.org/occurrence/2579432371?

与其他问题相关的 GRID 和 ROR 讨论: https ://github.com/gbif/registry/issues/274

我希望看到 ROR/GRID/ISNI 使用dwc:institutionID的每个出现记录(以覆盖 EML 中的机构 ID——因为即使在同一个 DarwinCore-Archive 中也可能明显不同)。

(发生记录与发生有关;而 GRSciColl 记录与机构有关——发生记录上的机构 ID 属性将链接/桥接两者)

我认为原则上您可以在dwc:institutionID中毫无问题地使用 ROR/GRID/ISNI,但这违反了 DwC 文档中的当前建议。 我认为作为一个社区,我们需要改变这个建议。

谢谢玛丽,我现在在 UAT 中看到了网络,但是,如果默认情况下只过滤样本数据集,那就太好了。 另外, https://www.gbif-uat.org/network/9400230d-de38-4e0e-b44d-fcdb661f0519还是空的?

另外, https://www.gbif-uat.org/network/9400230d-de38-4e0e-b44d-fcdb661f0519还是空的?

所有数据集都需要重新处理以获取索引中的networkKey

+ 摘要页面必须在另一个系统中编辑(我们可以在生产中这样做)。

我应该包括具有一些保存标本还是仅保存标本的数据集?

我还将包括保存了一些标本的数据集。 不确定这将如何影响概览页面上的计数,这些记录或数据集是基于吗?

度量是根据属于网络的数据集的记录生成的。 这意味着如果我标记包含观察的数据集,这些观察将包含在指标中。

@wouteraddink在 GBIF 挪威,我们现在已将所有大学博物馆 GBIF 数据发布者(不符合 ROR 和 Grid 资格)转移到大学级别(使用 ROR 和 Grid),并与最终的 GBIF 数据发布者合并(移动了各自的数据集)。为大学生物学和地质学系创建。

我们的目标是遵循挪威 GBIF 数据发布者应该是有资格/有资格获得 ROR 和 Grid ID 的实体的原则。 (并开始建议有资格但尚未拥有 ROR 的数据发布者注册此 ID)。

我已经使用“评论”更新了您的“CETAF+DiSSCo 机构”电子表格(其中第 121-122 行将被合并)。

感谢@dagendresen 的信息。 我一直在与 GRID 和 ROR 讨论,GRID 正在收紧他们的政策,不再允许大学中的机构使用单独的标识符。 ROR 仍与 GRID 保持 1:1 同步,但今年晚些时候可能会发生变化,他们可能会有更宽松的政策,ROR WG 也在努力为部门扩展,但这还处于开发的早期阶段,目前还没有尚未决定这些是直接通过 ROR 还是通过 wikidata 或 github 铸造。 对于 DiSSCo,我们现在可以使用 ROR,因为它现在具有完全实施的元数据模式,包括父组织关系,如果机构无法获得 ROR,我们可以使用 cetaf 护照标识符并将它们链接到他们的大学 ROR(如果需要)。 Orcid 尚未实施 ROR,但正在计划中。

此页面是否有帮助?
0 / 5 - 0 等级

相关问题

timrobertson100 picture timrobertson100  ·  9评论

marcos-lg picture marcos-lg  ·  11评论

MortenHofft picture MortenHofft  ·  5评论

MortenHofft picture MortenHofft  ·  24评论

timrobertson100 picture timrobertson100  ·  20评论