Registry: 与索引植物标本馆同步

创建于 2019-12-11  ·  9评论  ·  资料来源: gbif/registry

Index Herbariorum 是一个权威的目录,应该是 Herbaria 实体的主要来源。 注册表中的植物标本馆记录应与 IH 正在进行的编辑工作保持同步。

这第一次工作迭代的范围是故意的,以适应实现这一目标所需的最小功能。 完成后,可以将其他功能请求作为新问题打开。

设想一般同步操作如下:

  • 从 IndexHerbariorum 中检索所有植物标本馆
  • 对于每个实体,使用 IH IRN 在 GRSciColl 中找到相应的机构或馆藏

    • 如果实体存在并且它们不同,则更新 GrSciColl

    • 如果实体不存在,则将其作为机构插入,并带有持有 IH IRN 的标识符

    • 如果有冲突(例如多个选项)通知编辑解决

  • 为实体创建、更新或删除关联员工

未来版本可能允许在 GRSciColl 中编辑 IH 实体。 在这种情况下,当实体不同时,需要更复杂的逻辑,可能需要通知 GRSciColl 和 IH 员工以解决差异。

GRSciColl

最有用的评论

我建议我们将 ORCID 相关的想法转移到一个新问题上,以免混淆。 此票证专门用于使 GrSciColl 和 IH 同步(添加到 ORCID 帐户的链接是可取的,但不是必需的)

2020 年 1 月 8 日 14:31,Kyle Copas [email protected]写道:

另外,正如 Morten 建议的那样,我们可以在可用时使用 ORCiD,但我怀疑大多数人都创建了一个。

截至 2017 年 12 月,有 454,000 名生物科学用户创建了 ORCID ID,这是所有学科中采用率最高的三个之一。 Tbh,我们应该承诺这一点,使用现有的基础设施(包括成为 ORCID 成员,imo)并鼓励社区成员注册——承诺如果他们这样做,我们可以提供服务价值。

请注意,Bloodhound 已经在使用 ORCID 来拉动过去和现在的机构隶属关系,例如https://bloodhound-tracker.net/organization/Q1122595。 你们都会更好地了解它是如何工作的,但我们也可以将其视为(一部分?)我们的方法……


你收到这个是因为你被提到了。
直接回复此邮件,在 GitHub 上查看,或退订。

所有9条评论

IH 的机构有一个contact字段,其中只有电话、电子邮件和 webUrl (http://sweetgum.nybg.org/science/api/v1/institutions/UARK)。 在 GrSciColl 机构/收藏中,我们有一个contacts字段,但它们实际上是个人实体(http://api.gbif.org/v1/grscicoll/institution/f7068d69-cf88-42d8-a984-0c4de6ce8579,其联系人是 http://api.gbif.org/v1/grscicoll/person/118b48f0-9af9-45ac-8ea9-d8221d7fa2af )。

我们应该如何处理 IH 联系人? 忽略它? 将其添加为 GrSciColl 人员并将其链接到机构/收藏? 对于后者,名字是必需的,所以在这种情况下,我们需要组成一个。

我不知道谁能回答这个问题@timrobertson100 @MortenHofft @ManonGros

这些联系人字段不适用于个人。 它们是为了将植物标本馆作为一个实体。 因此,随着人们来来去去,这一点很重要。 我很确定从 IH 的角度来看,这将被认为是必不可少的,我的感觉是它也很重要。 所以我建议我们扩展我们的模型。 但最好也与其他人一起检查。

至于人/员工。 IH 也有一个端点。 据我所知,它们仅通过机构代码链接。 我们也应该及时同步这些。 但我们可能想更多地讨论我们处理此类联系人(ORCiD 等)的目标。 @ManonGros您对此有首选方法吗?

我喜欢扩展我们的模型的想法。

对于植物标本馆联系人,我同意@MortenHofft的看法,我们应该扩展我们的模型,使其具有类似于我们为 GBIF 出版组织所拥有的东西(例如参见 http://api.gbif.org/ 中的"email":["[email protected]"],"phone":["+47 99642071"] v1/组织/b670ea7c-48e7-45e4-ba66-5bf01ee4d398)。

对于人员/员工,我也同意,我们也应该同步/导入人员。 也许甚至在我们同步机构之前? (我只是问,因为在同步 IH 机构时更新联系人似乎是合乎逻辑的,但这需要员工/人员保持最新状态)。

据我了解,对我们而言,员工/人员可以拥有一个主要机构,但隶属于多个收藏和机构。 而对于 IH,一个人与一个机构代码相关联。 加上信息有点不同(http://api.gbif.org/v1/grscicoll/person/118b48f0-9af9-45ac-8ea9-d8221d7fa2af 和 http://sweetgum.nybg.org/science/ih/person-详细信息/?irn=131429)。

对于同步人员/员工,我们是否应该像为机构所做的那样进行? 意思是,首先半自动检查匹配。 如果是,我们如何链接它们? 人没有标识符或机器标签。 另外,正如 Morten 建议的那样,我们可以在可用时使用 ORCiD,但我怀疑大多数人都创建了一个。 即使对于那些有的人,我们也需要先找到他们。

我不知道这是否可能,但理想情况下我想象这样的事情:

  1. 为所有 GrSciColl 员工/人员查找潜在的 ORCiD(如果我们确认 ORCiD 对于给定人员是正确的,请优先与此同步)
  2. 将 IH 人员列表与 GrSciColl 人员/人员匹配并链接
  3. 如果早于 IH,则更新 GrSciColl 员工条目
  4. 将 GrSciColl 机构与 IH 同步(基于我们在匹配/检查后用于链接它们的标识符,例如我们在 UAT 中所做的)

我知道这不是那么简单,让我知道你的想法。

关于人员已经在此任务的描述中,因此我计划在此过程中同步它们。 我认为我们不需要手动执行某些操作。

编辑:当我说我认为我们不需要手动执行某些操作时,我的意思是我会尝试使用姓名、电子邮件或任何其他代表字段来匹配它们(我在上次数据库迁移中做了类似的事情,即使匹配并不完美,因为有很多员工重复但只是地址或电话不同),如果我无法匹配任何现有的,我将创建一个新的。 正如我之前提到的,这种匹配仍然不是完美的,如果我们希望它更准确,那么我们需要一些手动编辑。

另外,正如 Morten 建议的那样,我们可以在可用时使用 ORCiD,但我怀疑大多数人都创建了一个。

截至 2017 年 12 月,有 454,000 名生物科学用户创建了 ORCID ID,这是所有学科中采用率最高的三个之一(请参阅跨学科和地点采用 ORCID 的研究)。 Tbh,我们应该承诺这一点,使用现有的基础设施(包括成为 ORCID 成员,imo)并鼓励社区成员注册——承诺如果他们这样做,我们可以提供服务价值。

请注意,Bloodhound 已经在使用 ORCID 来拉动过去和现在的机构隶属关系,例如https://bloodhound-tracker.net/organization/Q1122595。 你们都会更好地了解它是如何工作的,但我们也可以将其视为(一部分?)我们的方法……

我建议我们将 ORCID 相关的想法转移到一个新问题上,以免混淆。 此票证专门用于使 GrSciColl 和 IH 同步(添加到 ORCID 帐户的链接是可取的,但不是必需的)

2020 年 1 月 8 日 14:31,Kyle Copas [email protected]写道:

另外,正如 Morten 建议的那样,我们可以在可用时使用 ORCiD,但我怀疑大多数人都创建了一个。

截至 2017 年 12 月,有 454,000 名生物科学用户创建了 ORCID ID,这是所有学科中采用率最高的三个之一。 Tbh,我们应该承诺这一点,使用现有的基础设施(包括成为 ORCID 成员,imo)并鼓励社区成员注册——承诺如果他们这样做,我们可以提供服务价值。

请注意,Bloodhound 已经在使用 ORCID 来拉动过去和现在的机构隶属关系,例如https://bloodhound-tracker.net/organization/Q1122595。 你们都会更好地了解它是如何工作的,但我们也可以将其视为(一部分?)我们的方法……


你收到这个是因为你被提到了。
直接回复此邮件,在 GitHub 上查看,或退订。

同步需要考虑的其他事项:
从长远来看,我们希望 IH 记录直接在 IH 中编辑,然后与 GrSciColl 同步。
但是现在,我们有少数编辑已经在编辑他们的 GrSciColl 记录。 这意味着 GrSciColl 包含有关收藏/机构而非 IH 的最新信息。
看这个例子:

这些只是少数情况,但最好不要覆盖这些条目。 现在我们应该在同步之前检查修改的日期,如果 GrSciColl 版本是最新的,请通知 IH。

在生产中并计划每周运行。

此页面是否有帮助?
0 / 5 - 0 等级

相关问题

MortenHofft picture MortenHofft  ·  24评论

MortenHofft picture MortenHofft  ·  5评论

timrobertson100 picture timrobertson100  ·  20评论

ahahn-gbif picture ahahn-gbif  ·  4评论

timrobertson100 picture timrobertson100  ·  17评论