Registry: Синхронизировать с Index Herbariorum

Созданный на 11 дек. 2019 · 9Комментарии · Источник: gbif/registry

Index Herbariorum — это авторитетный каталог, который должен быть основным источником объектов Herbaria. Записи гербариев в реестре должны синхронизироваться с текущими усилиями по редактированию IH.

Эта первая итерация работы преднамеренно рассчитана на минимальную функциональность, необходимую для достижения этой цели. После завершения дополнительные запросы функций могут быть открыты как новые проблемы.

Предполагается, что общая синхронизация будет работать следующим образом:

Получить все гербарии из IndexHerbariorum
Для каждой организации найдите эквивалентное учреждение или коллекцию в GRSciColl, используя IRN IH.
- Если сущность существует и они различаются, обновите GrSciColl.
- Если объект не существует, вставьте его как учреждение и с идентификатором, содержащим IH IRN.
- Если есть конфликт (например, несколько вариантов), уведомите редакторов для разрешения
Создание, обновление или удаление ассоциированных сотрудников для сущностей

В будущей версии может быть разрешено редактирование объектов IH в GRSciColl. В этом сценарии, когда объекты различаются, требуется более сложная логика, вероятно, требующая уведомления GRSciColl и персонала IH для устранения различий.

GRSciColl

Источник

timrobertson100

👍3

Самый полезный комментарий

Я предлагаю перенести идеи, связанные с ORCID, в новый выпуск, чтобы не смешивать вещи. Этот билет предназначен специально для синхронизации GrSciColl и IH (добавление ссылок на учетные записи ORCID желательно, но не обязательно)

8 января 2020 г., в 14:31, Кайл Копас, [email protected] , написал:
Кроме того, как предложил Мортен, мы могли бы использовать ORCiD, когда они были доступны, но я сомневаюсь, что большинство людей создали их.
По состоянию на декабрь 2017 года в биологических науках насчитывалось 454 000 пользователей, создавших идентификаторы ORCID, — это один из трех самых высоких показателей внедрения среди всех дисциплин. Tbh, мы должны взять на себя обязательство, использовать существующую инфраструктуру (в том числе стать членом ORCID, imo) и поощрять членов сообщества регистрироваться — обещание состоит в том, что мы можем предоставить ценность за услугу, если они это сделают.
Обратите внимание, что Bloodhound уже использует идентификаторы ORCID для извлечения как прошлой, так и настоящей институциональной принадлежности, например, https://bloodhound-tracker.net/organization/Q1122595. Вы все лучше знаете, как это работает, но мы также можем рассматривать это как (часть?) нашего подхода…
—
Вы получаете это, потому что вас упомянули.
Ответьте на это письмо напрямую, просмотрите его на GitHub или отмените подписку.

timrobertson100 8 янв. 2020

👍3

Все 9 Комментарий

Учреждения из IH имеют поле contact , в котором есть только телефон, адрес электронной почты и веб-URL (http://sweetgum.nybg.org/science/api/v1/institutions/UARK). В учреждении/коллекции GrSciColl у нас есть поле contacts , но на самом деле они являются физическими лицами (http://api.gbif.org/v1/grscicoll/institution/f7068d69-cf88-42d8-a984-0c4de6ce8579, чей контакт http://api.gbif.org/v1/grscicoll/person/118b48f0-9af9-45ac-8ea9-d8221d7fa2af).

Что нам делать с контактом IH? игнорируй это? добавить его как человека GrSciColl и связать с учреждением/коллекцией? для последнего требуется имя, поэтому в этом случае нам нужно его составить.

Я не знаю, кто лучше всех ответит на этот вопрос @timrobertson100 @MortenHofft @ManonGros

marcos-lg 6 янв. 2020

Эти контактные поля не для человека. Они для гербария как единое целое. Поэтому важно, как люди приходят и уходят. Я совершенно уверен, что это будет считаться важным с точки зрения IH, и я чувствую, что это также важно. Поэтому я бы предложил вместо этого расширить нашу модель. Но лучше посоветуйтесь с другими.

Что касается людей/персонала. У IH есть конечная точка и для них. Насколько я знаю, они связаны только кодами учреждений. Со временем мы должны синхронизировать и их. Но мы могли бы захотеть подробнее обсудить нашу цель обработки контактов такого рода (ORCiD и т. д.). @ManonGros у вас есть предпочтительный подход для этого?

MortenHofft 7 янв. 2020

Мне нравится идея расширения нашей модели.

marcos-lg 7 янв. 2020

Что касается контактов гербария, я согласен с вами @MortenHofft , мы должны расширить нашу модель, чтобы иметь что-то вроде того, что у нас есть для издательских организаций GBIF (см., Например, "email":["[email protected]"],"phone":["+47 99642071"] в http://api.gbif.org/ v1/organization/b670ea7c-48e7-45e4-ba66-5bf01ee4d398).

Что касается людей/персонала, я также согласен, мы также должны синхронизировать/импортировать людей. Возможно, еще до того, как мы синхронизируем институты? (Я просто спрашиваю, потому что было бы логично обновить контакты при синхронизации учреждений IH, но для этого потребуется обновить персонал / людей).

Насколько я понимаю, у нас сотрудники/люди могут иметь первичное учреждение, но быть аффилированными с несколькими коллекциями и учреждениями. В то время как для IH один человек связан с одним кодом учреждения. Плюс информация немного другая (http://api.gbif.org/v1/grscicoll/person/118b48f0-9af9-45ac-8ea9-d8221d7fa2af и http://sweetgum.nybg.org/science/ih/person- детали/?irn=131429).

Для синхронизации людей/персонала должны ли мы действовать так же, как для учреждения? Это означает, что сначала проверяется соответствие полуавтоматически. Если да, то как мы можем связать их? Для людей нет идентификаторов или машинных тегов. Кроме того, как предложил Мортен, мы могли бы использовать ORCiD, когда они были доступны, но я сомневаюсь, что большинство людей создали их. И даже для тех, у кого они есть, нам нужно их сначала найти.

Я не знаю, возможно ли это вообще, но в идеале я представляю себе что-то вроде этого:

Найдите потенциальный ORCiD для всех сотрудников/людей GrSciColl (если у нас есть подтверждение того, что ORCiD верен для данного человека, синхронизируйте с ним в приоритете)
Сопоставьте и свяжите список лиц IH с персоналом/людьми GrSciColl
Обновите записи персонала GrSciColl, если они старше IH.
Синхронизируйте учреждения GrSciColl с IH (на основе идентификаторов, которые мы используем для их связи после нашего сопоставления/проверки, например, что мы сделали в UAT)

Я знаю, что это не так просто, дайте мне знать, что вы думаете.

ManonGros 7 янв. 2020

Про персонал уже есть в описании этой задачи, поэтому я планировал синхронизировать их в этом процессе. Я не думаю, что нам нужно что-то делать вручную.

РЕДАКТИРОВАТЬ: когда я сказал, что не думаю, что нам нужно что-то делать вручную, я имел в виду, что попытаюсь сопоставить их, используя имя, адрес электронной почты или любое другое репрезентативное поле (я сделал что-то подобное в последней миграции БД, хотя сопоставление не идеален, потому что многие сотрудники дублируются, но просто с другим адресом или телефоном), и если я не могу сопоставить ни один из существующих, я создам новый. Тем не менее, это сопоставление не будет идеальным, как я уже упоминал ранее, если мы хотим, чтобы оно было более точным, нам потребуется некоторое ручное редактирование.

marcos-lg 7 янв. 2020

👍1

Кроме того, как предложил Мортен, мы могли бы использовать ORCiD, когда они были доступны, но я сомневаюсь, что большинство людей создали их.

По состоянию на декабрь 2017 года в биологических науках было 454 000 пользователей, которые создали идентификаторы ORCID, что является одним из трех самых высоких показателей внедрения среди всех дисциплин (см. Исследование внедрения ORCID в различных дисциплинах и регионах ). Tbh, мы должны взять на себя обязательство, использовать существующую инфраструктуру (в том числе стать членом ORCID, imo) и поощрять членов сообщества регистрироваться — обещание состоит в том, что мы можем предоставить ценность за услугу, если они это сделают.

Обратите внимание, что Bloodhound уже использует идентификаторы ORCID для извлечения как прошлой, так и настоящей институциональной принадлежности, например, https://bloodhound-tracker.net/organization/Q1122595. Вы все лучше знаете, как это работает, но мы также можем рассматривать это как (часть?) нашего подхода…

kcopas 8 янв. 2020

8 января 2020 г., в 14:31, Кайл Копас, [email protected] , написал:
Кроме того, как предложил Мортен, мы могли бы использовать ORCiD, когда они были доступны, но я сомневаюсь, что большинство людей создали их.
По состоянию на декабрь 2017 года в биологических науках насчитывалось 454 000 пользователей, создавших идентификаторы ORCID, — это один из трех самых высоких показателей внедрения среди всех дисциплин. Tbh, мы должны взять на себя обязательство, использовать существующую инфраструктуру (в том числе стать членом ORCID, imo) и поощрять членов сообщества регистрироваться — обещание состоит в том, что мы можем предоставить ценность за услугу, если они это сделают.
Обратите внимание, что Bloodhound уже использует идентификаторы ORCID для извлечения как прошлой, так и настоящей институциональной принадлежности, например, https://bloodhound-tracker.net/organization/Q1122595. Вы все лучше знаете, как это работает, но мы также можем рассматривать это как (часть?) нашего подхода…
—
Вы получаете это, потому что вас упомянули.
Ответьте на это письмо напрямую, просмотрите его на GitHub или отмените подписку.

timrobertson100 8 янв. 2020

👍3

Что еще нужно учитывать при синхронизации:
В долгосрочной перспективе мы хотим, чтобы записи IH редактировались непосредственно в IH, а затем синхронизировались с GrSciColl.
Но прямо сейчас у нас есть несколько редакторов, которые уже редактируют свои записи GrSciColl. Это означает, что GrSciColl содержит самую актуальную информацию о коллекции/учреждении, а не об IH.
См. этот пример:

http://sweetgum.nybg.org/science/ih/herbarium-details/?irn=125320
https://registry.gbif-uat.org/collection/b802fafc-7c78-4b1c-82f5-a536e0ac059b
Редактор даже добавил ссылку на записи GBIF.

Это всего лишь несколько случаев, но было бы неплохо не перезаписывать эти записи. На данный момент мы должны проверить измененные даты перед синхронизацией и уведомить IH, если версия GrSciColl более свежая.

ManonGros 8 янв. 2020

В производстве и планируется запускать еженедельно.

marcos-lg 29 апр. 2020

Была ли эта страница полезной?

0 / 5 - 0 рейтинги

Смежные вопросы

невозможно добавить ROR в GRSciColl

MortenHofft · 5Комментарии

GrSciColl Количество образцов, возможно, должно быть необязательным или полученным из подсчета GBIF?

rukayaj · 9Комментарии

Создать сетевой объект DiSSCo

timrobertson100 · 17Комментарии

Добавить категорию в набор данных

timrobertson100 · 20Комментарии

Строка/объект цитирования GBIF во всех наборах данных

MortenHofft · 24Комментарии