АГРОВОК и платформа MEL: стандартизация метаданных и следование принципам организации хранения данных FAIR

FAO/Nadine Azzu

A use case by ICARDA-MEL

Международный центр сельскохозяйственных исследований в засушливых зонах (ИКАРДА)  – международная организация, занимающаяся исследованиями в целях развития и выработкой инновационных, основанных на научных данных решений для стран в нетропических засушливых зонах. Центр входит в КГМСХИ, крупнейшую в мире сеть некоммерческих исследовательских организаций в области сельского хозяйства. Вместе с другими программами, проектами и организациями (ППО) ИКАРДА использует онлайн-платформу MEL (Monitoring, Evaluation and Learning – "Мониторинг, оценка и обучение") для планирования, управления, мониторинга, оценки своей деятельности, отчетности и обмена информацией о полученных результатах. MEL, объединяя ППО на одной общей платформе и предоставляя пространство для совместной работы, помогает пользователям собирать, визуализировать и использовать данные для принятия более обоснованных решений и обеспечения прозрачности и отчетности по инвестициям в научные исследования и разработки.

Группа по платформе MEL в ИКАРДА подготовила видеоматериалы, демонстрирующее, как такие группы используют платформу для получения максимальной отдачи, управляя организацией деятельности, ее мониторингом и оценкой для принятия более эффективных решений и получения более высоких результатов. Выполняя свою миссию – добиться повышения устойчивости к внешним факторам источников средств к существованию  в засушливых зонах, – ИКАРДА придерживается системы управления знаниями с открытым доступом, которая предоставляет участникам коллективной работы доступ к массивам данных и инструментам, защищая интеллектуальную собственность, максимально расширяя доступ к научным исследованиям, наращивая потенциал в области управления знаниями и укрепляя институциональный потенциал, расширяя базу научных знаний и в конечном счете обеспечивая более высокую отдачу.

С момента создания ИКАРДА в 1977 году ФАО и ИКАРДА сотрудничают по темам в области сельского хозяйства, продовольственной безопасности, управления знаниями и обмена данными. В большинстве документов ИКАРДА содержатся ссылки на термины и концепты (понятия) АГРОВОК, а в 2018–2019 годах плодотворное сотрудничество двух организаций расширилось за счет реализации операционной совместимости MEL-AGROVOC, в рамках которой АГРОВОК был интегрирован в платформу MEL для обеспечения легкого доступа к его словарным данным.

Практический пример использования

Важным элементом использования MEL является хранение наборов данных и документов при предоставлении полных метаданных для каждого элемента. На платформе MEL внедрено использование АГРОВОК для описания профилей пользователей, блогов, отчетов по результатам, массивов данных, журнальных статей, докладов о результатах исследований и мероприятий по наращиванию потенциала и т.д. Каждый автор может либо выбрать уже имеющиеся ключевые слова, либо использовать свои для каждого конкретного случая, однако настоятельно рекомендуется использование ключевых слов из АГРОВОК. На рисунке 1 показано использование АГРОВОК на платформе MEL в качестве контролируемого списка терминов.

 

Рисунок 1. Использование тезауруса АГРОВОК в качестве контролируемого списка в различных областях. Источник: ИКАРДА, 2021 год. 

 

Как происходит выбор ключевых слов на платформе MEL? 

Ключевые слова отбираются из различных источников в MEL, от публикаций до описаний инноваций, отчетов о результатах и наборов данных. 

Пользователь может добавить (см. рисунок 2):

 

  1. Новое ключевое слово, которое будет сохранено в базе данных MEL.
  2. Ключевое слово в соответствии с АГРОВОК.
  3. Ключевое слово, уже имеющееся в базе данных MEL.

Рисунок 2. Имеющиеся у пользователя MEL возможности выбора ключевых слов. Источник: ИКАРДА, 2021 год. 

 

Задача групп по управлению знаниями и данными состоит в пересмотре и обновлении раздела с ключевыми словами с тем, чтобы раздел включал как можно больше ссылок на АГРОВОК. Используемый инновационный подход заключается не только в том, чтобы внести ключевые слова АГРОВОК в MEL и связанные с MEL платформы, но и в том, чтобы обеспечить взаимодействие с АГРОВОК в реальном времени после ежемесячных обновлений тезауруса. Это обеспечивает постоянную синхронизацию между АГРОВОК, MEL и внешними репозиториями (например, DSPACE, DATAVERSE) и повышает межпрограммное взаимодействие для более широкого использования данных в организациях в соответствии с принципами FAIR (доступность для поиска, открытость, совместимость и повторное использование). Ежемесячно платформа MEL автоматически просматривает все ключевые слова, ранее не распознаваемые АГРОВОК, и приводит в соответствие с новыми концептами или терминами, представленными АГРОВОК (см. рисунок 3).

Облако слов на рисунке 4 показывает ключевые слова АГРОВОК, наиболее часто используемые в MELSpace и MELData.

Рисунок 3. Ключевые слова, использованные для публикации массивов данных MEL в a) (MELSpace) и b) (MELData). Источник: ИКАРДА, 2021 год. 

Рисунок 4. Облака слов с наиболее часто используемыми в MELSpace и  MELData ключевыми словами АГРОВОК. Источник: ИКАРДА, 2021 год.

Все ключевые слова, используемые на платформе MEL, перечислены в специальном разделе MEL, озаглавленном Keywords Intelligence ("Анализ ключевых слов"), где можно отслеживать частоту употребления ключевых слов и проверять, в каком контексте они встречаются (рисунок 5). Группа MEL активно пополняет тезаурус АГРОВОК как напрямую, внося общие научные понятия, так и в рамках деятельности, связанной с узкоспециальной терминологией. Сейчас группа MEL работает над представлением концептов и терминов, относящихся к животноводству в рамках Программы исследований КГМСХИ по животноводству, выбирая ключевые слова, для которых отсутствуют соответствия в АГРОВОК.

Рисунок 5. Страница MEL "Keywords Intelligence". Источник: ИКАРДА, 2021 год.

 

Преимущества использования АГРОВОК

 АГРОВОК и MEL работают вместе в соответствии с новой Политикой КГМСХИ в области массивов открытых и FAIR-данных (OFDA), направленной на использование по возможности открытых и соответствующих принципам FAIR данных. Поскольку АГРОВОК следует принципам FAIR, использование этого тезауруса отвечает интересам MEL и укрепляет соответствие научных результатов принципам FAIR.

 Программный интерфейс АГРОВОК обеспечивает быстрый и легкий доступ к его данным. Использование ключевых слов АГРОВОК при публикации наборов данных помогает стандартизации метаданных MEL за счет сокращения использования "одноразовых" ключевых слов. Архивирование данных от этого выигрывает, поскольку становится возможным определение наборов данных, относящихся к сходным темам. В наборы данных MEL часто входят местные термины на разных языках, поэтому согласованность ключевых слов в наборах данных с АГРОВОК повышает ценность данных за счет немедленного перевода на другие языки. Стандартизация и взаимосвязанность наборов данных повышает доступность данных для поиска. Сходным образом, использование в журнальных статьях и "серой" литературе ключевых слов из АГРОВОК укрепляет принципы FAIR, в частности, доступность научной информации и данных для поиска.