Hacia un modelo de temas basado en los conceptos del AGROVOC para la investigación y la difusión de productos de proyectos de agentes múltiples

FAO/Luis Sánchez Díaz

A use case by Hercules Panoutsopoulos, Agricultural University of Athens

En el período de siete años de ejecución del Programa Marco de Investigación e Innovación Horizonte 2020 , las inversiones de la Comisión Europea en proyectos de investigación e innovación centrados en la agricultura, la silvicultura y el desarrollo rural han alcanzado casi los 1.000 millones de euros. Estos proyectos de agentes múltiples (el informe de 2017 titulado “Horizon 2020 multi-actor projects” de Asociación Europea para la Innovación en materia de Productividad y Sostenibilidad Agrícolas (EIP-AGRI) contiene información sobre el concepto y el alcance de los proyectos de agentes múltiples del Horizonte 2020) han generado un gran número de productos de investigación y difusión (que suelen denominarse “objetos digitales”) en los que se comunica información importante sobre los resultados de las actividades de investigación, las mejores prácticas y las innovaciones.

No obstante, la aceptación y la reutilización de estos objetos digitales han sido limitadas. Como ocurre con muchos proyectos de investigación, muchos de estos productos han dejado de estar disponibles una vez ha finalizado el proyecto correspondiente. La consecuencia es que hay pocas posibilidades de que los distintos interesados del sector de la agricultura puedan acceder a los conocimientos disponibles para proseguir con las actividades de investigación y desarrollarlas. En este contexto el proyecto EUREKA se diseñó para proporcionar una solución a largo plazo gracias a la creación de un depósito permanente para reunir y seguir difundiendo contenidos y conjuntos de datos digitales relacionados con la agricultura.

El proyecto EUREKA es un proyecto del Horizonte 2020 financiado por la Unión Europea (con arreglo al acuerdo de subvención 862790) cuyo objetivo principal es reforzar y mejorar la corriente de conocimientos e innovaciones agrícolas a nivel europeo, nacional y regional. Está preparando la plataforma “FarmBook”, un depósito digital (que todavía se está desarrollando) para compartir y almacenar de forma permanente los objetos digitales creados por los proyectos de agentes múltiples financiados anteriormente. El depósito debe ser capaz de manejar objetos digitales heterogéneos (documentos, videos, audios, imágenes, conjuntos de datos de valores numéricos procedentes de mediciones sobre el terreno o transmitidos por sensores, etc.) disponibles en una variedad de formatos. Para facilitar el acceso y la reutilización de los objetos digitales, la FarmBook está aprovechando las normas de las web semánticas y los principios de datos localizables, accesibles, interoperables y reutilizables (FAIR) (Wilkinson, y otros, 2016).

La labor de diseño en EUREKA llevó consigo la creación de una estructura ligera (en relación con la semántica) de base gráfica para describir los temas de los objetos digitales de la FarmBook mediante la combinación de la categorización de temas agrícolas de la taxonomía de la EIP-AGRI con el tesauro del AGROVOC. La EIP-AGRI es una iniciativa encaminada a proporcionar a los agricultores y silvicultores el apoyo y los incentivos necesarios para establecer redes, innovar e intercambiar experiencias y prácticas. En este contexto, el portal de la EIP-AGRI opera como centro de coordinación para la comunidad agrícola de Europa al permitir el acceso a una variedad de recursos. El contenido disponible en el portal (como los extractos de prácticas, que son resúmenes de texto cortos de informaciones prácticas o recomendaciones, surgidas durante la ejecución de proyectos de agentes múltiples y cuya finalidad es que los utilicen los distintos agentes que participan en la cadena de valor) está etiquetado con las categorías de temas de la taxonomía de temas agrícolas de la EIP-AGRI. El amplio uso de esta taxonomía por parte de la comunidad ha llevado a la decisión de utilizarla como fundamento de nuestro modelo de temas.

Un grupo de organizaciones asociadas al proyecto, como la Universidad de agricultura de Atenas, la Universidad de Maastricht, el Instituto Ganadero, la Universidad de Gante, el Instituto de Economía Agrícola sin fines de lucro Kft  y el Leap Forward Group han colaborado en la preparación del modelo de temas.

The design work in EUREKA has involved the creation of a light-weight (in terms of semantics), graph-based structure to describe the topics of the FarmBook’s digital objects by combining the categorisation of agricultural topics in the EIP-AGRI taxonomy with the AGROVOC thesaurus. EIP-AGRI (i.e. the European Innovation Partnership for Agricultural Productivity and Sustainability) is an initiative aiming to provide farmers and foresters with the support and incentives needed to network, innovate, and share experiences and practices. In this context, the EIP-AGRI’s portal serves as a hub for the European agricultural community enabling access to a variety of resources.

Descripción del caso de uso

La metodología que se ha seguido en la preparación del modelo de temas se muestra en la figura 1.

 

Figura 1. Metodología seguida para la creación del modelo de temas en el proyecto EUREKA. Fuente: proyectos EUREKA, 2021.

Examen de la taxonomía de temas agrícolas de la EIP-AGRI Las categorías de temas de la EIP-AGRI se han establecido siguiendo un enfoque empírico ascendente basado en las cuestiones tratadas en los productos de los proyectos de investigación e innovación de agentes múltiples. No se han proporcionado definiciones para estas categorías de temas. Por esta razón, se ha emprendido un examen a fin de proponer una definición para cada categoría de temas de la EIP-AGRI basada en la literatura especializada. Las definiciones propuestas han ayudado a identificar los conceptos del AGROVOC que encajan con ellas y a crear la red semántica de cada categoría de temas de la taxonomía de la EIP-AGRI. La figura 2 muestra las categorías de temas de la EIP-AGRI.

Figura 2. Las categorías de temas de la EIP-AGRI adaptadas a partir del portal de la EIP-AGRI. Fuente: proyecto EUREKA, 2021.



Creación de una red semántica para cada categoría de temas de la EIP-AGRI – Cada categoría de temas de la taxonomía de la EIP-AGRI se ha vinculado con conceptos definidos en el tesauro del AGROVOC. El objetivo de esta actividad es identificar los conceptos del AGROVOC de alcance más amplio, más estricto o similar en relación con cada categoría de temas de la EIP-AGRI. Estos tipos de relaciones se han codificado en nuestro modelo utilizando las propiedades skos:broader (más amplio), skos:narrower (más concreto) y skos:closeMatch (suficientemente similar) de las normas del Sistema Simple de Organización del Conocimiento (SKOS) (Miles y Brickley, 2005). En el cuadro 1, que figura a continuación, se enumeran los conceptos del AGROVOC que el grupo de expertos en la materia ha identificado como más amplios, más concretos y similares respecto de la categoría de temas “Territorio/ordenación territorial” de la taxonomía de la EIP-AGRI. El establecimiento de vínculos formados con la ayuda de los tipos de relación mencionados se ha realizado sobre la base de las definiciones contenidas en las categorías de temas de la EIP-AGRI (creadas en el paso anterior) y en los conceptos del AGROVOC.

Cuadro 1. Categorías de temas de la EIP-AGRI y términos del AGROVOC de alcance más amplio, más concreto y similar. Fuente: proyecto EUREKA, 2021

Además de la identificación de los tipos de relaciones mencionados, cada categoría de temas de la EIP-AGRI se ha asociado con uno o varios sectores agrícolas (por ejemplo, “Agricultura”, “Ganadería” y “Silvicultura” – Acuicultura se ha excluido deliberadamente porque no hay proyectos de agentes múltiples del Horizonte 2020 que hayan tratado cuestiones de este sector concreto) y/o temas intersectoriales (esto es, “Medio ambiente”, “Sociedad” y “Economía”). Estas asociaciones se han determinado sobre la base de los conocimientos especializados del grupo de expertos en cada esfera y se han codificado en el modelo de temas utilizando el SKOS. Los conceptos del tesauro del AGROVOC, los sectores agrícolas y los temas intersectoriales, así como las propiedades del SKOS que los vinculan a cada una de las categorías de temas de la EIP-AGRI forman la red semántica de cada categoría de temas. La figura 3, que se encuentra a continuación, muestra la red semántica de la categoría de temas “Territorio/ordenación territorial”.

Figura 3. Red semántica de la EIP-AGRI para la categoría de temas “Territorio/ordenación territorial”. Fuente: proyecto EUREKA, 2021

Ensamblaje ensamblar del modelo de temas – La integración de las redes semánticas de todas las categorías de temas de la EIP-AGRI en un gráfico ha llevado a la construcción definitiva del modelo de temas de la FarmBook de EUREKA.

Beneficios de utilizar el tesauro del AGROVOC 

La creación de un modelo de temas basado en el uso de conceptos del AGROVOC tiene el objetivo de mejorar las operaciones de búsqueda y navegación en la plataforma FarmBook. Concretamente, el beneficio fundamental derivado del uso del AGROVOC es que se dispone de etiquetas en múltiples idiomas, ya que esto puede utilizarse para realizar búsquedas multilingües. Según Celli y Keizer (2016), la idea detrás del concepto de búsqueda multilingüe es que el usuario puede obtener resultados en idiomas distintos del utilizado al realizar la operación de búsqueda.

Gracias a la asociación de cada uno de los temas agrícolas en la taxonomía de la EIP-AGRI con conceptos de alcance más amplio, alcance más concreto o similar del AGROVOC, el usuario puede ciertamente recibir un conjunto mejorado de resultados (que abarque cuestiones de alcance más amplio, más concreto o similar en relación con un tema concreto – para suministrar conjuntos mejorados de resultados de búsquedas, los conceptos del AGROVOC también se han utilizado como palabras clave para la anotación de los objetos digitales de la FarmBook.) en idiomas distintos del de los términos de la búsqueda/pregunta. De este modo podemos dar soluciones a las necesidades de investigación exhaustiva (es decir, permitir que el usuario encuentre todo lo que esté disponible sobre un tema de búsqueda concreto) y de búsqueda exploratoria (es decir, dar al usuario algunos resultados “buenos” en caso de que no se esté seguro sobre lo que el usuario buscaba) con arreglo a la categorización de las necesidades de información mencionadas por Rosenfeld y otros (2015).

Próximos pasos

El próximo paso será la evaluación del modelo de temas por un grupo de expertos más amplio que el que intervino en la creación del modelo y para ello se utilizará una encuesta de evaluación. El objetivo de esta encuesta será recabar opiniones gracias a las cuales se podrá perfeccionar y ajustar el modelo con precisión (como se ilustra en la figura 1 por medio de las flechas que van de la fase de evaluación de la metodología hacia las fases anteriores). El modelo de temas se utilizará en la arquitectura de información de la plataforma FarmBook para etiquetar los objetos digitales. El desarrollo de su gráfico del marco para la descripción de recursos (rdf graph) mediante el uso de los programas adecuados (como Protégé - Brandt, 2011) permitirá que el modelo de temas se publique y esté disponible a través de un depósito de acceso abierto (como Zenodo).

Agradecimientos

La labor presentada en este documento se llevó a cabo en el marco del proyecto EUREKA del Horizonte 2020, que recibe financiación de la Unión Europea con arreglo al acuerdo de subvención 862790.

Referencias

Brandt, S. 2011. A practical guide to building owl ontologies using Protégé 4 and co-ode tools, edición 1.3. The university of Manchester107.

Celli, F. y Keizer, J. 2016. Enabling multilingual search through controlled vocabularies: The AGRIS approach. En Research Conference on Metadata and Semantics Research (págs. 237-248). Springer, Cham.

European Innovation Partnership for Agricultural Productivity and Sustainability 2017. Horizon 2020 multi-actor projects [15 de junio de 2021]https://ec.europa.eu/eip/agriculture/en/publications/eip-agri-brochure-horizon-2020-multi-actor. 

Miles, A. and Brickley, D. 2005. SKOS Core Vocabulary Specification: W3C Working Draft 2 November 2005 [23 de agosto de 2021]. https://www.w3.org/TR/2005/WD-swbp-skos-core-spec-200511 02/ .

Rosenfeld, L., Morville, P. y Arango, J., 2015. Information Architecture: For the Web and beyond. 4th edition. O’Reilly Media: Estados Unidos, California.

Wilkinson, M., Dumontier, M., Aalbersberg, I. et al. 2016. The FAIR Guiding Principles for scientific data management and stewardship  Sci Data 3160018 https://doi.org/10.1038/sdata.2016.18