Automated integration and analysis of big data in forestry management

dc.contributor
Universitat de Lleida. Departament d'Informàtica i Enginyeria Industrial
dc.contributor.author
Tejada Gutiérrez, Eva Luz
dc.date.accessioned
2025-12-02T13:37:43Z
dc.date.issued
2025-11-05
dc.identifier.uri
http://hdl.handle.net/10803/696004
dc.description.abstract
La biodiversitat d’espècies als ecosistemes del món és un indicador clau de la salut dels boscos i del benestar de la humanitat. Els boscos —i les plantes en general— són essencials pel valor que aporten en àmbits tan diversos com la silvicultura o l’economia. En els darrers anys, aquests s’han vist amenaçats per causes com l’escalfament global o la desforestació, que posen en risc totes les formes de vida que depenen d’ells. Per tal de revertir aquesta situació, cal trobar la manera d’assolir un desenvolupament sostenible sense comprometre els boscos ni els ecosistemes. Per tant, l’objectiu principal d’aquesta tesi és conèixer l’estat actual de les dades sobre plantes a escala mundial, analitzar-les i observar els canvis i la distribució de les espècies en els darrers anys. Per aconseguir-ho, es van identificar diferents fonts de dades, i després d’extreure-les, es van processar i depurar per garantir-ne la qualitat, per després integrar-les periòdicament de manera semiautomàtica. Aquestes dades han permès conèixer la distribució de les espècies al llarg del temps i de la geografia, informació necessària per calcular els índexs de biodiversitat. Posteriorment, utilitzant mètodes d’aprenentatge automàtic no supervisat, es van poder establir categories en funció dels índexs calculats, i es van identificar patrons en els ecosistemes i com han evolucionat al llarg del temps per predir comportaments futurs. Com a resultat, es van integrar més de 160 milions de registres de presència de plantes de la majoria de països. Per tal de facilitar la consulta dinàmica d’aquesta informació, s’ha dissenyat i desenvolupat la plataforma ForestForward, d’accés obert, que permet la cerca per any i ubicació geogràfica, útil per analitzar com ha canviat la biodiversitat al llarg dels darrers 50 anys. Els resultats obtinguts del càlcul dels índexs de biodiversitat mostren les regions del món amb major disponibilitat de dades i, per tant, amb més riquesa d’espècies. L’agrupació (clustering) de polígons segons els índexs de biodiversitat en els darrers 50 anys ha demostrat que les zones amb més característiques en comú també comparteixen certs patrons d’evolució al llarg del temps.
ca
dc.description.abstract
La biodiversidad de especies en los ecosistemas del mundo, es un gran indicador de la salud de los bosques y de la humanidad. Los bosques y plantas en general, son importantes debido a el valor que aportan en ámbitos tan amplios que van desde la silvicultura hasta la economía. En los recientes años estos se han visto amenazados por casusas, como el calentamiento global o la deforestación, que ponen en riesgo todas las formas de vida que dependen de ellos. Para enmendar esto, se debe encontrar la forma de alcanzar un desarrollo sostenible sin poner en riesgo los bosques y los ecosistemas. Por consiguiente, el objetivo principal de esta tesis es conocer el estado de los datos sobre plantas en el mundo, para analizarlos y ver en ellos sus cambios y la distribución de las especies en los últimos años. Para alcanzarlo, fue necesario encontrar diferentes fuentes de datos, y después de extraerlos, procesarlos y depurarlos para asegurar su calidad, se pasó a integrarlos periódicamente de forma semiautomática. Estos datos permitieron conocer la distribución de las especies a lo largo del tiempo y de la geografía, información necesaria para calcular índices de biodiversidad. Posteriormente al utilizar métodos de aprendizaje automático no supervisado, se pudo establecer categorías en función de los índices calculados y se establecieron patrones en los ecosistemas y cómo han evolucionado a través del tiempo para predecir comportamientos futuros. Como resultado se integraron 160 millones de registros de presencia de plantas de la mayoría de los países. Para la consulta dinámica de esa información se ha diseñado y desarrollado la plataforma ForestForward, a la que se puede acceder abiertamente, y donde se ha integrado una búsqueda por año y ubicación geográfica, útil para analizar cómo ha cambiado la biodiversidad en el transcurso de los últimos 50 años. Los resultados obtenidos del cálculo de los índices de biodiversidad muestran las regiones del mundo con mayor disponibilidad de datos y por tanto de riqueza de especies. La clusterización de polígonos con respecto a los índices de biodiversidad en los últimos 50 años ha mostrado que las zonas con más características en común de biodiversidad también comparten ciertos rasgos de evolución de estos en el tiempo. Un caso práctico es el desarrollo sostenible impulsado en Polonia en los últimos años, que ha facilitado la aplicación de políticas que propenden por la conservación de la biodiversidad y el cuidado de los recursos naturales, fomentando una economía sustentable que ayude a mitigar los efectos del cambio climático. En conclusión, conocer la biodiversidad de plantas en el mundo es una herramienta para la toma de decisiones sostenibles, aportando una visión más global de cómo se ven afectadas las plantas y bosques en el transcurso del tiempo.
ca
dc.description.abstract
Species biodiversity within global ecosystems is a key indicator of both forest health and human well-being. Forests—and plants in general—are crucial due to the value they provide across a wide range of domains, from forestry to economics. In recent years, forests have been increasingly threatened by factors such as global warming and deforestation, endangering all forms of life that depend on them. To address this, it is essential to find ways to achieve sustainable development without compromising forests and ecosystems. Therefore, the main objective of this thesis is to understand the current state of plant data around the world, to analyse these data and examine changes in species distribution over recent years. To achieve this, various data sources were identified, and after extraction, the data were processed and cleaned to ensure quality before being semi-automatically integrated on a regular basis. These datasets made it possible to explore species distribution over time and across geographic regions—information that is critical for calculating biodiversity indices. Subsequently, through the use of unsupervised machine learning methods, categories were established based on the calculated indices, revealing patterns in ecosystems and how they have evolved over time, enabling predictions of future trends. As a result, over 160 million records of plant occurrences from most countries were integrated. To enable dynamic access to this information, the ForestForward platform was designed and developed. It is openly accessible and includes functionality to search by year and geographic location, facilitating the analysis of how biodiversity has changed over the past 50 years. The results obtained from biodiversity index calculations highlight the regions of the world with the greatest data availability—and therefore the greatest species richness. The clustering of polygons based on biodiversity indices over the last 50 years revealed that regions with similar biodiversity characteristics also share common patterns in how these characteristics have evolved over time. A practical example is the case of Poland, where sustainable development policies in recent years have promoted biodiversity conservation and the protection of natural resources, supporting a sustainable economy aimed at mitigating the effects of climate change. In conclusion, understanding global plant biodiversity is a key tool for sustainable decision-making, offering a broader view of how plant life and forests are being affected over time.
ca
dc.format.extent
120 p.
ca
dc.language.iso
eng
ca
dc.publisher
Universitat de Lleida
dc.rights.license
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/
ca
dc.rights.uri
http://creativecommons.org/licenses/by-nc-sa/4.0/
*
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Integració
ca
dc.subject
Bases de dades
ca
dc.subject
Forestal
ca
dc.subject
Integración
ca
dc.subject
Bases de datos
ca
dc.subject
Integration
ca
dc.subject
Databases
ca
dc.subject
Forest
ca
dc.subject.other
Enginyeria informàtica
ca
dc.title
Automated integration and analysis of big data in forestry management
ca
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
004
ca
dc.contributor.director
Sorribas Tello, Albert
dc.contributor.director
Alves, Rui
dc.contributor.tutor
Solsona Tehàs, Francesc
dc.embargo.terms
12 mesos
ca
dc.date.embargoEnd
2026-11-05T01:00:00Z
dc.rights.accessLevel
info:eu-repo/semantics/embargoedAccess


Documents

This document contains embargoed files until 2026-11-05

This item appears in the following Collection(s)