Clustering large dimensional data via second order statistics: applications in wireless communications

Author

Pereira, Roberto Matheus Pinheiro

Director

Mestre Pons, Francesc X.

Codirector

Gregoratti, David

Tutor

Pascual Iserte, Antonio

Date of defense

2023-12-19

Pages

173 p.



Department/Institute

Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions

Doctorate programs

DOCTORAT EN TEORIA DEL SENYAL I COMUNICACIONS (Pla 2013)

Abstract

(English) In many modern signal processing applications, traditional machine learning and pattern recognition methods heavily rely on the having a sufficiently large amount of data samples to correctly estimate the underlying structures within complex signals. The main idea is to understand the inherent structural information and relationships embedded within the raw data, thereby enabling a wide variety of inference tasks. Nevertheless, the definition of what constitutes a sufficiently large dataset remains subjective and it is often problem-dependent. In this context, traditional learning approaches often fail to learn meaningful structures in the cases where the number of features closely matches (or even exceeds) the number of observations. These scenarios emphasize the need for tailored strategies that effectively extract meaningful structured information from these high-dimensional settings. In this thesis we address fundamental challenges posed by applying traditional machine learning techniques in large dimensional settings. Particularly, this thesis explores the comparison and clustering of symmetric positive definite matrices, such as covariance matrices, seen as objects in a Riemannian manifold. Initially, we investigate the asymptotic behavior of distances between sample covariance matrices by establishing a central limit theorem (CLT) that allows us to describe the asymptotic statistical law of these distances. We provide a general result for the class of distances that can be expressed as sums of traces of functions applied separately to each covariance matrix. This class includes conventional metrics like the Euclidean distance and Jeffreys' divergence, as well as more advanced distances found in Riemannian geometry, such as the log-Euclidean metric. Subsequently, we extend these findings to address the challenge of consistently estimating the distance between covariance matrices directly from the data. We complement this with a new statistical analysis of the asymptotic behavior of this category of distance estimators. Finally, we showcase the practical implications of these results by demonstrating how unsupervised learning algorithms can leverage them, with specific applications in wireless communications. In doing so, this thesis contributes with theoretical insights into unsupervised learning mechanisms, with a practical orientation toward wireless communication systems. The overarching aim is to facilitate the integration and interpretability of unsupervised learning solutions in forthcoming wireless networks and broader signal processing challenges.


(Español) En varias aplicaciones modernas de procesado de señales, los métodos tradicionales de aprendizaje automático y reconocimiento de patrones dependen en gran medida de la presencia de una cantidad de muestras de datos suficientemente grande para estimar correctamente las estructuras subyacentes en señales complejas. La idea principal es adquirir la información estructural inherente y las relaciones intrínsecas dentro de los datos brutos, lo que permite una amplia variedad de tareas de inferencia. Sin embargo, la definición de lo que constituye un conjunto de datos suficientemente grande sigue siendo subjetiva y a su vez depende del problema. En este contexto, los enfoques de aprendizaje tradicionales a menudo fallan al aprender estructuras significativas, especialmente en los casos en los que la dimensíon de los dados es muy similar (o incluso superior) al número de observaciones. Estos escenarios enfatizan la necesidad de diseñar nuevas estrategias que permitan extraer de forma eficaz información estructurada y significativa desde estos contextos de alta dimensionalidad. En esta tesis abordamos los desafíos fundamentales que plantean la aplicación de las técnicas tradicionales de aprendizaje automático en entornos de grandes dimensiones. En concreto, esta tesis explora la comparación y el agrupamiento de matrices simétricas definidas positivas, como las matrices de covarianza, vistas como objetos en una variedad de Riemann. Inicialmente, investigamos el comportamiento asintótico de las distancias entre matrices de covarianza muestral estableciendo un teorema central del límite que nos permite describir la distribución asintótica de estas distancias. En concreto, presentamos un resultado general para la familia de distancias que pueden expresarse como sumas de trazas de funciones aplicadas por separado a cada matriz de covarianza. Esta familia incluye métricas convencionales como la distancia euclidiana y la divergencia de Jeffreys, así como distancias más avanzadas basadas en la geometría riemanniana, como la métrica log-euclidiana. Posteriormente, ampliamos estos hallazgos para abordar el reto de estimar coherentemente la distancia entre matrices de covarianza directamente a partir de los datos asociados a ellas. Complementamos este estudio con un nuevo análisis estadístico del comportamiento asintótico de esta categoría de estimadores de distancia. Finalmente, mostramos las implicaciones prácticas de estos resultados demostrando cómo algoritmos de aprendizaje no supervisado pueden hacer uso de esas métricas y su respectivas distribuciones asintóticas, con aplicaciones específicas en la comunicación inalámbrica. De este modo, esta tesis aporta perspectivas teóricas sobre los mecanismos de aprendizaje no supervisado, con una orientación práctica hacia los sistemas de comunicación inalámbrica. El objetivo principal es facilitar la integración y la interpretabilidad de las soluciones de aprendizaje no supervisado en las redes inalámbricas de próxima generación, así como en desafíos más amplios en el procesado de señales.

Subjects

621.3 Electrical engineering

Knowledge Area

Àrees temàtiques de la UPC::Enginyeria de la telecomunicació

Note

Tesi amb menció de Doctorat Internacional

Documents

TRMPP1de1.pdf

1.453Mb

 

Rights

ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)