PyPortfolioOpt HRP: Clustering Jerárquico
La agrupación jerárquica (Hierarchical Clustering) es una de las técnicas de aprendizaje no supervisado más versátiles y poderosas disponibles para el a...
La agrupación jerárquica (Hierarchical Clustering) es una de las técnicas de aprendizaje no supervisado más versátiles y poderosas disponibles para el análisis de datos. A diferencia de métodos planos como K-Means, que requieren definir el número de clusters de antemano, la agrupación jerárquica construye una estructura de árbol (dendrograma) que revela las relaciones de similitud entre los puntos de datos en múltiples niveles. Esta guía explora los fundamentos teóricos, la implementación práctica en Python utilizando bibliotecas como scikit-learn y scipy, y aplicaciones avanzadas en la optimización de carteras financieras mediante el algoritmo de Paridad de Riesgo Jerárquica (HRP). La agrupación jerárquica organiza los datos en una jerarquía de clusters anidados. El resultado es un dendrograma, un diagrama de árbol que visualiza cómo los clusters se fusionan (enfoque aglomerativo) o se dividen (enfoque divisivo) a medida que cambia la distancia o disimilitud. 1. Aglomerativa (Bottom-Up): Es el método más común. Comienza tratando cada punto de datos como un cluster individual. En cada paso, fusiona los dos clusters más cercanos hasta que todos los puntos formen un solo cluster.