Daily Scrum — 4 de febrero de 2026

🎯 Objetivo hoy

Completar NMF con métricas de coherencia y generar visualizaciones.

Comparación de Funciones de Coste:
- Probar KL-divergence vs Frobenius.
- Documentar diferencias en resultados.
Métricas de Coherencia Semántica:
- Implementar cálculo de coherencia UCI.
- Implementar coherencia UMass.
- Comparar coherencia entre diferentes valores de k.
Visualizaciones de Tópicos:
- Generar wordclouds por tópico.
- Crear matriz de distribución documento-tópico.
- Guardar visualizaciones en data/visualizations/.
Mapa de Conceptos:
- Generar estructura de conceptos basada en tópicos.
- Preparar formato para futura integración en interfaz.

Coherencia UCI y UMass calculadas (implementación manual).
Visualizaciones generadas y guardadas en data/visualizations/.
Documentación de comparación Frobenius vs KL (Frobenius mejor: purity 0.77 vs 0.62).
Estructura de mapa de conceptos definida (concept_map.json).

Conclusión: Frobenius norm produce tópicos más coherentes y con mejor separación.

Experimento Adicional: Se comparó KL-divergence usando Bag-of-Words (conteos puros) vs Frobenius con TF-IDF.

TF-IDF + Frobenius: Purity 0.7625
BoW + KL: Purity 0.5531
Resultado: Frobenius sigue ganando en este dataset sintético (probablemente debido a la uniformidad de longitud de los documentos).

# UCI: PMI con sliding window
pmi = log((P(w1,w2) + ε) / (P(w1) × P(w2)))

# UMass: Co-ocurrencia documental  
score = log((D(w1,w2) + 1) / D(w2))