Daily Scrum — 6 de febrero de 2026
🎯 Objetivo hoy
Completar comparación de algoritmos de clustering y generar FAQs.
✅ ¿Qué hice ayer?
- Obtuve embeddings de preguntas sintéticas.
- Implementé K-Means con K-Means++ initialization.
- Implementé FCM con scikit-fuzzy.
- Calculé Silhouette Score inicial para ambos.
🚀 ¿Qué haré hoy?
- Métricas de Validación Externa:
- Calcular ARI (Adjusted Rand Index).
- Calcular NMI (Normalized Mutual Information).
- Comparar etiquetas predichas vs etiquetas reales.
- Análisis de FCM:
- Calcular coeficiente de partición (FPC).
- Identificar preguntas con membresía difusa (pertenecientes a múltiples clusters).
- Analizar documentos “trampa” y su clasificación.
- Generación de FAQs:
- Identificar centroides de cada cluster.
- Encontrar preguntas más cercanas a cada centroide.
- Generar lista de “Preguntas Sugeridas” por tema.
- Documentación de Resultados:
- Crear tabla comparativa K-Means vs FCM.
- Justificar elección de k basada en métricas.
🚧 Obstáculos potenciales
- Documentos “trampa” pueden distorsionar métricas.
- Interpretación del coeficiente de partición FCM.
✅ Criterios de aceptación
- ARI and NMI calculados para ambos algoritmos.
- Coeficiente de partición FCM documentado.
- Lista de FAQs generada (centroides).
- Tabla comparativa K-Means vs FCM documentada.
📊 Progreso del Sprint 6
Semana 1 ✅
- Prompts de Razonamiento (Chain-of-Thought)
- Generación de Dataset Sintético
Semana 2 ✅
- Topic Modeling con NMF
- Clustering de FAQs (K-Means + FCM)
Semana 3 (Próxima)
- Módulo de Evaluación de Dificultad
- Notebook de Validación Matemática
- Persistencia de Perfiles y Visualización