Daily Scrum — 6 de febrero de 2026

🎯 Objetivo hoy

Completar comparación de algoritmos de clustering y generar FAQs.


✅ ¿Qué hice ayer?

  • Obtuve embeddings de preguntas sintéticas.
  • Implementé K-Means con K-Means++ initialization.
  • Implementé FCM con scikit-fuzzy.
  • Calculé Silhouette Score inicial para ambos.

🚀 ¿Qué haré hoy?

  1. Métricas de Validación Externa:
    • Calcular ARI (Adjusted Rand Index).
    • Calcular NMI (Normalized Mutual Information).
    • Comparar etiquetas predichas vs etiquetas reales.
  2. Análisis de FCM:
    • Calcular coeficiente de partición (FPC).
    • Identificar preguntas con membresía difusa (pertenecientes a múltiples clusters).
    • Analizar documentos “trampa” y su clasificación.
  3. Generación de FAQs:
    • Identificar centroides de cada cluster.
    • Encontrar preguntas más cercanas a cada centroide.
    • Generar lista de “Preguntas Sugeridas” por tema.
  4. Documentación de Resultados:
    • Crear tabla comparativa K-Means vs FCM.
    • Justificar elección de k basada en métricas.

🚧 Obstáculos potenciales

  • Documentos “trampa” pueden distorsionar métricas.
  • Interpretación del coeficiente de partición FCM.

✅ Criterios de aceptación

  • ARI and NMI calculados para ambos algoritmos.
  • Coeficiente de partición FCM documentado.
  • Lista de FAQs generada (centroides).
  • Tabla comparativa K-Means vs FCM documentada.

📊 Progreso del Sprint 6

Semana 1 ✅

  • Prompts de Razonamiento (Chain-of-Thought)
  • Generación de Dataset Sintético

Semana 2 ✅

  • Topic Modeling con NMF
  • Clustering de FAQs (K-Means + FCM)

Semana 3 (Próxima)

  • Módulo de Evaluación de Dificultad
  • Notebook de Validación Matemática
  • Persistencia de Perfiles y Visualización