Daily Scrum — 5 de febrero de 2026

🎯 Objetivo hoy

Implementar clustering de FAQs con K-Means y FCM.

Preparación de Embeddings:
- Obtener embeddings de las preguntas sintéticas.
- Usar modelo de embeddings del RAG (text-embedding-3-small).
- Normalizar embeddings para clustering.
Clustering K-Means:
- Crear scripts/math/faq_clustering.py.
- Implementar K-Means con inicialización K-Means++.
- Probar diferentes valores de k (3, 5, 7).
- Aplicar Elbow Method para selección de k.
Clustering FCM (Fuzzy C-Means):
- Integrar scikit-fuzzy.
- Implementar FCM con parámetro de fuzziness m=2.
- Obtener grados de pertenencia por pregunta.
Comparación Inicial:
- Calcular Silhouette Score para ambos algoritmos.
- Documentar diferencias observadas.

Acción	Archivo
NEW	`scripts/math/faq_clustering.py`
NEW	`output/clustering/comparison.png`
NEW	`output/clustering/elbow_tfidf.png`
NEW	`output/clustering/elbow_bow.png`
NEW	`output/clustering/fcm_membership_tfidf.png`
NEW	`output/clustering/fcm_membership_bow.png`
NEW	`output/clustering/results.json`

Punto 1 y 2: Implementación de K-Means y FCM desde cero.
Embeddings: Integración de nomic-embed-text via Ollama finalizada.
NMF: Integración de embeddings en Topic Modeling con interpretación semántica.
Resultados: Comparativa final completada (Embeddings Silhouette: 0.24 vs TF-IDF: 0.13).

scripts/math/faq_clustering.py: Añadido soporte Ollama y robustez K-Means++.
scripts/math/topic_modeling.py: Añadido OllamaEmbeddings e interpretación de tópicos.
output/clustering/: Nuevas gráficas comparativas y heatmaps de embeddings.

Aplicar estos modelos de clustering para el etiquetado automático de nuevas FAQs en el chatbot.
Implementar visualización de tópicos 3D usando PCA/t-SNE sobre los embeddings.
Comparar TF-IDF vs BoW vs Embeddings