Sistemas de IA / Flujo de análisis
DataBrief AI
Un flujo de trabajo de IA acotado que convierte hojas de cálculo en informes de negocio contrastados — sin inventar métricas que los datos no respaldan.
DataBrief AI analiza archivos CSV/XLSX mediante detección de roles semánticos, ejecución Python controlada, reparación acotada y exportación de informes. El sistema está diseñado para mostrar lo que los datos pueden respaldar y hacer explícitas las métricas no disponibles.
Resumen del proyecto
Qué es el sistema
Tipo
Sistema de reporting con IA
Uso
Análisis de hojas de cálculo, briefs de negocio y apoyo a decisiones
Rol
Arquitectura de sistema, lógica de producto, implementación frontend/backend y diseño de flujo con IA
Stack
Next.js, FastAPI, runtime de análisis Python, SQLite, parsing CSV/XLSX y ejecución controlada
Estado
Prototipo con demo en vivo y GitHub disponible
Contexto de negocio
El problema de flujo del proyecto
Los flujos de reporting suelen empezar con archivos CSV o XLSX desordenados y terminar con resúmenes que parecen seguros incluso cuando los datos no los respaldan. Este proyecto explora cómo la IA puede acelerar briefs de negocio manteniendo visibles las métricas no soportadas, las advertencias y los límites de calidad del dato.
Sistema / Solución
Cómo se acota el flujo
El sistema acepta hojas de cálculo, perfila el dataset, identifica campos disponibles, planifica solo análisis respaldados, ejecuta Python controlado, evalúa fallos y exporta un informe cuyas afirmaciones quedan ligadas a resultados calculados. La revisión humana sigue siendo central porque el sistema muestra incertidumbre en vez de esconderla.
Inputs
CSV o XLSX con estructura desconocida, valores ausentes, duplicados y roles de columna inconsistentes.
Flujo
Validación de subida, perfilado semántico, selección de ruta, planificación acotada, ejecución, evaluación, reparación y exportación.
Lógica de proceso
El Python generado se ejecuta bajo verificaciones estáticas y límites; las métricas no soportadas se eliminan o se marcan como no disponibles.
Resultado
Informe de negocio estructurado, hallazgos, gráficos, código generado y artefactos exportables para revisión.
Límites
Advertencias, comprobaciones de afirmaciones no soportadas, límite de reparación y almacén de ejecuciones hacen el resultado más trazable.
Resumen
La promesa del producto es la contención
Las hojas de cálculo suelen contener señales de negocio útiles, pero los informes de IA se vuelven engañosos cuando calculan métricas que el dataset no puede respaldar. DataBrief AI se construye alrededor de una pregunta más estricta: ¿qué puede probar este archivo y qué debería negarse a inferir el sistema?
Recuento de pedidos / Valor medio de pedido
- Razón
- No se detectó ningún ID de pedido.
- Resultado
- El informe cambia al análisis por línea de compra en lugar de inventar métricas de pedidos.
Tasa de devolución/cancelación = 0%
- Razón
- No se detectó ningún campo de devolución, reembolso, cancelación ni estado.
- Resultado
- El informe marca la métrica como no disponible en lugar de mostrar un cero falso.
El valor del flujo no está en que intente responder a todo. Está en que hace visibles las afirmaciones no soportadas antes de que se conviertan en métricas de negocio.
Flujo de trabajo
Cuatro fases, límites claros
El software mantiene un flujo estricto detrás de la presentación simplificada: valida la subida, analiza el dataset, enruta el dominio, planifica el análisis soportado, ejecuta el Python generado, evalúa el resultado, repara solo los fallos recuperables y empaqueta el informe y las exportaciones.
Análisis
Lee filas, columnas, tipos, valores ausentes, duplicados y roles semánticos de los campos.
Enrutamiento y plan
Clasifica el dominio del dataset y construye un plan acotado de KPIs y gráficos solo desde las señales detectadas.
Ejecución
Ejecuta análisis Python controlado para crear métricas, gráficos y artefactos estructurados.
Evaluación y exportación
Clasifica los resultados de la ejecución, repara solo los fallos recuperables, contrasta el informe y empaqueta las exportaciones.
Resultado
Un informe que separa señal de advertencia
La página mantiene una sola vista previa de informe sólida y tres tarjetas de apoyo, en lugar de repetir el mismo ejemplo visual en cada sección.
Métricas soportadas
El informe arranca con las métricas que el archivo subido puede realmente respaldar.
Hallazgos contrastados
Los hallazgos y controles de calidad se muestran antes de la interpretación.
Artefactos y exportaciones
El Markdown del informe, el JSON de hallazgos, los gráficos y el código de análisis quedan vinculados a cada ejecución.
Arquitectura
El software es un flujo acotado, no un chatbot con envoltura de API
El sistema se organiza alrededor de fronteras de servicio explícitas: analizar primero, enrutar desde señales detectables, generar código de análisis desde plantillas, ejecutarlo bajo restricciones, evaluar el resultado y exponer artefactos mediante endpoints de exportación estables.
Frontera HTTP
FastAPI acepta subidas CSV/XLSX, valida tamaño y formato, crea un registro de ejecución y expone endpoints de estado, artefactos y exportaciones sin filtrar rutas del host.
Análisis semántico
El backend analiza filas, columnas, valores ausentes, duplicados, tipos inferidos y roles semánticos antes de decidir qué camino de análisis está permitido.
Ejecución controlada
El Python generado desde plantillas se verifica con reglas de importación AST y guardas de patrones sospechosos, y luego se ejecuta en un subproceso aislado con límites de tiempo y recursos.
Bucle de evaluación
Los resultados de ejecución se clasifican como éxito, recuperables o irrecuperables. Los fallos recuperables reciben como máximo dos intentos de reparación deterministas.
Informe contrastado
El generador de informes construye KPIs, hallazgos, advertencias, recomendaciones y aclaraciones solo desde los resultados calculados, y revisa en un único pase las afirmaciones no soportadas.
Almacén de ejecuciones
SQLite rastrea estado de ejecución, ruta, plan, evaluación, contador de reintentos, código generado, payload del informe, caducidad y metadatos de exportación de cada subida.
Resultado
Un sistema de IA útil porque sabe cuándo parar
DataBrief AI usa patrones agénticos — enrutamiento, evaluación, reparación acotada y generación contrastada — dentro de un shell de flujo determinista.
Decisión de producto
Un flujo acotado encaja mejor con el análisis de hojas de cálculo que un agente de forma libre, porque la tarea tiene una estructura repetible.
Marco de fiabilidad
El sistema valora los avisos explícitos, la ejecución controlada y los resultados respaldados por encima de la autonomía amplia.
Límite público
El caso de estudio muestra arquitectura y comportamiento sin posicionar el prototipo como SaaS de producción.
Construido con
Límites
- No está posicionado como SaaS de producción.
- No es un agente de IA completamente autónomo.
- No implementa aislamiento a nivel de sistema operativo.
- No enriquece las subidas con fuentes externas de internet.
- La calidad de los resultados depende de los roles de columna detectables y la estructura del dataset.
- El enrutamiento específico para rendimiento de campañas es una extensión de dominio futura.
Por qué importa
La fiabilidad pesa más que la novedad
Muchas herramientas de reporting con IA fallan cuando tratan el modelo como analista abierto. DataBrief AI hace lo contrario: entradas claras, ejecución controlada, restricciones explícitas y resultados revisables. Eso encaja mejor con equipos reales, donde la calidad del informe y la trazabilidad de la decisión pesan más que la autonomía amplia.
Uso para clientes
Dónde se vuelve útil
Una versión para cliente podría ayudar a equipos creativos, de marca, investigación u operaciones a reducir reporting manual, estandarizar resúmenes recurrentes y mejorar análisis asistidos por IA sin presentar conclusiones no soportadas como hechos.
Hablar de un sistema IA similar
¿Tienes un sistema creativo que merece desarrollarse?
Si tu equipo tiene un proceso creativo, herramienta interna, flujo de campaña o sistema de marca que merece ampliarse con IA, envía un brief breve y te ayudo a definir la lógica más clara.