RM
Volver a casos

Sistemas de IA / Flujo de análisis

DataBrief AI

Un flujo de trabajo de IA acotado que convierte hojas de cálculo en informes de negocio contrastados — sin inventar métricas que los datos no respaldan.

DataBrief AI analiza archivos CSV/XLSX mediante detección de roles semánticos, ejecución Python controlada, reparación acotada y exportación de informes. El sistema está diseñado para mostrar lo que los datos pueden respaldar y hacer explícitas las métricas no disponibles.

IA acotadaCSV/XLSXPythonExportación de informesBucle de evaluación
Informe de análisisConfianza de datos: Alta
Ejecución completadaMétricas no soportadas marcadas
Métrica principal$10.482Gasto total detectado
Líneas de compra1.248Filas con señal de compra
Gasto medio por fila$8,40Soportado por datos de fila
Recuento de pedidos y Valor medio de pedido no están disponibles porque no se detectó ningún ID de pedido.
Vista previa representativa del informe con métricas soportadas y avisos explícitos.

Resumen del proyecto

Qué es el sistema

Tipo

Sistema de reporting con IA

Uso

Análisis de hojas de cálculo, briefs de negocio y apoyo a decisiones

Rol

Arquitectura de sistema, lógica de producto, implementación frontend/backend y diseño de flujo con IA

Stack

Next.js, FastAPI, runtime de análisis Python, SQLite, parsing CSV/XLSX y ejecución controlada

Estado

Prototipo con demo en vivo y GitHub disponible

Contexto de negocio

El problema de flujo del proyecto

Los flujos de reporting suelen empezar con archivos CSV o XLSX desordenados y terminar con resúmenes que parecen seguros incluso cuando los datos no los respaldan. Este proyecto explora cómo la IA puede acelerar briefs de negocio manteniendo visibles las métricas no soportadas, las advertencias y los límites de calidad del dato.

Sistema / Solución

Cómo se acota el flujo

El sistema acepta hojas de cálculo, perfila el dataset, identifica campos disponibles, planifica solo análisis respaldados, ejecuta Python controlado, evalúa fallos y exporta un informe cuyas afirmaciones quedan ligadas a resultados calculados. La revisión humana sigue siendo central porque el sistema muestra incertidumbre en vez de esconderla.

Inputs

CSV o XLSX con estructura desconocida, valores ausentes, duplicados y roles de columna inconsistentes.

Flujo

Validación de subida, perfilado semántico, selección de ruta, planificación acotada, ejecución, evaluación, reparación y exportación.

Lógica de proceso

El Python generado se ejecuta bajo verificaciones estáticas y límites; las métricas no soportadas se eliminan o se marcan como no disponibles.

Resultado

Informe de negocio estructurado, hallazgos, gráficos, código generado y artefactos exportables para revisión.

Límites

Advertencias, comprobaciones de afirmaciones no soportadas, límite de reparación y almacén de ejecuciones hacen el resultado más trazable.

Resumen

La promesa del producto es la contención

Las hojas de cálculo suelen contener señales de negocio útiles, pero los informes de IA se vuelven engañosos cuando calculan métricas que el dataset no puede respaldar. DataBrief AI se construye alrededor de una pregunta más estricta: ¿qué puede probar este archivo y qué debería negarse a inferir el sistema?

Afirmación no soportada evitada

Recuento de pedidos / Valor medio de pedido

Razón
No se detectó ningún ID de pedido.
Resultado
El informe cambia al análisis por línea de compra en lugar de inventar métricas de pedidos.
Afirmación no soportada evitada

Tasa de devolución/cancelación = 0%

Razón
No se detectó ningún campo de devolución, reembolso, cancelación ni estado.
Resultado
El informe marca la métrica como no disponible en lugar de mostrar un cero falso.
Principio de diseñoFiabilidad por encima de autonomía.

El valor del flujo no está en que intente responder a todo. Está en que hace visibles las afirmaciones no soportadas antes de que se conviertan en métricas de negocio.

Flujo de trabajo

Cuatro fases, límites claros

El software mantiene un flujo estricto detrás de la presentación simplificada: valida la subida, analiza el dataset, enruta el dominio, planifica el análisis soportado, ejecuta el Python generado, evalúa el resultado, repara solo los fallos recuperables y empaqueta el informe y las exportaciones.

AnálisisEnrutamiento y planEjecuciónEvaluación y exportación

Análisis

Lee filas, columnas, tipos, valores ausentes, duplicados y roles semánticos de los campos.

Enrutamiento y plan

Clasifica el dominio del dataset y construye un plan acotado de KPIs y gráficos solo desde las señales detectadas.

Ejecución

Ejecuta análisis Python controlado para crear métricas, gráficos y artefactos estructurados.

Evaluación y exportación

Clasifica los resultados de la ejecución, repara solo los fallos recuperables, contrasta el informe y empaqueta las exportaciones.

Resultado

Un informe que separa señal de advertencia

La página mantiene una sola vista previa de informe sólida y tres tarjetas de apoyo, en lugar de repetir el mismo ejemplo visual en cada sección.

Informe de análisisConfianza de datos: Alta
Ejecución completadaMétricas no soportadas marcadas
Métrica principal$10.482Gasto total detectado
Líneas de compra1.248Filas con señal de compra
Gasto medio por fila$8,40Soportado por datos de fila
Recuento de pedidos y Valor medio de pedido no están disponibles porque no se detectó ningún ID de pedido.
Vista previa representativa de una ejecución. Las métricas de pedido no soportadas se marcan explícitamente.
A

Métricas soportadas

El informe arranca con las métricas que el archivo subido puede realmente respaldar.

B

Hallazgos contrastados

Los hallazgos y controles de calidad se muestran antes de la interpretación.

C

Artefactos y exportaciones

El Markdown del informe, el JSON de hallazgos, los gráficos y el código de análisis quedan vinculados a cada ejecución.

Arquitectura

El software es un flujo acotado, no un chatbot con envoltura de API

El sistema se organiza alrededor de fronteras de servicio explícitas: analizar primero, enrutar desde señales detectables, generar código de análisis desde plantillas, ejecutarlo bajo restricciones, evaluar el resultado y exponer artefactos mediante endpoints de exportación estables.

Frontera HTTP

FastAPI acepta subidas CSV/XLSX, valida tamaño y formato, crea un registro de ejecución y expone endpoints de estado, artefactos y exportaciones sin filtrar rutas del host.

Análisis semántico

El backend analiza filas, columnas, valores ausentes, duplicados, tipos inferidos y roles semánticos antes de decidir qué camino de análisis está permitido.

Ejecución controlada

El Python generado desde plantillas se verifica con reglas de importación AST y guardas de patrones sospechosos, y luego se ejecuta en un subproceso aislado con límites de tiempo y recursos.

Bucle de evaluación

Los resultados de ejecución se clasifican como éxito, recuperables o irrecuperables. Los fallos recuperables reciben como máximo dos intentos de reparación deterministas.

Informe contrastado

El generador de informes construye KPIs, hallazgos, advertencias, recomendaciones y aclaraciones solo desde los resultados calculados, y revisa en un único pase las afirmaciones no soportadas.

Almacén de ejecuciones

SQLite rastrea estado de ejecución, ruta, plan, evaluación, contador de reintentos, código generado, payload del informe, caducidad y metadatos de exportación de cada subida.

Resultado

Un sistema de IA útil porque sabe cuándo parar

DataBrief AI usa patrones agénticos — enrutamiento, evaluación, reparación acotada y generación contrastada — dentro de un shell de flujo determinista.

Decisión de producto

Un flujo acotado encaja mejor con el análisis de hojas de cálculo que un agente de forma libre, porque la tarea tiene una estructura repetible.

Marco de fiabilidad

El sistema valora los avisos explícitos, la ejecución controlada y los resultados respaldados por encima de la autonomía amplia.

Límite público

El caso de estudio muestra arquitectura y comportamiento sin posicionar el prototipo como SaaS de producción.

Construido con

Frontend Next.jsBackend FastAPIRuntime de análisis PythonProcesamiento CSV/XLSXVerificaciones de código estáticoEjecución controladaExportación de informesTests de calidad semántica

Límites

  • No está posicionado como SaaS de producción.
  • No es un agente de IA completamente autónomo.
  • No implementa aislamiento a nivel de sistema operativo.
  • No enriquece las subidas con fuentes externas de internet.
  • La calidad de los resultados depende de los roles de columna detectables y la estructura del dataset.
  • El enrutamiento específico para rendimiento de campañas es una extensión de dominio futura.

Por qué importa

La fiabilidad pesa más que la novedad

Muchas herramientas de reporting con IA fallan cuando tratan el modelo como analista abierto. DataBrief AI hace lo contrario: entradas claras, ejecución controlada, restricciones explícitas y resultados revisables. Eso encaja mejor con equipos reales, donde la calidad del informe y la trazabilidad de la decisión pesan más que la autonomía amplia.

Uso para clientes

Dónde se vuelve útil

Una versión para cliente podría ayudar a equipos creativos, de marca, investigación u operaciones a reducir reporting manual, estandarizar resúmenes recurrentes y mejorar análisis asistidos por IA sin presentar conclusiones no soportadas como hechos.

Hablar de un sistema IA similar

¿Tienes un sistema creativo que merece desarrollarse?

Si tu equipo tiene un proceso creativo, herramienta interna, flujo de campaña o sistema de marca que merece ampliarse con IA, envía un brief breve y te ayudo a definir la lógica más clara.