Me gusta mucho empezar a escribir un post por el principio. Esto puede parecer una obviedad pero es que lo que me gusta es escribir el título del post al final. Básicamente porque yo sé cómo empiezo a escribir pero hay veces que el propio texto me lleva a otros territorios y entonces tengo que cambiar el título original, si es que he empezado por ahí.

En realidad hoy creo que no hace falta, porque tengo muy claro de lo que voy a escribir: quiero contar lo que ya estamos haciendo en mi empresa con inteligencia artificial. Parece sencillo, pero no lo es tanto, porque aquí se trata no de teorizar, sino de recopilar, sintetizar y compartir lo que ya estamos trabajando. Es decir, voy a hablar en pasado y en presente.
No vendemos IA, vendemos criterio sobre dónde y cómo aplicarla.
Podría terminar aquí el post porque la cita anterior resume perfectamente lo que quiero contar. Pero quiero entrar en detalles.
La IA no sustituye, redistribuye el trabajo
O lo que es lo mismo, mucha gente ha entrado directamente en la conversación del miedo a la inteligencia artificial, pero deberíamos hablar más bien de redistribución del trabajo. Las cosas las vamos a hacer de otra manera y quizá también haya cambio de roles y de personas.
Tenemos internamente un evento en marcha llamado “Los días de IA”, que es una iniciativa semanal donde cada miembro del equipo presenta ante toda la organización un caso real de aplicación de IA en su trabajo. Tenemos ya cuatro sesiones completadas: Mindful Journal, herramientas de research, Notebook LM aplicado a formación, y un agente de Codex. La quinta sesión la tenemos confirmada sobre optimización de tokens.
Hemos sistematizado la documentación de cada sesión en doce bloques canónicos, en markdown y Word con la plantilla corporativa, para que el conocimiento no se quede en la persona que lo presenta y se pueda reutilizar.
En el caso del agente de Codex, el sistema está desplegado y disponible para todo el equipo del repositorio, es decir, no es una herramienta individual. Lo hemos hecho así a propósito para evitar que distintas personas construyan agentes paralelos y dispersen recursos.
Cada rol del Estudio está redefiniendo cómo aplica la IA en su área: research, producto, formación, ingeniería y dirección. Las decisiones sobre qué herramienta usar y cómo integrarla en el flujo se toman desde cada disciplina, no desde una directriz vertical.
El criterio es el activo y se entrena con los años
Trabajamos los prompts iniciales fuera de la herramienta de construcción elegida, con el apoyo de un LLM aparte (Claude o Gemini) que ayude a dar exactitud al enunciado antes de empezar a ejecutar. Después lo refinamos dentro del constructor.
Aplicamos criterio de dirección de diseño desde el primer prompt, es decir: paleta, tipografía, modelo de interacción, gestión del error y tono. En el caso de Mindful Journal, instrucciones como “tono europeo, azules, sin remates” sustituyeron a la estética genérica que devuelve la herramienta por defecto.
Aproximadamente el 80% de las conversaciones de dirección con clientes, futuros clientes y partners pasan por un LLM antes de salir hacia afuera: para clarificar puntos, alinear estrategias y priorizar objetivos, tanto a nivel de contenido como de forma.
Distinguimos de manera explícita y transparente entre dos tipos de agente:
- Los que tienen reglas cerradas y resultado seguro (pueden lanzarse con un trigger automático).
- Los que operan sobre contexto sensible de cliente (necesitan supervisión humana en cada ejecución).
Esa distinción se documenta en el gobierno de decisiones del propio agente.
El coste de explorar se ha desplomado, y eso lo cambia todo
No nos quedamos cruzados de brazos ni nos lamentamos:
Tenemos un stack de construcción rápida activo y en producción: Replit, Lovable, Google AI Studio, v0, Mocha (hasta hoy, que han anunciado que lo cierran). Cada herramienta sirve a un objetivo determinado y concreto, y elegimos la adecuada según el tipo de salida que va a tener (web vs. app móvil, prototipo vs. producto desplegable).
Las herramientas de assessment (madurez ResearchOps, índice de madurez UX) están planteadas como fabulosos activos comerciales: entregan valor al usuario antes de la primera conversación y por detrás alimentan el CRM con leads cualificados por nivel de madurez.
El planteamiento de cada propuesta a cliente parte del marco “pieza pequeña y acotada como entrada”: un AI Readiness Assessment antes de proponer la suite completa. Lo hemos probado ya en 5 presentaciones a clientes corporativos.
La verificación es rápida pero obligatoria
Quien piense que esto es copiar y pegar o que las automatizaciones funcionan solas sin intervención humana, tiene un problema de comprensión.
Notebook LM opera siempre sobre fuentes cerradas que seleccionamos previamente: guías metodológicas, informes de años anteriores, materiales propios y webs específicas. Nunca con acceso libre a internet. Cada respuesta del sistema en Notebook LM tiene asociada una cita verificable al documento y párrafo de origen, accesible con un clic. La revisión la hacemos contra la fuente, no contra la intuición.
El agente de Codex está construido sobre un sistema de 7 archivos que estructura toda la operación: rol del agente, estándar de implementación, contrato de entradas y salidas válidas, checklist de acciones obligatorias, lógica de testing, ejemplos de referencia y gobierno de decisiones. El agente ajusta los tests en el mismo momento en que modifica el código, de manera que la verificación es inherente al proceso, no un paso posterior que pueda olvidarse. Si un test falla, falla antes de que la migración se considere completada.
Tenemos Atlas, el repositorio interno de insights de research, como fuente de verdad consultable para las herramientas de IA que trabajan sobre conocimiento del Estudio.
La accesibilidad la trabajamos desde el prompt
Las herramientas de assessment las hemos construido sobre WCAG 2.2 desde el primer prompt, con instrucciones explícitas sobre tabulación, area-labels para lectores de pantalla, contrastes y orden de foco. No lo hemos añadido después.
Trabajamos el responsive con atención específica a dispositivos móviles : ya que los constructores no resuelven los tres breakpoints a la vez, tenemos que indicar expresamente qué versión corregir y verificar el comportamiento en cada una.
Cuando hemos generado interfaces con vibe coding hemos aplicado contraste verificado WCAG AA desde el principio.
Ofrecemos el Módulo 2 del AI Experience Suite (AI Experience Audit) como servicio comercial específico para auditar la usabilidad de funcionalidades de IA ya integradas en producto de cliente. Varios de los clientes corporativos a los que hemos presentado el módulo han reconocido tener funcionalidades de IA en producción que sus usuarios ignoran.
Los prompts iniciales los trabajamos en inglés para incurrir en un menor consumo de tokens y en línea con estudios sobre la influencia del idioma en la precisión del modelo. Lo hace el equipo de research y también el equipo de ingeniería para el afinado del agente.
En resumen, os he dicho que este post habla en pasado y en presente. Habla de lo que hacemos y es algo que, mea culpa, no teníamos documentado y aquí está.








