Saltar al contenido principal
onext technology
IA 24 mayo 2026 - 12 min de lectura

Tu factura Claude cambia el 15 de junio: la conversación FinOps que tu CFO va a iniciar (y cómo llegar preparado)

El 15 de junio Anthropic separa los agentes Claude del chat con créditos mensuales espejo. Los 6 controles FinOps mínimos antes del switch — sin esperar al overrun del 16 de junio.

Jordi García
Tech Lead en onext
Dos ejecutivos — CFO y CTO — en una oficina tecnológica luminosa de Barcelona revisando dashboards de costes de agentes IA y métricas de uso de Claude en pantallas de análisis

El 15 de junio de 2026 Anthropic cambia la forma en que cobra los agentes Claude. Es un cambio de pricing — no un anuncio de modelo, no un keynote, no una pieza de marketing. Pero es probablemente el cambio estructural más importante del trimestre para cualquier equipo que tenga Claude Code, Agent SDK o agentes Anthropic corriendo en producción.

El problema no es el cambio en sí. El problema es que la mayoría de equipos que va a pagar la diferencia el 16 de junio todavía no sabe que tiene un problema.

El delta exacto del 15 de junio

A partir del 15-jun-2026, Anthropic separa el uso programmatic del uso interactive en todas sus suscripciones. La frase canónica aparece en la cobertura de InfoWorld del anuncio: "the direction will not vary". Es un cambio que se ejecuta primero en Anthropic y que el resto de proveedores frontier va a replicar en 12-24 meses.

Lo que cambia:

  • Claude Code en modo agente (la claude -p, headless, programmatic).
  • Claude Agent SDK completo.
  • Claude Code GitHub Actions y cualquier integración CI/CD vía SDK.
  • Apps de terceros construidas sobre el Agent SDK.

Lo que no cambia:

  • El uso interactive de Claude Code (un humano escribiendo prompts, viendo respuestas, iterando con el modelo).
  • Claude.ai en uso de chat normal.

La estructura del nuevo cobro: cada suscripción recibe un consumption pool dedicado, separado del límite de chat, con créditos mensuales calculados como espejo del precio de la suscripción.

Plan Precio Créditos programmatic/mes
Pro $20/mes $20
Max 5x $100/mes $100
Max 20x $200/mes $200
Team Standard $30/seat/mes $20/seat
Team Premium $150/seat/mes $100/seat

Los créditos se consumen a tarifa API completa. Cuando se agotan, el agente no para — pero el coste sale ya del API billing pool, con tarifa unitaria, sin descuento subscription. El equipo que el 15-jun mantenía a tope una rutina headless en CI sobre un repo grande, descubre el 16-jun que su factura mensual es de tres dígitos por encima de lo que el plan financiero presupuestó.

Esto no es un bug. Es la nueva normalidad.

Tres tipos de equipos llegan al 15 de junio

Cuando hablamos con CTOs y CFOs de empresas mid-market que ya tienen Claude en producción, vemos tres patrones claros.

Equipo A — el que ya mide por agente y por workflow. Saben qué workflow consume qué tokens, tienen el coste por tarea útil presupuestado, y el switch del 15-jun es un evento operativo menor: recalibrar el plan con el nuevo formato de cobro, ajustar el cap por workflow, comunicar el cambio al CFO con dos cifras y una decisión. Tiempo de adaptación: una tarde.

Equipo B — el que pagaba "Max 20x unlimited" como si fuera ilimitado. Esta es la categoría más común. Compraron Max 20x ($200/mes/usuario) porque la documentación decía "alta intensidad de uso" y asumieron que el techo no se iba a tocar. El 15-jun descubrirán que el techo programmatic es exactamente $200 al mes, y que una rutina headless del Agent SDK puede consumir esos $200 en cuatro días. Tiempo de adaptación: dos semanas mínimo, porque hay que medir antes de decidir.

Equipo C — el que tiene rutinas headless sin observabilidad. Aquí la conversación no es FinOps — es de gobernanza básica. Si nadie en tu organización puede decirte, esta semana, qué rutinas Agent SDK están corriendo en qué cuenta, contra qué repos, con qué frecuencia y qué outputs producen, el problema del 15-jun es secundario. Hay un problema previo: tu equipo está delegando ejecución programática a un modelo sin trazabilidad. El switch del 15-jun lo va a hacer visible vía factura. Tiempo de adaptación: 4-6 semanas — y la parte cara no es la factura, es montar la observabilidad desde cero contra una superficie de ejecución que ya está activa.

La pregunta honesta: ¿en cuál de los tres categorías está tu equipo, ahora mismo, sin maquillar la respuesta?

Los 6 controles FinOps mínimos antes del 15 de junio

Los seis controles son secuenciales — instalar el 3 sin el 1 y el 2 no sirve de nada — y cada uno está pensado para ser ejecutable por un equipo de 1-2 personas en menos de una semana.

Control 1 · Medición por agente y por workflow

Antes del 15-jun, cada workflow programático de tu organización debe tener una etiqueta única en el log de uso Anthropic. No "Claude usage": etiqueta por workflow (extract-invoice-data, summarize-tickets, generate-rfp-response). Sin esto, los siguientes cinco controles son imposibles porque no puedes asignar coste a la unidad de valor de negocio.

Test de éxito

Tu dashboard de uso muestra el top-10 workflows por créditos consumidos en los últimos 30 días, y un humano de tu equipo sabe explicar qué hace cada uno.

Control 2 · Cap por workflow

Cada workflow etiquetado tiene un cap mensual de créditos. Si una rutina headless de CI se dispara, no debe consumir más del 30% del credit pool de la cuenta sin alertar. El cap se configura en el código del Agent SDK (max_credits_per_run, alerting hooks) o en el orchestrator si lo usas.

Test de éxito

Si mañana lanzas una rutina mal optimizada, el sistema te corta o te alerta antes del 16-jun, no después.

Control 3 · Prioridad por línea de negocio

No todos los workflows valen lo mismo. Un agente que genera ofertas comerciales es prioridad 1; un agente que transcribe tickets de soporte para análisis batch es prioridad 3. El credit pool se asigna por prioridad, no por orden de llegada. Cuando el pool se acabe — y se va a acabar — los workflows que se paran son los de baja prioridad, no los críticos.

Test de éxito

Cada workflow tiene un campo business_priority (1-3) y existe una política documentada de qué se mata primero cuando el credit pool baja del 20%.

Control 4 · Alerta de presupuesto

Cuando el credit pool consume el 50%, alguien en tu equipo recibe una notificación. Al 75%, llega a Slack del CTO. Al 90%, llega al CFO con un resumen automático de qué workflows están consumiendo y qué se va a parar si no se aprueba ampliación del pool. Esto se monta con un cron + script de 50 líneas contra la API de billing Anthropic. No es trabajo de un trimestre — es de una tarde.

Test de éxito

El primer trimestre post-15-jun, ninguna factura llega al CFO sin contexto previo.

Control 5 · Hedge multi-modelo

El cambio Anthropic del 15-jun no es Anthropic-específico. La frase de InfoWorld lo dice claro: "the direction will not vary". OpenAI, Google y Microsoft van a separar consumption pools en 12-24 meses. Cualquier organización que apueste 100% de sus workflows críticos a un único proveedor está heredando una posición frágil: el día que ese proveedor cambie pricing (otra vez), tu plan financiero entero se reabre.

El hedge significa que al menos un workflow crítico de tu organización debe ser portable a otro modelo en menos de una semana, con eval reproducible que valide la calidad equivalente. Arquitecturas multi-modelo sobre AWS Bedrock (Claude + Llama + Mistral en el mismo pipeline, con switch de proveedor configurable) son hoy la pieza más infravalorada del stack agentic enterprise.

Test de éxito

El CTO puede decirle al CFO, con timeline concreta, cuánto cuesta migrar el workflow más caro a un modelo alternativo sin perder calidad.

Control 6 · Evaluación con coste integrado

La métrica que importa post-15-jun no es accuracy. No es velocidad. Es coste por tarea útil verificada. La fórmula: créditos consumidos por el workflow dividido entre el número de outputs que pasaron la eval reproducible y se usaron en producción. Si el workflow consume $50 al mes y entrega 200 outputs útiles, el cost-per-task-util es $0,25. Si consume $200 y entrega 100 outputs útiles, es $2. La diferencia entre los dos workflows no es de modelo — es de método.

Algunos workflows van a tener coste por tarea útil aceptable dentro del credit pool. Otros no. Para esos, existe una vía alternativa: contratar la ejecución del proceso de negocio a un proveedor que asume el riesgo de modelo y de pricing en el contrato, no en tu factura. Es el modelo sobre el que funciona onext Enterprise AI — precio fijo por proceso de negocio, arquitectura multi-modelo subyacente (Claude, OpenAI, Gemini sobre AWS Bedrock), sin que el cambio de pricing de Anthropic del 15-jun ni el que venga después afecte lo que tu organización paga.

Test de éxito

Para cada workflow crítico, sabes si te conviene mantener el meter (coste variable bajo control) o pasar a coste fijo por proceso (coste predecible delegando el riesgo de modelo).

"The direction will not vary": por qué este cambio es estructural

Anthropic separa consumption pools en junio. OpenAI va a hacerlo entre Q4-2026 y Q2-2027. Google va a seguir. Microsoft, con Agent 365 ya en GA, va a ajustar pricing per-agent en próximas iteraciones. En 18-24 meses, el modelo "una suscripción ilimitada para todo" deja de existir en el frontier model market enterprise.

Lo que esto significa estructuralmente:

  • El plan financiero pasa de anual a trimestral. El presupuesto agentic se recalibra cada 90 días porque el pricing del proveedor se mueve cada 90 días.
  • La unidad de medición se desplaza de "usuarios" a "workflows". Pagas por workflow ejecutado, no por seat habilitado.
  • La arquitectura multi-modelo deja de ser una decisión "para más adelante". Pasa a ser el único hedge real contra la oscilación de pricing del proveedor único.
  • FinOps agentic se convierte en una disciplina propia, separada de FinOps cloud y FinOps SaaS. Tiene métricas distintas (cost-per-task-util), instrumentación distinta (tagging por workflow), y dueño distinto — no es solo el CFO, necesita un perfil mixto financiero/técnico que entienda el cost surface del modelo.

Si tu organización todavía no tiene a alguien con ese perfil, el 15-jun va a ser la primera factura que enseñe por qué hace falta.

La trampa silenciosa del Pro $20 + créditos espejo

Hay un matiz del nuevo pricing que ha pasado desapercibido en la cobertura inicial y que merece subrayarlo. Los créditos mensuales son espejo exacto del precio de la suscripción: Pro $20 → $20 créditos. La sensación inmediata es de neutralidad económica — "pago lo mismo, recibo créditos por valor de lo mismo, sin sorpresa". Pero el efecto real es distinto: opera como un techo de uso que cambia los incentivos de desarrollo de tu equipo.

Antes del 15-jun, un desarrollador con Max 20x podía iterar agresivamente con Claude Code sin pensar en factura. El incentivo era experimentar. Post-15-jun, ese mismo desarrollador sabe que cada rutina headless agresiva acerca el momento en que su credit pool se agota y la factura entra al API billing. El incentivo cambia: pasa de experimentar a optimizar.

Para el equipo bien organizado, este cambio de incentivo es positivo — fuerza disciplina. Para el equipo desorganizado, es un freno a la experimentación legítima en un momento donde la experimentación es el único camino para entender qué workflows realmente entregan valor. La diferencia entre los dos resultados la marca el método de tu equipo para introducir agentes en producción con coste auditado desde el día uno.

La métrica post-switch que vale la pena monitorizar

Una sola métrica: % de credit pool consumido por workflow de valor verificado. Si tu organización consume $1.000 al mes en créditos programáticos y solo $300 corresponden a workflows con valor de negocio verificable (output evaluado, usado en producción, con impacto medible), tu cost-per-task-util efectivo es $1.000/valor($300), no $1.000/output($800). El 70% de tu factura está pagando por experimentación útil + ruido + workflows abandonados a medias.

Está bien — siempre que sepas que está bien y sea decisión consciente. El equipo que el 15-jun llega con esta métrica configurada, llega con criterio. El equipo que llega con un pool habilitado y sin métrica, llega con factura — y con la conversación de comité que viene en septiembre cuando el CFO pregunte por el run-rate.

6 controles. 1 métrica. Y la decisión, para cada workflow crítico, de si te conviene el meter o el coste fijo por proceso.

¿Tu equipo llega al 15-jun con los 6 controles instalados?

En onext acompañamos a equipos de ingeniería mid-market a montar FinOps agentic operativa antes del switch — observabilidad por workflow, hedge multi-modelo sobre AWS Bedrock y política de cap por línea de negocio.

Ver cómo trabajamos

Sesión de diagnóstico de tu superficie agentic actual en menos de una semana.