El 15 de junio de 2026 Anthropic cambia la forma en que cobra los agentes Claude. Es un cambio de pricing — no un anuncio de modelo, no un keynote, no una pieza de marketing. Pero es probablemente el cambio estructural más importante del trimestre para cualquier equipo que tenga Claude Code, Agent SDK o agentes Anthropic corriendo en producción.
El problema no es el cambio en sí. El problema es que la mayoría de equipos que va a pagar la diferencia el 16 de junio todavía no sabe que tiene un problema.
El delta exacto del 15 de junio
A partir del 15-jun-2026, Anthropic separa el uso programmatic del uso interactive en todas sus suscripciones. La frase canónica aparece en la cobertura de InfoWorld del anuncio: "the direction will not vary". Es un cambio que se ejecuta primero en Anthropic y que el resto de proveedores frontier va a replicar en 12-24 meses.
Lo que cambia:
- Claude Code en modo agente (la
claude -p, headless, programmatic). - Claude Agent SDK completo.
- Claude Code GitHub Actions y cualquier integración CI/CD vía SDK.
- Apps de terceros construidas sobre el Agent SDK.
Lo que no cambia:
- El uso interactive de Claude Code (un humano escribiendo prompts, viendo respuestas, iterando con el modelo).
- Claude.ai en uso de chat normal.
La estructura del nuevo cobro: cada suscripción recibe un consumption pool dedicado, separado del límite de chat, con créditos mensuales calculados como espejo del precio de la suscripción.
| Plan | Precio | Créditos programmatic/mes |
|---|---|---|
| Pro | $20/mes | $20 |
| Max 5x | $100/mes | $100 |
| Max 20x | $200/mes | $200 |
| Team Standard | $30/seat/mes | $20/seat |
| Team Premium | $150/seat/mes | $100/seat |
Los créditos se consumen a tarifa API completa. Cuando se agotan, el agente no para — pero el coste sale ya del API billing pool, con tarifa unitaria, sin descuento subscription. El equipo que el 15-jun mantenía a tope una rutina headless en CI sobre un repo grande, descubre el 16-jun que su factura mensual es de tres dígitos por encima de lo que el plan financiero presupuestó.
Esto no es un bug. Es la nueva normalidad.
Tres tipos de equipos llegan al 15 de junio
Cuando hablamos con CTOs y CFOs de empresas mid-market que ya tienen Claude en producción, vemos tres patrones claros.
Equipo A — el que ya mide por agente y por workflow. Saben qué workflow consume qué tokens, tienen el coste por tarea útil presupuestado, y el switch del 15-jun es un evento operativo menor: recalibrar el plan con el nuevo formato de cobro, ajustar el cap por workflow, comunicar el cambio al CFO con dos cifras y una decisión. Tiempo de adaptación: una tarde.
Equipo B — el que pagaba "Max 20x unlimited" como si fuera ilimitado. Esta es la categoría más común. Compraron Max 20x ($200/mes/usuario) porque la documentación decía "alta intensidad de uso" y asumieron que el techo no se iba a tocar. El 15-jun descubrirán que el techo programmatic es exactamente $200 al mes, y que una rutina headless del Agent SDK puede consumir esos $200 en cuatro días. Tiempo de adaptación: dos semanas mínimo, porque hay que medir antes de decidir.
Equipo C — el que tiene rutinas headless sin observabilidad. Aquí la conversación no es FinOps — es de gobernanza básica. Si nadie en tu organización puede decirte, esta semana, qué rutinas Agent SDK están corriendo en qué cuenta, contra qué repos, con qué frecuencia y qué outputs producen, el problema del 15-jun es secundario. Hay un problema previo: tu equipo está delegando ejecución programática a un modelo sin trazabilidad. El switch del 15-jun lo va a hacer visible vía factura. Tiempo de adaptación: 4-6 semanas — y la parte cara no es la factura, es montar la observabilidad desde cero contra una superficie de ejecución que ya está activa.
Los 6 controles FinOps mínimos antes del 15 de junio
Los seis controles son secuenciales — instalar el 3 sin el 1 y el 2 no sirve de nada — y cada uno está pensado para ser ejecutable por un equipo de 1-2 personas en menos de una semana.
Control 1 · Medición por agente y por workflow
Antes del 15-jun, cada workflow programático de tu organización debe tener una etiqueta única en el log de uso Anthropic. No "Claude usage": etiqueta por workflow (extract-invoice-data, summarize-tickets, generate-rfp-response). Sin esto, los siguientes cinco controles son imposibles porque no puedes asignar coste a la unidad de valor de negocio.
Test de éxito
Tu dashboard de uso muestra el top-10 workflows por créditos consumidos en los últimos 30 días, y un humano de tu equipo sabe explicar qué hace cada uno.
Control 2 · Cap por workflow
Cada workflow etiquetado tiene un cap mensual de créditos. Si una rutina headless de CI se dispara, no debe consumir más del 30% del credit pool de la cuenta sin alertar. El cap se configura en el código del Agent SDK (max_credits_per_run, alerting hooks) o en el orchestrator si lo usas.
Test de éxito
Si mañana lanzas una rutina mal optimizada, el sistema te corta o te alerta antes del 16-jun, no después.
Control 3 · Prioridad por línea de negocio
No todos los workflows valen lo mismo. Un agente que genera ofertas comerciales es prioridad 1; un agente que transcribe tickets de soporte para análisis batch es prioridad 3. El credit pool se asigna por prioridad, no por orden de llegada. Cuando el pool se acabe — y se va a acabar — los workflows que se paran son los de baja prioridad, no los críticos.
Test de éxito
Cada workflow tiene un campo business_priority (1-3) y existe una política documentada de qué se mata primero cuando el credit pool baja del 20%.
Control 4 · Alerta de presupuesto
Cuando el credit pool consume el 50%, alguien en tu equipo recibe una notificación. Al 75%, llega a Slack del CTO. Al 90%, llega al CFO con un resumen automático de qué workflows están consumiendo y qué se va a parar si no se aprueba ampliación del pool. Esto se monta con un cron + script de 50 líneas contra la API de billing Anthropic. No es trabajo de un trimestre — es de una tarde.
Test de éxito
El primer trimestre post-15-jun, ninguna factura llega al CFO sin contexto previo.
Control 5 · Hedge multi-modelo
El cambio Anthropic del 15-jun no es Anthropic-específico. La frase de InfoWorld lo dice claro: "the direction will not vary". OpenAI, Google y Microsoft van a separar consumption pools en 12-24 meses. Cualquier organización que apueste 100% de sus workflows críticos a un único proveedor está heredando una posición frágil: el día que ese proveedor cambie pricing (otra vez), tu plan financiero entero se reabre.
El hedge significa que al menos un workflow crítico de tu organización debe ser portable a otro modelo en menos de una semana, con eval reproducible que valide la calidad equivalente. Arquitecturas multi-modelo sobre AWS Bedrock (Claude + Llama + Mistral en el mismo pipeline, con switch de proveedor configurable) son hoy la pieza más infravalorada del stack agentic enterprise.
Test de éxito
El CTO puede decirle al CFO, con timeline concreta, cuánto cuesta migrar el workflow más caro a un modelo alternativo sin perder calidad.
Control 6 · Evaluación con coste integrado
La métrica que importa post-15-jun no es accuracy. No es velocidad. Es coste por tarea útil verificada. La fórmula: créditos consumidos por el workflow dividido entre el número de outputs que pasaron la eval reproducible y se usaron en producción. Si el workflow consume $50 al mes y entrega 200 outputs útiles, el cost-per-task-util es $0,25. Si consume $200 y entrega 100 outputs útiles, es $2. La diferencia entre los dos workflows no es de modelo — es de método.
Algunos workflows van a tener coste por tarea útil aceptable dentro del credit pool. Otros no. Para esos, existe una vía alternativa: contratar la ejecución del proceso de negocio a un proveedor que asume el riesgo de modelo y de pricing en el contrato, no en tu factura. Es el modelo sobre el que funciona onext Enterprise AI — precio fijo por proceso de negocio, arquitectura multi-modelo subyacente (Claude, OpenAI, Gemini sobre AWS Bedrock), sin que el cambio de pricing de Anthropic del 15-jun ni el que venga después afecte lo que tu organización paga.
Test de éxito
Para cada workflow crítico, sabes si te conviene mantener el meter (coste variable bajo control) o pasar a coste fijo por proceso (coste predecible delegando el riesgo de modelo).
"The direction will not vary": por qué este cambio es estructural
Anthropic separa consumption pools en junio. OpenAI va a hacerlo entre Q4-2026 y Q2-2027. Google va a seguir. Microsoft, con Agent 365 ya en GA, va a ajustar pricing per-agent en próximas iteraciones. En 18-24 meses, el modelo "una suscripción ilimitada para todo" deja de existir en el frontier model market enterprise.
Lo que esto significa estructuralmente:
- El plan financiero pasa de anual a trimestral. El presupuesto agentic se recalibra cada 90 días porque el pricing del proveedor se mueve cada 90 días.
- La unidad de medición se desplaza de "usuarios" a "workflows". Pagas por workflow ejecutado, no por seat habilitado.
- La arquitectura multi-modelo deja de ser una decisión "para más adelante". Pasa a ser el único hedge real contra la oscilación de pricing del proveedor único.
- FinOps agentic se convierte en una disciplina propia, separada de FinOps cloud y FinOps SaaS. Tiene métricas distintas (cost-per-task-util), instrumentación distinta (tagging por workflow), y dueño distinto — no es solo el CFO, necesita un perfil mixto financiero/técnico que entienda el cost surface del modelo.
Si tu organización todavía no tiene a alguien con ese perfil, el 15-jun va a ser la primera factura que enseñe por qué hace falta.
La trampa silenciosa del Pro $20 + créditos espejo
Hay un matiz del nuevo pricing que ha pasado desapercibido en la cobertura inicial y que merece subrayarlo. Los créditos mensuales son espejo exacto del precio de la suscripción: Pro $20 → $20 créditos. La sensación inmediata es de neutralidad económica — "pago lo mismo, recibo créditos por valor de lo mismo, sin sorpresa". Pero el efecto real es distinto: opera como un techo de uso que cambia los incentivos de desarrollo de tu equipo.
Antes del 15-jun, un desarrollador con Max 20x podía iterar agresivamente con Claude Code sin pensar en factura. El incentivo era experimentar. Post-15-jun, ese mismo desarrollador sabe que cada rutina headless agresiva acerca el momento en que su credit pool se agota y la factura entra al API billing. El incentivo cambia: pasa de experimentar a optimizar.
Para el equipo bien organizado, este cambio de incentivo es positivo — fuerza disciplina. Para el equipo desorganizado, es un freno a la experimentación legítima en un momento donde la experimentación es el único camino para entender qué workflows realmente entregan valor. La diferencia entre los dos resultados la marca el método de tu equipo para introducir agentes en producción con coste auditado desde el día uno.
La métrica post-switch que vale la pena monitorizar
Está bien — siempre que sepas que está bien y sea decisión consciente. El equipo que el 15-jun llega con esta métrica configurada, llega con criterio. El equipo que llega con un pool habilitado y sin métrica, llega con factura — y con la conversación de comité que viene en septiembre cuando el CFO pregunte por el run-rate.
6 controles. 1 métrica. Y la decisión, para cada workflow crítico, de si te conviene el meter o el coste fijo por proceso.
Fuentes
- InfoWorld · Anthropic puts Claude agents on a meter across its subscriptions · 14-may-2026.
- The Register · Anthropic tosses agents into the API billing pool.
- The Decoder · Claude subscriptions get separate budgets for programmatic use, billed at full API prices.
- eWeek · Claude Agent Users Face New Monthly Credit Caps in the Coming Weeks.
- VentureBeat · Anthropic reinstates OpenClaw and third-party agent usage on Claude subscriptions — with a catch.
- Codersera · Anthropic's June 15 Billing Change: What Every Claude Code & Agent SDK User Must Do.