Volver a la Biblioteca
Market Analysis·10 min·Jun 2026

La Curva de Costo de la IA Permite a las Ventures de LATAM Saltarse la Serie A

El costo de inferencia se desploma. Eso mueve el capital de la infraestructura al producto y neutraliza, justo a tiempo, la desventaja histórica de capital de LATAM.

La curva de costo de inferencia de IA hizo algo silencioso y enorme. El precio de correr un modelo de una capacidad dada cae cerca de un orden de magnitud por año, lo que significa que el build que antes exigía una Serie A ahora cabe dentro de un cheque pre-seed. Para América Latina eso no es una nota técnica al pie. Es el momento en que una desventaja histórica de profundidad de capital deja de importar.

El AI Index 2025 de Stanford encontró que el costo de inferencia de un sistema al nivel de GPT-3.5 cayó más de 280 veces entre noviembre de 2022 y octubre de 2024. Andreessen Horowitz ubica la misma tendencia en cerca de 10x por año. Cuando el costo de levantar un producto de IA se desploma, el insumo escaso deja de ser capacidad de ingeniería. Pasa a ser acceso a un dominio y distribución.

Avante Ventures construye exactamente sobre ese giro. La curva de costo es el viento a favor. La profundidad de operador y el dato propietario son la estrategia.

La curva de costo, con números fechados

La caída del costo por token de IA es hoy la tendencia mejor documentada del sector, y los números son contundentes. Para un modelo de desempeño equivalente, el costo de inferencia cae cerca de 10x cada año, según Andreessen Horowitz en noviembre de 2024. El ejemplo ancla es difícil de descartar. Al nivel de GPT-3, el precio pasó de 60 dólares por millón de tokens en noviembre de 2021 a cerca de 0,06 dólares en noviembre de 2024. Una caída de 1.000x en tres años.

Stanford respalda la misma historia desde una silla neutral. El [AI Index 2025](https://hai.stanford.edu/ai-index/2025-ai-index-report) reporta que el costo de inferencia de un sistema al nivel de GPT-3.5 cayó más de 280 veces entre noviembre de 2022 y octubre de 2024. Para un lector de 2026 esa es la cifra con la que conviene abrir, porque es reciente y viene de la academia, no de un fondo.

Epoch AI midió el mismo colapso con un método más estricto. El precio para alcanzar un nivel fijo de capacidad cayó a una mediana de cerca de 50x por año, con un rango de 9x a 900x según la tarea. La aceleración importa más que el promedio. Desde enero de 2024, la mediana subió a cerca de 200x por año.

  • a16z (nov 2024): cerca de 10x por año, 1.000x en tres años al nivel de GPT-3.
  • Stanford HAI AI Index (2025): más de 280 veces para inferencia al nivel de GPT-3.5, de nov 2022 a oct 2024.
  • Epoch AI (mar 2025): mediana de 50x por año entre benchmarks, acelerando a cerca de 200x por año después de enero de 2024.

El costo de inferencia de un sistema al nivel de GPT-3.5 cayó más de 280 veces entre noviembre de 2022 y octubre de 2024.

— Stanford HAI, AI Index Report 2025

Hacia dónde mueve el dinero la inferencia barata

Cuando la inferencia, la búsqueda vectorial y la infraestructura gestionada se vuelven commodity al mismo tiempo, el costo fijo de levantar un producto de IA se desploma y el costo marginal de probar una idea se acerca a cero. El capital que una startup de 2021 quemaba en un equipo de plataforma de 20 personas para construir retrieval, harnesses de evaluación e infraestructura de serving hoy es una línea en una factura de API gestionada.

Entonces el cuello de botella se mueve. El insumo escaso deja de ser cuántos ingenieros contrata para escribir plomería. Pasa a ser criterio de producto, acceso a dominio y llegar a los ingresos antes de que se acabe el dinero. La cobertura a lo largo de 2025 documenta empresas AI-native que alcanzan valoración de unicornio con [equipos de menos de 50 personas](https://www.businessinsider.com/ai-startup-unicorns-with-tiny-teams-2025-5), un patrón estructuralmente imposible cuando la infraestructura debía construirse antes que el producto.

Para un venture studio ese es el juego entero. Si el build es barato, el valor diferenciado no está en escribir el código. Está en el acceso a dominio, el dato propietario y la velocidad a los primeros ingresos. Es lo que Avante entrega el día uno, no en el mes nueve.

Dirigir US$ 300 mil a 500 mil a producto, no a infra

La eficiencia de capital de una startup de IA hoy se decide por dónde van los primeros dólares, no por cuántos son. Resolver la plomería de la empresa una sola vez dirige cerca de US$ 300 mil a US$ 500 mil de capital efectivo por venture hacia producto y tracción, en lugar de overhead. La curva de costo es lo que hace posible ese direccionamiento. Cuando la línea de infraestructura se encoge hasta volverse una cuenta de API, una porción mayor del primer cheque llega al cliente.

En términos de caja. Un equipo de IA en etapa seed de 2021 quizá gastaba un tercio de su primer año levantando infraestructura que un equipo de 2026 alquila por llamada. Ese tercio recuperado es la diferencia entre un intento de product-market fit y dos o tres. Avante despliega US$ 500 mil a US$ 1,5 millones por venture en el pre-seed, y la curva decide cuánto de eso llega al producto.

La eficiencia se compone dentro de un studio. Infraestructura compartida en el portafolio, sumada a una curva de costo que sigue cayendo, hace que el mismo dólar compre más intentos de producto cada año.

Por qué el timing favorece a Brasil

Brasil es donde la curva de costo y la brecha de mercado se alinean con más nitidez. Los servicios representan cerca del 70% del PIB brasileño, y esa base sigue poco digitalizada. El sector de servicios creció 3,1% en 2024, su cuarto año seguido de alza, según el [IBGE](https://agenciabrasil.ebc.com.br/economia/noticia/2025-02/setor-de-servicos-cresce-31-em-2024-mostra-ibge). Una economía grande, en crecimiento y con poco software es exactamente el objetivo que un equipo AI-native puede atender ahora sin una Serie A.

El telón de fondo de capital es la otra mitad, y vale para toda la región, de México y Colombia a Chile y Argentina. El funding de venture en LATAM tuvo un reset fuerte después de 2021 y se recupera desde una base baja. En 2024 la región captó cerca de 4.500 millones de dólares en 751 deals, un alza de 8% interanual, con Brasil tomando 44% y México 26%, según datos de LAVCA. Ese total regional de un año entero es un redondeo frente a una sola ronda grande de IA en Estados Unidos.

El argumento de timing se desprende directo. Una curva de costo más barata neutraliza justo la desventaja que el capital escaso imponía. Cuando el build ya no exige 20 ingenieros y una Serie A para financiarlos, el campo de infraestructura se nivela, y la ventaja que queda es la profundidad de operador de dominio. Brasil la tiene en abundancia, y el resto de LATAM también.

Lea el timing en los dos sentidos a la vez. La curva de costo abarata construir una empresa de IA en LATAM, y la economía de servicios del 70% del PIB de Brasil le da un terreno subconstruido al cual apuntar ese capital.

La inferencia barata no es un moat

Aquí está la parte que un pitch deck se saltaría. Una curva de costo en caída está disponible para todos, y por eso no puede ser su defensa. Baja la barrera para sus competidores al mismo ritmo en que la baja para usted. Cualquiera con una tarjeta de crédito y una clave de API recibe los mismos precios. La inferencia barata es viento a favor, nunca un moat.

Hay una segunda trampa en los mismos datos. Epoch AI documenta una paradoja de costo. Los precios por token caen mientras el gasto total en inferencia puede subir, porque los modelos de razonamiento queman muchos más tokens por tarea. Barato por unidad no es barato en agregado cuando el uso escala. Los fundadores que planean con el precio de titular de hoy se sorprenden con la factura de mañana.

Si el costo no es un moat, la ventaja durable tiene que venir de algún lugar que la curva de costo no toca. Dato propietario, distribución y costo de cambio. La respuesta del studio es el flywheel copilot, dato, capital. Construya un copiloto de IA para generar dato propietario, luego use ese dato para levantar y desplegar capital. El copiloto es barato gracias a la curva de costo. El dato es el moat que la curva de costo no puede erosionar.

Cómo usa Avante la curva

Avante Ventures es un venture studio que construye empresas AI-native en Brasil y América Latina. Trata la curva de costo como viento estructural a favor, no como tesis. La tesis es profundidad de operador combinada con dato propietario, ensambladas el día uno.

En la mecánica, Avante lanza 3-4 ventures por año a través de un sistema de seis etapas. Research, Partner, Build, Traction, Revenue, Compound. Despliega US$ 500 mil a US$ 1,5 millones por venture en el pre-seed y conserva economía de co-founder. Como la curva de costo dirige cerca de US$ 300 mil a US$ 500 mil de capital efectivo a producto en lugar de overhead, un venture de studio lanza 6-9 meses por delante de un equipo independiente con financiamiento comparable.

El benchmark detrás del modelo es la razón por la que el studio existe. La Global Startup Studio Network ubica el IRR de studio en cerca de ~50% frente a un ~19% estándar del sector para VC tradicional, cerca de 2,5x a lo largo de horizontes realistas. Ese es el benchmark del modelo de studio, no el retorno realizado de la propia Avante. Lea la tesis completa en [/why-avante](/why-avante) y análisis de mercado relacionados en [/library](/library).

La curva de costo abarató el build para todos a la vez. Lo que no hizo fue entregarle a nadie operadores de dominio con más de 10 años de cicatriz en el mercado brasileño. Ese es el insumo que sigue escaso, y es el que Avante ensambla antes de la primera línea de código.

— Equipo Fundador de Avante
São Paulo + San Francisco · escrito desde dentro del studio

¿Quieres más? Recibe un ensayo al mes sobre venture building, negocios AI-native y la oportunidad Brasil.

Ver Biblioteca completa →