Playbook·11 min·Jun 2026

El Flywheel Copilot a Dato a Fondo, Explicado

Lanza un copilot para acuñar dato propietario y convierte ese dato en capital. El mecanismo, la falla y cómo lo corre Avante.

El flywheel copilot, dato, capital es una sola idea dicha de tres formas. Construya un copilot de IA que haga trabajo real en un vertical denso en regulación. Deje que cada interacción acuñe dato estructurado y difícil de conseguir. Luego convierta ese dato en capital, ya sea levantando con base en la fuerza del dataset, ya sea desplegando capital directo en los activos que el dato identifica.

Ese es el patrón recurrente en Avante Ventures, un venture studio que construye empresas AI-native en Brasil y América Latina. No es un eslogan. Es una secuencia de construcción con un orden preciso y un único punto de falla, y la mayoría de los equipos se equivoca en el orden. Corren tras el fondo antes de que el dato esté lo bastante denso para precificar algo.

El loop en una frase

El copilot genera dato, el dato se vuelve un activo precificado, el activo atrae o se vuelve capital, y el capital compra más uso que densifica el dato. Es la máquina completa. El orden no se negocia. Sáltese el uso y lo demás es un pitch deck sin motor debajo.

Lo que hace viable este loop en 2026 es que la primera vuelta se abarató. El modelo dejó de ser la parte cara de una empresa de IA, y dejó de ser la parte durable también. Todo lo que perdura fue empujado fuera del modelo y encima del dato que el modelo toca y que nadie más puede copiar.

Etapa uno: un copilot que acuña dato

Un copilot es AI-native solo si quitar el modelo rompe el flujo central. Aplique la prueba a cualquier producto. Si seguiría funcionando como software corriente con el modelo retirado, la IA es una función pegada en el borde. Si el flujo existe solo porque el modelo hace el trabajo de juicio, y el acto de hacer ese trabajo deja dato etiquetado atrás, es AI-native. El producto es el instrumento de recolección de dato.

La razón de que esto sea viable hoy sin una Series A es el colapso del costo de inferencia. Epoch AI mostró que el precio para igualar el desempeño de GPT-4 en un conjunto de preguntas científicas de nivel doctoral cayó cerca de 40x por año, con la mediana entre todas las tareas medidas cerca de 50x por año y las tareas más rápidas cayendo hasta 900x al año. Una capacidad que costaba una fortuna el año pasado es un redondeo este año.

La consecuencia estratégica es dura. Si el modelo es casi gratis y mejora para todos al mismo tiempo, ningún modelo es moat. La defensibilidad tiene que vivir en algún lugar que la curva de precio no alcanza. En este patrón, vive en el dato propietario que el copilot produce mientras trabaja.

El precio para alcanzar el desempeño de GPT-4 en preguntas científicas de nivel doctoral cayó cerca de 40x por año, con mediana entre tareas cerca de 50x por año. El modelo es la parte barata ahora. El dato es el moat.

— Epoch AI, marzo de 2025

Etapa dos: el dato se vuelve el moat y el activo

La mayoría de los moats de dato es ficción, y la crítica más afilada viene de quienes financian IA. Andreessen Horowitz lo dijo sin rodeos en 2019. En general no hay un efecto de red inherente que venga solo de tener más dato. La economía a menudo corre en sentido contrario. El costo de agregar dato único a su acervo puede subir, mientras el valor del dato incremental baja. Pasado cierto umbral de cobertura, cada nueva porción cuesta más y entrega menos.

Entonces, ¿cuándo es el dato realmente defensable? a16z nombra la condición exacta. Acumular dato propietario es más fuerte cuando las fuentes son escasas o reacias a entregar dato a más de un proveedor. Sus ejemplos son fuentes reguladas por el gobierno y burós de crédito. Ese perfil, dato escaso, trabado por regulación, en manos de quien se resiste a compartirlo dos veces, es el blanco preciso de este flywheel.

La versión que funciona tiene nombre. NFX define un efecto de red de dato como el caso en que el valor de un producto aumenta con más dato y en que más uso del producto genera más de ese dato. La condición que importa: el dato tiene que ser central para cómo el producto beneficia al usuario, no un artefacto lateral. El propio contraejemplo de James Currier es la advertencia. Netflix mejora con dato de visualización, pero el catálogo carga el valor, así que el efecto de dato allí es apenas marginal.

El consenso de los inversionistas en 2025 llega al mismo punto. Bessemer argumenta que los ganadores de IA vertical no competirán en el modelo de base, y los diferenciadores clave son dato propietario, profundidad de integración y valor económico entregado. Insight Partners es aún más directa. El acceso a dato ganado crea un moat que se ensancha con cada cliente integrado, y el acceso a dato específico, desordenado y no estandarizado sigue siendo uno de los moats más fuertes en IA. Esa última frase es la vara de verdad. No tenemos dato, sino que tenemos el tipo de dato que solo este copilot puede generar a escala.

Escaso: la fuente está trabada por regulación o por un tenedor reacio a abastecer a un segundo proveedor.
Ganado en el flujo: el copilot es el único instrumento práctico que lo acuña a escala.
Compuesto en el uso: el dato se vuelve más valioso conforme se usa el producto, no conforme queda guardado en almacenamiento.

Etapa tres: el dato se vuelve capital

Hay dos salidas de la etapa dos, y la segunda es la interesante. La primera es levantar con base en la fuerza del dataset. Un dataset propietario y trabado por regulación que precifica o puntúa una clase de activo es una historia de levantamiento que un modelo de estante no puede contar. La segunda es desplegar capital directo en los activos que el dato identifica. El dataset deja de ser activo de venta y se vuelve un motor de originación.

El crédito embebido es el análogo más limpio. El argumento en el fintech es que una plataforma dentro del flujo acumula dato transaccional y de comportamiento que la deja precificar riesgo mejor que un banco mirando al mismo deudor desde afuera. El dato es la ventaja, y la ventaja se monetiza como capital desplegado en crédito. El dato como garantía funciona igual. Un prestamista adelanta contra una cuenta por cobrar o una demanda judicial solo cuando alguien precifica el riesgo de forma creíble, y un dataset propietario es lo que hace creíble esa precificación.

Esa es la vuelta que la mayoría de los equipos nunca alcanza, porque exige que el dato esté lo bastante denso para apostar dinero. Un modelo acertado el 70 por ciento de las veces es un buen copilot y un pésimo suscriptor. La etapa de capital es donde el dato delgado queda expuesto.

El patrón en Alphajuri, WIR y BR Auction Intel

El mismo loop corre en tres verticales distintos en el portafolio de Avante. Descrito por dominio, sin números inventados.

Alphajuri lo corre en activos judiciales. Un copilot para precatórios y demandas hace el trabajo de valuación y seguimiento, y cada caso que procesa densifica un dataset para valuar y financiar esos activos. El contexto brasileño es lo que lo hace escalar. Los servicios representan cerca del 70% del PIB brasileño con baja penetración de software, lo que significa una superficie enorme de flujos poco digitalizados y densos en regulación donde un copilot acuña dato que ningún actor establecido tiene. El mercado de precatórios tenía cerca de R$300 mil millones en deuda pública impaga ordenada por tribunal, con el stock federal solo por encima de R$140 mil millones en 2023, y cerca de un cuarto de los precatórios pendientes ya había cambiado de manos en el mercado secundario. Un mercado de ese tamaño, tan fragmentado y tan difícil de precificar es exactamente donde un copilot construye dato que ningún modelo de estante tiene, y donde el dato puede financiar los activos directo.

WIR lo corre en insurtech, con AXA. La precificación y el scoring de riesgo asíncronos convierten cada interacción de suscripción en un dataset etiquetado de precificación. La salida es una señal de precio que un modelo genérico no reproduce, porque el modelo genérico nunca vio las interacciones. BR Auction Intel lo corre en subastas inmobiliarias brasileñas. Raspar, enriquecer y puntuar construye un dataset de oportunidades de subasta que se vuelve señal de originación, dirigiendo capital hacia inmuebles específicos.

Por qué el loop falla si nadie usa el copilot

El loop solo cierra si el copilot alcanza uso suficiente para densificar el dato. Ese es el punto débil honesto de toda la tesis, y fingir lo contrario es como los studios pierden dinero. Un copilot que nadie usa no produce dato, escaso o no. El dato delgado no precifica nada, no puntúa nada y no origina nada, así que la etapa de capital simplemente nunca llega.

Tres formas concretas de quebrar. Riesgo de wrapper: el copilot agrega demasiado poco sobre un modelo crudo, así que el uso nunca crece y no hay qué acuñar. Riesgo de distribución: el dato existe pero el producto nunca alcanza la densidad de flujo donde el efecto de red aparece, que es exactamente la advertencia de efecto marginal de Currier ocurriendo en la práctica. Riesgo de dependencia del modelo: el equipo confunde el modelo con el moat, y cuando el precio de inferencia cae otras 50x la supuesta ventaja se evapora.

La disciplina que el flywheel exige es incómoda para fundadores que quieren hablar del fondo el día uno. Obsesiónese con el uso del copilot primero. El dato, el moat y el capital están todos estrictamente aguas abajo de él. Un studio que financia el dataset antes de que el uso exista compró un número que no precifica nada.

Evalúe el uso del copilot antes de evaluar el dataset. El dato escaso es defensable, pero un copilot que nadie usa no acuña dato, y un dataset que no precifica nada no llega a la etapa de capital.

Cómo corre Avante el flywheel

Avante Ventures corre esto como un studio, no como un portafolio de apuestas. Lanza 3-4 ventures por año mediante un sistema de seis etapas: Research, Partner, Build, Traction, Revenue, Compound. Despliega $500K-1.5M por venture y retiene economía de co-founder. La ventaja estructural son operadores de dominio con más de 10 años de cicatriz del mercado brasileño, sumados a un playbook de Silicon Valley y capital de primer cheque, ensamblados el día uno en vez de reclutados a lo largo del primer año.

El modelo de studio y este flywheel encajan por una razón específica. Resolver la plomería de la empresa una sola vez enruta cerca de $300K-500K de capital efectivo por venture hacia producto y tracción en vez de overhead, lo que le da al copilot el aire para alcanzar densidad de uso antes de que la tesis de dato tenga que probarse. Una venture de studio lanza 6-9 meses por delante de un equipo independiente con financiamiento comparable, y en este patrón esos meses son puro acúmulo de dato. El benchmark que cita Avante es el hallazgo de GSSN de que el IRR de studio ronda ~50% frente a ~19% del venture capital tradicional, cerca de 2.5x. Esa es la ventaja del modelo de studio, no una afirmación sobre el retorno de ninguna venture aislada. Vea /why-avante para la tesis y /principles para cómo opera el studio.

El flywheel no es una historia sobre IA. Es una historia sobre qué activo sobrevive cuando el modelo es gratis. El equipo que se obsesiona con el copilot termina dueño de lo único que la curva de precio no copia. El equipo que se obsesiona con el fondo termina sosteniendo un dataset que no precifica nada.

— Equipo Fundador de Avante

São Paulo + Silicon Valley · escrito desde dentro del studio

¿Quieres más? Recibe un ensayo a la semana sobre venture building, negocios AI-native y la oportunidad Brasil.

Ver Biblioteca completa →