O Flywheel Copilot para Dado para Fundo, Explicado
Lance um copilot para cunhar dado proprietário e transforme esse dado em capital. O mecanismo, a falha e como a Avante roda isso.
O flywheel copilot, dado, capital é uma ideia só, dita de três formas. Construa um copilot de IA que faça trabalho real em um vertical denso de regulação. Deixe cada interação cunhar dado estruturado e difícil de obter. Depois transforme esse dado em capital, seja captando com base na força do dataset, seja alocando capital direto nos ativos que o dado identifica.
Esse é o padrão recorrente na Avante Ventures, um venture studio que constrói empresas AI-native no Brasil e na América Latina. Não é um slogan. É uma sequência de construção com ordem precisa e um único ponto de falha, e a maioria dos times erra a ordem. Eles correm atrás do fundo antes de o dado estar denso o bastante para precificar qualquer coisa.
O loop em uma frase
O copilot gera dado, o dado vira ativo precificado, o ativo atrai ou vira capital, e o capital compra mais uso que adensa o dado. É a máquina inteira. A ordem não se negocia. Pule o uso e o resto é um pitch deck sem motor embaixo.
O que torna esse loop viável em 2026 é que a primeira volta ficou barata. O modelo deixou de ser a parte cara de uma empresa de IA, e deixou de ser a parte durável também. Tudo que dura foi empurrado para fora do modelo e para cima do dado que o modelo toca e que ninguém mais consegue copiar.
Etapa um: um copilot que cunha dado
Um copilot só é AI-native se remover o modelo quebrar o fluxo central. Aplique o teste em qualquer produto. Se ele ainda funcionaria como software comum com o modelo retirado, a IA é uma funcionalidade colada na borda. Se o fluxo existe apenas porque o modelo faz o trabalho de julgamento, e o ato de fazer esse trabalho deixa dado rotulado para trás, é AI-native. O produto é o instrumento de coleta de dado.
A razão de isso ser viável hoje sem uma Series A é o colapso do custo de inferência. A Epoch AI mostrou que o preço para igualar o desempenho do GPT-4 em um conjunto de questões científicas de nível de doutorado caiu cerca de 40x por ano, com a mediana entre todas as tarefas medidas perto de 50x por ano e as tarefas mais rápidas caindo até 900x ao ano. Uma capacidade que custava uma fortuna no ano passado é arredondamento neste ano.
A consequência estratégica é dura. Se o modelo é quase de graça e melhora para todo mundo ao mesmo tempo, nenhum modelo é moat. A defensibilidade precisa morar em algum lugar que a curva de preço não alcança. Nesse padrão, ela mora no dado proprietário que o copilot produz enquanto trabalha.
O preço para atingir o desempenho do GPT-4 em questões científicas de nível de doutorado caiu cerca de 40x por ano, com mediana entre tarefas perto de 50x por ano. O modelo é a parte barata agora. O dado é o moat.
— Epoch AI, março de 2025
Etapa dois: o dado vira o moat e o ativo
A maioria dos moats de dado é ficção, e a crítica mais afiada vem de quem financia IA. A Andreessen Horowitz disse sem rodeios em 2019. Em geral não existe efeito de rede inerente que venha apenas de ter mais dado. A economia muitas vezes anda no sentido errado. O custo de adicionar dado único ao seu acervo pode subir, enquanto o valor do dado incremental cai. Passado certo limiar de cobertura, cada nova fatia custa mais e entrega menos.
Então quando o dado é de fato defensável? A a16z nomeia a condição exata. Acumular dado proprietário é mais forte quando as fontes são escassas ou relutantes em fornecer dado para mais de um fornecedor. Os exemplos deles são fontes reguladas por governo e bureaus de crédito. Esse perfil, dado escasso, travado por regulação, em mãos de quem reluta em compartilhar duas vezes, é o alvo preciso deste flywheel.
A versão que funciona tem nome. A NFX define um efeito de rede de dado como o caso em que o valor de um produto aumenta com mais dado e em que mais uso do produto gera mais desse dado. A condição que importa: o dado precisa ser central para como o produto beneficia o usuário, não um artefato lateral. O contraexemplo do próprio James Currier é o aviso. A Netflix melhora com dado de audiência, mas o catálogo carrega o valor, então o efeito de dado ali é apenas marginal.
O consenso dos investidores em 2025 chega ao mesmo ponto. A Bessemer argumenta que os vencedores de IA vertical não competirão no modelo de base, e os diferenciais-chave são dado proprietário, profundidade de integração e valor econômico entregue. A Insight Partners é ainda mais direta. Acesso a dado conquistado cria um moat que se alarga a cada cliente integrado, e o acesso a dado específico, bagunçado e não padronizado segue sendo um dos moats mais fortes em IA. Essa última frase é a régua de verdade. Não temos dado, mas temos o tipo de dado que só este copilot consegue gerar em escala.
- Escasso: a fonte é travada por regulação ou por um detentor relutante em abastecer um segundo fornecedor.
- Conquistado no fluxo: o copilot é o único instrumento prático que o cunha em escala.
- Composto no uso: o dado fica mais valioso conforme o produto é usado, não conforme fica parado em armazenamento.
Etapa três: o dado vira capital
Há duas saídas da etapa dois, e a segunda é a interessante. A primeira é captar com base na força do dataset. Um dataset proprietário e travado por regulação que precifica ou pontua uma classe de ativo é uma história de captação que um modelo de prateleira não consegue contar. A segunda é alocar capital direto nos ativos que o dado identifica. O dataset deixa de ser ativo de venda e vira um motor de originação.
O crédito embarcado é o análogo mais limpo. O argumento no fintech é que uma plataforma dentro do fluxo acumula dado transacional e comportamental que a deixa precificar risco melhor do que um banco olhando o mesmo tomador de fora. O dado é a vantagem, e a vantagem é monetizada como capital alocado em crédito. Dado como garantia funciona igual. Um credor adianta contra um recebível ou uma ação judicial apenas quando alguém precifica o risco de forma crível, e um dataset proprietário é o que torna essa precificação confiável.
Essa é a volta que a maioria dos times nunca alcança, porque exige que o dado esteja denso o bastante para apostar dinheiro. Um modelo certo 70 por cento das vezes é um bom copilot e um péssimo subscritor. A etapa de capital é onde o dado fino é exposto.
O padrão em Nexa, WIR e BR Auction Intel
O mesmo loop roda em três verticais diferentes no portfólio da Avante. Descrito por domínio, sem números inventados.
A Nexa Tech roda em ativos judiciais. Um copilot para precatórios e ações faz o trabalho de avaliação e acompanhamento, e cada caso que processa adensa um dataset para avaliar e financiar esses ativos. O contexto brasileiro é o que faz isso escalar. Serviços respondem por cerca de 70% do PIB brasileiro com baixa penetração de software, o que significa uma superfície imensa de fluxos pouco digitalizados e densos de regulação onde um copilot cunha dado que nenhum incumbente tem. O mercado de precatórios tinha cerca de R$300 bilhões em dívida pública não paga determinada por tribunal, com o estoque federal sozinho acima de R$140 bilhões em 2023, e cerca de um quarto dos precatórios pendentes já havia trocado de mãos no mercado secundário. Um mercado desse tamanho, tão fragmentado e tão difícil de precificar é exatamente onde um copilot constrói dado que nenhum modelo de prateleira tem, e onde o dado pode financiar os ativos direto.
A WIR roda em insurtech, com a AXA. Precificação e scoring de risco assíncronos transformam cada interação de subscrição em um dataset rotulado de precificação. A saída é um sinal de preço que um modelo genérico não reproduz, porque o modelo genérico nunca viu as interações. A BR Auction Intel roda em leilões imobiliários brasileiros. Raspar, enriquecer e pontuar constrói um dataset de oportunidades de leilão que vira sinal de originação, direcionando capital para imóveis específicos.
Por que o loop falha se o copilot fica sem uso
O loop só fecha se o copilot atingir uso suficiente para deixar o dado denso. Esse é o ponto fraco honesto de toda a tese, e fingir o contrário é como studios perdem dinheiro. Um copilot que ninguém usa não produz dado, escasso ou não. Dado fino não precifica nada, não pontua nada e não origina nada, então a etapa de capital simplesmente nunca chega.
Três formas concretas de quebrar. Risco de wrapper: o copilot adiciona pouco demais sobre um modelo cru, então o uso nunca cresce e não há o que cunhar. Risco de distribuição: o dado existe mas o produto nunca atinge a densidade de fluxo onde o efeito de rede aparece, que é exatamente o aviso de efeito marginal de Currier acontecendo na prática. Risco de dependência de modelo: o time confunde o modelo com o moat, e quando o preço de inferência cai mais 50x a suposta vantagem evapora.
A disciplina que o flywheel exige é desconfortável para fundadores que querem falar do fundo no dia um. Obcecue com o uso do copilot primeiro. O dado, o moat e o capital estão todos estritamente a jusante dele. Um studio que financia o dataset antes de o uso existir comprou um número que não precifica nada.
Avalie o uso do copilot antes de avaliar o dataset. Dado escasso é defensável, mas um copilot que ninguém usa não cunha dado, e um dataset que não precifica nada não chega à etapa de capital.
Como a Avante roda o flywheel
A Avante Ventures roda isso como um studio, não como um portfólio de apostas. Lança 3-4 ventures por ano por meio de um sistema de seis etapas: Research, Partner, Build, Traction, Revenue, Compound. Aloca $500K-1.5M por venture e mantém economia de co-founder. A vantagem estrutural são operadores de domínio com mais de 10 anos de cicatriz do mercado brasileiro, somados a um playbook de Vale do Silício e capital de primeiro cheque, montados no dia um em vez de recrutados ao longo do primeiro ano.
O modelo de studio e este flywheel se encaixam por um motivo específico. Resolver o encanamento da empresa uma vez roteia cerca de $300K-500K de capital efetivo por venture para produto e tração em vez de overhead, o que dá ao copilot o fôlego para atingir densidade de uso antes de a tese de dado precisar se provar. Uma venture de studio lança 6-9 meses à frente de um time autônomo com financiamento comparável, e nesse padrão esses meses são puro acúmulo de dado. O benchmark que a Avante cita é o achado da GSSN de que o IRR de studio fica perto de ~50% contra ~19% do venture capital tradicional, cerca de 2.5x. Essa é a vantagem do modelo de studio, não uma afirmação sobre o retorno de qualquer venture isolada. Veja [/why-avante](/why-avante) para a tese e [/principles](/principles) para como o studio opera.
O flywheel não é uma história sobre IA. É uma história sobre qual ativo sobrevive quando o modelo é de graça. O time que se obceca com o copilot acaba dono da única coisa que a curva de preço não copia. O time que se obceca com o fundo acaba segurando um dataset que não precifica nada.
Quer mais? Receba um ensaio por mês sobre venture building, negócios AI-native e a oportunidade Brasil.
Ver Biblioteca completa →