Onde Mora o Moat Quando o Modelo Vira Commodity
Alugue o modelo, seja dono do moat. Um playbook sobre dado proprietario, efeitos de rede de dados e process power em IA vertical, com os anti-moats a evitar.
O modelo de fundacao deixou de ser moat no instante em que a inferencia comecou a cair 10x ao ano. Quando a capacidade central vira utilidade que qualquer concorrente aluga de varios fornecedores, a defensibilidade precisa morar onde a curva de preco nao alcanca. Esse lugar e o efeito de rede de dados, o dado proprietario e o process power em IA vertical.
Este e um playbook sobre onde a vantagem duravel realmente fica depois que o modelo vira commodity. A versao curta. O modelo e o motor alugado. O moat e aquilo a que o motor esta preso. Na Avante Ventures construimos para a segunda coisa, porque a primeira ja nao e algo que se possa possuir.
O modelo é alugado, então o moat se desloca
O modelo virou commodity porque a inferencia barateou mais rapido do que quase qualquer tecnologia da historia. Segundo a [a16z](https://a16z.com/llmflation-llm-inference-cost/), para um LLM de desempenho equivalente o custo cai 10x a cada ano, um fator de 1.000 em tres anos. A qualidade nivel GPT-3 saiu de US$ 60 por milhao de tokens no fim de 2021 para cerca de US$ 0,06. Rastreadores independentes da [Epoch AI](https://epoch.ai/data-insights/llm-inference-price-trends) confirmam a direcao, com algumas tarefas caindo 40x ao ano.
Uma queda de 10x ao ano, disponivel para todos, e a definicao de utilidade. Entao a pergunta estrategica ja nao e qual modelo voce usa. E o que se acumula ao redor do modelo que um concorrente com o mesmo modelo e mais dinheiro nao consegue replicar ate o proximo trimestre. Tres mecanismos passam nesse teste. Leia em ordem de durabilidade, e veja como eles se conectam em [/why-avante](/why-avante).
Para um LLM de desempenho equivalente, o custo de inferencia cai 10x a cada ano, um fator de 1.000 em tres anos.
— a16z, Welcome to LLMflation, novembro de 2024
Dado proprietário: um estoque que decai
Um dataset proprietario obtido uma unica vez e um estoque, e estoque decai. A correcao mais afiada ao hype do dado como moat continua sendo o texto da a16z [The Empty Promise of Data Moats](https://a16z.com/the-empty-promise-of-data-moats/), que argumenta que em geral nao existe efeito de rede inerente em simplesmente ter mais dado. Pior, o dado bate em retornos decrescentes. No exemplo deles, de um chatbot de suporte, passados cerca de 40% de cobertura das perguntas o custo de adicionar dado unico sobe enquanto o valor de cada novo registro cai.
O dado so e defensivel sob condicoes apertadas. O acesso precisa ser genuinamente exclusivo, ou a precisao em um dominio de alto risco precisa alimentar um loop de uso e feedback. Um dataset que um rival tambem pode comprar ou raspar e linha de custo, nao moat. Ter uma pilha de dados e largada na frente. O moat e o que mantem a pilha crescendo mais rapido do que qualquer um consegue copiar.
Efeitos de rede de dados: o fluxo que compõe
O efeito de rede de dados e o tipo duravel porque e um fluxo, nao um estoque. O uso de cada cliente melhora o produto para o proximo cliente, entao o ativo se reabastece mais rapido do que decai. A NFX, no seu [Network Effects Manual](https://www.nfx.com/post/network-effects-manual), trata os efeitos de rede como o mecanismo central de defensibilidade e credita a eles a maior parte do valor criado por empresas de tecnologia.
A ressalva importa, e e onde a maioria dos fundadores se engana. O loop so conta quando mais uso melhora o produto de forma mensuravel numa dimensao que o cliente valoriza, e quando um concorrente comecando do zero nao consegue igualar essa melhora. Escala sozinha nao faz isso. Um loop de feedback faz.
- Escala, nao moat. Um novo entrante com o mesmo modelo e mais capital replica sua posicao de dado em um trimestre.
- Fluxo de verdade. Seu produto fica estruturalmente melhor quanto mais tempo roda, porque o uso alimenta um ativo que rivais nao compram.
- O teste. Se um concorrente bem financiado nao alcanca sua posicao de dado ate o proximo trimestre, voce tem efeito de rede, nao so escala.
Process power e lock-in de workflow
Process power e o moat que compoe dentro de workflows regulados. O [7 Powers](https://blas.com/7-powers/) de Hamilton Helmer define Process Power como excelencia operacional mais histerese, a resistencia que mantem um processo dificil de copiar mesmo quando seus resultados estao a vista. Ele anda junto com os Switching Costs, que surgem quando um cliente valoriza compatibilidade entre compras repetidas de uma mesma empresa ao longo do tempo.
Quando um produto de IA vira o sistema de registro de um processo regulado, sair significa revalidar uma trilha de compliance, retreinar equipe e reintegrar sistemas adjacentes. O custo de sair e o moat. E por isso que a IA vertical vence a IA horizontal. Um assistente generico nao tem workflow para ancorar. Um produto vertical que vive dentro de um processo licenciado, auditado e denso em regulacao ancora fundo e permanece.
Mapeando isso nos 7 Powers
O framework de Helmer e util aqui justamente porque forca honestidade sobre qual poder voce de fato tem. O modelo nao e nenhum deles. E um insumo que todo rival compartilha. Os moats duraveis de IA mapeiam em tres dos sete poderes, e a evidencia de 2025 confirma.
Segundo a [Insignia Ventures](https://review.insignia.vc/2025/04/15/moats-ai/), a IA tornou o construir mais facil e o defender exponencialmente mais dificil, com software chegando a US$ 1 milhao de ARR mais rapido do que nunca. Os estudos de caso de mercados emergentes deles caem nos mesmos tres poderes. Uma plataforma de carros usados compoe um data flywheel a partir de mais de 160 pontos de dado por veiculo. Um credor combina um ERP proprietario com financiamento e segura 3% de inadimplencia contra 20 a 30% do setor numa retracao. Um banco digital transforma uma licenca regulatoria escassa em distribuicao que rival nenhum iguala.
- Network Economies. O efeito de rede de dados, onde cada usuario melhora o produto para o proximo.
- Process Power. Excelencia operacional mais histerese, o lock-in de workflow de um sistema de registro.
- Cornered Resource. Uma licenca escassa ou um feed de dados exclusivo que um concorrente nao aluga nem raspa.
- Switching Costs. O custo de revalidacao, retreinamento e reintegracao de sair de um workflow regulado.
Os anti-moats: wrappers e dado comprável
Saber o que nao e moat e metade do playbook. Um wrapper fino sobre uma API publica aluga a capacidade que todo concorrente aluga, adiciona um prompt e nao e dono de nenhum dado que compoe. Nenhum dos poderes de Helmer se aplica a ele. Um dataset proprietario que um rival pode comprar ou raspar e uma linha de custo vestida de moat.
Os outros modos de falha sao mais silenciosos. Escala de dado e confundida com efeito de rede de dados, quando mais linhas sem um loop dirigido por uso e apenas um estoque que decai. Dependencia de modelo se disfarca de estrategia, ate uma queda de 10x ao ano e a disponibilidade multi-fornecedor apagarem isso. E um dataset limpo sem canal para ser implantado perde para um dataset pior que ja vive dentro de um workflow que clientes usam todo dia.
Rode o teste da troca no seu proprio moat. Se voce trocasse de fornecedor de modelo amanha e sua defensibilidade nao mudasse, o modelo nunca foi o moat. Ache o loop ou o workflow que sobrevive a troca.
Como a Avante engenheira o moat
A Avante Ventures e um venture studio que constroi empresas AI-native no Brasil e na America Latina. O metodo e um flywheel copilot, dado, capital. Construir um copilot de IA para fazer trabalho real dentro de uma vertical, capturar o dado proprietario que o trabalho gera, e usar esse ativo de dado para captar e implantar capital. O copilot e a cunha. O efeito de rede de dados e o moat. O capital e a composicao.
O studio lanca 3-4 ventures por ano atraves de um sistema de seis estagios. Research, Partner, Build, Traction, Revenue, Compound. O capital por venture e de US$ 500K-1.5M no pre-seed, com economia de co-founder retida. O modelo e referenciado em dados da GSSN que mostram IRR de studio de ~50% contra ~19% do VC tradicional, cerca de 2.5x, um benchmark do modelo de studio e nao uma afirmacao sobre o retorno proprio da Avante.
A razao de isso funcionar na America Latina e estrutural. Servicos respondem por cerca de 70% do PIB brasileiro com baixa penetracao de software, exatamente a superficie onde um produto vertical pode virar o sistema de registro. Junte isso a operadores de dominio que carregam mais de 10 anos de cicatriz de mercado brasileiro, e o dado compoe em lugares que concorrentes nao alcancam. Workflows de ativos judiciais, como precatorios e claims, e scoring de risco em seguros sao fluxos, nao estoques. O modelo vai continuar ficando mais barato. O moat e tudo o que voce constroi para que isso deixe de importar. Veja como operamos em [/principles](/principles).
Quer mais? Receba um ensaio por mês sobre venture building, negócios AI-native e a oportunidade Brasil.
Ver Biblioteca completa →