Playbook·10 min·Jun 2026

A Armadilha do Wrapper: Quando AI-Native É de Fato Defensável

Um prompt de sistema não é um moat de wrapper de IA. Mas o wrapper não está condenado. Veja a linha entre fino e espesso, e como o flywheel de dados a cruza.

Um prompt de sistema sobre uma API de modelo de fundação não é um moat, e em fevereiro de 2026 um VP do Google colocou data na morte do wrapper fino. A pergunta deixou de ser se wrappers de IA são defensáveis no abstrato. É se o seu é dono de algo que o próximo lançamento de modelo não consegue apagar.

A versão honesta, porque o cético está quase sempre certo. Um wrapper não está condenado por ser wrapper. Está condenado por ser fino. A defensabilidade AI-native vem de ser dono de pelo menos um ativo que compõe e que um concorrente com o mesmo modelo e mais dinheiro não consegue copiar até o próximo trimestre. Na Avante Ventures construímos para esse ativo desde o dia um, porque o modelo em si já não é algo que se possa possuir.

A crítica ao wrapper fino está certa

Quem vende os modelos agora diz em voz alta a parte que ficava no sussurro. Em 21 de fevereiro de 2026, o TechCrunch noticiou que Darren Mowry, o VP que lidera a organização global de startups do Google em Cloud, DeepMind e Alphabet, alertou que dois tipos de startup de IA podem não sobreviver. O primeiro é o wrapper fino.

Vale citar as palavras dele com precisão. Se você está contando com o modelo de back-end para fazer todo o trabalho e está praticamente fazendo white-label desse modelo, a indústria não tem mais muita paciência para isso. Envolver propriedade intelectual muito fina ao redor de Gemini ou GPT-5 é a armadilha. A receita foi uma frase que vale guardar. Startups precisam de moats profundos e largos. A segunda categoria condenada foi o agregador, porque os usuários querem propriedade intelectual embutida, não uma camada de roteamento que os provedores de modelo vão absorver nos próprios recursos corporativos.

A economia por trás do alerta é a compressão de margem descendo a encosta. O TechCrunch noticiou em setembro de 2025 que equipes de aplicação agora tratam modelos de fundação como uma commodity para trocar de fornecedor à vontade. Parece alavancagem, até você perceber que todo concorrente troca pela mesma commodity. Um fundador descreveu o desfecho para os indiferenciados como vender grãos de café para a Starbucks. Essencial para a xícara, pago quase nada por isso.

Se você está contando com o modelo de back-end para fazer todo o trabalho e está praticamente fazendo white-label desse modelo, a indústria não tem mais muita paciência para isso.

— Darren Mowry, VP da organização global de startups do Google, TechCrunch, fevereiro de 2026

Fino versus espesso, definido

Espessura não tem nada a ver com quanto código você escreveu. Tem a ver com o que compõe enquanto você dorme. Uma venture espessa é dona de pelo menos um ativo que fica mais forte com o uso e que um rival bem financiado não reconstrói copiando a sua interface. Todo o resto é enfeite sobre um motor alugado.

Comece pelo motivo de o motor não poder ser o moat. A inferência está desinflando mais rápido do que quase qualquer tecnologia da história, uma curva que mapeamos para a região em a curva de custo da infraestrutura de IA. Segundo a a16z, para um LLM de desempenho equivalente o custo cai 10x a cada ano, um fator de 1.000 em três anos. A qualidade nível GPT-3 saiu de cerca de US$ 60 por milhão de tokens no fim de 2021 para por volta de US$ 0,06 no fim de 2024. Uma capacidade que fica 10x mais barata por ano, disponível para todos a partir de vários fornecedores, é uma utilidade. Você não constrói moat sobre uma utilidade. Constrói sobre aquilo a que a utilidade está presa.

Para um LLM de desempenho equivalente, o custo de inferência cai 10x a cada ano, um fator de 1.000 em três anos. A qualidade nível GPT-3 caiu de cerca de US$ 60 por milhão de tokens para por volta de US$ 0,06.

— a16z, Welcome to LLMflation, novembro de 2024

As três fontes de espessura

A defensabilidade durável mora em três lugares, em ordem crescente de força. Cada um carrega um teste de falha, e a maioria dos fundadores falha nele em silêncio.

O motivo de os efeitos de rede importarem mais é a matemática. A NFX, no seu Network Effects Manual, credita aos efeitos de rede cerca de 70% do valor criado por empresas de tecnologia desde 1994, e os classifica como a mais forte das quatro defensabilidades reais. Um flywheel de dados proprietário é como uma venture AI-native constrói um, em vez de apenas alegar que tem.

Flywheel de dados proprietário. Um estoque de dados não é moat, um fluxo é, que é o coração de como os efeitos de rede de dados funcionam na IA vertical. O texto da a16z, The Empty Promise of Data Moats, mostra que em geral não existe efeito de rede inerente em apenas ter mais dado, e que no exemplo de um chatbot de suporte, passados cerca de 40% de cobertura das perguntas, não há vantagem em coletar mais. O moat é um loop em que cada uso produz dado que melhora o produto de forma mensurável mais rápido do que a pilha decai.
Avaliações específicas de domínio. O ativo mais difícil de copiar é uma definição graduada do que significa correto em um domínio regulado e denso em julgamento. Um modelo genérico redige uma cláusula ou precifica um risco. Saber qual resultado está certo, errado ou silenciosamente perigoso em um contexto jurídico ou de seguros brasileiro é julgamento codificado que operadores levaram anos para conquistar. O fornecedor do modelo não entrega as suas avaliações por você.
Lock-in de workflow. O 7 Powers de Hamilton Helmer chama isso de Process Power e Switching Costs. Quando um produto de IA vira o sistema de registro de um processo regulado, sair significa revalidar uma trilha de compliance, retreinar a equipe e reintegrar sistemas adjacentes. O custo de sair é o moat. É por isso que a IA vertical vence a horizontal. Um assistente genérico não tem workflow para ancorar.

Como o flywheel cruza a linha

O flywheel é a máquina que transforma uma cunha de entrada fina em uma posição espessa ao longo do tempo. Este é o flywheel copilot, dado, capital. Lance um copilot de IA que faz trabalho real dentro de uma vertical. O trabalho gera dado proprietário que ninguém mais tem. Esse dado afia as avaliações de domínio e melhora o produto, o que aprofunda o lock-in de workflow, o que produz mais dado. O copilot é a cunha de aparência fina no dia um. O loop é o que o torna espesso até o segundo ano.

A evidência de 2025 de que essa é a verdadeira linha divisória vem de mercados emergentes, não do Vale do Silício. Segundo a Insignia Ventures, a IA tornou o construir mais fácil e o defender exponencialmente mais difícil, com software chegando a US$ 1 milhão de ARR mais rápido do que nunca. Os estudos de caso deles caem exatamente nesses mecanismos. Uma plataforma de carros usados compõe um flywheel de dados a partir de mais de 160 pontos de dado por veículo. Um credor que combina um ERP proprietário com financiamento segurou 3% de inadimplência durante a COVID enquanto o setor de fintech mais amplo rodava de 20 a 30%. Todos eles alugaram o mesmo modelo. Nenhum deles alugou o flywheel.

A história que fundadores contam e não é verdade

O pitch mais comum em IA é uma história de moat espesso narrada sobre um produto fino. Fundadores descrevem um efeito de rede de dados que não construíram, um flywheel que não atingiu velocidade de escape e uma defensabilidade que vive inteiramente no tempo futuro. O modo de falha honesto tem duas partes, e elas se alimentam.

Primeiro, o loop de dados passa fome porque a empresa não tem distribuição. Um loop de feedback só compõe se usuários suficientes o alimentarem. Sem um canal para adquirir e reter esses usuários, um concorrente mais bem distribuído com um dataset pior vence, porque o dataset pior dele está crescendo enquanto o seu fica parado. Segundo, dado proprietário sem como continuar coletando não é moat, é um estoque que decai. Um dataset congelado no lançamento é ultrapassado por um produto que melhora a cada uso.

O teste da troca é a disciplina que corta a história ao meio. Se você trocasse de fornecedor de modelo amanhã e a sua defensabilidade não mudasse, o modelo nunca foi o seu moat. Ache o loop ou o workflow que sobrevive à troca antes que um lançamento de modelo o ache por você.

Rode o teste da troca na sua própria venture. Troque de fornecedor de modelo na cabeça. Se a sua defensabilidade não muda, o modelo nunca foi o moat, e o flywheel de dados que você descreve ainda é promessa, não ativo.

Como a Avante constrói espesso desde o dia um

A Avante Ventures é um venture studio que constrói empresas AI-native no Brasil e na América Latina, projetada para começar espessa em vez de torcer para engrossar depois. O método é o flywheel copilot, dado, capital rodando dentro de um sistema de seis estágios. Research, Partner, Build, Traction, Revenue, Compound. Cada venture é pareada no dia um com um operador de domínio que carrega mais de 10 anos de cicatriz de mercado brasileiro, de onde vêm as avaliações proprietárias, e com US$ 500K-1.5M de capital de primeiro cheque, que compra a distribuição que mantém o loop de dados alimentado. Como a inferência é barata, esse primeiro cheque muitas vezes basta para chegar à receita sem uma Série A. A tese completa está em /why-avante.

O Brasil faz a conta fechar. Serviços respondem por cerca de 70% do PIB brasileiro, segundo o IBGE a maior fatia da economia e por muito tempo mal atendida por software, que é exatamente a superfície onde um produto de IA vertical pode virar o sistema de registro. O portfólio mostra o padrão por domínio. Ativos judiciais, onde o dado de workflow em torno de precatórios e claims é genuinamente proprietário. Precificação de seguros, onde a precisão do scoring de risco alimenta um loop de uso. Inteligência de leilões imobiliários, onde dados de leilão enriquecidos e pontuados se compõem. Em cada um deles o modelo é o motor alugado e o moat é o fluxo de dado de domínio preso a ele.

Os retornos do modelo de studio são o motivo de construirmos assim, com dados da GSSN mostrando IRR de studio de cerca de 50% contra cerca de 19% do VC tradicional, aproximadamente 2.5x, um benchmark do modelo e não uma afirmação sobre o retorno realizado de qualquer fundo específico. A crítica ao wrapper está certa. É justamente por isso que uma venture deve ser construída para que o próximo lançamento de modelo seja vento a favor, não um obituário. Veja como operamos em /principles.

— Time Fundador da Avante

São Paulo + Vale do Silício · escrito de dentro do studio

Quer mais? Receba um ensaio por semana sobre venture building, negócios AI-native e a oportunidade Brasil.

Avante Intelligence · semanal · sem spam. Ou ver a Biblioteca