- Alan Nicolas ♾️
- Posts
- A Infraestrutura Que Separa o Vale do Brasil
A Infraestrutura Que Separa o Vale do Brasil
No Vale do Silício, empresas pagam $300/dia em tokens e premiam quem gasta mais. No Brasil, dois dólares ainda e caro.

Essa semana eu vim com 18 pessoas para o Vale do Silício.
E desde que cheguei, tem uma coisa acontecendo aqui que talvez vocês se conectem.
As pessoas vão para cafeterias e ficam codando. Tu entra numa cafeteria, tá todo mundo com a tela preta. E quando acabam os tokens, daí é o momento do networking. Acabou o token de um, acabou o de outro, aí conversam sobre negócio, sobre o que estão fazendo.
A galera vai lá para trabalhar, não para fazer networking. Ficam codando e só param quando os tokens acabam. Para usar o máximo de token possível.
Essa é a segunda turma da Imersão. 15 brasileiros, 2 portugueses. Cinco dias. Manhã a gente visita, absorve, conecta. Tarde, implementação guiada, aplicando no negócio real de cada um. Noite, síntese e networking no jantar. Google DeepMind, Stanford, UC Berkeley, GitHub, Vercel, startups.

E nas visitas que fizemos essa semana, a cena da cafeteria fez ainda mais sentido.
Quando os Tokens Acabam
As empresas que eu tô visitando aqui entregam de 100 a 300 dólares por dia em tokens para cada funcionário.
Eles têm tabelinhas na parede com monitor. E premiam quem gasta mais token.
Tem salários aqui que são pagos em token.
Tem pessoas que escolhem: "olha, eu quero ganhar X por mês, mas eu quero ganhar mais 20 mil em tokens também para poder tocar os meus projetos."
O New York Times deu um nome para isso em março: tokenmaxxing.

A Meta criou um ranking interno. Claudeonomics. 85 mil funcionários rankeados por consumo de tokens. 60 trilhões de tokens em 30 dias.
Ficou tão intenso que derrubaram o sistema em 48 horas.
No Google, eles disponibilizam todos os modelos. Anthropic, OpenAI, todos. A maioria dos engenheiros usa Claude Code. Lá tem um board, as pessoas ganham prêmios, ganham dinheiro quando gastam bastante tokens.
E não é só dentro das empresas. Na conferência da Nvidia em março de 2026, o Jensen Huang disse que se um engenheiro ganha 500 mil dólares por ano e não gasta pelo menos metade disso em tokens, ele ficaria "deeply alarmed".
A assinatura dessas ferramentas funciona como academia. Vendem muito mais inscrições do que poderiam receber ao mesmo tempo. As pessoas têm que dormir, têm que comer. Então entregam por um valor menor do que seria se todo mundo usasse o tempo inteiro.
Só que aqui, as pessoas usam. Até acabar. E quando acaba, aí sim, conversam.
E do lado de cá?
Gastar dois dólares é muito dinheiro para nós. Muita grana.
Eu disse isso na live de quinta e é real. É caro para nós. E as empresas ainda não estão entendendo a dinâmica da importância disso. Porque as pessoas aqui sabem que podem ser 10, 20, 30 vezes mais produtivas se tiverem isso.
A diferença é de tratamento.
De um lado, token é investimento.
Do outro, token é custo.
E enquanto essa diferença existe, outra coisa aconteceu.
O Que Saiu na Quinta
No meio da imersão, a Anthropic lançou o modelo novo.
Quinta-feira, 16 de abril. Dia 4.
De manhã, a gente estava na UC Berkeley com o professor Jeff Eyet. De tarde, no GitHub com o Jose Palafox. No fim do dia, Vercel com o Guillermo Rauch.
E nesse dia, o Opus 4.7 saiu.
Os benchmarks oficiais dizem que melhorou. SWE-bench Verified: 87.6%, contra 80.8% do anterior.
Na live que fiz na quinta à noite, testei ao vivo.
Chamei o arquiteto do sistema, pedi para analisar uma conversa inteira e conferir os gaps que existiram, onde as decisões ou o que foi feito poderia ter sido melhor. Ele fez uma análise de 12 gaps.
Lendo o que trouxe, alguns faziam sentido. Outros não tanto.
Nos meus testes, em 256 mil tokens de contexto, a compreensão caiu de 91.9% para 59.2%.
Em 1 milhão de tokens, foi de 78.3% para 32.2%.
Semanas antes, um diretor sênior da AMD já tinha escrito no GitHub: "Claude regrediu ao ponto de não ser confiável para engenharia complexa."
Logo depois, a Anthropic lançou o 4.7.

Tudo indica, pelo paper que publicaram e por vários motivos, que o 4.7 não é da mesma família do Opus 4.6. Na verdade, é provavelmente uma destilação do Mitos, o modelo de pesquisa deles.
Ao invés de melhorar o que existia, destilaram algo novo.
O preço por token continua o mesmo. No site, nada mudou.
Só que o novo tokenizer transforma o mesmo texto em 35% mais tokens. Em inglês, o consumo subiu 58%. Em chinês, 6%.
Eu acompanho isso a cada lançamento. Sempre comparo quanto gasta mais de tokens entre diferentes idiomas e linguagens de programação. Uma disparidade assim eu não lembro de ter visto.
A conta não muda no painel.
Muda na fatura.
E aí fica a pergunta.
A Distância Real
O que separa quem absorve essa mudança de quem paga mais sem perceber?
Engenharia de contexto é muito mais importante que engenharia de prompt.
Essa frase apareceu de forma unânime nas conversas aqui.
É sobre onde os dados estão antes do modelo chegar neles. Se a IA precisa de uma informação e você não mapeou onde ela está, ela vai torrar um monte de token procurando.
Se os dados estão estruturados, no formato certo, no lugar certo, ela faz um read direto. Sem busca. Sem desperdício.
Não adianta falar em RAG. RAG é bom para chatbot. Você pede um cachorro quente e o sistema busca por cachorro. Para essa parte de memória, de estrutura de dados, o que as empresas têm mais usado aqui é Markdown mesmo. YAML. Categorias claras.
Governança.
O próximo AIOX vai gastar cinco vezes menos tokens. Cinco vezes. Mesmo usando enxame de agentes. Porque a estrutura ao redor ficou mais inteligente.
A Moeda Que Mudou
Mas estrutura sozinha não explica o que eu vi aqui.
No dia 3 da imersão, o grupo inteiro foi para um hackathon no The Garage, em São Francisco. 18 pessoas construindo junto, no mesmo espaço que startups daqui usam toda semana.
O que vi lá tem nome. A a16z publicou um artigo em fevereiro chamando de gift culture.
No Vale, a moeda não é proteger. É dar.

Dar código, dar processo, dar acesso.
O OpenClaw tem hackathon toda semana aqui. Um deles pegou um prédio de dez andares. Em cada área do prédio tinha um hackathon de setores diferentes do mercado. Mudou completamente o mercado. Cisne negro da mesma família que o DeepSeek em 2025.
O Peter, que está por trás do OpenClaw, já tem condições financeiras suficientes para viver o que para ele é o suficiente. Veio ao Vale mesmo assim. Para ter mais poder computacional, estar mais à frente da tecnologia, poder criar.
Na quinta, o Guillermo Rauch, criador do Next.js e fundador da Vercel, recebeu nosso grupo. Compartilhando como funciona por dentro com 18 brasileiros e portugueses.
E por que esse compartilhamento importa agora? Porque a velocidade aqui não para. Toda vez que a Anthropic faz um lançamento, as startups aqui ficam apreensivas. Porque a cada lançamento, ela mata várias startups. Um modelo novo permite muitas vezes que se consiga mudar mercados inteiros.
A Anthropic cresceu de 9 bilhões de lucro para mais de 30 bilhões. Tá valendo quase 1 trilhão de dólares. Engolindo todo mundo aqui no Vale.
Duas coisas são consenso aqui: a OpenAI, se não morrer, vai ser mais uma só. E a única que tem chance nessa corrida é o Google.
No trimestre que o Opus 4.7 saiu, 78.557 pessoas de tech perderam o emprego.
Quase metade das empresas atribuiu a mesma causa: IA.
A distância entre os dois lados não é o oceano.
É que de um lado, as pessoas gastam 300 dólares por dia em tokens e ganham prêmio por isso. Do outro, gastar dois dólares ainda é "muito dinheiro para nós, muita grana".
E aí fica a pergunta: onde construir essa base?
Onde Construir
Eu vim para cá para estudar mais, me aprofundar mais, conversar mais, descobrir se a gente tá indo pelo caminho certo.
Até agora a resposta tem sido positiva. As pessoas que viram o que a gente tá fazendo estão dizendo: "nossa, que legal, vamos conversar mais." Convites para entrar em empresas que são fechadas, que nem permitem visitantes.
Tudo que eu mostrei aqui nessa newsletter, a cultura de gastar tokens com propósito, a engenharia de contexto, a governança de dados, é o que a gente tá construindo no AIOX. E o Cohort AIOX Fundamentals é onde a pessoa começa.
4 semanas. Aulas às terças e quintas. Sessões de pronto-socorro às segundas e sextas para destravar quando trava. Porque trava. E tá tudo bem travar.
A Karla não sabia abrir um terminal. Passou pelo Fundamentals. Fechou um cliente de 8 mil reais.
Ela não é um caso isolado. 284 pessoas em 7 países já passaram por lá. Gente que nunca escreveu uma linha de código. Gente que achava que IA era coisa de programador.
Turma 4 começa segunda (20 de abril).
Alan Nicolas ♾️
CEO, Academia Lendár[IA]
📚️ Livros Recomendados:
Darwinismo Digital - Tom Goodwin: As empresas que mais faturam com tecnologia não criam tecnologia. Criam a camada de contexto em cima dela.
Negócios Conscientes - Fred Kofman: Kofman foi VP de liderança no Google e no LinkedIn. Ele viu por dentro o que acontece quando cultura vira infraestrutura e quando cultura é só discurso.
Novacene - James Lovelock: Lovelock tinha 100 anos quando escreveu este livro. Criou a hipótese Gaia. Aqui ele argumenta que a Terra está entrando numa era onde inteligência não-biológica se torna dominante, e que isso não é ameaça.
💻 Vídeo Recomendado
Assista a minha ultima live:
Descubra como sobreviver e prosperar na Era da IA ♾️
Escrita por: Alan Nicolas utilizando Obsidian potencializado com IA
Mantenha-se atualizado: Últimas tendências e desenvolvimentos em IA
📲 Redes Sociais
Para mais conteúdos lendários sobre Inteligência Artificial e Business, aproveite para me seguir nas redes sociais: