Todo modelo de IA que presta um dia vira lenda. Aparece, encanta, e some. Ou fica tão caro que chamar ele de volta custa a bagatela de um rim. Ou a alma do seu ente querido.

Já foi assim com vários. Está sendo de novo agora, com um que faz uma coisa que eu não tinha conseguido com nenhum outro modelo. Tem até nome de fábula: Fable. E fábula é isso, coisa do imaginário que aparece e evapora.

Enquanto um gênio desses está à solta, a maioria gasta a janela fazendo joguinho e app de fim de semana. É sempre o erro mais caro.

Porque tem uma pergunta que quase ninguém para pra fazer: o que você faz com um gênio que você já sabe que não vai ficar?

Por que ele some, e vai sumir de novo

O Fable não evaporou por acaso. O governo americano tirou ele do ar no mês passado. E a leitura que sobra pra mim é irônica: quem mais acendeu o alarme foi a própria Anthropic, batendo na tecla de que o modelo era perigoso demais, que ia hackear tudo.

O governo levou a sério. Acharam uma falha de prompt injection, dessas que todo modelo tem, e travaram. O marketing de medo da casa acabou virando trava contra a casa.

E não é só ele. O modelo novo da OpenAI, o 5.6, passou pelo mesmo filtro: saiu liberado só pra clientes que o governo aprovar.

Não trato isso como acidente isolado. Modelo de ponta virou questão de governo, de segurança, de disputa. Aparece, assusta alguém, some. E a minha aposta é que vai acontecer de novo, cada vez mais.

Ele não é melhor. Ele é de outra categoria

Passei três dias testando ele quando abriu antes. E voltei a testar agora, quase sem dormir.

O que ele tem não é "mais qualidade". É outro tipo de cabeça.

Os outros modelos são ótimos executores. Você pede uma tela, eles fazem a tela. Pede um código, sai o código.

Dá pra ver isso até numa bobagem. Pedi pro Fable e pros outros modelos a mesma animação de carros colidindo. O Fable calculou a massa do tanque, o ângulo da queda, as galinhas voando com sombra e splash na água.

O Opus botou os carros andando de ré, entrando um dentro do outro. Não é sobre o carrinho. É que um entende como o mundo se comporta e o outro não.

Botei ele até dentro do Claude Design, que fica visualizando o que cria, e a diferença de acabamento saltava na tela.

E não para no código. Joguei pra ele uma carta de vendas e uma sequência de e-mail pra analisar, e ele achou o furo de argumento que os outros modelos não veem. Ele simula a objeção que nasce na cabeça de quem lê e já mostra onde a prova entra pra derrubar ela.

Ele lê a peça pensando no efeito de cada frase no curto e no longo prazo, e não como um corretor que ajeita vírgula. É o tipo de uso que a maioria nem pensou em dar pra ele nesses poucos dias de janela aberta.

E essa mesma compreensão vale pro seu código. O Fable enxerga o sistema inteiro. Como as peças se conectam, onde uma decisão de hoje vira um gargalo daqui a duas mil linhas.

Apertar o parafuso qualquer Zé Ruela faz. Saber qual parafuso apertar, e com que força, pra máquina não quebrar depois de rodar um tempo, não é qualquer um.

Por isso você não prompta ele igual aos outros.

Com os outros, você escreve tudo miudinho. Você é o cérebro, ele é a mão.

Com o Fable, quanto mais você amarra, pior fica. Ele precisa de espaço.

Pensa na diferença entre falar com um estagiário e falar com um especialista. Pro estagiário, você diz exatamente o que fazer, passo a passo. Pro especialista, você aponta o problema e sai da frente.

Você não chega no médico e explica pra ele como fazer o procedimento em você.

Então a regra vira quase o contrário do que você aprendeu. Não escreva o prompt perfeito. Aponte uma dor.

"Meu sistema tá lento e eu quero que fique rápido." "Meu código foi escrito por modelos piores e eu quero que você melhore sem quebrar nada." "Meu site tá sem graça e eu queria animações que impressionem."

Você aponta o problema. Ele descobre o como. Uma dor bem apontada rende mais que um prompt de trinta linhas escritas no capricho.

O erro caro é usar o gênio pra apertar parafuso

Só que saber conversar com ele não é o difícil. O difícil é decidir no que gastar ele. E é aqui que quase todo mundo queima a janela.

O Fable é caríssimo. Eu deixei o uso de créditos ligado por descuido e ele torrou R$ 400 fazendo pouca coisa. Um amigo gastou R$ 110 em 10 minutos.

E ele só está liberado até o dia 7, com metade do seu limite semanal. A janela é curta e cara.

Então usar esse gênio pra escrever código simples é como pagar um cirurgião pra chutar bola. Ele chuta. Mas você está usando a coisa errada pra tarefa errada.

A jogada é separar por camada. Cada modelo faz o que ele é.

O modelo genial decide a arquitetura. O modelo barato aperta o parafuso. E um orquestrador no meio segura as pontas.

Foi o que montei aqui. O Codex orquestra. O Fable arquiteta e revisa a estrutura. O Composer, que é absurdamente rápido, escreve o código.

Toda vez que aparece uma decisão difícil, o orquestrador chama o Fable. Na hora de executar, chama o barato. Rodei durante horas assim e gastei 11% da minha cota mensal.

E isso já saiu do improviso. Como dividir tarefa entre o modelo caro e o barato sem perder qualidade virou objeto de estudo acadêmico. Na prática é o que eu vejo aqui: mandar pro barato o que ele dá conta corta o grosso do custo e quase não mexe no resultado.

E no meu próprio uso é a mesma coisa: rotear pro barato falha justamente no raciocínio profundo. Ou seja, o parafuso vai pro barato. A arquitetura fica com o gênio. A diferença é que agora o custo disso dá pra medir.

E não é que os modelos abertos sejam ruins. Muito pelo contrário. Um GLM, um Deepseek, os chineses, ficaram bons de verdade, e pra tarefa comum já resolvem barato. O parafuso eles apertam bem.

Mas o modelo que faz a diferença de abstração, esse é o que some ou fica caro. E vai continuar caro enquanto a infraestrutura ainda estiver sendo construída. Talvez alivie quando os datacenters estiverem 100% prontos. Talvez. Por enquanto, o que é bom de verdade cobra caro pra rodar.

Tem um motivo prático pra não deixar o gênio como orquestrador também. A API da Anthropic cai bastante. Se você deixa ele rodando sozinho por horas, uma queda trava tudo. O orquestrador precisa ser o modelo confiável, não o mais inteligente.

E antes de largar ele pra rodar, três cuidados que vão te salvar dinheiro.

Não deixe a opção de usar crédito ou API marcada. Foi assim que os quatrocentos reais evaporaram enquanto eu dormia.

Não rode ele no máximo nem no ultra. O ponto certo é o esforço alto. No máximo ele fica caro à toa, no ultra ele dispara workflow e torra token numa velocidade absurda.

E não use o loop pra reativar. Cada vez que reativa, ele relê a conversa inteira de novo e cobra por tudo outra vez.

O que o gênio precisa deixar antes de sumir

Agora você usa ele barato e no lugar certo. Mas tem uma pergunta que vale mais que qualquer dica de custo: o que ele deixa pra trás quando for embora?

Porque se ele vai embora dia 7, produzir com ele é o pior uso possível. O que fica depois é lixo se não for pensado.

O melhor uso é fazer o gênio deixar rastro no seu sistema. Duas coisas, na ordem.

Primeira: afiar o harness. As skills, o arquivo de regras, o CLAUDE.md, tudo que fica em volta do modelo conduzindo ele.

E isso escala. O mesmo pedido que enxugou aquele projeto serve pro sistema inteiro. O gênio lê a estrutura toda e conduz a mudança, em vez de você reescrever no braço.

Peguei um projeto do meu time que carregava 90.000 tokens só pra iniciar. Pedi pro Fable otimizar sem perder nenhuma função. Caiu pra 37.000. Mesma capacidade, um terço do peso.

Não peça pro gênio otimizar as skills pra ele mesmo usar. Peça pra ele otimizar pros modelos que vão ficar.

Uma skill escrita por um modelo pior é uma skill limitada por quem a escreveu. Então eu uso o Fable pra reescrever as skills do Codex, do Composer, do meu sistema inteiro.

Ele lê o manual de cada um, entende as falhas de cada ferramenta, e adapta. Depois o gênio some e o rastro fica melhor do que era.

E cuidado pra não entender ao contrário. Afiar o harness é enxugar, não empilhar. Quanto melhor o modelo, menos regra ele aguenta em cima.

Cheguei a deletar skills e regras de um projeto e ele ficou melhor. Modelo forte quer liberdade, do mesmo jeito que você não contrata o Steve Jobs pra ficar dando ordem de como fazer marketing.

Então são dois usos, e nenhum é acumular: o gênio CONSTRÓI o harness que os modelos baratos vão herdar, e ENXUGA o que trava o próprio gênio. Afiar dos dois lados.

Um artigo sobre engenharia de harness argumenta uma coisa que bate com o que eu vejo na prática: o mesmo modelo rende de formas muito diferentes dependendo do que você construiu em volta, a ponto da diferença do harness pesar mais que a diferença entre os próprios modelos.

Um harness bom com modelo médio bate um harness ruim com modelo de ponta.

A outra, e pra mim a mais valiosa: destilar como você decide.

Eu tenho mais de duzentas heurísticas catalogadas. Não são frases bonitas. É como eu tomo decisão. "Código acima de LLM: o que é determinístico vira código, o que é probabilístico vira modelo." "Conserto mecânico antes de endurecer o sistema."

Toda vez que eu preciso explicar muito uma coisa pra IA, é sinal de que falta uma forma dela decidir sozinha. Então eu extraio isso das minhas conversas gravadas e viro regra.

O que o Fable fez foi ler todas elas e criar as meta-heurísticas. Heurística sobre heurística. Ele entendeu como as minhas decisões se conectam entre si, achou os padrões que eu nem via, e organizou tudo isso num formato que os modelos baratos conseguem seguir sozinhos depois.

Isso tem nome: destilação. Um modelo grande transfere pro pequeno não só as respostas, mas os padrões por trás delas, e um modelo bem menor consegue guardar quase todo o desempenho do grande. O gênio vai embora e deixa o jeito de pensar instalado no barato que fica.

Uma dessas regras, pra você ver o nível: se um módulo pode falhar, o sistema tem que ter o próximo modelo pronto atrás, e um terceiro atrás desse. Nunca um erro seco na cara do usuário. Isso não é código, é uma decisão minha virada em instrução que qualquer modelo agora executa sozinho.

E se você está achando que isso não é pra você porque não tem duzentas regras catalogadas, para. Ninguém começou com duzentas.

Você já toma dezenas de decisões por semana que hoje moram só na sua cabeça. O jeito que você corrige a IA, o que você aceita, o que rejeita. Isso já é a matéria-prima. Abre as suas últimas conversas com o modelo e manda ele extrair o seu padrão de lá.

O gênio não precisa que o sistema exista antes. Ele pega as poucas decisões que você já repete e monta o esqueleto do resto. Dá pra começar agora, com ele ainda aqui.

Se qualquer pessoa aleatória digita a mesma coisa que você e a máquina cria igual, cadê o seu valor? Ele é ilusório.

O que sobra de seu é o seu padrão de decidir. A ferramenta é a mesma pra todo mundo no mesmo dia. O critério, não.

Fecho com uma dica que economiza dinheiro de verdade: não use esses modelos por API, use por assinatura. A assinatura ainda é subsidiada. Você paga um valor e recebe um uso que, na conta da API, valeria muito mais. Foi por esquecer isso uma vez que o gênio me mordeu de madrugada.

O Fable é a fábula. Aparece, some, volta caro. Mas se você usar a janela certa, ele deixa a parte que fica: um sistema afiado e o seu jeito de pensar, gravado, rodando no modelo que você vai continuar pagando barato.

Não use ele pra criar. Use ele pra deixar rastro.

E esse princípio, tirar o que só existe na sua cabeça e virar sistema que roda sem você, não vale só pro código.

Vale pra parte que mais depende de gente boa e mais racha quando ela sai: a sua operação de vendas.

De 13 a 16 de julho, às 14h, rola a Semana Comercial com Claude Code. Quatro lives ao vivo, de graça, uma por dia, cada uma com alguém que vive daquilo: Fran no diagnóstico comercial, Bruno no CRM e no pipeline, Adavio na cadência, Marcondes na proposta e no fechamento.

Quatro dias pra tirar a operação comercial da sua cabeça e virar processo.

Alan Nicolas ♾️
CEO, Academia Lendár[IA]

P.S. Quando o Fable sumir dia 7, a pergunta que vai sobrar não é qual modelo você tinha na mão. É o que você soube pedir pra ele enquanto dava. O resto o tempo apaga.

Aqui está os prompts para utilizar junto com o fable, prometidos na live. [Clique aqui para pegar eles]

📚 Livros Recomendados:

  • Atmamun — Kapil Gupta: Gupta tem uma tese que incomoda: o que realmente importa em você não pode ser ensinado, empacotado nem vendido, porque nasce da prática silenciosa e não da informação. É a definição mais afiada de conhecimento tácito que existe. Leia e você entende por que a máquina copia tudo que dá pra escrever num prompt, e por que a única coisa que ela nunca alcança é o critério que você destilou apanhando.

  • O Código Da Criatividade — Marcus du Sautoy: Du Sautoy é matemático e passou o livro tentando descobrir o que a máquina consegue gerar sozinha e o que ela só imita. A resposta desmonta o pânico do momento: o modelo produz variação infinita e barata, mas quem decide o que presta continua sendo o seu gosto treinado. Depois deste livro você para de perguntar "o que a IA cria" e começa a perguntar de quem é o critério que separa o lixo do valioso.

  • Novaceno — James Lovelock: Lovelock escreveu isto aos cem anos pra cravar uma ideia que assusta e liberta: vem aí uma era em que máquinas pensam mais rápido que nós, e o papel que sobra pro humano não é competir, é ser quem semeia o critério de onde tudo parte. É a versão cósmica da tese desta edição. O modelo executa numa velocidade que você nunca vai ter, e mesmo assim quem decide o que importa continua sendo você.

💻 Vídeo Recomendado

Assista a minha ultima live:

🗞 Sobre a Newsletter:

  • Descubra como sobreviver e prosperar na Era da IA ♾️

  • Escrita por: Alan Nicolas utilizando Obsidian potencializado com IA

  • Mantenha-se atualizado: Últimas tendências e desenvolvimentos em IA

📲 Redes Sociais

Para mais conteúdos lendários sobre Inteligência Artificial e Business, aproveite para me seguir nas redes sociais:

Como você avalia a edição de hoje?

Login or Subscribe to participate

Continue lendo