MÓDULO 2.5

🧠 Opus / Sonnet / Haiku

A família de modelos da Anthropic. Diferenças de capacidade, velocidade, custo. Quando usar cada um — e como trocar no chat.

6
Tópicos
35
Minutos
Inter.
Nível
Decisão
Tipo
1

🎯 A família 4.x

Três tamanhos, cada um com trade-off claro entre capacidade, velocidade e custo: Opus, Sonnet, Haiku.

            Capacidade    Velocidade    Custo
Opus           ★★★★★         ★★          $$$
Sonnet         ★★★★          ★★★★         $$
Haiku          ★★★           ★★★★★        $
2

🦅 Opus — o pesado

Modelo mais capaz da família. Melhor em raciocínio multi-passo, análise complexa, código sofisticado. Pago em tempo extra e cota mais limitada.

🎯 Quando vale

  • • Investigação de bug crítico cross-system
  • • Decisão técnica com muitas variáveis
  • • Escrita longa que precisa de coerência
  • • Código sofisticado (arquitetura, refator delicado)
3

🎵 Sonnet — o padrão

Default sensato. 80% dos casos terminam bem em Sonnet. Sobe pra Opus só se Sonnet falhou.

Default
Primeira escolha
80% casos
Resolve sem fricção
Rápido
Latência baixa
Custo justo
Sustenta uso diário
4

⚡ Haiku — o ágil

Modelo menor, muito rápido, barato. Ótimo para tarefas simples em volume: classificação, extração, resumo curto, autocomplete.

🎯 Casos típicos

  • • Classificar tickets em categorias predefinidas
  • • Extrair campos de texto não estruturado
  • • Resumir email em 1 frase
  • • Verificações simples de conteúdo
  • • Autocomplete contextual
5

🔄 Trocar de modelo no chat

Seletor no topo do chat permite trocar a qualquer momento. Mensagens anteriores ficam preservadas. Híbrido economiza cota.

💡 Estratégia híbrida

Começa com Sonnet. Se a tarefa virou difícil ("o modelo não está pegando"), troca pra Opus pra última mensagem. Volta pra Sonnet quando a fricção passou. Economiza cota de Opus pros momentos onde Opus faz diferença.

6

📊 Cotas e limites

Pro tem cotas separadas para Opus (mais limitadas) e Sonnet (mais generosas). Max amplia ambas. Importante saber qual cota travou.

1

Rolling window

Cota é janela rolante (ex: últimas X horas). Quando bate, espera um pouco e libera novamente.

2

Mensagem de limite

"You've hit the limit for [Model]". Mostra o modelo que travou. Outros modelos podem continuar funcionando.

3

Workaround

Bateu Opus? troca pra Sonnet temporariamente. Bateu tudo? hora de Max ou de pausa.

Resumo do Módulo

Opus = raciocínio profundo, lento, cota apertada
Sonnet = default, 80% dos casos
Haiku = volume, baixa latência
Troca no chat sem perder contexto
Híbrido Sonnet+Opus economiza cota
Cotas separadas por modelo — rolling window

Próximo módulo:

2.6 — Extended Thinking, Search, Research