🎯 A família 4.x
Três tamanhos, cada um com trade-off claro entre capacidade, velocidade e custo: Opus, Sonnet, Haiku.
Capacidade Velocidade Custo
Opus ★★★★★ ★★ $$$
Sonnet ★★★★ ★★★★ $$
Haiku ★★★ ★★★★★ $
🦅 Opus — o pesado
Modelo mais capaz da família. Melhor em raciocínio multi-passo, análise complexa, código sofisticado. Pago em tempo extra e cota mais limitada.
🎯 Quando vale
- • Investigação de bug crítico cross-system
- • Decisão técnica com muitas variáveis
- • Escrita longa que precisa de coerência
- • Código sofisticado (arquitetura, refator delicado)
🎵 Sonnet — o padrão
Default sensato. 80% dos casos terminam bem em Sonnet. Sobe pra Opus só se Sonnet falhou.
⚡ Haiku — o ágil
Modelo menor, muito rápido, barato. Ótimo para tarefas simples em volume: classificação, extração, resumo curto, autocomplete.
🎯 Casos típicos
- • Classificar tickets em categorias predefinidas
- • Extrair campos de texto não estruturado
- • Resumir email em 1 frase
- • Verificações simples de conteúdo
- • Autocomplete contextual
🔄 Trocar de modelo no chat
Seletor no topo do chat permite trocar a qualquer momento. Mensagens anteriores ficam preservadas. Híbrido economiza cota.
💡 Estratégia híbrida
Começa com Sonnet. Se a tarefa virou difícil ("o modelo não está pegando"), troca pra Opus pra última mensagem. Volta pra Sonnet quando a fricção passou. Economiza cota de Opus pros momentos onde Opus faz diferença.
📊 Cotas e limites
Pro tem cotas separadas para Opus (mais limitadas) e Sonnet (mais generosas). Max amplia ambas. Importante saber qual cota travou.
Rolling window
Cota é janela rolante (ex: últimas X horas). Quando bate, espera um pouco e libera novamente.
Mensagem de limite
"You've hit the limit for [Model]". Mostra o modelo que travou. Outros modelos podem continuar funcionando.
Workaround
Bateu Opus? troca pra Sonnet temporariamente. Bateu tudo? hora de Max ou de pausa.
✅ Resumo do Módulo
Próximo módulo:
2.6 — Extended Thinking, Search, Research