Módulo 2.5 — Opus/Sonnet/Haiku

🎯 A família 4.x

Três tamanhos, cada um com trade-off claro entre capacidade, velocidade e custo: Opus, Sonnet, Haiku.

            Capacidade    Velocidade    Custo
Opus           ★★★★★         ★★          $$$
Sonnet         ★★★★          ★★★★         $$
Haiku          ★★★           ★★★★★        $

🦅 Opus — o pesado

Modelo mais capaz da família. Melhor em raciocínio multi-passo, análise complexa, código sofisticado. Pago em tempo extra e cota mais limitada.

🎯 Quando vale

• Investigação de bug crítico cross-system
• Decisão técnica com muitas variáveis
• Escrita longa que precisa de coerência
• Código sofisticado (arquitetura, refator delicado)

🎵 Sonnet — o padrão

Default sensato. 80% dos casos terminam bem em Sonnet. Sobe pra Opus só se Sonnet falhou.

Default

Primeira escolha

80% casos

Resolve sem fricção

Rápido

Latência baixa

Custo justo

Sustenta uso diário

⚡ Haiku — o ágil

Modelo menor, muito rápido, barato. Ótimo para tarefas simples em volume: classificação, extração, resumo curto, autocomplete.

🎯 Casos típicos

• Classificar tickets em categorias predefinidas
• Extrair campos de texto não estruturado
• Resumir email em 1 frase
• Verificações simples de conteúdo
• Autocomplete contextual

🔄 Trocar de modelo no chat

Seletor no topo do chat permite trocar a qualquer momento. Mensagens anteriores ficam preservadas. Híbrido economiza cota.

💡 Estratégia híbrida

Começa com Sonnet. Se a tarefa virou difícil ("o modelo não está pegando"), troca pra Opus pra última mensagem. Volta pra Sonnet quando a fricção passou. Economiza cota de Opus pros momentos onde Opus faz diferença.

📊 Cotas e limites

Pro tem cotas separadas para Opus (mais limitadas) e Sonnet (mais generosas). Max amplia ambas. Importante saber qual cota travou.

Rolling window

Cota é janela rolante (ex: últimas X horas). Quando bate, espera um pouco e libera novamente.

Mensagem de limite

"You've hit the limit for [Model]". Mostra o modelo que travou. Outros modelos podem continuar funcionando.

Workaround

Bateu Opus? troca pra Sonnet temporariamente. Bateu tudo? hora de Max ou de pausa.

✅ Resumo do Módulo

✓

Opus = raciocínio profundo, lento, cota apertada

✓

Sonnet = default, 80% dos casos

✓

Haiku = volume, baixa latência

✓

Troca no chat sem perder contexto

✓

Híbrido Sonnet+Opus economiza cota

✓

Cotas separadas por modelo — rolling window

Próximo módulo:

2.6 — Extended Thinking, Search, Research

← Anterior Próximo →