A Anthropic lançou uma nova versão de seu modelo Sonnet de médio porte, acompanhando o ciclo de atualização de quatro meses da empresa. Em uma postagem anunciando o novo modeloa Anthropic enfatizou melhorias na codificação, no seguimento de instruções e no uso do computador.
O Sonnet 4.6 será o modelo padrão para usuários dos planos Gratuito e Pro.
A versão beta do Sonnet 4.6 incluirá uma janela de contexto de 1 milhão de tokens, o dobro do tamanho da maior janela anteriormente disponível para o Sonnet. A Anthropic descreveu a nova janela de contexto como “suficiente para armazenar bases de código inteiras, contratos longos ou dezenas de artigos de pesquisa em uma única solicitação”.
O lançamento ocorre apenas duas semanas depois o lançamento do Opus 4.6com um modelo Haiku atualizado que provavelmente será lançado nas próximas semanas.
O lançamento vem com um novo conjunto de pontuações recordes de benchmark, incluindo OS World para uso de computador e SWE-Bench para engenharia de software. Mas talvez o mais impressionante seja a sua pontuação de 60,4% no ARC-AGI-2, destinado a medir competências específicas da inteligência humana. A pontuação coloca o Sonnet 4.6 acima da maioria dos modelos comparáveis, embora ainda fique atrás de modelos como Opus 4.6, Gemini 3 Deep Think e uma versão refinada do GPT 5.2.

