Na terça -feira, o Google lançou Gemini 2.5, uma nova família de modelos de raciocínio de IA que faz uma pausa para “pensar” antes de responder a uma pergunta.
Para iniciar a nova família de modelos, o Google está lançando a Gemini 2.5 Pro Experimental, um modelo de IA multimodal e raciocínio que a empresa afirma ser o seu modelo mais inteligente até agora. Este modelo estará disponível na terça-feira na plataforma de desenvolvedores da empresa, o Google AI Studio, bem como no aplicativo Gemini para assinantes do plano de IA de US $ 20 por mês, de US $ 20 por mês, Gemini Advanced.
Avançando, o Google diz que todos os seus novos modelos de IA terão recursos de raciocínio assados.
Desde que o Openai lançou o Primeiro modelo de raciocínio da IA em setembro de 2024O1, a indústria de tecnologia correu para combinar ou exceder os recursos desse modelo com os seus. Hoje, antropia, Deepseek, Google e Xai têm modelos de raciocínio de IA, que usam poder de computação extra e tempo para verificar e raciocinar os problemas antes de fornecer uma resposta.
As técnicas de raciocínio ajudaram os modelos de IA a alcançar novas alturas nas tarefas de matemática e codificação. Muitos no mundo da tecnologia acreditam que os modelos de raciocínio serão um componente essencial de agentes de IA, sistemas autônomos que podem executar tarefas em grande parte intervenção humana. No entanto, esses modelos também são mais caros.
O Google afirma que a Gemini 2.5 Pro supera seus modelos de IA de fronteira anterior e alguns dos principais modelos de IA concorrentes, em vários benchmarks. Especificamente, o Google diz que projetou o Gemini 2.5 para se destacar na criação de aplicativos da Web visualmente atraentes e aplicativos de codificação de agitação.
Em uma avaliação de edição de código de medição, chamada AIDER POLYGLOT, o Google diz que Gemini 2.5 Pro pontuações 68,6%, superando os principais modelos de IA do OpenAI, antropal e Deepseek.
No entanto, em outro teste, medindo as habilidades de codificação agêntica, o SWE-banch verificou, Gemini 2.5 Pro pontuações 63,8%, superando o O3-mini do OpenAI e o R1 do Deepseek, mas o Soneto Claude de 3,7 3,7 do Antropic, que obteve 70,3%.
No último exame da humanidade – um teste multimodal, incluindo milhares de perguntas de crowdsourcing em torno de matemática, humanidades e ciências naturais -, o Google diz que Gemini 2.5 Pro pontuações 18,8%, superando os principais modelos de IA do OpenAI, antropia e de profundidade.
Para começar, o Google diz que a Gemini 2.5 Pro está enviando uma janela de contexto de 1 milhão de token, o que significa que o modelo de IA pode ingressar cerca de 750.000 palavras em um único prompt. Isso é mais longo do que todo o Senhor dos Anéis. No entanto, o Google diz que uma janela de contexto de 2 milhões de token está chegando em breve.
O Google já experimentou os modelos de raciocínio de IA – lançando anteriormente uma versão “pensante” de Gemini em dezembro – mas a Gemini 2.5 representa o concorrente mais sério da empresa para a Série de Modelos Open O Open O.
O Google não compartilhou preços de API para Gemini 2.5 Pro.