Google’s Modelo de IA mais caro Parece ter atravessado um marco importante: vencer um videogame de 29 anos.
Ontem à noite, CEO do Google, Sundar Pichai Postado triunfantemente em x“Que acabamento! Gemini 2.5 Pro acabou de completar o Pokémon Blue!”
Para ficar claro, o Gêmeos interpreta Pokemon Livestream foi criado por (em suas próprias palavras) “um engenheiro de software de 30 anos não afiliado ao Google”, que passa Joel Z.. Mas os executivos do Google têm aplaudido o esforço.
Por exemplo, Logan Kilpatrick, o líder do produto para o Google AI Studio, Postado no mês passado O fato de Gemini estar “fazendo um grande progresso ao completar os Pokémon” e “ganhou seu 5º emblema (o próximo melhor modelo tem apenas 3 até agora, embora com um arnês de agente diferente)”, levando Pichai a piada“Estamos trabalhando na API, inteligência artificial de Pokémon :)” ”
Por que Pokémon? De fevereiro, Progresso Antrópico destacou O fato de seus modelos de IA Claude estavam fazendo em “Pokémon Red”, escrevendo que o “Treinamento de pensamento e agente” de Claude oferece “um grande impulso” em tarefas “mais inesperadas”, como jogar um jogo clássico. (“Pokémon Red” e “Blue” são versões diferentes de Um título de Gameboy lançado pela primeira vez em 1996 e vinculado à franquia Pokémon de longa data). Existe até Um Claude toca canal Pokemon Twitch que Joel Z citou como uma inspiração.
Apesar de seu progresso, Claude ainda não parece ter derrotado “Pokémon Red”. Isso significa que Gemini é objetivamente melhor no jogo? Em sua página Twitch, Joel Z pediu aos espectadores: “Por favor, não considere isso uma referência para o quão bem um LLM pode jogar Pokemon. Você não pode realmente fazer comparações diretas – Gêmeos e Claude têm ferramentas diferentes e receber informações diferentes.”
E ambos os modelos de IA precisam de ajuda para jogar o jogo – é onde o agente mencionado mencionado aproveita Entre, fornecendo aos modelos que as capturas de tela de jogos sobrepostas com informações adicionais, permitindo que o modelo decida como responder (que pode envolver chamadas de agentes especializados) e pressionando o botão que corresponde às instruções da IA.
Evento do TechCrunch
Berkeley, CA.
|
5 de junho
Joel Z reconheceu que havia outras “intervenções de desenvolvimento” para ajudar Gemini a concluir o jogo, mas insistiu que não está trapaceando.
“Minhas intervenções melhoram as habilidades gerais de tomada de decisão e raciocínio de Gêmeos”, diz ele. “Eu não dou dicas específicas – não há explosões ou instruções diretas para desafios específicos como o Monte.
Além disso, ele disse: “Gêmeos interpreta Pokémon ainda está sendo desenvolvido ativamente, e a estrutura continua a evoluir”.