Openai tem publicou um post -mortem no Questões recentes de bajulação com o modelo de IA padrão alimentando chatgpt, GPT-4O – Questões que forçaram a empresa a reverter uma atualização do modelo divulgado na semana passada.
No fim de semana, após a atualização do modelo GPT-4O, os usuários nas mídias sociais observaram que o ChatGPT começou a responder de uma maneira excessivamente validada e agradável. Rapidamente se tornou um meme. Os usuários postaram capturas de tela de chatgpt aplaudindo todos os tipos de problemas, perigoso decisões e idéias.
Em um post no X no domingo, o CEO Sam Altman reconhecido o problema e disse que o OpenAI funcionaria em correções “o mais rápido possível”. Dois dias depois, Altman anunciado A atualização do GPT-4O estava sendo revertida e que o OpenAI estava trabalhando em “correções adicionais” para a personalidade do modelo.
De acordo com o Openaia atualização, destinada a tornar a personalidade padrão do modelo “parecer mais intuitiva e eficaz”, foi informada demais por “feedback de curto prazo” e “não explicou completamente como as interações dos usuários com o ChatGPT evoluem ao longo do tempo”.
“Como resultado, o GPT -4O distorceu as respostas que eram excessivamente favoráveis, mas falsas”, escreveu o OpenAi em um post no blog. “As interações banhadas podem ser desconfortáveis, perturbadoras e causar angústia. Ficamos aquém e estamos trabalhando para acertar.”
O Openai diz que está implementando várias correções, incluindo refinar suas técnicas principais de treinamento de modelo e instruções do sistema para afastar explicitamente o GPT-4O da bajulação. A empresa também está construindo mais corrimãos de segurança para “aumentar a honestidade e a transparência do modelo”, diz o documento.
O Openai também diz que está explorando maneiras de permitir que os usuários dêem “feedback em tempo real” para “influenciar diretamente suas interações” com o ChatGPT e escolher entre várias “personalidades” do ChatGPT.
“(W) explorando novas maneiras de incorporar feedback mais amplo e democrático aos comportamentos padrão do ChatGPT”, escreveu a empresa em sua postagem no blog. “Também acreditamos que os usuários devem ter mais controle sobre como o ChatGPT se comporta e, na medida em que é seguro e viável, faça ajustes se não concordarem com o comportamento padrão”.