O recurso de geração de imagem do ChatGPT recebe uma atualização

Durante uma transmissão ao vivo na terça -feira, o CEO da Openai, Sam Altman, anunciou a primeira grande atualização para Chatgpt’s recursos de geração de imagens em mais de um ano.

ChatGPT agora pode alavancar a empresa GPT-4O Modelo para criar e modificar imagens e fotos nativamente. O GPT-4O há muito sustentou a plataforma de chatbot de IA, mas até agora, o modelo só conseguiu gerar e editar texto-não imagens.

Altman disse que a geração de imagens nativas do GPT-4O está ao vivo hoje em ChatGPT e SORA, o produto de geração de vídeo da AI da OpenAI, para assinantes do plano Pro de US $ 200 por mês da empresa. O Openai diz que o recurso está lançado em breve para usuários mais e gratuitos do ChatGPT, bem como para os desenvolvedores que usam o serviço API da empresa.

GPT-4O com saída de imagem “pensa” um pouco mais do que o modelo de geração de imagens que ele substitui efetivamente, Dall-e 3para tornar o que o OpenAI descreve como imagens mais precisas e detalhadas. O GPT-4O pode editar imagens existentes, incluindo imagens com pessoas nelas-transformando-as ou “pintar detalhes”, como primeiro plano e objetos de fundo.

O OpenAI não revelou quais dados de imagem usavam para ativar os novos recursos de geração de imagens. Muitos fornecedores de IA generativos veem os dados de treinamento como uma vantagem competitiva e, portanto, mantenham -os e qualquer informação relacionada a eles perto do baú. Mas os detalhes dos dados de treinamento também são uma fonte potencial de ações relacionadas a IP, outro desincentivo para as empresas revelarem muito.

O OpenAI oferece um formulário de exclusão que permite aos criadores solicitar que seus trabalhos sejam removidos de seus conjuntos de dados de treinamento. A empresa também diz que respeita os pedidos para proibir seus bots de arranhar na Web de coletar dados de treinamento, incluindo imagens, de sites.

O recurso de geração de imagem atualizado do ChatGPT segue após a saída de imagem nativa experimental do Google para o Gemini 2.0 Flash, um dos principais modelos da empresa. A característica poderosa se tornou viral nas mídias sociais – mas não necessariamente pelas melhores razões. O componente de imagem de Gemini 2.0 Flash acabou por ter poucos corrimãospermitindo que as pessoas removam marcas d’água e criem imagens que representam personagens protegidos por direitos autorais.

O recurso de geração de imagem do ChatGPT recebe uma atualização

Comments

Deixe um comentário Cancelar resposta