OpenAI revela seu primeiro chip personalizado, construído pela Broadcom

Na quarta-feira, a OpenAI revelou seu primeiro processador de inferência personalizado, projetado e fabricado em colaboração com a Broadcom. Chamado Jalapeño, o novo processador foi projetado especificamente para as necessidades exclusivas dos sistemas de inferência da OpenAI. Os próprios modelos de IA da OpenAI ajudaram no desenvolvimento do chip, disse a empresa.

Embora o chip ainda esteja sendo testado, a OpenAI afirma que os primeiros resultados mostram um desempenho por watt significativamente melhor do que as alternativas atuais de última geração.

A parceria foi anunciado oficialmente em outubromas os planos de chips da OpenAI têm há muito tempo há rumores como forma de reduzir a dependência da empresa das GPUs da Nvidia. Google e Amazônia ambos construíram chips personalizados para atender a um propósito semelhante, geralmente chamados de “aceleradores de IA” – silício projetado especificamente para acelerar cargas de trabalho de aprendizado de máquina.

O presidente da OpenAI, Greg Brockman, explicou a abordagem da empresa para o desenvolvimento de chips em seu podcast internologo após o anúncio da parceria Broadcom.

“Temos uma compreensão profunda da carga de trabalho”, disse Brockman no episódio. “Estamos realmente procurando por cargas de trabalho específicas que não são atendidas e (e nos perguntando) como podemos construir algo que seja capaz de acelerar o que é possível?”

O Jalapeño foi projetado especificamente para inferência, o processo de execução de modelos de IA pré-construídos em resposta a comandos do usuário. No anúncio, a OpenAI enfatizou o baixo custo operacional do chip ao executar modelos de codificação em tempo real. É provável que tarefas mais intensivas em desempenho, como o pré-treinamento, ainda dependam do hardware Nvidia, mas mesmo pequenas reduções nos custos de inferência podem ajudar muito a melhorar os resultados financeiros da empresa.

A otimização desse sistema de inferência pode revelar-se um fator crucial no futuro da economia da IA ​​— e é provável que ocorra em todos os níveis da pilha. A OpenAI já está construindo produtos de agência como o Codex e os modelos que os alimentam, bem como data centers para executar esses modelos. A mudança para chips específicos permite que a empresa vá ainda mais longe nesse processo, conforme explicou a empresa em seu anúncio.

“A OpenAI não está apenas desenvolvendo modelos de fronteira ou construindo produtos sobre eles; ela está projetando a infraestrutura subjacente a eles: arquitetura de chips, kernels, sistemas de memória, rede, agendamento, sistemas de implantação e experiência de produto”, escreveu a empresa. “Como o OpenAI opera em toda a pilha, cada camada pode ser otimizada em torno do mesmo objetivo: tornar seus modelos mais rápidos, mais confiáveis ​​e mais acessíveis para os usuários.”

Quando você compra por meio de links em nossos artigos, podemos ganhar uma pequena comissão. Isso não afeta nossa independência editorial.

Comments

No comments yet. Why don’t you start the discussion?

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *