A JetBrains, a empresa por trás de uma variedade de ferramentas populares de desenvolvimento de aplicativos, lançou seu primeiro modelo de IA “aberto” para codificar.
Na quarta -feira, Jetbrains feitos MellumUm modelo de geração de código que a empresa lançou para suas várias suítes de desenvolvimento de software no ano passado, disponível abertamente na plataforma de AI, abraçando o rosto. Mellum, treinado em mais de 4 trilhões de tokens, pesa 4 bilhões de parâmetros e foi projetado especificamente para a conclusão do código (ou seja, concluindo trechos de código com base no contexto circundante).
Os parâmetros correspondem aproximadamente às habilidades de solução de problemas de um modelo, enquanto os tokens são os bits brutos de dados que um modelo processa. Um milhão de tokens é equivalente a ~ 30.000 linhas de código.
“Projetado para integração em ferramentas de desenvolvedores profissionais (por exemplo, sugestões de código inteligente em ambientes de desenvolvedor integrados), assistentes de codificação movidos a IA e pesquisas sobre compreensão e geração de código, a Mellum também é adequada para aplicações educacionais e experimentos de ajuste fino”. explica Jetbrains em um relatório técnico.
A JetBrains diz que treinou Mellum, que é o Apache 2.0-Licensed, em uma coleção de conjuntos de dados, incluindo código permitido permissivamente dos artigos do GitHub e da Wikipedia em inglês. O treinamento levou cerca de 20 dias em um aglomerado de GPUs de 256 H200 NVIDIA.
Mellum leva algum trabalho para subir e correr. O modelo básico não pode ser usado fora da caixa; Tem que ser ajustado primeiro. Embora a Jetbrians tenha fornecido alguns modelos de mellum para a Python, a empresa adverte que eles são destinados à “estimativa sobre possíveis recursos”-não implantando em um ambiente de produção.
O código gerado pela IA está sem dúvida como o software é construído, mas também está introduzindo novos desafios de segurança. Mais de 50% das organizações encontram problemas de segurança com o código produzido às vezes ou com frequência, de acordo com um final de 2023 Pesquisa da plataforma de segurança do desenvolvedor Synk.
Evento do TechCrunch
Berkeley, CA.
|
5 de junho
De fato, Jetbrains observa que Mellum pode “refletir vieses presentes nas bases de código públicas” (por exemplo, gerando código semelhante em estilo aos repositórios de código aberto) e que suas sugestões de código não serão necessariamente “seguras ou livres de vulnerabilidades”.
“Este é apenas o começo”, escreveu Jetbrains em um Postagem do blog. “Não estamos perseguindo a generalidade – estamos construindo foco. Se Mellum Sparks mesmo um experimento, contribuição ou colaboração significativa, consideraríamos uma vitória”.