Eu dei recentemente meu OpenClaw um verdadeiro braço robótico para brincar. Os resultados praticamente explodiram minha própria rede neural.
O agente de IA foi capaz de configurar o braço, usá-lo para ver e agarrar coisas lentamente e até treinar outro modelo de IA para pegar e posicionar objetos específicos. E dizem que a AGI ainda está a alguns anos de distância! (Estou brincando, provavelmente é).
Os resultados convenceram-me de que podemos estar à beira de um avanço na robótica. Treinar e controlar robôs costumava exigir habilidade considerável. Os modelos de IA atuais podem tornar isso quase fácil.
“A codificação alimentada por IA é muito interessante porque tem o potencial de preencher a lacuna entre os métodos convencionais de engenharia, que são confiáveis, mas não generalizam, e os modelos contemporâneos de visão-linguagem-ação, que generalizam, mas ainda não são confiáveis”, diz Ken Goldberg, roboticista da UC Berkeley que está explorando a abordagem.
Comprei um braço pré-construído chamado LeRobot 101. Faz parte de um projeto de código aberto da HuggingFace que torna relativamente barato começar a construir e experimentar robótica.
O LeRobot vem com dois braços: um braço controlador que uma pessoa opera usando uma alça e um gatilho, e um braço seguidor com uma câmera que replica esses movimentos. Você pode treinar um modelo de IA teleoperando o braço do controlador e fazendo com que o modelo aprenda como mover o seguidor em resposta ao que vê na câmera.
Construindo com OpenClaw
Antes de usar o OpenClaw, passei várias horas tentando conectar e calibrar o robô, e a certa altura quase quebrei os motores ao aplicar configurações erradas, o que causou superaquecimento.
Então, com a ajuda do OpenClaw e do Codex, consegui vibrar o código de um programa simples que fechava a garra da garra quando ela avistava uma bola vermelha. No terminal, o Codex realizou o complicado trabalho de configurar as conexões com o robô. Depois, com a minha ajuda, calibrou as posições das juntas. Ele também escreveu um script Python que usava diversas bibliotecas para identificar e segurar a bola em questão. A codificação Vibe não é perfeita, é claro, e alucinações podem introduzir bugs, especialmente ao trabalhar com hardware diferente, mas os resultados foram impressionantes.


