Cinco arquitetos da economia da IA ​​explicam onde as rodas estão saindo

Cinco arquitetos da economia da IA ​​explicam onde as rodas estão saindo

No início desta semana, cinco pessoas que tocam em todas as camadas da cadeia de fornecimento de IA sentaram-se na Milken Global Conference em Beverly Hills, onde conversaram com este editor sobre tudo, desde escassez de chips a data centers orbitais até a possibilidade de que toda a arquitetura que sustenta a tecnologia esteja errada.

No palco com o TechCrunch: Christophe Fouquet, CEO da ASML, empresa holandesa que detém o monopólio das máquinas de litografia ultravioleta extrema, sem as quais os chips modernos não existiriam; Francis deSouza, COO do Google Cloud, que supervisiona uma das maiores apostas em infraestrutura da história corporativa; Qasar Younis, cofundador e CEO da Applied Intuition, uma empresa física de IA de US$ 15 bilhões que começou na simulação e desde então passou para a defesa; Dimitry Shevelenko, diretor de negócios da Perplexity, empresa de busca para agentes nativa de IA; e Eve Bodnia, uma física quântica que deixou a academia para desafiar a arquitetura fundamental que a maior parte da indústria de IA considera natural em sua startup, Logical Intelligence. (O ex-cientista-chefe de IA da Meta, Yan LeCun, assumiu o cargo de presidente fundador de seu conselho de pesquisa técnica no início deste ano.)

Aqui está o que os cinco tinham a dizer:

Os gargalos são reais

O boom da IA ​​está atingindo limites físicos rígidos, e as restrições começam mais abaixo na pilha do que muitos podem imaginar. Fouquet foi o primeiro a dizê-lo, descrevendo uma “enorme aceleração na produção de chips”, ao mesmo tempo que expressou a sua “forte convicção” de que, apesar de todo esse esforço, “nos próximos dois, três, talvez cinco anos, o mercado terá oferta limitada”, o que significa que os hiperscaladores – Google, Microsoft, Amazon, Meta – não vão receber todos os chips pelos quais estão a pagar, ponto final.

DeSouza destacou o quão grande – e quão rápido cresce – é um problema, lembrando ao público que a receita do Google Cloud ultrapassou US$ 20 bilhões no último trimestre, crescendo 63%, enquanto seu backlog — a receita comprometida, mas ainda não entregue — quase dobrou em um único trimestre, de US$ 250 bilhões para US$ 460 bilhões. “A demanda é real”, disse ele com uma calma impressionante.

Para Younis, a restrição vem principalmente de outros lugares. A Intuição Aplicada constrói sistemas de autonomia para carros, caminhões, drones, equipamentos de mineração e veículos de defesa, e seu gargalo não é o silício – são os dados que só podemos coletar enviando máquinas para o mundo real e observando o que acontece. “Você tem que encontrá-lo no mundo real”, disse ele, e nenhuma simulação sintética preenche totalmente essa lacuna. “Levará muito tempo até que você possa treinar totalmente modelos que funcionam sinteticamente no mundo físico.”

Evento Techcrunch

São Francisco, Califórnia
|
13 a 15 de outubro de 2026

O problema energético também é real

Se os chips são o primeiro gargalo, a energia é quem está por trás dele. DeSouza confirmou que o Google está explorando data centers no espaço como uma resposta séria às restrições energéticas. “Você tem acesso a energia mais abundante”, observou ele. É claro que, mesmo em órbita, não é simples. DeSouza observou que o espaço é um vácuo, portanto elimina a convecção, deixando a radiação como a única maneira de liberar calor no ambiente circundante (um processo muito mais lento e mais difícil de projetar do que os sistemas de refrigeração a ar e líquido dos quais os data centers dependem hoje). Mas a empresa ainda trata isso como um caminho legítimo.

O argumento mais profundo apresentado por Souza, sem surpresa, foi sobre a eficiência através da integração. A estratégia do Google de co-engenharia de toda a sua pilha de IA – desde chips TPU personalizados até modelos e agentes – paga dividendos em watts por flop que uma empresa que compra componentes prontos para uso simplesmente não consegue replicar, sugeriu ele. “Executar o Gemini em TPUs é muito mais eficiente em termos de energia do que qualquer outra configuração”, porque os projetistas de chips sabem o que está por vir no modelo antes de ele ser lançado, disse ele. Num mundo onde a disponibilidade de energia está a tornar-se uma enorme restrição ao alcance desta tecnologia, esse tipo de integração vertical é uma grande vantagem competitiva.

Fouquet repetiu o ponto mais tarde na discussão. “Nada pode ser inestimável”, disse ele. A indústria está num momento estranho neste momento, investindo quantidades extraordinárias de capital, impulsionada por necessidades estratégicas. Mas mais computação significa mais energia, e mais energia tem um preço.

Um tipo diferente de inteligência

Enquanto o resto da indústria debate escala, arquitetura e eficiência de inferência dentro do paradigma do grande modelo de linguagem, Bodnia está construindo algo muito diferente.

A sua empresa, Logical Intelligence, baseia-se nos chamados modelos baseados em energia (EBMs), uma classe de IA que não prevê o próximo token numa sequência, mas em vez disso tenta compreender as regras subjacentes aos dados, de uma forma que ela argumenta estar mais próxima de como o cérebro humano realmente funciona. “A linguagem é uma interface de usuário entre meu cérebro e o seu”, disse ela. “O raciocínio em si não está ligado a nenhuma linguagem.”

Seu maior modelo funciona com 200 milhões de parâmetros – em comparação com as centenas de bilhões dos principais LLMs – e ela afirma que funciona milhares de vezes mais rápido. Mais importante ainda, ele foi projetado para atualizar seu conhecimento à medida que os dados mudam, em vez de exigir um novo treinamento do zero.

Para design de chips, robótica e outros domínios onde um sistema precisa compreender regras físicas em vez de padrões linguísticos, ela argumenta que os EBMs são a opção mais natural. “Quando você dirige um carro, você não está procurando padrões em nenhum idioma. Você olha ao seu redor, entende as regras do mundo ao seu redor e toma uma decisão.” É um argumento interessante e que provavelmente atrairá mais atenção nos próximos meses, dado que o campo da IA ​​começa a perguntar se a escala por si só é suficiente.

Agentes, guarda-corpos e confiança

Shevelenko passou grande parte da conversa explicando como o Perplexity evoluiu de um produto de busca para algo que agora chama de “trabalhador digital”. A Perplexity Computer, sua mais nova oferta, foi projetada não como uma ferramenta usada por um trabalhador do conhecimento, mas como uma equipe dirigida por um trabalhador do conhecimento. “Todos os dias você acorda e tem cem funcionários em sua equipe”, disse ele sobre a oportunidade. “O que você vai fazer para aproveitar ao máximo?”

É um argumento convincente; também levanta questões óbvias sobre controle, então perguntei a eles. Sua resposta foi granularidade. Os administradores corporativos podem especificar não apenas quais conectores e ferramentas um agente pode acessar, mas também se essas permissões são somente leitura ou leitura-gravação — uma distinção que é extremamente importante quando os agentes atuam dentro de sistemas corporativos. Quando o Comet, o agente de uso de computadores da Perplexity, realiza ações em nome de um usuário, ele apresenta um plano e pede aprovação primeiro. Alguns usuários acham o atrito irritante, disse Shevelenko, mas ele disse que o considera essencial, especialmente depois de ingressar no conselho da Lazard, onde disse que se encontrou inesperadamente solidário com os instintos conservadores de um CISO que protege uma marca de 180 anos construída inteiramente na confiança do cliente. “A granularidade é a base de uma boa higiene de segurança”, disse ele.

Soberania, não apenas segurança

Younis ofereceu o que pode ter sido a observação mais geopoliticamente carregada do painel, que é a de que a IA física e a soberania nacional estão entrelaçadas de uma forma que a IA puramente digital nunca esteve.

A Internet inicialmente se espalhou como tecnologia americana e enfrentou resistência apenas na camada de aplicação – os Ubers e DoorDashes – quando as consequências off-line se tornaram visíveis. A IA física é diferente. Veículos autónomos, drones de defesa, equipamento mineiro, máquinas agrícolas – estes manifestam-se no mundo real de formas que os governos não podem ignorar, levantando questões sobre segurança, recolha de dados e quem, em última análise, controla os sistemas que operam dentro das fronteiras de uma nação. “Quase consistentemente, todos os países dizem: não queremos esta informação em forma física nas nossas fronteiras, controlada por outro país.” Poucas nações, disse ele à multidão, podem atualmente utilizar um robotáxi do que possuir armas nucleares.

Fouquet enquadrou a situação de forma um pouco diferente. O progresso da IA ​​da China é real – o lançamento do DeepSeek no início deste ano causou algo próximo do pânico em partes da indústria – mas esse progresso é limitado abaixo da camada do modelo. Sem acesso à litografia EUV, os fabricantes de chips chineses não podem fabricar os semicondutores mais avançados, e os modelos construídos em hardware mais antigo funcionam em desvantagem crescente, independentemente da qualidade do software. “Hoje, nos Estados Unidos, você tem os dados, tem o acesso à computação, tem os chips, tem o talento. A China faz um trabalho muito bom no topo da pilha, mas faltam alguns elementos abaixo”, disse Fouquet.

A questão da geração

Perto do final do nosso painel, alguém na plateia fez a pergunta óbvia e incômoda: tudo isso vai impactar a capacidade de pensamento crítico da próxima geração?

As respostas foram, talvez sem surpresa, optimistas, embora não ingenuamente. De Souza apontou para a escala dos problemas que ferramentas mais poderosas poderiam finalmente permitir que a humanidade resolvesse. Pense nas doenças neurológicas cujos mecanismos biológicos ainda não compreendemos, na remoção de gases com efeito de estufa e nas infraestruturas de rede que foram adiadas durante décadas. “Isso deve nos levar ao próximo nível de criatividade”, disse ele.

Shevelenko destacou uma questão mais pragmática: o emprego inicial pode estar desaparecendo, mas a capacidade de lançar algo de forma independente nunca foi tão acessível. “(Para) qualquer pessoa que tenha o Perplexity Computer… a restrição é sua própria curiosidade e agência.”

Younis traçou a distinção mais nítida entre trabalho intelectual e trabalho físico. Ele destacou o facto de o agricultor americano médio ter 58 anos e de a escassez de mão-de-obra na mineração, no transporte rodoviário de longo curso e na agricultura ser crónica e crescente – não porque os salários sejam demasiado baixos, mas porque as pessoas não querem esses empregos. Nesses domínios, a IA física não está a substituir trabalhadores dispostos. É preencher um vazio que já existe e que só se pretende aprofundar a partir daqui.

Quando você compra por meio de links em nossos artigos, podemos ganhar uma pequena comissão. Isso não afeta nossa independência editorial.

Comments

No comments yet. Why don’t you start the discussion?

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *