Esses dois fundadores deixaram Goldman e Meta para construir IA de voz para mercados que todos ignoravam

Esses dois fundadores deixaram Goldman e Meta para construir IA de voz para mercados que todos ignoravam

O suporte e o serviço ao cliente estão entre os setores mais importantes em IA de voz no momento. Mas construir um produto que pareça humano e responda sem atrasos perceptíveis acaba por ser muito mais difícil em alguns mercados do que noutros – e a maioria dos principais intervenientes não foi construída tendo em mente a África e o Médio Oriente.

Aethex AIuma startup fundada no ano passado para preencher essa lacuna, levantou US$ 3 milhões em financiamento pré-semente liderado pela 4DX Ventures, com a participação da Enza Capital, Dorm Room Fund, Mojo Ventures e Stanford GSB 26 Fund. Os investidores individuais incluem professores de Stanford, executivos de telecomunicações e pesquisadores de IA da Anthropic.

Em vez de usar ferramentas de orquestração existentes como Vapi e Kit ao vivoa empresa construiu seu próprio modelo pequeno e camada de orquestração do zero para lidar com os dialetos localizados de inglês, francês e árabe falados em seus mercados-alvo – uma decisão orientada, como veremos, pelas demandas específicas de operação na região.

A empresa também está lançando sua plataforma para que as empresas experimentem sua tecnologia e se inscrevam em seus serviços, juntamente com APIs e SDKs para que os desenvolvedores experimentem seus modelos.

A startup foi fundada por Mariama Diallo e Ayooluwa Odemuyiwa. O CEO Diallo trabalhou na Goldman Sachs e mais tarde ingressou na ModelML, apoiada pela YC, como contratado de produto e crescimento. O CTO Odemuyiwa formou-se na Caltech, trabalhou na Meta e matriculou-se na Stanford Business School antes de cofundar a empresa. A dupla queria construir algo para os mercados emergentes e começou a procurar oportunidades.

As empresas em todo o mundo estão a correr para adotar ferramentas de IA para automatizar partes das suas operações. Mas isso nem sempre funciona. No Egipto, um call center automatizou uma parte significativa das suas chamadas, mas reverteu o sistema devido aos maus resultados, descobriram os fundadores. Vários centros de apoio em África disseram-lhes que encontrar e contratar engenheiros para automatizar as chamadas ao custo certo era uma dor de cabeça persistente.

“A latência e a instabilidade que vimos nas chamadas automatizadas nesta região eram ultrajantes. Se tivéssemos nos tornado orquestradores, talvez tivéssemos que usar modelos grandes hospedados fora da região, resultando em latência mais alta. Percebemos que, para que isso funcionasse, teríamos que usar modelos muito pequenos e reduzir a latência em cada etapa”, disse Odemuyiwa ao TechCrunch sobre a decisão de construir os próprios modelos e camada de orquestração da empresa.

Os laboratórios de IA que implantam seus modelos mais recentes geralmente gastam milhões treinando-os e adquirindo dados. AethexAI encontrou uma solução para ambos. Em vez de perseguir os maiores modelos possíveis, decidiu que modelos pequenos são suficientes para resolver o problema de latência, mantendo a precisão e desenvolveu a sua própria série Kora, com parâmetros que variam entre 300 milhões e 1,7 mil milhões. Isso é uma fração do tamanho dos LLMs, e é exatamente esse o ponto.

Para treinar esses modelos, a startup utilizou gravações anônimas de um parceiro de call center. Também enviou discos rígidos para estações de rádio em toda a África para coletar mais dados de áudio. Para manter os custos baixos, construiu uma rede de colaboradores de estudantes universitários para anotar dados e pronunciar nomes locais. Como resultado, diz a startup, agora ela atende mais de 17.000 ligações por dia.

Do lado comercial, a empresa tem o cuidado de orientar os clientes que são novos na voz da IA ​​ao longo do processo, oferecendo demonstrações e workshops no local para ajudá-los a identificar os melhores casos de uso para automação.

“Sempre dizemos aos clientes que não podemos ser tudo para todos agora. Somos pequenos. Quando começamos a conversar com uma empresa, pedimos que escolham um caso de uso que seja mais importante para eles para começar”, disse Diallo.

A startup está aberta para trabalhar em todos os setores, mas no momento, uma grande parte de seus casos de uso envolve chamadas para cobrança de dívidas, ativação de clientes ou verificação KYC – Know Your Customer, o processo padrão de verificação de identidade usado por bancos e telecomunicações. A empresa está contratando engenheiros avançados por contrato para atender aos mercados locais e construindo parcerias de canal com provedores de telecomunicações para lidar com a telefonia para chamadas de voz com IA. As soluções plug-and-play, diz ele, simplesmente não funcionarão aqui.

Walter Badoo, cofundador e sócio-gerente da 4DX Ventures, argumenta que o mercado de África e do Médio Oriente é fundamentalmente diferente dos mercados para os quais a maioria das empresas de IA de voz foram criadas para servir.

“As empresas em África e no Médio Oriente processam cerca de três vezes o volume de chamadas dos seus homólogos ocidentais, uma vez que a voz ainda é o canal dominante para a interacção com o cliente”, disse ele. “Os sistemas existentes foram construídos para mercados ocidentais caracterizados por infraestrutura de GPU de ponta, ambientes de fala padrão em inglês e europeu e fluxos de trabalho empresariais comuns nos EUA e na Europa. Isso cria lacunas reais quando as empresas precisam de sistemas que lidam com dialetos, troca de código e padrões de fala informais, e que funcionam dentro de sua infraestrutura de telefonia existente e seus preços reais.”

Dito de outra forma, embora empresas como ElevenLabs, Deepgram, Sierra e Cognigy estejam a expandir-se globalmente a um ritmo acelerado, os mercados para os quais foram construídas e os mercados em que estão a entrar nem sempre são a mesma coisa. Startups como a AethexAI apostam que as lacunas – modelos especializados em dialectos locais, parcerias no terreno, infra-estruturas construídas para a região – representam uma abertura de mercado que os gigantes não têm incentivo nem arquitectura para fechar.

Quando você compra por meio de links em nossos artigos, podemos ganhar uma pequena comissão. Isso não afeta nossa independência editorial.

Comments

No comments yet. Why don’t you start the discussion?

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *