Thinking Machines apresenta proposta de modelos de interação em tempo real
Mira Murati, a engenheira que liderou o desenvolvimento de tecnologias revolucionárias como o ChatGPT (IA de conversação) e o DALL-E (gerador de imagens) na OpenAI, acaba de revelar o norte de sua nova empreitada. A Thinking Machines, startup fundada por Murati após sua saída conturbada da gigante da inteligência artificial, anunciou que seu foco principal não será apenas criar modelos de linguagem maiores, mas sim os chamados "modelos de interação".
Diferente das IAs que conhecemos hoje, onde você envia um comando (prompt) e espera uma resposta estática, a proposta da Thinking Machines é criar sistemas que colaborem com o usuário de forma fluida e orgânica. Segundo a empresa, esses modelos serão capazes de processar fluxos constantes de áudio, vídeo e texto simultaneamente. Na prática, isso significa uma IA que pode ver o que você está fazendo, ouvir suas instruções e agir ou responder instantaneamente, sem as pausas robóticas que ainda marcam a tecnologia atual.
Contexto: por que a saída de Mira Murati importa tanto para o mercado?
Para entender o peso desse anúncio, é preciso olhar para a trajetória de Mira Murati. Como CTO (Chief Technology Officer) da OpenAI, ela foi a peça-chave na transição da empresa de um laboratório de pesquisas para uma potência comercial. Ela esteve à frente do lançamento do GPT-4 e do Sora — o impressionante modelo de geração de vídeos que chocou a internet há alguns meses.
Sua saída da OpenAI ocorreu em um momento de intensa reestruturação interna na empresa de Sam Altman, marcada por uma debandada de talentos do alto escalão. Quando uma figura desse calibre funda sua própria companhia, o mercado de tecnologia interpreta isso como o nascimento de uma concorrente direta capaz de ditar os próximos passos da indústria. A escolha do nome "Thinking Machines" também carrega um peso histórico: é uma referência direta à Thinking Machines Corporation, uma empresa pioneira em supercomputação dos anos 80, sugerindo que Murati pretende resgatar a ambição de criar máquinas que realmente "pensem" de forma autônoma.
O que é, afinal, um modelo de interação?
Para quem não está familiarizado com o jargão técnico, a maioria das IAs atuais funciona em um sistema de "turno". Você fala, ela processa e depois responde. O modelo de interação proposto por Murati busca quebrar essa barreira através da multimodalidade nativa. Isso significa que a IA não converte sua voz em texto para depois entender; ela entende a entonação da voz, o contexto visual de uma câmera e o texto escrito ao mesmo tempo, tudo em um único processo cerebral digital.
Reação do mercado e da comunidade geek
O anúncio foi recebido com uma mistura de euforia e ceticismo saudável por especialistas em tecnologia e entusiastas da cultura geek. No Vale do Silício, a Thinking Machines já é vista como o próximo "unicórnio" (startup avaliada em mais de 1 bilhão de dólares) antes mesmo de lançar um produto final. Investidores estão atentos à capacidade de Murati de atrair talentos da OpenAI e do Google para sua nova casa.
Já na comunidade nerd, as comparações com a ficção científica são inevitáveis. A promessa de uma IA que interage em tempo real via áudio e vídeo nos aproxima de assistentes virtuais icônicos, como o JARVIS de Homem de Ferro ou a Samantha do filme Her. No entanto, o desafio técnico é imenso. Para que uma IA colabore em tempo real, a latência (o atraso no processamento) precisa ser praticamente zero, algo que exige um poder computacional absurdo e algoritmos extremamente otimizados.
- Expectativa: Uma IA que ajuda programadores a corrigir código enquanto eles digitam, observando a tela em tempo real.
- Desafio: Garantir a privacidade do usuário, já que a IA precisaria de acesso constante a feeds de câmera e microfone.
- Impacto: Mudança radical na forma como consumimos entretenimento e produzimos conteúdo digital.
O que esperar da tecnologia da Thinking Machines
Embora a empresa ainda não tenha demonstrado um software funcional para o público geral, o manifesto publicado em seu blog oficial deixa claro que o objetivo é a colaboração natural. Imagine estar jogando um videogame e ter um companheiro de equipe controlado por IA que não apenas segue scripts, mas que realmente entende a estratégia que você está traçando visualmente no mapa e sugere mudanças por voz em tempo real.
Outro ponto fundamental é a capacidade de "ação". A Thinking Machines sugere que seus modelos não apenas falarão, mas poderão executar tarefas em ambientes digitais. Isso coloca a startup na corrida pelos chamados "Agentes de IA", sistemas que podem navegar na web, usar softwares de edição ou gerenciar calendários de forma independente, agindo como braços direitos digitais.
| Característica | IA Tradicional (LLM) | Modelo de Interação (Thinking Machines) |
|---|---|---|
| Entrada de dados | Majoritariamente texto (Prompt) | Áudio, Vídeo e Texto contínuos |
| Tempo de Resposta | Processamento em lotes (pausas) | Tempo real (streaming) |
| Objetivo | Gerar conteúdo ou responder perguntas | Colaborar e agir em conjunto com o humano |
Para ficar no radar
Até o momento, a Thinking Machines não confirmou datas de lançamento para uma versão beta ou preços de assinatura. O que se sabe é que a empresa está em fase acelerada de contratação de engenheiros de aprendizado de máquina e pesquisadores de visão computacional. O foco inicial deve ser o mercado corporativo e de desenvolvedores, onde a necessidade de ferramentas de colaboração em tempo real é mais urgente.
Para o público geek e entusiastas de tecnologia, o ponto crucial será observar como essa IA lidará com a integração em dispositivos móveis e wearables (como óculos inteligentes). Se Mira Murati conseguir entregar metade do que o conceito de "modelos de interação" promete, estaremos diante da maior mudança na interface homem-máquina desde a invenção da tela sensível ao toque. O próximo capítulo dessa história deve envolver rodadas de investimento massivas e, possivelmente, a primeira demonstração técnica que provará se a Thinking Machines é, de fato, a sucessora espiritual da OpenAI.


