Durante muitos anos (2023–2025), a inteligência artificial avançou significativamente em várias frentes. Modelos de linguagem de grande escala (LLMs) e chatbots, sistemas multimodais, ferramentas científicas de IA e robótica tiveram avanços importantes.
Gigantes da tecnologia lançaram novos assistentes de IA, comunidades open-source disponibilizaram modelos poderosos e até reguladores passaram a agir para lidar com o impacto da IA.
A seguir, apresentamos as conquistas mais marcantes, desde extensões do GPT-4 e o Gemini do Google até o Prêmio Nobel do AlphaFold e descobertas impulsionadas por IA na ciência e na arte.
Modelos Generativos de Linguagem e Chatbots
Os LLMs modernos tornaram-se muito mais capazes e multimodais. O GPT-4 Turbo da OpenAI (anunciado em nov. de 2023) agora pode processar 128.000 tokens em um único prompt (aproximadamente 300 páginas de texto) e é muito mais barato de operar que o GPT-4.
Em maio de 2024, a OpenAI lançou o GPT-4o (Omni), um modelo aprimorado que processa texto, imagens e áudio em tempo real – oferecendo ao GPT-4 “visão e audição” conversacionais. O próprio ChatGPT agora possui recursos integrados de imagem e voz: os usuários podem enviar fotos ou falar com o bot, que responderá com base nesses inputs visuais ou auditivos.
- GPT-4 Turbo e GPT-4o (Omni): O GPT-4 Turbo (nov. 2023) reduziu custos e ampliou o contexto para 128K tokens. O GPT-4o (mai. 2024) tornou a IA verdadeiramente multimodal, gerando texto, fala e imagens com velocidade quase humana.
- Avanços do ChatGPT: No final de 2023, o ChatGPT “pode agora ver, ouvir e falar” – imagens e áudios podem ser enviados ou ditados como prompts, e o bot responde conforme.
Também integrou o DALL·E 3 (out. 2023), permitindo gerar imagens a partir de texto com auxílio de prompts conversacionais. - Série Gemini do Google: Em dez. de 2024, o Google DeepMind lançou os primeiros modelos Gemini 2.0 (“Flash” e protótipos) projetados para a “era agente” – IA capaz de executar tarefas complexas de forma autônoma.
O Google já começou a testar o Gemini 2.0 na Busca (AI Overviews) e outros produtos para mais de um bilhão de usuários, refletindo suas habilidades aprimoradas de raciocínio e multimodalidade. - Outros modelos: A Meta lançou o LLaMA 3 em abril de 2024 (LLMs open-weight com até 400 bilhões de parâmetros), afirmando superar muitos modelos anteriores.
O Claude 3 da Anthropic e as ferramentas copiloto da Microsoft também se basearam nesses avanços (por exemplo, o Copilot usa tecnologia da OpenAI).
Essas inovações permitem que assistentes de IA mantenham conversas muito mais longas e ricas, além de processar entradas diversas.
Elas também alimentam novos aplicativos “assistentes” via APIs (como o “AI Overviews” do Google, Assistants API da OpenAI, etc.), tornando a IA mais acessível para desenvolvedores e usuários finais.
Avanços Multimodais e Criativos em IA
A criatividade e a compreensão visual da IA explodiram. Modelos de texto para imagem e texto para vídeo atingiram novos patamares:
O DALL·E 3 da OpenAI (out. 2023) gera imagens fotorrealistas a partir de prompts e está integrado ao ChatGPT para auxiliar na criação de prompts guiados.
O Google lançou o Imagen 3 (out. 2024) e o Veo 2 (dez. 2024) – motores de última geração para texto-para-imagem e texto-para-vídeo – que melhoram drasticamente a qualidade, o detalhe e a consistência na geração artística e de vídeos por IA.
Até a IA musical avançou com as ferramentas MusicFX do Google e pesquisas relacionadas (como experimentos MusicLM).
- Modelos de arte generativa: DALL·E 3 e Imagen 3 seguem prompts sutis (incluindo texto embutido em imagens) com alta fidelidade.
O Veo 2 do Google pode gerar clipes curtos de vídeo a partir de uma única descrição textual, um avanço notável para síntese de vídeo.
Stable Diffusion e Midjourney também lançaram versões mais recentes (v3, v6) com realismo aprimorado neste ano. - IA em dispositivos: A Apple lançou a Apple Intelligence (no iOS 18 e macOS 15, final de 2024) – IA generativa integrada ao iPhone/iPad/Mac.
Inclui assistentes de escrita (reescrever, revisar, resumir no Mail/Pages), uma Siri ainda mais inteligente e ferramentas de imagem como o Image Playground (criação de ilustrações divertidas via texto) e o Genmoji (emoji personalizado gerado por IA).
As fotos ganharam busca por linguagem natural (“encontre Maya andando de skate”) e o recurso “Clean Up” remove objetos indesejados das imagens.
A abordagem da Apple enfatiza processamento local e privacidade. - IA na arte: Um exemplo marcante: em nov. de 2024, a Sotheby’s vendeu a primeira pintura criada por um robô humanoide.
Um retrato de Alan Turing feito pelo robô com IA Ai-Da alcançou US$ 1,08 milhão.
Essa venda recorde (“A.I. God: Portrait of Alan Turing”) destaca o papel crescente da IA na criatividade e seu impacto cultural.
No geral, os modelos generativos estão democratizando a criatividade: qualquer pessoa pode gerar arte, música ou vídeo com poucas palavras.
O foco da indústria mudou da mera novidade (imagens surreais) para a geração útil de imagens (logotipos, diagramas, mapas) e realismo próximo ao humano.
(Em março de 2025, a OpenAI lançou até o “4o Image Generation”, integrando seu melhor modelo de imagem ao GPT-4o para resultados precisos e fotorrealistas guiados pela conversa.)
Essas ferramentas estão rapidamente sendo incorporadas a apps, navegadores e fluxos de trabalho criativos.
IA na Ciência, Medicina e Matemática
As conquistas da IA impulsionaram descobertas científicas e avanços em pesquisa:
- AlphaFold 3 – biomoléculas: Em nov. de 2024, o Google DeepMind (com Isomorphic Labs) revelou o AlphaFold 3, um novo modelo que prevê as estruturas 3D de todas as biomoléculas (proteínas, DNA, RNA, ligantes, etc.) simultaneamente, com precisão inédita.
Para interações proteína-droga, o AlphaFold 3 é cerca de 50% mais preciso que métodos tradicionais.
Seus criadores lançaram imediatamente um AlphaFold Server gratuito para que pesquisadores do mundo todo possam prever estruturas moleculares.
Isso expande as previsões apenas de proteínas do AlphaFold 2 e deve revolucionar a descoberta de medicamentos e pesquisas genômicas. - Prêmio Nobel – Dobramento de Proteínas: A importância desse avanço foi reconhecida com o Prêmio Nobel de Química de 2024.
Demis Hassabis e John Jumper (DeepMind) dividiram o prêmio (com David Baker) pelo desenvolvimento do AlphaFold (IA para dobramento de proteínas).
O comitê Nobel destacou que o AlphaFold “abriu possibilidades completamente novas” no design de proteínas.
(Essa é uma das conquistas de IA mais renomadas até hoje.) - AlphaProteo – design de medicamentos: Também em 2024, o DeepMind anunciou o AlphaProteo, uma IA que projeta novos ligantes proteicos – moléculas que se ligam fortemente a proteínas-alvo.
O AlphaProteo pode acelerar a criação de novos anticorpos, biossensores e candidatos a medicamentos gerando estruturas promissoras para alvos específicos. - Matemática – AlphaGeometry: O AlphaGeometry e o AlphaProof do DeepMind trouxeram outro avanço.
Em julho de 2024, o AlphaGeometry 2 resolveu um problema da Olimpíada Internacional de Matemática em 19 segundos, atingindo o nível de medalha de prata.
Esse é um caso raro de IA enfrentando matemática avançada do ensino médio. - Computação quântica – AlphaQubit e Willow: A IA também melhorou hardware de ponta.
Em 2024, o Google anunciou o AlphaQubit, um decodificador baseado em IA que identifica erros em computadores quânticos (como os chips Sycamore do Google) muito melhor que métodos anteriores.
Depois, em dez. de 2024, o Google revelou o Willow, um novo chip quântico que, usando correção avançada de erros, resolveu uma tarefa de benchmark em menos de 5 minutos que levaria cerca de 10^24 anos no melhor supercomputador atual.
Esses avanços renderam ao Willow o prêmio “Avanço em Física do Ano 2024”, destacando o papel da IA no progresso quântico.
Na medicina e saúde, os modelos de IA também avançaram. Por exemplo, o novo Med-Gemini do Google (ajustado com dados médicos) obteve 91,1% em um exame médico dos EUA (estilo USMLE), superando amplamente modelos anteriores.
Ferramentas habilitadas por IA para radiologia e patologia (como Derm e Path Foundations) foram lançadas para melhorar a análise de imagens.
No geral, a IA é agora uma parceira indispensável na pesquisa – desde mapear o cérebro humano em escala nanométrica (com imagens EM assistidas por IA) até acelerar o rastreamento de tuberculose na África, conforme relatado por pesquisadores do Google.
IA em Robótica e Automação
Robôs movidos por IA estão aprendendo tarefas complexas do mundo real.
Os robôs humanoides Optimus da Tesla foram demonstrados publicamente em outubro de 2024 (evento “We, Robot”). Várias dezenas de unidades Optimus caminharam, ficaram em pé e até dançaram no palco – embora relatos posteriores tenham indicado que as demonstrações iniciais foram parcialmente controladas remotamente por humanos.
Ainda assim, o evento destacou o rápido progresso rumo a robôs de uso geral.
- Robôs ALOHA do DeepMind: O laboratório de IA do Google avançou significativamente em robôs domésticos.
Em 2024, o robô ALOHA (Assistente Doméstico Autônomo com Pernas) aprendeu a amarrar cadarços, pendurar uma camisa, consertar outro robô, inserir engrenagens e até limpar uma cozinha usando apenas planejamento e visão por IA.
Os projetos open-source “ALOHA Unleashed” mostraram robôs coordenando dois braços para tarefas, um marco em manipulação de uso geral. - Transformers Robóticos: O DeepMind apresentou o RT-2 (Robotic Transformer 2), um modelo visão-linguagem-ação que pode aprender tanto com imagens da internet quanto com dados reais de robôs.
O RT-2 permite que robôs interpretem instruções como um humano, aproveitando o conhecimento da web.
Foi demonstrado ajudando um robô a separar objetos seguindo comandos de texto. - Robôs industriais: Outras empresas também avançaram: a Boston Dynamics continuou aprimorando os robôs Atlas e Spot (sem grandes novidades de destaque), e veículos autônomos movidos por IA melhoraram (o Full Self-Driving Beta da Tesla teve expansão, embora a autonomia total ainda não tenha sido alcançada).
Na manufatura, empresas focadas em IA como a Figure AI captaram recursos para construir robôs domésticos para tarefas cotidianas.
Esses esforços mostram robôs realizando tarefas cada vez mais difíceis sem programação explícita. Contudo, humanoides totalmente autônomos ainda são uma meta futura.
As demonstrações (Optimus, ALOHA, RT-2) são marcos, mas pesquisadores alertam que ainda há muito trabalho para que robôs possam trabalhar com segurança e confiabilidade ao lado de humanos em larga escala.
IA em Produtos, Indústria e Sociedade
O impacto da IA se estende a produtos do dia a dia e até políticas públicas:
- Dispositivos de consumo: Grandes produtos tecnológicos incorporaram agentes de IA.
O Copilot da Microsoft (integrado ao Windows, Office, Bing) e o Bard/Bard AI do Google na Busca (com Gemini por trás) levaram o poder dos LLMs aos usuários.
Os dispositivos da Apple receberam a Apple Intelligence (como citado acima) e fabricantes de hardware como a Nvidia venderam números recordes de GPUs para IA, alimentando tanto a nuvem quanto a IA para consumidores.
(A Nvidia tornou-se a empresa mais valiosa do mundo em 2024 graças ao boom da IA.) - Regulação – Lei de IA da UE: Refletindo o alcance da IA, reguladores também agiram.
Em 1º de agosto de 2024, entrou em vigor a Lei de IA da UE, a primeira legislação abrangente sobre IA.
Ela estabelece um marco baseado em riscos: IA de baixo risco (filtros de spam, videogames) tem regras mínimas; regras de transparência obrigam sistemas como chatbots a revelar que são IA; IA de alto risco (ferramentas médicas ou de contratação) enfrenta supervisão rigorosa; e IA claramente inaceitável (como “pontuação social” de indivíduos por governos) é proibida.
Esse conjunto de regras (junto com diretrizes futuras para modelos de uso geral) é uma conquista importante na governança da IA e deve influenciar padrões globalmente. - Crescimento da indústria: O setor de IA viu financiamentos e avaliações históricas: a OpenAI alcançou uma avaliação reportada de US$ 157 bilhões no final de 2023, e empresas como Anthropic, Inflection e startups chinesas de IA captaram rodadas bilionárias.
A demanda por hardware de IA da NVIDIA elevou seu valor de mercado acima de US$ 3,5 trilhões em meados de 2024.
Esses números evidenciam como a IA se tornou central na economia tecnológica.
>>> Já experimentou: Comparando a Inteligência Artificial com a Inteligência Humana ?
Em resumo, a IA não está mais confinada a laboratórios ou demonstrações de novidade – está incorporada em telefones, carros, locais de trabalho e políticas públicas.
Os avanços acima – do vasto conhecimento do GPT-4 às revoluções científicas do AlphaFold – demonstram a rápida maturação da IA.
À medida que avançamos para 2025, essas conquistas prenunciam aplicações de IA ainda mais poderosas e práticas em nosso cotidiano.