2023년부터 2025년까지 인공지능은 여러 분야에서 비약적인 발전을 이루었습니다. 대형 언어 모델(LLM)과 챗봇, 멀티모달 시스템, 과학 AI 도구, 로봇공학 등에서 모두 획기적인 성과가 있었습니다.
기술 대기업들은 새로운 AI 비서를 출시했고, 오픈소스 커뮤니티는 강력한 모델을 공개했으며, 규제 기관들도 AI의 영향에 대응하기 시작했습니다.
아래에서는 GPT-4 확장판과 구글의 Gemini, AlphaFold의 노벨상 수상, 그리고 과학과 예술 분야에서 AI가 이룬 발견 등 가장 주목할 만한 성과들을 살펴봅니다.
생성형 언어 모델과 챗봇
현대의 대형 언어 모델은 훨씬 더 강력해지고 멀티모달 기능을 갖추었습니다. OpenAI의 GPT-4 Turbo(2023년 11월 발표)는 한 번의 프롬프트에서 128,000 토큰(약 300페이지 분량의 텍스트)을 처리할 수 있으며, GPT-4보다 훨씬 저렴하게 운영됩니다.
2024년 5월, OpenAI는 텍스트, 이미지, 오디오를 실시간으로 처리하는 업그레이드 모델인 GPT-4o(Omni)를 선보였습니다. 이는 GPT-4에 대화형 ‘시각과 청각’을 부여한 셈입니다. ChatGPT 자체에도 이미지와 음성 기능이 내장되어 사용자가 사진을 업로드하거나 음성으로 대화할 수 있으며, 시각 및 청각 입력에 기반해 응답합니다.
- GPT-4 Turbo와 GPT-4o (Omni): GPT-4 Turbo(2023년 11월)는 비용을 낮추고 컨텍스트 길이를 128K 토큰으로 확장했습니다. GPT-4o(2024년 5월)는 AI를 진정한 멀티모달로 만들어 텍스트, 음성, 이미지를 거의 인간 속도로 교차 생성할 수 있습니다.
- ChatGPT 발전: 2023년 말까지 ChatGPT는 “보고, 듣고, 말할 수 있게” 되었습니다. 이미지와 오디오를 프롬프트로 업로드하거나 음성으로 입력할 수 있으며, 봇이 이에 맞춰 응답합니다.
또한 2023년 10월 DALL·E 3가 통합되어 대화형 프롬프트를 통해 텍스트에서 이미지를 생성할 수 있습니다. - 구글의 Gemini 시리즈: 2024년 12월, 구글 딥마인드는 “에이전트 시대”를 위한 첫 Gemini 2.0 모델(“Flash” 및 프로토타입)을 공개했습니다. 이는 AI가 자율적으로 다단계 작업을 수행할 수 있도록 설계되었습니다.
구글은 이미 10억 명 이상의 사용자를 대상으로 검색(“AI Overviews”) 및 기타 제품에 Gemini 2.0을 시험 적용하며 향상된 추론 및 멀티모달 능력을 선보이고 있습니다. - 기타 모델: 메타는 2024년 4월 LLaMA 3(최대 4000억 매개변수의 오픈 웨이트 LLM)를 공개하며 이전 모델들을 능가한다고 주장했습니다.
Anthropic의 Claude 3와 마이크로소프트의 코파일럿 도구들도 이러한 발전을 기반으로 구축되었습니다(예: 코파일럿은 OpenAI 기술 기반).
이러한 혁신 덕분에 AI 비서는 훨씬 더 길고 풍부한 대화를 유지할 수 있으며 다양한 입력을 처리할 수 있게 되었습니다.
또한 구글의 “AI Overviews”, OpenAI의 Assistants API 등 API를 통한 새로운 ‘비서’ 앱들이 등장해 개발자와 최종 사용자 모두에게 AI 접근성을 높이고 있습니다.
멀티모달 및 창의적 AI 발전
AI의 창의력과 시각 이해 능력이 폭발적으로 성장했습니다. 텍스트-이미지와 텍스트-비디오 모델이 새로운 경지에 도달했습니다:
OpenAI의 DALL·E 3(2023년 10월)는 프롬프트로부터 사진처럼 사실적인 이미지를 생성하며, ChatGPT와 통합되어 안내형 프롬프트 작성도 지원합니다.
구글은 Imagen 3(2024년 10월)과 Veo 2(2024년 12월)를 선보였는데, 이는 최첨단 텍스트-이미지 및 텍스트-비디오 엔진으로 AI 예술과 영상 생성의 품질, 세부 묘사, 일관성을 크게 향상시켰습니다.
음악 AI도 구글의 MusicFX 도구와 관련 연구(예: MusicLM 실험)를 통해 발전했습니다.
- 생성형 예술 모델: DALL·E 3와 Imagen 3은 이미지 내 포함된 텍스트를 포함한 미묘한 프롬프트도 높은 충실도로 따릅니다.
구글의 Veo 2는 단일 텍스트 설명으로 짧은 영상 클립을 생성할 수 있어 영상 합성 분야에서 주목할 만한 진전입니다.
Stable Diffusion과 Midjourney도 올해 v3, v6 버전으로 현실감을 높인 새 버전을 출시했습니다. - 기기 내 AI: 애플은 2024년 말 iOS 18과 macOS 15에 내장된 생성형 AI인 Apple Intelligence를 출시했습니다.
이 기능은 메일과 페이지에서 글쓰기 보조(재작성, 교정, 요약), 더욱 똑똑해진 시리, 텍스트로 재미있는 일러스트를 만드는 Image Playground, AI 생성 맞춤 이모지 Genmoji 등을 포함합니다.
사진은 자연어 검색(“마야가 스케이트보드 타는 사진 찾기”)이 가능해졌고, ‘Clean Up’ AI는 사진에서 원치 않는 객체를 제거합니다.
애플은 기기 내 처리와 개인정보 보호를 중시하는 접근법을 취하고 있습니다. - 예술 분야 AI: 인상적인 사례로 2024년 11월 소더비 경매에서 휴머노이드 로봇이 그린 첫 그림이 판매되었습니다.
AI 로봇 Ai-Da가 그린 앨런 튜링 초상화는 108만 달러에 낙찰되었습니다.
이 기록적인 판매(“A.I. God: Portrait of Alan Turing”)는 AI가 창의성에서 점점 더 중요한 역할을 하며 문화적 영향력을 확대하고 있음을 보여줍니다.
전반적으로 생성형 모델은 창의성을 민주화하고 있습니다. 누구나 몇 마디 말만으로 예술, 음악, 영상을 만들 수 있게 되었습니다.
산업계의 초점은 단순한 신기함(초현실적 이미지)에서 실용적인 이미지 생성(로고, 도표, 지도)과 인간과 같은 사실성으로 이동했습니다.
(2025년 3월 OpenAI는 GPT-4o에 최상의 이미지 모델을 통합한 “4o 이미지 생성”을 출시해 대화형 안내에 따른 정밀하고 사실적인 출력물을 제공하고 있습니다.)
이 도구들은 빠르게 앱, 브라우저, 창작 워크플로우에 통합되고 있습니다.
과학, 의학 및 수학 분야의 AI
AI 성과는 과학적 발견과 연구 진전을 촉진했습니다:
- AlphaFold 3 – 생체분자: 2024년 11월 구글 딥마인드(아이소모픽 랩스와 협력)는 모든 생체분자(단백질, DNA, RNA, 리간드 등)의 3D 구조를 동시에 예측하는 새로운 모델 AlphaFold 3를 공개했습니다. 전례 없는 정확도를 자랑합니다.
단백질-약물 상호작용 예측에서 AlphaFold 3는 기존 방법보다 약 50% 더 정확합니다.
개발자들은 즉시 무료 AlphaFold 서버를 공개해 전 세계 연구자들이 분자 구조를 예측할 수 있게 했습니다.
이는 AlphaFold 2의 단백질 예측을 확장한 것으로, 신약 개발과 유전체 연구에 혁신을 가져올 것으로 기대됩니다. - 노벨상 – 단백질 접힘: 이 발전의 중요성은 2024년 노벨 화학상 수상으로 입증되었습니다.
데미스 하사비스와 존 점퍼(딥마인드)는 데이비드 베이커와 함께 AlphaFold(단백질 접힘 AI) 개발로 상을 받았습니다.
노벨 위원회는 AlphaFold가 “단백질 설계에 완전히 새로운 가능성을 열었다”고 평가했습니다.
(이는 지금까지 가장 주목받는 AI 성과 중 하나입니다.) - AlphaProteo – 약물 설계: 2024년 딥마인드는 AlphaProteo를 발표했는데, 이는 새로운 단백질 결합체를 설계하는 AI입니다. 목표 단백질에 강하게 결합하는 분자를 생성합니다.
AlphaProteo는 특정 표적에 적합한 단백질 구조를 생성해 새로운 항체, 바이오센서, 약물 후보물질 개발을 가속화할 수 있습니다. - 수학 – AlphaGeometry: 딥마인드의 AlphaGeometry와 AlphaProof도 또 다른 돌파구를 마련했습니다.
2024년 7월 AlphaGeometry 2는 국제 수학 올림피아드 문제를 19초 만에 해결하며 은메달 수준의 실력을 보여주었습니다.
이는 AI가 고등학교 수준의 고급 수학 문제를 해결한 드문 사례입니다. - 양자 컴퓨팅 – AlphaQubit & Willow: AI는 최첨단 하드웨어 발전에도 기여했습니다.
2024년 구글은 양자 컴퓨터 오류를 기존 방법보다 훨씬 잘 식별하는 AI 기반 디코더 AlphaQubit을 발표했습니다(예: 구글 Sycamore 칩).
이어 2024년 12월에는 첨단 오류 수정 기술을 적용해 최고 슈퍼컴퓨터가 약 10^24년 걸릴 작업을 5분 이내에 해결한 새로운 양자 칩 Willow를 공개했습니다.
이 성과로 Willow는 2024년 “올해의 물리학 혁신상”을 수상하며 AI가 양자 기술 발전에 핵심 역할을 하고 있음을 입증했습니다.
의학 및 건강 분야에서도 AI 모델이 큰 진전을 이루었습니다. 예를 들어, 구글의 신형 Med-Gemini(의료 데이터로 미세 조정됨)는 미국 의료 시험 벤치마크(USMLE 스타일)에서 91.1% 점수를 기록하며 이전 모델들을 크게 앞섰습니다.
방사선학과 병리학용 AI 도구(예: Derm 및 Path Foundations)도 이미지 분석 향상을 위해 출시되었습니다.
전반적으로 AI는 나노스케일 뇌 지도 작성(AI 지원 전자현미경 이미지)부터 아프리카 결핵 선별 가속화에 이르기까지 필수적인 연구 파트너가 되었습니다(구글 연구진 보고).
로봇공학 및 자동화 분야의 AI
AI가 탑재된 로봇들은 복잡한 실제 작업을 학습하고 있습니다.
테슬라의 Optimus 휴머노이드 로봇은 2024년 10월 ‘We, Robot’ 행사에서 공개 시연되었습니다. 수십 대의 Optimus가 무대에서 걷고, 서고, 심지어 춤을 추었으나, 초기 시연은 일부 원격 조종이 포함되었다는 보도도 있었습니다.
그럼에도 이 행사는 범용 로봇 개발의 빠른 진전을 보여주었습니다.
- 딥마인드의 ALOHA 로봇: 구글 AI 연구소는 가정용 로봇 분야에서 인상적인 성과를 냈습니다.
2024년 ALOHA(Autonomous Legged Household Assistant) 로봇은 AI 계획과 시각만으로 신발끈 묶기, 셔츠 걸기, 다른 로봇 수리, 기어 삽입, 주방 청소까지 배웠습니다.
“ALOHA Unleashed” 오픈소스는 두 팔을 조율하는 범용 조작 능력을 가진 로봇을 공개해 최초 사례가 되었습니다. - 로봇 트랜스포머: 딥마인드는 RT-2 (Robotic Transformer 2)를 선보였는데, 이는 인터넷 이미지와 실제 로봇 데이터를 모두 학습하는 시각-언어-행동 모델입니다.
RT-2는 웹 지식을 활용해 인간처럼 명령을 해석할 수 있으며, 텍스트 명령에 따라 물체를 분류하는 로봇 시연도 이루어졌습니다. - 산업용 로봇: 보스턴 다이내믹스는 Atlas와 Spot 로봇을 계속 개선했으나 단일 획기적 성과는 없었고, AI 기반 자율주행 차량도 발전했습니다(테슬라의 Full Self-Driving 베타가 더 널리 배포되었으나 완전 자율주행은 아직 미완성).
제조업에서는 Figure AI 같은 AI 중심 기업들이 가사 작업용 로봇 개발을 위해 자금을 모았습니다.
이러한 노력들은 명시적 프로그래밍 없이 점점 더 어려운 작업을 수행하는 로봇을 보여줍니다. 그러나 완전 자율 휴머노이드 로봇은 아직 먼 미래입니다.
Optimus, ALOHA, RT-2 시연은 중요한 이정표이나, 연구자들은 로봇이 대규모로 안전하고 신뢰성 있게 인간과 함께 작업하려면 더 많은 연구가 필요하다고 경고합니다.
제품, 산업 및 사회 분야의 AI
AI의 영향력은 일상 제품과 정책 영역까지 확장되고 있습니다:
- 소비자 기기: 주요 기술 제품에 AI 에이전트가 통합되었습니다.
마이크로소프트의 코파일럿(윈도우, 오피스, 빙 내장)과 구글의 바드/검색 내 바드 AI(Gemini 기반)는 사용자에게 LLM 기능을 제공했습니다.
애플 기기에는 앞서 언급한 Apple Intelligence가 도입되었고, 엔비디아 같은 하드웨어 제조사는 클라우드와 소비자 AI를 지원하는 AI GPU를 기록적으로 판매했습니다.
(엔비디아는 2024년 AI 붐으로 세계에서 가장 가치 있는 기업이 되었습니다.) - 규제 – EU AI 법안: AI의 영향력을 반영해 규제 기관도 움직였습니다.
2024년 8월 1일, 최초의 포괄적 AI 법안인 EU AI 법안이 발효되었습니다.
이 법안은 위험 기반 프레임워크를 설정합니다: 저위험 AI(스팸 필터, 비디오 게임)는 최소한의 규제를 받으며, 투명성 규칙은 챗봇 같은 AI 시스템이 AI임을 공개하도록 요구합니다; 고위험 AI(의료, 채용 도구)는 엄격한 감독을 받으며; 명백히 허용 불가한 AI(예: 정부의 ‘사회 점수 매기기’)는 금지됩니다.
이 규칙 세트는(범용 모델에 대한 향후 지침과 함께) AI 거버넌스의 중요한 성과이며 전 세계 표준에 영향을 미칠 것으로 예상됩니다. - 산업 성장: AI 분야는 역사적인 자금 조달과 기업 가치 상승을 경험했습니다. OpenAI는 2023년 말 약 1,570억 달러의 평가 가치를 기록했고, Anthropic, Inflection, 중국 AI 스타트업들도 수십억 달러 규모의 투자 라운드를 진행했습니다.
엔비디아의 AI 하드웨어 수요는 2024년 중반 시가총액을 3.5조 달러 이상으로 끌어올렸습니다.
이 수치는 AI가 기술 경제의 중심이 되었음을 보여줍니다.
>>> 시도해 보셨나요: AI와 인간 지능 비교 ?
요컨대, AI는 더 이상 연구실이나 신기한 시연에만 머무르지 않고, 휴대폰, 자동차, 직장, 공공 정책에 깊숙이 자리 잡았습니다.
위에서 살펴본 GPT-4의 방대한 지식부터 AlphaFold의 과학 혁명에 이르기까지, AI의 빠른 성숙을 보여주는 성과들입니다.
2025년을 맞아 이러한 성과들은 우리 일상에 더욱 강력하고 실용적인 AI 응용이 도래할 것을 예고합니다.