[아이뉴스24 정종오 기자] AI 에이전트 시대가 되면서 전력 사용량이 급증하고 있는 것으로 나타났다. AI 에이전트는 기존 생성형 AI보다 질문 한 건당 최대 136.5배에 이르는 에너지를 소비하는 것으로 분석됐다.
하루 137억건의 AI 에이전트 요청이 발생하는 미래 환경을 가정해 분석한 결과 데이터센터 전력 수요는 약 198.9기가와트(GW)에 이르렀다.
AI가 스스로 생각하고 행동하는 ‘AI 에이전트' 시대가 열리면서 데이터센터의 전력 소비가 새로운 과제로 떠오르고 있다. KAIST 연구팀이 AI 에이전트의 계산 비용과 에너지 소비를 분석한 결과, 기존 생성형 AI보다 질문 한 건당 최대 136.5배 많은 에너지를 사용하는 것으로 나타났다. 이번 연구는 AI 시대의 경쟁력이 모델 성능을 넘어 데이터센터와 전력 인프라의 효율성으로 확대되고 있음을 보여준다.
![AI 에이전트 시대 전력 소비량이 급증할 것으로 분석됐다. [사진=KAIST]](https://image.inews24.com/v1/58ec0bad5e2295.jpg)
한국과학기술원(KAIST, 총장 배충식) 전기및전자공학부 유민수 석좌교수 연구팀은 AI 에이전트가 실제 서비스 환경에서 얼마나 많은 계산 자원과 전력을 사용하는지를 체계적으로 분석했다.
최근 챗GPT(ChatGPT)와 같은 대형 언어 모델(LLM, Large Language Model, 사람의 언어를 이해하고 글을 생성하는 인공지능 모델) 기반 애플리케이션은 단순히 질문에 답하는 수준을 넘어 스스로 계획을 세우고 인터넷 검색이나 계산기, 코드 실행 등 다양한 외부 도구를 활용해 복잡한 문제를 해결하는 AI 에이전트(AI Agent, 여러 도구를 스스로 활용해 목표를 수행하는 차세대 인공지능) 로 빠르게 발전하고 있다.
이러한 AI 에이전트는 소프트웨어 개발, 연구, 업무 자동화 등 다양한 분야에서 활용이 확대되고 있다. 운영하기 위해 얼마나 많은 전력과 비용이 필요한지는 거의 알려져 있지 않았다.
연구팀은 AI 에이전트를 단순한 프로그램이 아니라 데이터센터의 서버와 GPU(Graphics Processing Unit, 대규모 AI 계산을 수행하는 고성능 반도체)가 지속적으로 처리해야 하는 새로운 형태의 작업인 워크로드(Workload, 컴퓨터가 수행해야 하는 전체 계산 작업)로 정의하고 실제 실행 과정에서 발생하는 계산량과 에너지 소비를 분석했다.
분석 결과 AI 에이전트는 기존의 단계별 추론(Chain-of-Thought, CoT, AI가 사람처럼 생각 과정을 하나씩 전개하며 답을 찾는 방식)과 달리 반복적으로 여러 차례 대형 언어 모델 호출(LLM Invocation, AI가 언어 모델에 새로운 판단이나 답변 생성을 요청하는 계산 과정)을 수행하는 것으로 나타났다.
이처럼 언어 모델을 반복적으로 호출하면서 응답 시간도 증가했다. AI 에이전트의 답변 시간은 최대 153.7배 늘어났으며 외부 도구가 작업을 수행하는 동안 GPU는 전체 실행 시간의 최대 54.5%를 아무 계산도 하지 못한 채 대기하는 것으로 분석됐다. AI가 더 복잡한 일을 수행할수록 고가의 GPU를 충분히 활용하지 못하는 새로운 비효율이 발생하는 것이다.
연구팀은 AI 에이전트가 사용하는 전력도 데이터센터 규모에서 분석했다. 현재 상용 AI 서비스 수준인 700억개의 매개변수(Parameter, AI가 학습한 지식과 능력을 저장하는 값) 를 가진 대형 언어 모델을 사용하는 AI 에이전트는 질문 한 건을 처리하는 데 평균 348.41와트시(Wh, 전기를 얼마나 사용했는지를 나타내는 에너지 단위)의 전력을 소비했다. 이는 기존 생성형 AI의 단순 질의응답 방식보다 136.5배 높은 수준이다.
하루 137억건의 AI 에이전트 요청이 발생하는 미래 환경을 가정해 분석한 결과, 데이터센터 전력 수요는 약 198.9기가와트(GW, 국가 단위 전력망에서 사용하는 매우 큰 규모의 전력 용량)에 이를 것으로 추정됐다. 이는 현재 세계 각국이 추진 중인 수 기가와트(GW) 규모의 AI 데이터센터를 크게 뛰어넘는 수준이며 미국 전체 평균 전력 소비량의 약 절반에 해당하는 규모다.
이번 연구는 AI 시대의 경쟁력이 ‘더 똑똑한 AI'에서 ‘더 효율적 AI'로 옮겨가고 있음을 보여준다. 앞으로는 AI 모델만 발전시키는 것이 아니라 AI 반도체, 데이터센터, 전력 인프라를 함께 최적화하는 ‘공동 설계(Co-design)'가 필수 전략이 될 것으로 기대된다. 이는 AI 서비스의 운영 비용을 낮추고, 지속가능한 AI 인프라를 구축하는 핵심 기술이 될 전망이다.
유민수 석좌교수는 “이번 연구는 단순히 AI가 더 똑똑해지는 것을 넘어 그 지능을 구현하고 유지하기 위해 얼마나 많은 전력과 비용이 필요한지를 정량적으로 제시한 첫 사례”라며 “앞으로 AI 에이전트가 보편화되는 시대에는 AI 데이터센터 인프라 뿐 아니라 AI 에이전트 모델과 전력 인프라까지 통합적으로 공동 설계(co-design)하여 최적화하는 접근이 더욱 중요해질 것”이라고 지적했다.
이어 “이를 통해 최종 이용자가 AI 서비스를 활용하는 데 들어가는 비용을 획기적으로 절감하고 동시에 지속가능한 AI 인프라를 구축하기 위한 연구와 투자가 필수적”이라고 덧붙였다.
이번 연구(논문명 : The Cost of Dynamic Reasoning: Demystifying AI Agents and Test-Time Scaling from an AI Infrastructure Perspective)는 KAIST 전기및전자공학부 김지인 박사과정 학생이 제1저자로 수행했다. 컴퓨터 시스템 설계 분야 국제학회인 32회 IEEE HPCA(International Symposium on High-Performance Computer Architecture)에서 지난 2월 발표됐다.
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기