[아이뉴스24 윤소진 기자] KT클라우드가 인공지능 데이터센터(AIDC) 핵심 기술을 실증하는 국내 첫 테스트베드를 본격 가동한다. 엔비디아 최신 B200 GPU와 140kW급 초고밀도 액체냉각(리퀴드쿨링·수냉식) 시스템을 실제 운영 환경으로 구현해 실측 데이터를 확보하고 급성장하는 AIDC 시장을 선점하겠다는 전략이다.
![허영만 KT클라우드 데이센터본부장(전무)이 11일 오전 서울 목동 'AI 이노베이션 센터' 개소식에서 환영사를 하고 있다. [사진=KT클라우드]](https://image.inews24.com/v1/74b013faa4f27b.jpg)
11일 KT클라우드는 서울 목동에 'AI 이노베이션 센터(실증센터)'를 오픈했다. 단순 쇼룸이 아닌 전력·냉각·통신까지 실제 데이터센터와 동일한 환경을 갖춘 국내 유일의 실증 공간이다.
허영만 KT클라우드 데이터센터 본부장은 “일부 모형 전시를 하는 곳은 있었지만 실제 장비를 100% 현장과 같은 환경에서 구동하는 건 처음”이라고 강조했다.
실측 데이터 없는 투자는 '도박'
엔비디아 B200 같은 고성능 GPU는 발열이 커 기존 공냉식(에어쿨링)으론 한계가 뚜렷하다. 랙당 100kW를 넘는 초고밀도 구성을 위해선 액체냉각이 필수지만, 설계·운영에 참고할 실측 데이터가 부족한 상황이다. 설계 기준이 모호한 상황에서 대규모 AI센터 투자는 도박에 가깝다.
AI 이노베이션 센터는 이런 불확실성을 줄이기 위한 ‘선행 검증 플랫폼’이다. 축소판 데이터센터에서 냉각·전력·네트워크 운영 데이터를 확보한 뒤 이를 상용 센터에 곧바로 적용해 시행착오를 최소화한다는 것이다.
KT클라우드는 현재 150MW 규모의 IT 전력을 운영 중이며 2030년까지 300MW를 추가로 확보할 계획이다. 올해 가산 AIDC를 시작으로 내년 부천·안산·개봉 등 신규 데이터센터를 모두 액체냉각 수용 구조로 설계해 향후 AI 수요 증가분 상당 부분을 흡수하겠다는 구상이다.
허 본부장은 "신규 물량의 60% 이상을 리퀴드쿨링으로 가져가되, 시장 상황에 따라 에어쿨링 방식과 유연하게 조합할 것"이라고 설명했다. 그는 이어 "내년 4월 직접 서비스를 목표로 가산 데이터센터에 국내 최초 리퀴드쿨링 기반 서비스를 상용화했다"며 "향후 기술 스펙과 검증 데이터를 업계 발전을 위해 공개하는 방안도 검토 중”이라고 덧붙였다.
KT클라우드는 액체냉각 수요가 이미 특정 분야에서 뚜렷하게 나타나고 있다고 본다. 방재원 KT클라우드 데이터센터 사업담당은 “클라우드 사업자, 제약·의료, 대학·연구기관 등 고성능 컴퓨팅을 필요로 하는 수요가 급증하고 있다”며 “이들은 비용보다 다운타임과 데이터 손실에 훨씬 민감하기 때문에 검증된 안정성이 곧 경쟁력”이라고 설명했다.
140kW까지 버티는 '부하기' 독자 개발
![허영만 KT클라우드 데이센터본부장(전무)이 11일 오전 서울 목동 'AI 이노베이션 센터' 개소식에서 환영사를 하고 있다. [사진=KT클라우드]](https://image.inews24.com/v1/d74e3cbc6dda21.jpg)
AI 이노베이션 센터는 'AI 스튜디오'(쇼룸)와 'AI 인프라 랩스'(실증공간)로 구성된다. 이곳에는 B200 GPU 서버, D2C(Direct-to-Chip) 냉각 시스템, 자체 개발 140kW급 부하기, RoCEv2 기반 AI 전용 네트워크가 24시간 가동 중이다. 센터 투어에서는 실제 작동 중인 4가지 핵심 기술을 직접 확인할 수 있었다.
D2C 액체냉각 시스템은 GPU 칩 위에 냉각판(콜드플레이트)을 밀착시켜 냉각수로 열을 직접 제거하는 방식으로, 공냉 대비 20~30% 전력을 절감한다. 현장에선 실제 B200 서버가 장착된 랙에서 냉각수가 순환하며 100kW가 넘는 부하를 35도로 안정적으로 유지하는 모습이 모니터를 통해 실시간 확인됐다.
KT클라우드가 독자 개발한 '수냉식 부하기'는 고가의 GPU 서버를 구매하지 않고도 동일한 발열 구조를 구현하는 장비다. 서버 한 대 수준의 열(8kW)을 재현해 여러 대를 조합하면 랙당 140kW까지 테스트할 수 있어 설계 검증 비용을 크게 줄인다.
RoCEv2(RDMA over Converged Ethernet v2) 기반 AI 전용 네트워크는 기존 인피니밴드 대비 비용 효율성과 확장성이 높아 차세대 AI 인프라 대안으로 평가된다. 현장에서는 실제 서버와 스위치 기반의 네트워크가 구동되며 생성형 AI 모델이 실시간 서비스되는 모습을 확인할 수 있었다.
자율주행 점검 로봇은 열화상·AI 카메라와 환경 센서를 기반으로 서버실을 순회하며 이상 징후를 자동 탐지한다. 열화상 카메라로 과열을 감지하고, AI 카메라로 서버 LED 상태를 점검한다. 온습도·조도·가스·소음 센서로 환경 데이터를 실시간 수집하며, 이상 징후 발견 시 자동으로 관제 시스템에 알림을 보낸다.
허 본부장은 "통상 데이터센터에 상주하는 인력이 60~70명 정도 되는데, 자율주행로봇을 통해 인력을 3분의1 수준까지 줄이고 업무 생산성을 크게 높일 수 있다"고 부연했다.
현장에는 AI 서버를 특수 액체에 직접 담가 열을 식히는 액침냉각(이머전쿨링) 기술의 실제 모형도 전시됐다. KT클라우드는 기술검증(PoC)을 통해 실제 부하 테스트를 진행한 결과, 최대 60%의 전력 절감 효과를 확인했다. 이 밖에도 디지털트윈 기반 자율 전력제어 '패스파인더', AI 예지정비 시스템 'DIMS 인사이트' 등 지능형 관제 솔루션이 시연됐다.
최지웅 KT클라우드 대표는 "AI 이노베이션 센터는 단순한 쇼룸이 아니라 차세대 데이터센터 기술을 실증하고 고객 가치 중심의 AI 인프라를 구현하기 위한 핵심 플랫폼”이라며 “데이터센터 기술 혁신의 새로운 기준을 제시하고, 국내 AI 생태계의 성장을 선도할 것”이라고 말했다.
/윤소진 기자(sojin@inews24.com)
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기