[아이뉴스24 김문기기자] 엔비디아가 고성능 컴퓨팅과 인공지능에 대응하는 새로운 GPU 아키텍처를 공개했다.
지난 10일(현지시간)GPU 테크놀로지 컨퍼런스(GTC) 2017 기조연설에 나선 젠슨 황 엔비디아 CEO는 인공지능 및 고성능 컴퓨팅 발전에 대응하는 GPU 컴퓨팅 아키텍처 볼타(Volta)를 발표했다.
기조연설에서는 볼타 기반 첫 프로세서 엔비디아 테슬라 V100 데이터센터 GPU도 함께 발표됐다. 테슬라 V100 데이터센터 GPU는 인공지능 추론 및 트레이닝에서 요구되는 탁월한 속도와 확장성을 지원한다.
젠슨 황 CEO는 "학습이 가능한 컴퓨터 소프트웨어를 구축하는 혁신적인 인공지능 접근법인 딥 러닝은 무한대의 프로세싱 파워를 요구한다. 이러한 수요에 대응하기 위해 수천 명의 엔비디아 엔지니어들이 지난 3여년 간 볼타 개발에 매진해왔으며, 삶을 변화시키는 인공지능의 잠재력에 대한 업계의 인식을 제고시켜왔다"고 말했다.
엔비디아의 7세대 GPU 아키텍처인 볼타는 210억개 트랜지스터로 구축됐다. CPU 100대와 같은 수준의 성능으로 딥 러닝을 구현한다는 게 엔비디아 측의 설명이다.
볼타의 테라플롭 피크 성능은 엔비디아 전 세대 GPU 아키텍처 파스칼(Pascal) 대비 5배, 2년 전 출시된 맥스웰(Maxwell) 아키텍처 대비 15배 향상됐다.
볼타는 고성능 컴퓨팅 시스템을 위해 연산 과학 및 데이터 과학에 최적화된 플랫폼을 제공한다. 쿠다(CUDA) 코어와 새로운 볼타 텐서 코어(Volta Tensor Core)를 통합 아키텍처에 결합시킴으로써, 테슬라 V100 GPU를 탑재한 1대의 서버는 기존 고성능 컴퓨팅에 필요한 수백 개의 일반 CPU를 대체할 수 있다.
테슬라 V100 GPU는 640개의 텐서 코어를 장착했다. CPU 100개의 성능에 준하는 120 테라플롭 딥 러닝 성능을 구현한다. 인공지능 워크로드를 가속화기 위해 고안됐다. 텐서 코어(Tensor Core)는 210억개 이상의 트랜지스터로 구성됐다.
차세대 NVLink는 CPU와 GPU, 또는 GPU 간의 초고속 연결을 지원하는 차세대 인터커넥트다. 이전 세대 대비 최대 2배 가량의 성능을 제공한다. 이전 세대 GPU에 비해 50% 향상된 메모리 대역폭을 제공한다.
한편, 엔비디아는 볼타 아키텍처 기반 인공지능 개인용 ‘DGX AI 슈퍼컴퓨터’도 공개했다.
볼타 아키텍처 기반의 엔비디아 테슬라 V100 데이터센터GPU와 인공지능 소프트웨어 패키지로 구성됐다. 이전 세대 DGX와 비교해 3배 가량 빠르다. 최대 CPU 800개의 성능을 단일 시스템 형태로 제공한다.
DGX 포트폴리오는 데이터센터에 적용되는 엔비디아 DGX-1 인공지능 슈퍼컴퓨터와 새로운 개인용 슈퍼컴퓨팅 워크스테이션인 엔비디아 DGX 스테이션으로 구성됐다.
두 시스템 모두 새롭게 출시 된 엔비디아 GPU 클라우드(NVIDIA GPU Cloud)를 통해 제공되는 통합형 엔비디아 GPU클라우드 딥 러닝 스택(NVIDIA GPU Cloud Deep Learning Stack)을 활용한다.
짐 맥휴(Jim McHugh) 엔비디아 DGX 컴퓨팅 담당 제너럴 매니저는 "엔비디아의 DGX 포트폴리오와 소프트웨어는 중대한 인공지능 연구 작업을 발전시키고, 새로운 컴퓨팅의 시대가 제시하는 가능성을 실현하는데 있어 핵심적인 수단들"이라며 "인공지능 및 고급 분석 분야를 위한 성능 구현에 있어 타의 추종을 불허한다"고 말했다.
김문기기자 moon@inews24.com
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기