[아이뉴스24 정유림 기자] 김병학 카카오 카나나알파 성과리더는 23일 회사의 통합 인공지능(AI) 브랜드 '카나나'를 토대로 구성한 AI 모델 라인업 10종을 공개했다. 김 리더는 "서비스에 최적화한, 효율적인 모델이라는 강점을 바탕으로 AI 모델의 활용도를 높일 것"이라고 밝혔다.
이날 경기도 용인시 카카오 AI 캠퍼스에서 열린 '이프카카오 2024'에서 김 리더는 회사의 AI 모델을 소개했다. 카카오의 AI 모델은 '카나나'라는 브랜드 아래 언어모델(LLM) 3종(△플래그 △에센스 △나노)과 멀티모달 언어모델(MLLM) 3종(△카나나-오 △카나나-브이 △카나나-에이), 비주얼 생성모델 2종(△칼리지 △키네마)과 음성모델 2종(△카브 △카스트)으로 전체 라인업을 구성했다.
전 세계적으로 압도적인 규모의 AI 모델 개발을 위한 기술 경쟁이 이어져 온 가운데, 김 리더는 카카오의 AI 모델이 효율성을 갖췄다는 점을 역설했다. 김 리더는 "(카카오의 AI 모델은) 한국어(한글) 처리에 있어 성능이 높다는 점, 신뢰할 수 있는 데이터를 통해 학습했으며 서비스 최적화에 맞춘 비용 효율적인 모델이라는 것이 주요 특징"이라고 설명했다.
김 리더는 언어모델 3종 중 중소형 규모의 AI 모델인 '카나나 에센스'를 사례로 제시하며 "유사한 규모의 다른 AI 모델과의 성능 비교에서 유사하거나 더 높은 성능을 보이는 것으로 나타났다"며 "한국어 논리와 추론을 평가하는 한국판 AI 성능 평가 체계(KMMLU) 등의 지표에서도 다른 AI 모델과 비교해 우위를 보였다"고 강조했다.
글(텍스트) 외에 이미지나 음성 등 다양한 형태의 데이터를 동시에 처리하는 멀티모달 언어모델 3종 중 여러 데이터를 통합적으로 처리하는 '카나나-오' 모델에 대해 김 리더는 "다양한 형태의 데이터를 동시에 이해해 빠르게 결과를 생성한다"며 "결과물로 글(텍스트)과 음성(오디오)을 함께 생성하며 어떤 질문을 하던 평균 1.6초의 속도로 빠르게 답변을 한다"고 설명했다.
이미지와 영상을 결과물로 만드는 비주얼 생성 모델에 대해서도 소개했다. 김 리더는 "동영상 생성모델인 '키네마'의 경우 글(텍스트) 입력부터 이미지, 개인 프로필 사진까지 다양한 입력을 처리하는 형태로 개발 중"이라며 "입력된 이미지를 바탕으로 단순히 영상을 생성하는 것을 넘어 간단한 마우스 조작 만으로 카메라와 캐릭터의 움직임을 쉽게 제어할 수 있게 되고 이를 통해 풍부하고 다채로운 비디오 콘텐츠를 제작할 수 있을 것"이라고 했다.
김 리더는 "카카오는 AGI(인공일반지능)를 향한 글로벌 기업과의 경쟁에서 도전을 이어가고 있다"며 "AI 생태계 조성 등에 기여할 수 있는 기반 마련을 위해 다양한 AI 모델을 개발해 왔다"고 했다. 그러면서 "기술의 가치는 실용적인 서비스로 구현돼 실질적인 가치를 제공해야 비로소 빛을 발한다고 생각한다"며 "카카오의 AI 모델을 서비스에 적용하는 것을 넘어 직원들의 생산성 향상도 도모할 수 있는 기반으로 확대되도록 할 것"이라고 밝혔다.
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기