IT·과학 산업 경제
정치 사회 문화·생활
전국 글로벌 연예·스포츠
오피니언 포토·영상 기획&시리즈
스페셜&이벤트 포럼 리포트 아이뉴스TV

짐 데이비스 SAS "데이터 분석, 관리방식 먼저 정립해야"

본문 글자 크기 설정
글자크기 설정 시 다른 기사의 본문도 동일하게 적용됩니다.

"'SAP 하나' 인메모리 기술과 고급 분석 결합…내년 6월 성과 공개"

[박계현기자] "기업들이 데이터를 효과적으로 활용하기 위해선 먼저 기업이 현재 처한 상황을 돌아보고 조직 내 누가 데이터를 다루는 적임자인지를 파악할 필요가 있다."

SAS 짐 데이비스 최고마케팅책임자(CMO, 부회장)은 최근 'SAS 프리미어 비즈니스 리더십 시리즈(PBLS, Premier Business Leadership Series)' 행사가 열린 미국 플로리다주 올랜도에서 기자와 만나 "데이터를 제대로 활용하기 위해선 단순히 소프트웨어, 하드웨어 관점이 아니라 기업 내 관리방식을 먼저 정립할 필요가 있다"고 말했다.

데이비스 부회장은 "기업 스스로 '데이터 퀄리티, 분석모델의 퀄리티를 다루는 적절한 절차가 있는가?', '조직 내에 분석을 제대로 이해하는 사람들이 있는가?', '데이터 분석을 적정한 때에 활용하고 결과를 신속하게 받아보고 있는가?', '조직 내 다수가 데이터에 대한 접근권한을 갖고 있는가?' 등의 질문을 던져보고 기업이 데이터를 어느 정도 취급할 수 있는 수준에 이르렀는지 파악하고 있어야 한다"고 조언했다.

데이터 분석과 관련한 기업들의 고민 중 하나는 내부에 전문가가 많지 않다는 점이다. SAS는 이 부분에 대한 해결책으로는 데이터시각화 솔루션인 '비주얼 애널리틱스' 제품과 일반 이용자도 하둡을 다룰 수 있는 데이터매니지먼트 툴 등을 내세우고 있다.

데이비스 부회장은 "데이터 규모에 따라 전문가, 일반인이 이용하는 인터페이스가 달라질 수 있지만 SAS는 다른 두 그룹 모두 빅데이터에 접근할 수 있도록 돕고 있다"며 "비주얼 애널리틱스를 통해 아이패드·데스크톱 등에서 빅데이터 분석이 가능할 뿐 아니라 이용자는 메뉴를 클릭하는 것만으로 전문가가 설계한 고급 분석 기능을 이용할 수 있다"고 설명했다.

그는 데이터 분석과 관련해 현재 기업들이 주목하는 분야로 사기행위 적발과 고객 정보 분석 등을 꼽았다. 이들 분야는 은행, 통신사 등 업종에 관계없이 관심을 갖는 분야로, 인메모리 기술을 활용하면 데이터 분석 속도를 획기적으로 높일 수 있다.

SAS는 지난 23일 SAP와 공동으로 'SAP 하나' 플랫폼과 SAS의 분석 기술을 활용해 다양한 공동 기술을 개발하고 향후 제품 로드맵을 공개하겠다고 밝힌 바 있다. 디스크가 아닌 메인 메모리에 모든 데이터를 저장하고 처리하는 방식인 인메모리 기술을 활용해 기업들의 주요 고민거리였던 분석 속도 문제를 해결하겠다는 것이다.

데이비스 부회장은 "빅데이터에 대해 얘기할 때 많은 사람들이 얘기하는 것은 빅데이터가 아니라 그저 큰 규모의 데이터를 의미하는 경우가 많다"며 "기존에는 1천200만 명의 고객 정보를 분석하는데 8~10시간 걸렸다면 인메모리 기술을 이용하면 수십초만에 처리하는 것도 가능하다"고 설명했다.

그는 또한 "결국 고객들이 겪고 있던 문제는 빅데이터가 아니라 빅컴퓨팅 이슈였고 기존 고객들이 겪던 문제의 90% 가까이도 해결할 수 있을 것"이라고 자신하며 "앞으로 'SAP 하나' 플랫폼 위에 고객 맞춤형 인텔리전스와 가격 최적화 솔루션을 구동시켜 더 큰 규모의 솔루션이 구동되도록 할 것"이라고 말했다. 이에 대한 성과 발표는 내년 6월께로 예정돼 있다.

◆ 다음은 짐 데이비스 부회장과의 일문일답.

-'SAS 프리미어 비즈니스 리더십 시리즈'에서 '데이터를 돈처럼 다루라'는 주제로 강연했다. 무슨 뜻인지 설명해 줄 수 있나.

데이터 관점에서 흥미로운 시기에 와 있다고 생각한다. 청중들에게 데이터를 의미있게 만들 수 있게 하기 위해 어떤 노력을 하고 있는지 질문을 던졌다. 데이터를 이용할 때 그저 사업 성과를 좀 더 효율적으로 내기 위해서 사용하고 있는지, 아니면 데이터를 그 자체로 새로운 시도를 해볼 수 있는 자산으로 보는지 나는 데이터가 새로운 상품을 만들어 내거나 새로운 비즈니스 기회를 창출할 수 있다고 믿는다.

이러한 기회에서 장애물이 되는 데는 어떤 것들이 있을까. 이는 단순히 소프트웨어, 하드웨어 관점의 문제가 아니다. 거버넌스 문제가 있다. 데이터 퀄리티, 분석모델의 퀄리티를 다루는 적절한 절차가 있는가? 조직 내에 분석을 제대로 이해하는 사람들이 있는가? 데이터 분석을 적정한 때에 활용하고 결과를 신속하게 받아보고 있는가? 조직 내 다수가 데이터에 대한 접근권한을 갖고 있는가?

나는 청중들에게 이러한 분석에 대한 성숙도를 평가 해 볼 수 있는 모델을 제시하고 스스로 어떤 카테고리에 속하는지 평가해 볼 수 있도록 했다. 이러한 모델을 스스로 평가해 봄에 따라 데이터 취급 숙련도나 업계 평균에서 어느 정도 위치에 있는지를 가늠해 볼 수 있다.

이러한 툴을 바탕으로 경영진은 '우리가 만족할만한 수준에 이르렀는가', '데이터 이용의 관점에서 우리 조직을 개선시킬 점은 없는가' '우리는 데이터 분석을 어떻게 활용할 것인가'를 자문해 볼 수 있게 된다.

우리는 모두 데이터에 대해 더 잘 알기를 원하지만 이유가 무엇이든간에 기업들은 이를 실제로 활용하지 못하는 경우가 많다. 여기에는 몇 단계의 진입레벨이 있는 것 같다. 기업은 데이터를 활용하는 방향으로 나아가고 싶어하지만 실제로는 진행이 되지 않는 경우가 많다.

-빅데이터가 계속 확장해 나가고 있는 건 맞나?

그렇다고 본다. 내가 얘기하고 싶었던 부분은 사람들이 빅데이터에 대해 얘기하면서도 정작 내가 무얼 하고 있는지에 대해선 객관적으로 보려고 하지 않는다는 것이다. 데이터 규모는 점차 커질 것이라고 본다. 사물인터넷의 관점에서 보면 현재 시장에는 200억 개의 IP 주소가 생성돼 있는데 2020년 경에는 500억~900억 개에 달할 것으로 전망되고 있다. 사방에서 데이터가 전송될 것이고 그렇게 되면 데이터환경이 현재와는 매우 달라질 것이다. 나의 키노트는 바꿔 얘기하면 '현재 범람하고 있는 데이터량이나 향후 더 증가할 데이터에 대해 준비가 돼 있냐'는 질문이기도 했다. 빅데이터는 명백한 추세다.

-SAS가 SAP 하나(HANA) 플랫폼과 협력할 것이라는 발표가 있었다. 그런데 그 전에 'SAP 하나는 단순한 BI 에 불과하다'고 말하지 않았나.

그랬다. SAS는 SAP와 수년간 협력해 왔다. SAS는 SAP보다 함께 기술을 개발해 나가는 고객사(Joint customer)를 많이 보유하고 있다. 동시에 SAS의 힘은 예측가능한 분석에 있기도 하다. SAP 하나의 운영 환경, 웨어하우스 인포메이션, 컴퓨팅 플랫폼, 데이터 등이 SAS의 분석 솔루션이 구동되는 환경으로 확장될 충분한 이유가 있는 셈이다.

SAS는 SAP 하나 환경에서 하이엔드급 분석 솔루션을 구동하는 것이 가능할 것으로 확신하고 있다. 하이엔드 분석을 하나 환경으로 가져가려고 한다. 이러한 형태의 협력이 가능한 것은 SAS의 하이엔드 분석 솔루션이 SAP에는 없는 부분이기 때문이다. 그래서 과거 내 발언을 철회하려고 한다. SAP 하나는 매우 빠르게 구동이 가능하도록 디자인돼 있다. 이런 환경에서 SAS 솔루션이 구동되는 것을 시도하지 않을 이유가 없다.

-SAP가 단순한 BI에 불과하다는 발언은 SAP 하나의 초기 성능이 핵심업무 영역에 사용하기에는 미흡했던 탓에 나온 것 아닌가. SAP 하나의 성능이 그 당시와 비교했을 때 개선됐나.

하나는 데이터 스테이징 영역과 인메모리 플랫폼이 결합된 기술이다. 그래서 하나를 들여다보면 그 다음엔 여기에 무엇을 붙여서 쓸 것인지를 생각해야 한다. SAP가 SAS와의 협업에서 제공하는 것은 하나 위에 올라가는 BI 확장성(Capability)이다. 이같은 협업은 기업에서 하나를 비즈니스 목적으로 활용하기 위해 필요한 것이다. SAS와 SAP와 협업은 모두 스테이징 영역과 관련이 있고 SAS의 분석 솔루션이 스테이징 영역에 속한다는 특성에는 변함이 없다.

다만 내가 그 같은 말을 했을 당시에는 처음 나온 대부분의 기술이 그렇듯 하나 역시 충분히 완성된 기술은 아니었다. 이젠 하나는 완성된 기술이고 SAP 측에선 하나 이용자들이 분석 환경을 구축할 수 있도록 기술적인 확장을 해나가고 싶어한다. 이러한 점은 SAS가 원하는 것이기도 하다. 좋은 협업 관계가 형성되리라 본다.

-그렇다면 SAP 하나가 충분히 성숙한 기술이고 시장에서 확장성 또한 증명했다고 볼 수 있는 건가?

SAP는 자연스럽게 확장성을 증명했다고 본다. 우리는 시장의 수용성에 주목했다. 하나로 지칭되는 스테이징 환경은 그간 SAP 하나가 설치된 기반을 봤을 때 시장 수용성을 확보했다. SAP 하나는 두세 사람이 이끌어 가는 기술이 아니고 SAP는 하나에 진지하게 접근하고 있고 많은 투자를 할 것으로 보인다. 이런 측면에서 SAP 하나는 이미 성숙한 기술이고 이러한 점을 고려해 협업을 결정한 것이다.

-SAP와의 협업을 낙관하고 있나.

매우 그렇다. SAS, SAP 직원들로 구성된 두 그룹의 팀이 각각 미국 노스캐롤라이나주(SAS 본사 소재지)와 독일 월도프(SAP 본사 소재지)를 오가면서 수개월간 함께 작업을 해왔다. 협업이 잘 이뤄질 경우에는 지난주 라스베가스에서 열린 SAP 테크에드(TechEd) 행사에서 발표하기를 원했는데 결과가 무척 좋아서 발표할 수 있었다.

SAS의 분석모델을 SAP 하나의 워킹 환경에 집어넣어 SAS 모델이 하나 내에서 작동이 된다. 여기까지가 우리가 작업한 내용이고 SAS 솔루션과 SAP 하나가 함께 작동할 수 있다는 것을 알았으니 앞으로는 고객 맞춤형 인텔리전스나 가격 최적화 솔루션을 구동시키고 더 큰 규모의 솔루션이 구동될 수 있도록 하려고 한다. 내년 6월쯤 이에 대한 성과를 발표할 예정이다.

-하둡 툴을 포함한 데이터 매니지먼트도 함께 발표했다. 빅데이터가 특정 전문가들이 아닌 일반인들도 다룰 수 있는 영역이 될 것이라고 보는가.

SAS는 SAP 하나와의 협업 뿐 아니라 클라우데라, 호튼웍스 등 하둡 진영과도 협력해 나가고 있다. 이런 협업과 함께 데이터시각화 솔루션인 '비주얼 애널리틱스'도 지원하고 있다. 이 제품은 데스크톱에서도 구동될 뿐 아니라 통계학 박사학위나 게임 프로그래머 같은 프로그래밍 지식이 없어도 분석을 할 수 있다.

일례로 아이패드를 사용하든 데스크톱을 사용하든 '비주얼 애널리틱스'는 빅데이터에 연결이 되지만 이용자들은 그 사실을 알아차리지 못한다. 메모리에서 구동되는 시간이 무척 빨라서 분석 대상 데이터가 수천만, 수십억 건이나 된다는 것을 체감할 수 없다.

또 이 제품에는 판매량 예측과 같은 고급 분석기능도 들어간다. 판매량 예측을 원하는 이용자가 메뉴를 클릭하면 프로그램은 6가지 다른 방법으로 이를 분석한 뒤 가장 정교한 예측치를 이용자에게 전달한다. 우리는 통계학 박사들이 설계한 모델을 적용해 이러한 인터페이스를 일반인들이 이용할 수 있도록 구성했다. 데이터 규모에 따라 전문가, 일반인이 이용하는 인터페이스가 달라질 수 있지만 SAS는 두 다른 그룹 모두 빅데이터에 접근할 수 있도록 돕고 있다.

-호튼웍스, 클라우데라 등 하둡 진영과 협업하고 있다. SAS가 오픈소스 커뮤니티를 위해 공헌하는 측면은 없나.

간접적으로만 있다. SAS가 오픈소스 커뮤니티와 공동으로 진행하고 있는 프로젝트가 있는지는 내가 모르는 부분이다. 다만 SAS 플랫폼을 통해 클라우데라, 호튼웍스 등의 하둡 환경에 접근할 수 있도록 하고 있다. 하둡 클러스터 내에서 SAS 솔루션이 구동될 수 있는 등 통합 환경이 제공되고 있다. 오라클 DB 툴, 테라데이타 등과 같은 수준의 통합성을 갖췄다.

하둡은 단순한 스토리지 스트럭처로 분석 기능을 제공하지 않지만 경제적으로 데이터를 저장하고 복제할 수 있기 때문에 하둡 클러스터의 데이터를 메모리로 가져와 분석 솔루션에서 구동시키는데 활용하고 있다.

-짐 굿나잇 SAS 회장이 키노트를 통해 '사람들이 얘기하는 빅데이터가 진정한 의미의 빅데이터가 아니다'라고 얘기했는데 이게 무슨 뜻인가.

빅데이터에 대해 얘기할 때 많은 사람들이 얘기하는 것은 빅데이터가 아니라 그저 큰 규모의 데이터를 의미하는 경우가 많다. 소셜네트워크에서 수집되는 데이터나 영상데이터, 제조업 공정에서 전송되는 센서 데이터 등은 빅데이터가 될 수 있을지 몰라도 그저 2천만명의 고객 정보를 처리하는 데이터를 빅데이터라고 부를 수는 없다. 이 작업은 빅데이터라기 보다는 대규모 분석에 가깝다.

기존에는 1천200만 명의 고객 정보를 분석하는데 8시간에서 10시간 걸렸다면 인메모리 기술을 이용하면 수십초만에 처리하는 것도 가능하다. 이 기술은 기존 고객들이 겪던 문제의 90% 가까이를 해결할 수가 있었다. 결국 고객들이 겪고 있던 문제는 빅데이터가 아니라 빅컴퓨팅 이슈였던 셈이다.

-현재 SAS 제품을 이용하는 기업들이 가장 고민하고 있는 문제는 뭐라고 생각하나. 또 관심을 갖고 있는 기술 적용분야는 어디인가.

굉장히 다양한 고민거리가 있지만 그 중 다수는 하둡을 어떻게 사용할지 고민하고 있고 또 어떻게 하면 분석결과를 신속하게 받아볼 수 있을지를 고민하고 있다. 의사결정을 할 때 참고할 수 있는 데이터를 가능한 빨리 받아보기를 원한다. 또 다수가 조직 내 전문성이나 기술부족이라는 문제를 겪고 있다. 데이터를 활용하기를 원하지만 조직 내에서 분석루틴을 알고 있는 사람은 많지 않다.

현재 기업들이 주목하고 있는 분야는 사기행위 적발과 고객 정보와 관련된 분석이다. 이 분야들은 은행, 통신사 등 업종에 관계없이 주목하고 있다.

박계현기자 kopila@inews24.com




주요뉴스


공유하기

주소가 복사되었습니다.
원하는 곳에 붙여넣기 해주세요.
alert

댓글 쓰기 제목 짐 데이비스 SAS "데이터 분석, 관리방식 먼저 정립해야"

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중
댓글 바로가기


뉴스톡톡 인기 댓글을 확인해보세요.



TIMELINE