IT·과학 산업 경제
정치 사회 문화·생활
전국 글로벌 연예·스포츠
오피니언 포토·영상 기획&시리즈
스페셜&이벤트 포럼 리포트 아이뉴스TV

네이버 "빅데이터? 재가공과 활용이 더 중요"

본문 글자 크기 설정
글자크기 설정 시 다른 기사의 본문도 동일하게 적용됩니다.

빅데이터 리터러시 콘퍼런스 개최…"데이터, 기술자 전유물 아냐"

[성상훈기자] "나에게 필요한 데이터를 제외한 데이터는 모두 쓰레기 입니다. 데이터를 어떻게 가공하고 활용할 것인가가 중요한 것이죠. 수요는 공급의 어머니입니다."

윤영찬 네이버 부사장은 7일 경기도 성남 네이버 그린팩토리 본사에서 열린 '데이터 리터러시 콘퍼런스 2016' 오프닝 스피치를 통해 이같이 강조했다.

윤 부사장은 "빅데이터 라는 단어 그대로의 의미보다 데이터를 활용하고 쓸 줄 아는 능력인 '데이터 리터러시'를 기르는 것이 더 중요하다는 의미"라며 "빅데이터라는 것은 공급의 문제가 아니라 수요에 방점이 있다. 여러분이 빅데이터 생태계를 열어가는 주인공인 것"이라고 역설했다.

네이버의 데이터를 살펴보면 1초에 7천400개의 검색 쿼리 데이터가 쌓이고 있고 1초당 2천707개의 이메일 전송이 이뤄진다. 매초마다 등록되는 이미지 데이터도 427개에 달한다.

네이버는 이처럼 수시로 형성되는 데이터를 포함해 실시간 댓글, 데모그라피, 블로그나 카페 방문자수 변화 추이 등 수많은 데이터를 실시간으로 유입해 새로운 데이터로 재가공하고 있다. 이를 기반으로 스스로에게 유용한 데이터로 활용하고 쓰는 것은 사용자들의 몫이라는 것.

윤 부사장은 "원유는 유전에 구멍을 잘 뚫으면 기름이 쏟아지고 이를 활용해서 많은 사람들에게 혜택을 주는 원천소스"라며 "데이터도 원유에 비유할 수 있지만 직접 사용하고 융합할 수 있는 리터러시 능력을 키우고 활용해야 온전한 빅데이터 생태계가 만들어 질 수 있다"고 덧붙였다.

부가 데이터는 누군가에게 꼭 필요한 정보로 활용되기도 한다.

예를 들어 포털에서 가로수길 맛집 검색으로 특정 매장을 클릭했다면 사용자들에게는 단순히 레스토랑 정보를 수집하는 것이지만 레스토랑 주인은 시간대별, 요일별 인기 검색 수치를 통해 특정 날짜, 특정 시간대, 특정 연령대가 주로 매장을 검색해 본다는 것을 인식하게 된다.

여기에 대한 데이터를 스스로 활용할 수 있다면 주요 고객으로 모셔야할 타겟층과 마케팅 전략을 만들수도 있다.

네이버는 이를 위해 올해 초 '데이터랩'을 오픈한 바 있으며 데이터랩을 통해 빅데이터 활성화를 위한 기반 플랫폼을 구축하고 지역별 관심도, 쇼핑검색어 데이터 등이 포함된 '검색어 트랜드 조회 서비스'를 제공하고 있다.

많은 소상공인과 기업들은 데이터랩을 통해 비즈니스 인사이트를 얻기도 한다. 가장 많이 검색된 '검색어'를 통해 현업의 흐름과 트렌드를 알 수 있기 때문이다.

김원용 네이버 데이터랩 이사는 "데이터랩을 통해 향후 성별, 연령별 검색 데이터 흐름에 대한 결과를 제공하는 것도 검토중에 있다"며 "검색어 트렌드 뿐만 아니라 검색어를 통해 본 글로 사용자의 생각을 분석하는 서비스도 고민하고 있다"고 전했다.

◆데이터, 삶의 패턴을 바꾸다

데이터를 활용한 비즈니스도 인공지능 시대를 맞이하면서 급변하고 있다. 네이버가 출시한 인공지능 번역 서비스 '파파고'와 인공지능 음성대화 개발 툴 '아미카'도 그중 하나다.

SK텔레콤의 '누구' 처럼 인공지능이 도입된 음성 대화 스피커가 등장하는가 하면 AI봇을 활용한 상담 컨설팅 시스템을 기업들이 속속 도입하고 있다.

최근 서울대학교 이준환 교수 연구팀이 개발한 'AI 뉴스로봇'도 비슷한 사례라 할 수 있다. 이 뉴스 로봇은 경기 결과값에 대한 데이터와 알고리즘을 조합해 야구 시합이 종료되면 0.5초만에 기사를 트위터와 페이스북에 게재한다.

일반인의 80%가 사람이 쓴 것인지 기계가 쓴 것인지 구분하지 못할 정도로 기사 자체도 정교하다.

인공지능과 데이터가 만나면서 기존의 인과적 데이터에 그치지 않고 상관관계와 연관된 새로운 서비스로 거듭나기도 한다. 아마존의 도서 추천 서비스나 넷플릭스의 영화 추천 서비스가 대표적인 예다. 이같은 데이터 기반 서비스를 통해 사람들의 삶의 패턴은 빠르게 변화하고 있다.

다만 많은 기업들이 빅데이터를 마케팅 용어로 사용하고 있지만 대부분 데이터 규모나 비정형성과는 무관하다는 점을 유의해야 한다는 지적도 있다.

구본권 한겨레 부설 사람과디지털연구소장은 "데이터 중심 사회에서 데이터 구조를 모르면 살아갈 수 없다"며 "인공지능 시대는 사람과 기계가 각자 할일을 구분해야 하는데 이를 위해서는 데이터가 어떤 속성을 갖고 있고 어떤 구조로 돼있는지 파악할 수 있어야 한다"고 강조했다.

모든 데이터의 흐름이 빅데이터라는 단어 하나로 포장되면 데이터의 속성과 구조에 대한 이해를 하는데 방해가 된다는 의미다.

구 소장은 "데이터의 속성을 알아야 인공지능, 자동화 시대에 대비할 수 있다"며 "이제는 데이터가 기술자들만의 영역이 아니라 모든 이들의 필수적인 능력으로 요구되고 있다"고 전했다.

성상훈기자 hnsh@inews24.com



공유하기

주소가 복사되었습니다.
원하는 곳에 붙여넣기 해주세요.

alert

댓글 쓰기 제목 네이버 "빅데이터? 재가공과 활용이 더 중요"

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중
댓글 바로가기