[김국배기자] 국내 소프트웨어(SW) 기업이 인공지능(AI) 산업 발전을 위해 80억 건 가량의 자사 데이터를 개방하기로 해 눈길을 끌고 있다.
솔트룩스가 지난 20년간 축적해온 80억 건의 데이터를 단계적으로 개방한다고 19일 발표했다.
이번에 개방되는 데이터는 공개 데이터와 소셜 데이터 뿐 아니라 방대한 언어 자원과 지식 베이스를 포함할 예정으로 아시아 최대 규모라는 게 회사 측 설명이다.
인공지능 기술 구현을 위한 알고리즘이 로켓이라면 데이터는 로켓의 연료에 비유된다.
최근 AI 붐이 일면서 강력한 알고리즘들은 오픈소스(공개SW)로 개방되고 있지만 실용적인 AI 시스템 구현을 위한 필수적인 데이터를 확보하긴 어려운 실정.
특히 기계학습과 딥러닝을 위한 고품질 데이터 구축을 위해선 막대한 비용과 오랜 투자 기간이 필요해 국내 스타트업이나 중소 기업에는 고충이 되고 있다.
솔트룩스는 AI 원천기술 개발을 위해 20년간 데이터를 자체 구축하고 외부 지식을 수집, 정제하기 위해 노력해온 결과, 주요 산업별 공개 데이터와 통계 지표, 소셜 빅데이터, 다국어 언어자원 등 80억 건 이상의 정제된 데이터를 확보한 상태다.
솔트룩스는 오는 11월 데이터 포털과 이를 활용하기 위한 오픈 애플리케이션프로그래밍인터페이스(API)를 개방할 예정이다. 이를 통해 여러 전문 기업과 파트너십을 체결하고 공통 경쟁력을 조기 확보할 수 있을 것으로 기대하고 있다.
이경일 솔트룩스 대표는 "자사의 핵심 자산인 데이터 개방을 결정하기까지 많은 고민이 있었고 용기도 필요했다"며 "우리는 이번 결정을 통해 더 늦기 전에 해외 선도기업과 경쟁할 수 있는 국내 인공지능 생태계가 마련될 수 있기를 기대한다"고 말했다.
이어 "실력 있는 국내 스타트업과 협력해 해외 진출 및 세계적 기업으로 도약하기 위한 교두보를 마련하고 미래 지능정보 사회 구현에 기여할 수 있도록 노력하겠다"고 덧붙였다.
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기