개인정보 논란 끝? …비식별 정보, 재식별 대회 열린다
2018.09.30 오후 12:01
내달 예·본선 통해 개인정보 비식별·재식별 기술 검토
[아이뉴스24 성지은 기자] 안전한 개인정보 활용은 가능할까.

한국인터넷진흥원(KISA)이 이 질문에 해답을 얻고 사회적 합의를 도출하기 위해 오는 11월 '개인정보 비식별 기술 경진대회'를 개최한다고 30일 밝혔다.

오용석 KISA 개인정보비식별지원센터장은 "당사자를 특정할 수 없게 개인정보 비식별 조치를 해도 재식별될 수 있다는 우려가 크다"며 "우려를 해소하고 사회적 합의를 도출할 방법을 고민하다 대회를 구상하게 됐다"고 말했다.

국내에서는 개인정보 비식별 조치를 둘러싼 대립이 지속되고 있다. 산업계에서는 비식별 조치를 통해 개인정보가 포함된 데이터의 활용도가 높아질 것으로 기대하나, 시민단체에서는 데이터 재조합 등으로 개인정보가 재식별될 가능성을 우려해 반대하고 있다.





이에 11월 열리는 대회에서는 개인정보 비식별과 재식별 가능성을 검토한다. 일본 메이지대학은 2015년부터 비식별 기술 경진대회 '퍼스널 워크숍 컵(PWS Cup)'을 개최하고 있는데 이를 벤치마킹했다.

앞서 4인 이하로 구성된 18개 팀이 참가 신청을 완료했으며, 예선(1~2일)에서 비식별 조치를, 본선(29~30일)에서 재식별 작업을 하고 기술력을 겨룬다.


각 팀에는 데이터 집합 100만개가 주어진다. 하나의 데이터 집합에는 이름·성별·나이 등 개인정보부터 통신사·신용등급·카드한도 등 금융·통신정보까지 총 15개 정보가 포함됐다. 이 데이터는 통계청 자료 등을 참고해 무작위로 생성된 가짜 정보다.

◆예선 비식별·본선 재식별 겨뤄…데이터 활용 '쑥'

먼저 예선에서 각 팀은 데이터 집합 100만개에서 특정인을 식별할 수 없게 개인정보를 익명·가공하는 비식별 조치를 취한다. KISA는 당일 개인정보가 포함된 금융 데이터의 상관관계를 조사하는 시나리오 기반의 문제를 출제할 예정이다.

각 팀은 다양한 방식의 비식별 조치 기법(K-익명성, L-다양성, T-유사성 등) 가운데 특정 기법을 선택한 이유와 방법 등을 발표하며, 평가위원들이 안정성과 유용성을 기준으로 결과물을 평가한다.

다만 오 센터장은 "충분하지 않은 비식별 조치로 안전성이 담보되지 않을 시엔 탈락한다"며 안전성을 강조했다.

예선을 통과한 팀은 본선에서 비식별 조치된 데이터를 개인정보로 식별할 수 있게 복원하는 재식별 작업을 한다. 각 팀은 재식별 조치한 추정 결과물을 제출하고 재식별 방법 등을 함께 발표하며, 이를 기준으로 평가받는다.



KISA는 예선 점수와 본선 점수를 합산한 최종 점수에 따라 3개 우수팀을 선발, 올해 말 열리는 '개인정보보호의 밤' 행사와 연계해 상장과 상금 총 600만원을 수여할 예정이다.

정현철 KISA 개인정보보호본부장은 "올해 처음 대회를 개최하기 때문에 100% 안전하다고 말할 수는 없지만, (개인정보 활용을) 안전하게 만들어가는 과정으로 이해해줬으면 한다"고 말했다.

아울러 KISA는 개인정보비식별지원센터를 정책기술 전문 연구조직으로 확대하고 기술 개선과 제도 보완을 이어갈 방침이다. 향후 개인정보 비식별 조치 데이터 활용이 급증할 것으로 전망되는 가운데, 이에 사용되는 여러 기술을 발전시키고 개인정보 재식별을 막는 제도적 보완장치를 마련한단 목표다.

또한 개개인이 스스로 개인정보를 관리하고 이를 기업에 판매한 뒤 보상을 얻는 '개인 데이터 스토어(PDS)' 사업에 블록체인을 접목, 기업의 데이터 사용 이력을 추적하고 신뢰를 제고하는 방안도 구상 중이다. 연 1억2천만여건씩 수집하는 스팸 데이터는 산·학·연에 개방해 연구개발을 지원하고, 자체 데이터를 확대 개방할 방침이다.

/성지은기자 buildcastle@inews24.com