[아이뉴스24 박진영 기자] 인공지능(AI) 학습에 공개된 개인정보를 활용하려면 법적 근거가 보다 명확해야 한다는 지적이 나왔다. 현행 법에서는 별도로 규제를 하지 않지만 법적 모호함을 해소하기 위해서는 근거가 필요하다는 것이다.
한국지능정보사회진흥원(NIA)은 15일 오전 서울 중구 한진빌딩 신관 아카데미아실에서 '생성형 인공지능 규제 개선방향' 공개 세미나를 개최하고 이같이 밝혔다.
이날 '생성형 AI와 개인정보 이슈와 개선방안' 발제를 맡은 이일신 변호사(법무법인 광장)는 "국내 개인정보보호법상에서 공개된 데이터 활용에 대해선 별도로 규제하고 있진 않다"면서 "공개 데이터는 사회 통념 상으로 정보 활용 동의로 간주하고, 원론적으로는 AI 학습 데이터로 활용할 수 있다"고 밝혔다. 이어 "다만 AI 학습 데이터로 활용할 수 있는 지에 대해선 명확한 판단 사례가 부족해 모호한 부분이 있다"고 덧붙였다.
생성형 AI의 학습을 위해서는 양질의 데이터 확보가 관건인 만큼 데이터 확보 경쟁이 치열해지고 있다. 이 과정에서 크롤링 등을 통해 공개된 데이터를 수집·활용하는 경우가 많다. 문제는 개인정보가 포함된 데이터 활용과 관련해 각국에서 규제가 이뤄지고 있다는 것이다.
일례로 페이스북, 인스타그램 등 SNS 등에 올라온 얼굴 이미지를 동의없이 수집·가공하고, 데이터베이스를 구축해 활용한 '클리어 뷰 AI'에 대해선 호주, 캐나다, 프랑스, 이탈리아, 영국 등에서 과징금 부과 등 제재 처분을 내린 바 있다.
이와 관련해 이 변호사는 "여러 해외 규제당국은 공개된 사진의 AI 학습 데이터 활용이 EU GDPR 등 위반에 해당한다고 판단했는데, 이것이 모든 AI 학습 데이터 구축에 동일하게 적용되는 건 아니다"면서 "이 사례는 사진 데이터를 수집해 생체 인식 목적으로 활용된 경우"라고 설명했다.
실제로 이탈리아 등 해외 규제당국은 정당한 이익에 따른 AI 학습 데이터 활용은 인정하고 있다. 앞서 오픈AI의 챗GPT에서 개인정보 유출 사고가 발생하면서, 이탈리아에서는 챗GPT 접속을 제한했다. 이후 오픈AI가 알고리즘 훈련을 위한 개인정보 처리는 '정당한 이익'을 법적 근거로 처리할 것을 명시함에 따라 이탈리아는 챗GPT 접속 제한을 해제하기도 했다.
그는 개인식별이나 민감정보 처리를 전제하지 않는 범위에서 공개된 개인정보를 AI 학습데이터로 수집·확용하는 것이 가능하도록 규제기관의 적극적 해석이 필요하다고 강조했다. 공개 데이터에 한해 정보주체 동의 없이도 AI 학습 목적으로 활용할 수 있도록 입법이 이뤄져야 한다는 것이다.
이 변호사는 "최근 개인정보보호위원회가 영상정보의 경우 원본데이터를 AI 학습에 활용할 수 있도록 한 개인정보 안심구역 등을 마련했는데, 모든 AI 학습에 관해선 적용될 수 없다는 점에서 일반적 대안이 되기는 어렵다"면서 "공개된 정보에 한해선 AI 학습 목적으로 활용할 수 있도록 예외 규정 등을 명시한 입법 과정이 필요하다고 생각한다"고 밝혔다.
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기