IT·과학 산업 경제
정치 사회 문화·생활
전국 글로벌 연예·스포츠
오피니언 포토·영상 기획&시리즈
스페셜&이벤트 포럼 리포트 아이뉴스TV

[IT돋보기] CCTV 개인정보 피한 정부 AI 가상데이터…업계, 정확도 '갸웃'

본문 글자 크기 설정
글자크기 설정 시 다른 기사의 본문도 동일하게 적용됩니다.

"개인정보 보호, 비식별 등 조치한 실제 영상 데이터 필요"

쏟아지는 정보통신기술(ICT) 현안을 잠시 멈춰 서서 좀 더 깊숙히 들여다봅니다. 'IT돋보기'를 통해 멈춘 걸음만큼 보다 심층적으로 분석하되, 알기 쉽게 풀어쓰겠습니다. [편집자주]

[아이뉴스24 최은정 기자] 정부가 민간에 개방하는 인공지능(AI) 학습 데이터를 두고 지능형 CCTV 등 일부 업계가 데이터 실효성에 의문을 제기하고 있다. 범죄 예방에 필요한 영상 학습 데이터들이 가상 시나리오를 기반으로 만들어졌다는 이유에서다.

과학기술정보통신부는 지난 18일부터 음성·자연어, 헬스케어, 자율주행 등 부문의 170개 종류 AI 학습 데이터를 'AI 허브'에 순차적으로 공개하고 있다. 여기에는 음성, 이미지뿐 아니라 영상 관련 33개 종류 데이터도 포함돼 있다.

이중 이달 말 공개될 '안전' 분야의 위험·이상 행동 등 영상은 배우들이 시나리오를 기반으로 연기한 모습을 녹화한 것이다. 업체들은 실제 상황을 촬영한 동영상에 비해 해당 영상은 AI 학습 효과가 미흡할 것으로 봤다.

 [사진=아이뉴스24]
[사진=아이뉴스24]

20일 AI 기반 CCTV 서비스를 연구중인 한 업체 관계자는 "시간이 다소 오래 걸리더라도 개인정보 보호, 비식별화 등 조치를 거친 실제 영상 데이터를 활용하는 것이 (AI 학습에) 더욱 효과적"이라며 "등장인물이 연기하는 영상은 사실상 도움이 되기 힘들다"고 주장했다.

기업 입장에서 실제 범죄 현장이 담긴 영상을 확보하기란 쉽지 않다. 확보했다고 하더라도 AI 학습 시 모든 등장인물의 얼굴은 가려야 하고, 신체 전체를 변경하는 비식별 조치 등을 거쳐야 한다. 또 인물들로부터 해당 영상 사용에 대한 동의를 얻어야 한다. 시간과 비용 등 부담이 큰 상황. 이 관계자는 "다소 아쉽다"는 입장을 나타냈다.

다만 기업들은 AI 학습에 필요한 데이터 종류와 양 자체가 늘었다는 점은 긍정적이라는 데에 입을 모았다.

이 관계자는 "실제가 아닌 가상의 데이터이나 절대적인 학습 데이터 양과 종류가 늘었다는 점은 의미가 있다"고 말했다.

한 포털업계 관계자는 "가상으로 제작된 데이터라 하더라도 데이터 자체의 품질과 양이 어느 수준 이상이면 사전 훈련용으로 가치가 있다"며 "또 해당 데이터를 재가공하면 충분히 실제 서비스를 위한 AI 모델 개발에 유용하게 활용될 수 있다"고 했다.

/최은정 기자(ejc@inews24.com)



공유하기

주소가 복사되었습니다.
원하는 곳에 붙여넣기 해주세요.

alert

댓글 쓰기 제목 [IT돋보기] CCTV 개인정보 피한 정부 AI 가상데이터…업계, 정확도 '갸웃'

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중
댓글 바로가기