[아이뉴스24 민혜정 기자] 네이버 뉴스 알고리즘 검토위원회가 알고리즘 등에 기반한 네이버 뉴스 서비스 자동화가 관리자 개입이 불가능한 구조라고 결론 내렸다. 네이버가 힘을 싣고 있는 자동 편집 방식이 공정성·신뢰성 회복에 효율적이라는 평가다.
뉴스 알고리즘 검토 위원회는 29일 서울 중구 프레스센터에서 발표회를 열고 지난 6개월여에 걸쳐 진행한 네이버 뉴스 알고리즘 검토 결과를 공개했다. 검토위는 네이버 뉴스 서비스를 ▲뉴스 검색(랭킹 알고리즘) 서비스 ▲인공지능에 기반한 AiRS 뉴스 추천(에어스, 개인 맞춤형 뉴스) 서비스 ▲연예 및 스포츠 뉴스 서비스로 구분했다.
검토위는 각 서비스에 대한 ▲데이터의 확보 과정 ▲실제 검색 결과를 결정하는 알고리즘과 그에 반영되는 자질(feature) ▲이용자에게 서비스가 실제로 공개되는 과정 ▲전체 과정에 대해 수립된 업무 절차의 적절성 등 을 검토했다.
검토 과정에서 검토위는 각 분야의 기술 프로세스에 대한 세부 내용을 파악할 수 있는 문서 와 학습 데이터 샘플 등에 대한 상세 내용을 네이버 측으로부터 공유 받았다. 검토 결과 검토위는 뉴스 검색 서비스 영역에서 명확한 가이드라인을 기반으로 품질평가 방향이 정립돼 있었으며, 앞으로도 계속 이러한 시스템을 정착시키는 것이 중요할 것이라고 평했다.
네이버 뉴스 랭킹 학습 알고리즘으로는 SVMRank가 사용되고 있으며, 다른 학습 알고 리즘을 사용하기에 적합하지 않아, 네이버가 알고리즘 교체보다는 더 좋은 자질의 발굴에 초점을 두고 검색 결과 개선을 위한 노력을 기울이는 것으로 파악됐다.
검토위는 뉴스검색 결과는 알고리즘을 통해 자동으로 배치되기 때문에 관리자의 개입은 원칙적으로 불가능한 구조라고도 설명했다. 뉴스검색 개발·운영·개선에 대한 의사 결정 이력이 모두 기록되고 있고, 이용 자 피드백을 수집하고 반영해 실제 이용자들의 검색 품질 만족도를 꾸준히 평가하고 있는 점을 확인했다고도 덧붙였다.
에어스 뉴스 추천 서비스 영역의 경우 검토위는 네이버가 편집자의 개입 없이 자동적으로 뉴 스 이용자들의 피드백 데이터를 수집해 학습 데이터를 확보하고 있다고 결론 내렸다.
검토위는 네이버가 협력필터 (Collaborative Filtering)와 품질모델(Quality Model)을 결합해 이용자의 기사 선호도와 기사 품질을 고려한 개인화된 추천 점수를 계산하는 알고리즘을 활용하고 있다고도 발표했다. 특히 이 과정에서 이용자의 기존 관심사와는 다른 분야의 기사도 함께 추천될 수 있도 록 함으로써 필터버블(Filter Bubbles, 확증편향) 문제를 최소화 하고 있다는 검토 의견을 말했다.
연예 및 스포츠 기사 추천 서비스에서는 일반 분야 뉴스 기사와는 수집되는 기사의 양과 형태, 뉴스 정보의 유효기간 등이 매우 다르다는 특징이 고려됐다. 해당 영역의 특성을 반영한 최신성과 기사 클릭 수치와 같은 피드백 정보를 바탕으로, 비 맞춤형 뉴스 추천 서비스를 제공하고 있는 것으로 조사됐다.
검토위는 연예 및 스포츠 기사가 앞선 두 서비스에 비해 데이터 기반의 기계 학습 이 아닌 규칙 기반의 알고리즘을 바탕으로 서비스가 운영되고 있는데 , 정형화된 특성이 존재하는 해당 영역의 특징을 반영한 것이라 분석했다.
다만 연예 및 스포츠 기사 추천 알 고리즘의 핵심 역할을 하는 자질이 현재로서는 체계적으로 적절히 활용되고 있으나 시간이 지남에 따라 효용성에 변화가 있을 수 있으므로, 자질에 대한 꾸준한 검증이 필요할 것이라 강조했다.
검토위는 "결론적으로 네이버의 뉴스 서비스 자동화는 공정성과 신뢰성 문제의 해결을 위한 효 율적인 대안"이라고 평가했다.
이밖에도 학습 데이터 구축 주기를 더욱 단축시키고 다양한 연령층을 포괄하며, 알고리즘 개선을 위한 연구개발에 힘쓸 것과 '좋은 기사'에 대한 공통 기준을 확립하고 기사 품질 평가 방법 을 개발해 주기적으로 실행하고, 그 결과를 문서화해 전체 서비스에 공유하는 업무 관리체계 를 갖출 것을 권고했다.
이같은 검증결과를 놓고 관리자 개입 없는 기계적 공정함이 능사인가에 대한 지적도 나왔다. 이를테면 A매체에서 단독 기사를 썼는데 A보다 늦게 이와 유사한 기사를 쓴 B매체 기사가 뉴스판이나 검색 결과 상위에 배치 된다면 문제가 된다는 지적이다.
김용찬 검토위 위원은 "이는 뉴스 알고리즘에 언론사 평판, 생산 전력 등을 얼마나 반영하냐인데 어려운 문제"라며 "네이버의 심도 있는 논의가 필요하다"고 말했다.
네이버가 투명한 뉴스 운영을 위해 알고리즘을 공개해야 하는지 여부도 관건이다. 알고리즘을 공개하면 투명성은 확보할 수 있지만 이는 기업 기밀이고, 어뷰징(반복 전송) 기사가 속출할 수 있어 우려하는 시각도 있다.
맹성현 위원장은 "구글도 알고리즘이 공개가 안되고 있는데 공개가 되는 순간 어뷰징에 악용될 수 있기 때문"이라며 "알고리즘은 기업 비밀 유지와 상충될 여지도 있어서 범위를 기업에서 결정해야 할 것"이라고 말했다.
한편 네이버 뉴스 알고리즘 검토위는 지난 5월 ▲컴퓨터 공학 ▲정보학 ▲커뮤니케이션 총 3개 분야의 맹성현 위원장(한국과학기술원 전산학부 교수)을 비롯한 전문가 11인으로 발족됐다.
민혜정기자 hye555@inews24.com
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기