IT·과학 산업 경제
정치 사회 문화·생활
전국 글로벌 연예·스포츠
오피니언 포토·영상 기획&시리즈
스페셜&이벤트 포럼 리포트 아이뉴스TV

네이버 개입? 알고리즘 편향?...뉴스 알고리즘 논란 쟁점 살펴보니

본문 글자 크기 설정
글자크기 설정 시 다른 기사의 본문도 동일하게 적용됩니다.

여당, 알고리즘에 인위적 개입, 기사 배치 순서에 영향 미쳤다는 의혹 제기
네이버 "특정 요소가 검색 결과 바꾸지 않아…외부 검증 지속 받아와"

[아이뉴스24 정유림 기자] 뉴스 검색 알고리즘을 둘러싼 정치권의 네이버 공격은 정당한 문제 제기일까. 여당을 중심으로 이어지는 뉴스 알고리즘 공세는 '네이버의 부당한 개입'을 전제로 하고 있다. 이에 대해 네이버는 "전혀 사실이 아니라"며 외부의 알고리즘 검증 결과를 근거로 내세우고 있다.

일각에서는 총선을 앞두고 여권의 '포털 길들이기'라는 비판도 있지만 방송통신위원회의 조사 결과에 따라 네이버 뉴스 알고리즘 문제는 어디로 불똥이 튈지 예단하기 어렵다. 여당이 제기하는 의혹, 이에 대한 네이버의 해명을 토대로 논란의 쟁점을 짚어봤다.

네이버 사옥 전경 [사진=아이뉴스24 DB]
네이버 사옥 전경 [사진=아이뉴스24 DB]

① 여당 "알고리즘 개입해 언론사 차별" vs 네이버 "그럴 수 없는 구조"

국회 과학기술방송통신위원회 여당 간사인 박성중 국민의힘 의원은 4일 "네이버가 알고리즘에 인위적으로 개입해 언론사를 차별했다"고 주장했다. 박 의원은 네이버로부터 입수한 자료를 토대로 언론사 피인용지수 도입 전인 2021년 3월과 도입 후인 2021년 8월을 비교해 상위 20개 언론사 순위가 크게 바뀐 결과를 놓고 이같은 의혹을 제기한 것이다.

박 의원은 "조선일보를 2위에서 6위로, 동아일보는 4위에서 14위로 배치한 반면 MBC는 일반 언론사 중에서 1위로 배치되는데 매우 큰 영향을 미쳤다"고 언급하면서 네이버가 알고리즘에 개입해 언론사를 차별했다고 비판했다.

박 의원의 주장에 네이버는 펄쩍 뛰고 있다. 앞서 네이버는 2018년 언론사 인기도(매체별 영향력)라는 지수(자질)를 뉴스 검색 알고리즘에 적용했다. 언론사 인기도는 외부 전문가로 구성된 알고리즘 검토위원회의 권고에 따라 도입된 것이라는 게 네이버 설명이다. 네이버는 "공신력이 있고 정확한 정보를 전하는 언론사가 노출될 수 있도록 한다는 취지에서 언론사 인기도를 도입하게 됐다"고 설명했다.

이후 네이버는 2021년 8월 언론사 피인용지수라는 요소를 결합해 언론사 인기도를 업데이트했다. 언론사 인기도를 고도화하기 위한 조치였다는 설명이다. 언론사 피인용지수란 기사 본문에 특정 언론사 기사를 인용하는 횟수를 추출해 반영한 것이다.

네이버 관계자는 "같은 사이트를 사용하는 A일보나 A계열의 매체는 동일한 언론사 인기도를 가지게 되는데 이 경우 인력과 자원이 풍부한 대형 언론사가 유리할 수 있다는 외부의 지적이 있었다"며 "이 값이 뉴스 검색 결과에 큰 영향을 미치지는 않지만 이용자에게 더 정확한 검색 결과를 보여주고자 언론사 피인용지수를 도입한 것"이라고 설명했다.

 [사진=박성중 국민의힘 의원실]
[사진=박성중 국민의힘 의원실]

② 여당 "지수 적용, 구글과 달라" vs 네이버 "비교 어렵고 상황도 다르다"

박 의원은 "(네이버는) 인기도를 따지는 알고리즘이 구글 등 국제적으로 통용되는 방식을 적용한 것이라고 국민을 호도하고 있다"며 "네이버가 2018년까지 없던 (언론사 인기도) 지수를 알고리즘에 영구히 적용한 것을 지적하는 것이며 시시각각으로 변하는 사이트들의 중요도를 산출하는 구글의 방식과는 엄연히 다르다"고 주장했다.

이에 대해 네이버 관계자는 "알고리즘 구성 요소나 소스 코드 공개 현황 등은 회사마다 다르고 서비스를 제공하는 상황도 달라 비교가 어렵다"고 반박했다. 네이버는 "알고리즘 검토위원회와 같은 외부 검증을 통해 문제가 있다고 지적을 받은 부분들에 대해 개선 노력을 이어왔다"며 "알고리즘 업데이트도 이어가고 있기 때문에 특정 지수가 영구적으로 적용된다고 보기 어렵다"고 설명했다.

③ 여당 "알고리즘 편향 학습" vs 네이버 "데이터 편향성도 검증 받아"

네이버가 처음부터 알고리즘을 편향적으로 학습시킨 것 아니냐는 지적도 제기됐다. 박 의원은 "검색 키워드 200여 개를 중구난방, 임의로 선정해 알고리즘을 엉터리로 학습시킨 것으로 드러났다"며 "네이버가 알고리즘을 시작부터 편향되게 학습시켜 국민을 극단적인 확증 편향으로 몰아붙였다"고 날을 세웠다.

이에 대해 네이버 관계자는 "키워드 하나당 연관된 데이터가 많고 그로부터 파생되는 데이터도 다양해 언급된 키워드 수를 포함해 훨씬 더 많은 양의 데이터를 학습시키고 있다"며 "데이터의 편향성 문제에 대해서도 알고리즘 검토위원회의 검증을 받는다"고 말했다.

2차 알고리즘 검토위원회는 "(네이버에) 무작위 데이터를 요청하고 이를 분석했으며 학습 데이터를 만드는 과정에서 특이한 사항은 없는지, 알고리즘이 의도적인 편향성을 갖고 있을 가능성 등을 검토했다"고 밝힌 바 있다.

이와 관련해 위원회는 "네이버 뉴스 알고리즘 구성에 의도적인 편향성이 들어 있지 않다고 확인할 수 있었다"면서 "학습 데이터의 경우 다른 기관과의 협업이나 양질의 학습 데이터 공동 구축 등을 생각할 수 있을 것으로 보며 학습 데이터 공개를 통해 검색 기술 발전에 기여할 수 있을 것"이라는 권고 사항을 제시했다.

/정유림 기자(2yclever@inews24.com)




주요뉴스


공유하기

주소가 복사되었습니다.
원하는 곳에 붙여넣기 해주세요.
alert

댓글 쓰기 제목 네이버 개입? 알고리즘 편향?...뉴스 알고리즘 논란 쟁점 살펴보니

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중
댓글 바로가기


뉴스톡톡 인기 댓글을 확인해보세요.



TIMELINE