더 나은 세상은 가능하다, 이정환닷컴!

네이버의 보수 편향성 논란과 플랫폼 공정성 이슈.

Written by leejeonghwan

December 15, 2020

며칠 전(2020년 12월13일) MBC ‘스트레이트’가 네이버 뉴스 추천 알고리즘이 보수 신문을 우선적으로 노출하고 있다는 보도를 내보냈습니다.

저도 비슷한 데이터를 들여다 보던 참이라 흥미롭게 봤습니다만 몇 가지 아쉬운 점이 있었습니다. 전체적인 문제의식은 동의하지만 조사 방법의 문제를 짚고 넘어가지 않을 수 없습니다.

일단 조사 기간이 1주일로 너무 짧았습니다. 11월30일~12월6일까지 1주일 동안 5분 간격으로 크롤링한 데이터인데요. 조금 더 시간을 두고 집계를 했다면 더 좋은 보도가 됐을 텐데 아쉽습니다. 이를 테면 다음에서는 세계일보가 헤드라인에 가장 많이 노출되고 있다는 결과가 나왔는데 조사기간이 길었다면 아마도 다른 결과가 나왔을 겁니다.

다음은 첫 화면 배열 이력을 공개하고 있는데, 12월1일 하루 동안 첫 화면에 배열했다는 기사 리스트가 3385건이나 됩니다. 1주일이면 대략 2만 건이 넘는데요. 이 가운데 노출 시간 기준으로 세계일보 기사가 8.0%나 헤드라인을 차지했다고 한다면 뭔가 이상하다는 생각을 했어야 합니다.

2만 건이 실제로 첫 화면에 배치된 것인가, 첫 화면 중에서도 헤드라인은 교체 주기가 더 긴 것인가, 개인화 추천은 모바일에서만 작동하고 PC 화면에서는 별도의 알고리즘으로 돌아가는 것인가 등등의 질문을 해야 할 것이고요. PC 트래픽이 전체 트래픽의 10%라는데 PC와 모바일의 조건이 다르다면 과연 이걸로 뉴스 편집의 편향성을 평가할 수 있는 것인지도 질문이 필요했을 것입니다. PC 편집은 모바일 편집 결과를 어떻게 반영하고 있는가도 궁금하지만 네이버가 답을 하지 않으니 알 수 없는 문제이기도 합니다.

저도 최근에 네이버 알고리즘을 분석하는 논문을 쓴 적 있기 때문에 “아, 논문은 저렇게 쓰면 안 되는데”하는 생각이 들었습니다. 물론 이건 논문이 아니라 언론 보도입니다만, 만약 이런 주제로 논문을 쓰겠다고 한다면 당장 “조사 기간을 더 늘려라”, “이건 PC 헤드라인 뉴스를 1주일 동안 살핀 결과일 뿐 알고리즘의 편향성을 분석한 결과라고 주장하기는 어렵지 않겠느냐”는 등의 지적을 받았을 것입니다. 노출 시간도 당연히 살펴봐야 하지만 기사 건수 비중도 함께 비교해야 할 거고요.

언론 보도도 마찬가지입니다. 제가 만약 데스크라면 “이거 좀 이상한데? 기간을 늘려서 돌려보지?”라고 했을 거고요. 아니면 “1분 간격으로 크롤링을 하면 좀 더 정확한 그림이 나오지 않겠어?”라고 물어봤을 것 같습니다. “PC는 그렇다 치고 모바일은 어때?”라고 물어봤을 거고요. “PC는 개인화 추천이 아니라며? 그럼 어디까지 알고리즘인 거야?”

알고리즘 편집의 영향을 분석하려면 네이버와 다음이 실제로 개인화 추천 영역에서 이용자들에게 어떤 뉴스를 추천하고 있는가를 살펴야 할 텐데 ‘스트레이트’ 보도는 거기까지 나가지 않았습니다. 물론 헤드라인 뉴스를 살펴보는 것만으로도 알고리즘의 편향성을 검증할 수 있다고 주장할 수 있겠지만 범주가 다른 이야기입니다. 모바일은 개인화 추천인데 PC에서는 여전히 동일한 기사 편집을 제공하고 있다고 지적할 수도 있겠지만 그건 ‘스트레이트’가 주장하는 것과 전혀 다른 맥락이 되고요.

세계일보를 보수로 분류하는 건 그렇다 치고 한국에서 한겨레와 경향신문 말고 진보로 분류할 수 있는 신문이 얼마나 더 되는지도 의문입니다. 멀리 갈 거 없이 3년 전 같으면(김장겸 사장이 물러난 게 2017년 11월13일) KBS와 MBC도 보수로 분류됐을지도 모릅니다. 기준이 모호하다는 거죠.

‘스트레이트’ 보도가 안타까웠던 건 큰 방향이 맞다고 하더라도 이런 식의 어설픈 비판이 오히려 문제 해결을 어렵게 만들 것이기 때문입니다. 결과가 대충 비슷하니까 괜찮은 게 아니라 이런 기사는 디테일이 매우 중요하다고 생각합니다. 비판을 넘어 음모론으로 빠질 수밖에 없습니다. 학자들이 네이버가 두려워서 인터뷰를 하지 않으려 했다는 대목도 동의하기 어렵고요.

하지만 영리 기업이면서 공적 플랫폼으로서 작동하고 있는 포털 권력에 대한 비판이 더욱 많아져야 한다고 생각합니다. 네이버가 문제가 없다고 말하는 게 아닙니다. 그래서 이 글을 쓰고 있는 것입니다.

위의 그림은 2015년 5월13일 저와 금준경 기자가 같이 썼던 기사 이미지인데요. 연합뉴스가 네이버와 다음 양쪽에서 압도적인 점유율 1위를 기록하고 있습니다. “편향성 시비를 피하려고 기계적 중립에 안주하고 있다”는 게 5년 전 진단이었습니다.

네이버와 다음에 연합뉴스와 뉴시스, 뉴스1 등 통신사 비중이 높다는 건 오래 전부터 지적돼 왔던 문제입니다. 애초에 낮 시간에 기사가 많지 않아서 통신사 기사를 쓸 수밖에 없다는 게 포털의 해명이고요. 여전히 신문사들은 다음날 아침에 배달될 종이신문을 만드느라 바뿌고 방송사들은 인터넷 보다는 방송이 더 우선이죠. 사람 편집자가 편집하던 시절에는 같은 속보라도 이왕이면 좀 더 빠르고 다른 언론사들도 받아쓰는 연합뉴스 기사를 우선 배치하는 게 안전하기도 했을 거고요.

제가 여러 기사나 칼럼에서 제안했던 건 네이버와 다음이 언론이라면(네이버는 아니라고 하지만) 적극적으로 뉴스 가치에 대한 판단을 하고 그 판단에 따른 비판을 감수하고 책임도 져야 한다는 것이었습니다. 그런데 그런 논란을 피하려고 무색무취의 통신사 기사를 깔고 있는 것이죠. 네이버나 다음 입장에서는 뉴스가 핵심 상품이 아니니까요.

네이버가 인공지능 편집으로 전환한 이후 중앙일보와 조선일보의 비중이 크게 높아진 건 사실입니다. 아래에서 자세한 데이터를 보여드리겠습니다. ‘스트레이트’는 기사 배열(노출) 기준으로 살펴봤지만 실제로 ‘많이 본 뉴스’에서도 중앙일보와 조선일보의 비중이 압도적으로 높습니다. 과거에는 네이버도 통신사 비중이 압도적으로 높았는데 바뀐 거죠.

네이버가 보수 성향 언론에 편향된 편집을 하고 있다는 비판은 네이버가 일부 신문에 가중치를 더 두고 있다는 의혹으로 이어질 수밖에 없습니다. 네이버 알고리즘이 중앙일보나 조선일보의 기사를 더 우대하고 있다는 이야기가 되는 것입니다.

만약 알고리즘이 실제로 그렇게 설계돼 있다면 이건 네이버가 뉴스 사업을 중단해야 할 정도로 심각한 사건이라고 생각합니다. 그렇기 때문에 이런 의혹을 던지려면 충분한 근거를 제시해야 합니다.

지금 우리가 확실하게 말할 수 있는 건 알고리즘 편집 이후 중앙일보와 조선일보 등 일부 신문의 노출 비중이 늘어났다는 것입니다. 알고리즘이 이 두 신문을 의도적으로 띄우고 있는 게 아니냐는 의혹을 제기할 수는 있지만 만약 이걸 논문으로 쓴다면 교수님께 야단을 맞을 것입니다. 뒤늦게 대학원 공부를 하면서 배운 것은 명확하게 논증하고 검증할 수 없는 것을 섣불리 주장해서는 안 된다는 것입니다. 분명한 것은 왜 떴는지 모르겠지만 떴다는 것이고 여기서부터 출발해야 한다고 생각합니다.

위의 그림은 5년 전인 2015년 네이버와 다음의 ‘많이 본 뉴스’의 언론사별 비중입니다. 정확하게는 2014년 11월1일부터 2015년 4월30일까지 6개월 동안의 분석 결과입니다. 확실히 네이버나 다음이나 연합뉴스 비중이 높고 상위 5개 언론사 비중이 각각 48.6%와 46.2%를 차지하고 있다.

아래 그림은 올해 1월1일부터 8월31일까지 8개월 동안의 분석 결과입니다.

다음은 통신 3사의 비중이 크게 늘어났고 네이버는 뉴시스와 뉴스1의 비중이 줄어든 대신 중앙일보와 조선일보의 비중이 크게 늘어났습니다. 무슨 일이 벌어진 것일까요?

‘스트레이트’ 보도가 전체 트래픽의 10% 정도에 해당한다는 PC 편집 화면의 비중을 살펴본 거라면 이 데이터는 네이버 전체에서 실제로 많이 읽힌 기사의 언론사별 비중을 살펴본 것입니다.

저는 포털의 ‘많이 본 뉴스’가 굉장히 중요한 데이터라고 생각합니다. 포털의 편집이 의제설정 역할을 한다면 ‘많이 본 뉴스’는 그 결과일 테니까요. 그리고 한국처럼 포털의 점유율이 높은 나라에서는 ‘많이 본 뉴스’가 여론의 방향을 예측하는 데 중요한 지표가 된다고 생각합니다. 그런데 지난 9월 윤영찬 의원의 “카카오 들어오라 하세요” 논란 이후 ‘많이 본 뉴스’를 비공개로 전환해 버렸습니다. 만약 이걸 집계하고 싶다면 언론사별로 제공되는 통계를 모두 더해서 조합하는 방법도 가능하긴 할 것 같습니다.

무슨 이유에서인지 네이버는 지난해부터 순위 변동이 일어났습니다. 중앙일보와 조선일보가 치고 올라왔고 뉴시스와 뉴스1의 비중이 줄었습니다. 상대적으로 다음은 큰 변동이 없고요. 아래 그래프에서 굵은 파란색이 중앙일보고, 굵은 빨간색은 조선일보입니다. 노란색이 연합뉴스고요.

다음은 조회 수를 공개하지 않고 있지만 네이버는 ‘많이 본 뉴스’에서 조회 수를 확인할 수 있었습니다. 조회 수 역시 급격한 변동이 있었습니다. 중앙일보가 압도적인 1위를 기록하고 있습니다. 조선일보가 연합뉴스의 조회 수를 따라 잡았군요.

몇 가지 추론해 볼 수 있는 건 네이버 ‘언론사 홈’ 구독이 뉴스의 추천과 ‘많이 본 뉴스’에 영향을 미쳤을 거라는 가정입니다.

다음 그래프는 12월13일 기준으로 네이버 ‘언론사 홈’ 구독자를 집계한 것입니다. 100만 단위로 표시된 것은 정확한 숫자를 공개하지 않은 곳입니다. 중앙일보가 500만 명을 넘어섰고 조선일보도 400만 명대입니다. (조선일보는 100만 단위로만 공개를 하고 있는데 400만 명이 넘은지 꽤 됐으니 아마 연합뉴스보다 더 많을 것으로 추정됩니다.)

확실히 네이버 독자들이 중앙일보와 조선일보를 선호한다는 사실을 확인할 수 있습니다. 중앙일보야 비교적 일찌감치 디지털 실험을 서둘렀고 아마도 기사 출고 전략 등에서 어떤 변화가 있었을 것으로 추정됩니다만 조선일보는 뜻밖이긴 합니다. 물론 애초에 네이버에 상대적으로 보수 성향의 이용자들 비중이 클 수도 있고요. 물론 노출이 많이 되기 때문에 상대적으로 구독자 수가 더 빠른 속도로 늘었을 가능성도 있습니다.

알고리즘 편집이 네이버의 선택이고 네이버의 의도가 반영돼 있다면 ‘언론사 홈’ 구독은 독자들의 선택이 반영된 결과일 것입니다. 그리고 독자들의 선택이 어떤 형태로든 알고리즘 편집에 반영돼 있을 수 있고요.

만약 ‘언론사 홈’ 구독 수가 뉴스 노출에 영향을 미친다면 구독자가 384만 명인 한겨레가 중앙일보의 절반 이상은 돼야겠죠. 그런데 실제로 한겨레 기사가 ‘많이 본 뉴스’에 포함되는 비율은 중앙일보의 6분의 1 수준 밖에 되지 않습니다. 다음에서도 한겨레 기사가 중앙일보 기사의 6분의 1 수준으로 읽힙니다. 중앙일보와 조선일보가 단순히 ‘언론사 홈’ 구독이 많아서 더 많이 읽힌다고 보기에는 여전히 의문이 남습니다. 아니면 한겨레가 ‘언론사 홈’ 구독은 많지만 실제로 커버리지가 넓지 않을 수도 있고요. 중앙일보와 조선일보가 실시간 검색어 이슈 등에 대응을 잘 하고 있기 때문일 수도 있습니다. 어떤 이유로든 한겨레 기사가 네이버 독자들에게 어필하지 못하는 것일 수도 있습니다.

암튼 이런 분석은 ‘스트레이트’ 보도만큼 화끈하지는 않군요. “네이버가 보수 편향이 심각하다”고 결론을 내려버리면 시원하겠지만요.

‘기자 페이지’ 구독자 수도 살펴봤습니다. 손석희 사장의 영향이겠지만 JTBC가 1위를 기록하고 있고 뉴스1과 중앙일보, KBS 뉴스, 국민일보 순입니다. 경향신문과 한겨레 기자는 순위권에 없습니다. 기자들 순위를 살펴보면 확실히 스타 기자의 파워가 막강하다는 사실을 확인할 수 있습니다. 하지만 구독자 수가 실제로 알고리즘에 어느 정도로 반영되는지는 여전히 확인할 방법이 없습니다. 상대적으로 ‘기자 페이지’ 구독 수는 ‘언론사 홈’ 구독수만큼 많지 않습니다.

기자 페이지 구독자는 손석희 사장이 압도적인 1위를 기록하고 있고 머니투데이 남형도 기자가 2위, 한국경제 김현석 기자가 3위로 따라붙고 있습니다.

확실히 여러 지표에서 중앙일보가 앞서는 것은 사실이지만 조선일보는 또 중앙일보만큼 잘하는 것 같지 않습니다. 조선일보와 중앙일보가 네이버에서 갑자기 잘 읽히게 된 이유가 무엇일까요?

분명한 건 지난해 1월부터 어떤 변화가 네이버에서 많이 읽히는 기사의 성격을 바꿔놓았다는 것입니다. 네이버가 PC 버전까지 인공지능 편집으로 전환한 게 2019년 4월이지만 모바일에서는 2018년부터 부분적으로 개인화 영역을 늘려 왔습니다.

위에 보는 그림은 종이신문 1면 머리기사가 네이버에서 얼마나 읽혔는지를 비교해 본 것입니다. 1면 머리기사가 네이버 ‘많이 본 뉴스’에 포함된 비율을 살펴봤더니, 14.46% 밖에 되지 않았습니다. 하루 210건씩 집계되는 네이버 ‘많이 본 뉴스’는 한국 사회의 여론을 흔드는 기사들입니다. 이게 절대적인 비교는 될 수 없겠지만 일간 신문이 가장 중요하다고 생각해서 1면 머리기사에 배치하는 기사가 정작 네이버에서는 선택을 받지 못하고 있다는 이야기죠. 그런데 이것도 언론사마다 편차가 컸습니다. 중앙일보와 조선일보가 압도적으로 높고, 한국일보와 한겨레 등은 평균을 밑돌았습니다.

이 그림은 이 1면 머리기사들의 건수와 조회 수 합계입니다.

좋은 기사를 만드는 것과 많이 읽히는 것은 다르고, 많이 읽히는 기사가 반드시 좋은 기사도 아니고 안 읽힌다고 해서 좋지 않은 기사가 아닌 것도 아닙니다. 다만 기사는 많이 읽혀야 힘이 생깁니다. 그리고 어떤 기사를 많이 읽게 만드느냐가 포털이 확보하고 있는 권력이고 그래서 이 문제를 공적 책임의 영역에서 논의해야 하는 것입니다.

다시 이 글의 처음 질문으로 돌아가면, 네이버가 중앙일보와 조선일보를 띄워서 이런 결과가 나온 것일까요. 아니면 이 신문사들이 실제로 네이버 이용자들의 선택을 더 많이 받고 있는 것일까요? 아니면 네이버 알고리즘이 이용자들의 선호를 반영해서 이 신문사들 기사를 더 많이 노출한 결과일까요.

질문을 확장해 보면 이런 편향성 논란을 피하기 위해 연합뉴스 기사로 도배를 하는 게 옳을까요. 아니면 중앙일보와 조선일보 기사를 노출하는 만큼 한겨레와 경향신문 기사를 동일한 비중으로 추천해야 할까요.

네이버는 이런 질문에 한 번도 책임있는 답변을 내놓지 않았습니다. 사실 네이버가 임의로 결정할 수 있는 문제가 아니기도 합니다. 그래서 계속 의혹이 쌓여가는 것이고요.핵심은 어떤 알고리즘도 완벽하지 않으며 알고리즘에 공정성과 객관성을 기대할 수는 없다는 것입니다. 특히 네이버와 다음처럼 지배적인 포털 사업자는 이들이 이슈의 흐름과 편향, 의제 설정에 미치는 영향을 끊임없이 감시 받고 검증 받아야 합니다. 그리고 더욱 중요한 것은 알고리즘은 끊임없이 개선돼야 하며 아무리 영업 비밀이라고 하더라도 최소한의 원칙이 공개돼야 하며 외부의 감시와 비판을 받아들여야 한다는 것입니다. 알고리즘이 편집하기 때문에 개입할 수 없다는 것도 변명일 수밖에 없고요.

네이버와 다음의 알고리즘 편향을 측정하기 위해 다수의 컴퓨터에 가상 머신을 설치해 뉴스 타임라인의 변화를 추적·기록하는 방법도 고민해 봤습니다만 엄두가 안 나서 실제로 진행해 보지는 못했습니다. 언젠가 한 번 시도해 보고 싶습니다. 관심 있으시면 다음 링크를 읽어보시고요.

연구 과제 : 알고리즘은 과연 공정할까.

지금 이 글은 미디어X 뉴스레터에 실어 보낸 글입니다. 구독하시려면 아래에서 신청해 주세요.

뉴스레터를 시작합니다.

.

leejeonghwan.com audio
Voiced by Amazon Polly

Related Articles

Related

잔여백신 예약 노하우.

잔여백신 예약 노하우.

“나만 안 맞았어 백신(EVEM, Everybody Vaccinated. Except Me.)” 증후군에 시달리다가 오늘 작정하고 휴가부터 냈습니다. 10시부터 매복하다가 5분 만에 예약 성공해서 맞고 왔습니다. 위에 그림에서 보는 것처럼 터치를 네 번 해야 되는데, 이걸 1초 만에 끝내는 게 관건입니다. 별 건 아니지만 약간의 노하우가 있어서 정리해 봅니다. 0. 잔여 백신은 노쇼 백신과는 좀 다른 의미입니다. 일단 1병을 개봉해서 여러 명이 맞을 수 있는데 LDS(Low...

모니터 연결 없이 라즈베리파이 원격 제어하기.

모니터 연결 없이 라즈베리파이 원격 제어하기.

1. 일단 SD카드를 컴퓨터에 연결해서 라즈베리 OS를 설치해 줍니다. 2. 자동으로 와이파이를 잡아주기 위해 루트 디렉토리에 wpa_supplicant.conf 파일을 만들고 다음과 같이 적어줍니다. 터미널 프로그램으로 접속하면 됩니다. cd /Volumes/boot touch ssh vi wpa_supplicant.conf country=US ctrl_interface=DIR=/var/run/wpa_supplicant GROUP=netdev update_config=1...

티본 스테이크, 실패 없이 잘 굽는 방법.

티본 스테이크, 실패 없이 잘 굽는 방법.

유튜브에 뒤져보면 온갖 비법이 넘쳐나는데 전문가들도 조금씩 스타일이 다르다. 스테이크를 잘 굽는 모든 노하우는 결국 안쪽까지 온도가 잘 전달되게 만드는 것이 전부다. 자칫 겉은 타고 안은 피가 뚝뚝 떨어지는 상황을 피하려면 최적의 온도와 시간을 맞춰야 한다. 이게 다 고기가 두꺼워서 생기는 문제다. 몇 가지 기본만 갖추면 된다. 첫째, 겉면을 굽고(시어링), 둘째, 버터를 끼얹으면서 안쪽까지 열이 전달되도록 하고(베이스팅), 셋째, 꺼내서 적정 시간을 식힌다(레스팅). 핵심은...

더 나은 세상은 가능하다, 이정환닷컴!

Join

Subscribe For Updates.

이정환닷컴 뉴스레터를 구독하세요.