알쏭달쏭 포털뉴스 배열원리, '뉴스알고(NewsAlgo)'로 체험해보아요

2020. 11. 20. 12:00수업 현장

인항고 1학년 학생들의 ‘뉴스알고’ 수업 후기. <사진 출처: 필자 제공>

 

'포털 뉴스 배열 원리' 알려드려요

 

언론진흥재단 '뉴스 알고리즘 개발' 시범수업

 

한국언론진흥재단은 2016년부터 3년간 ‘뉴스트러스트위원회’를 운영하며

저널리즘 가치에 기반한 뉴스 배열 알고리즘을 개발해 공개했다.

이렇게 탄생한 ‘뉴스알고’ 프로그램을 이용해 포털 화면에 나타나는

뉴스 배열의 원리 등을 직접 체험해보는 수업을 소개한다.

 

글 윤현옥 (미디어교육 강사)


 

 

“프로그램이 정한 기준에 따라서 뉴스 기사에 점수를 매긴다는 것이 신기했다.

가중치를 다르게 매기면 그에 따라 점수가 바뀌는 점 또한 인상 깊었다.

기사 속에 ‘이럴 수가, 충격’ 등의 자극적이고

관심을 유발하는 내용이 있는지 바로 분석해 볼 수 있어 신선했다.”

 

 


 

 

 

구글 검색창에서 우리는 알고리즘을 만난다. 검색어를 다 작성하기도 전에 구글의 자동완성 기능은 이미 우리가 찾고자 하는 검색어들을 나열해 준다. 구글에 로그인 상태와 로그아웃 상태에서 검색어를 입력하니 추천 검색어가 다르게 제시된다. 로그인 상태에서 ‘유튜브’라는 키워드로 검색했던 필자의 검색 경험이 학습되어 알고리즘이 작동 1)한 것이다.

 

 

구글 검색창에서 ‘유튜브’를 검색했을 때 결과 비교. 왼쪽이 로그아웃, 오른쪽이 로그인 상태다. <사진 출처: 필자 제공>

 

오늘도 알고리즘이 나를 이곳으로

알고리즘 2)은 우리가 늘 사용하고 있는 스마트폰에도 적용된다. 다양한 앱을 사용하기 위해 제공한 개인정보 데이터가 나의 사용 패턴을 학습해 편리하게도 맞춤 정보를 추천해 준다. 맞춤 정보는 내가 인지하지 못한 관심을 일깨워주는 역할을 하기도 한다. 가장 흔하게 경험할 수 있는 알고리즘은 하나를 클릭하면 다음 재생 영상이 알아서 실행되는 유튜브.

 

“오늘도 알 수 없는 알고리즘이 나를 이곳으로 이끌었습니다”라는 유튜브 유행 댓글처럼 하나의 영상에서 시작한 나는 어느 순간 원했든, 원하지 않았든 어떤 콘텐츠 앞에 머무르게 된다. 이러한 콘텐츠 소비는 이용자 소비 패턴을 분석하는 인공지능 서비스에 의해 개인의 관심사에 부합되는 맞춤형 콘텐츠를 제공하고 이용자의 취향에 따라 선택과 행동을 하도록 알아서 제공되는 것이다. 이 ‘알아서’ 제공되는 콘텐츠가 정보 편식 현상을 의미하는 ‘필터버블’ 속에 이용자를 가둬둘 수 있다는 경고는 특히 포털 뉴스 알고리즘과 관계 깊다.

 

‘뉴스알고(News Algo)’ 3) 수업은 일상 속 알고리즘을 내가 어떻게 경험하고 있는지부터 시작한다. 알고리즘을 활용하면 사람이 평생 동안 모아도 볼 수 없는 양의 데이터를 실시간으로 처리하고 결과에 반영할 수 있다. 알고리즘을 어떻게 구성하느냐에 따라 문제 해결 과정이나 결괏값에 도달할 때 변화 또는 오류가 생길 수도 있기에 프로그램을 명확하고 효율적으로 만드는 것이 중요하다. 학생들은 이런 알고리즘의 원리를 간단히 체험하기 위해 출발과 도착 지점을 제시하고 어떤 교통 편으로 이동을 할 것인지 생각해보게 된다. 도착 지점까지 가는 데 필요한 요구 조건을 생각해 보는 것이다. 예를 들어 시간·요금·거리·건강 등의 조건이 적용되면 이동하는 과정과 도착 지점의 결과는 달라질 수 있다. 이처럼 문제를 해결하기 위해 정해진 절차나 방법을 알고리즘이라 정의 4) 한다.

 

인공지능 알고리즘은 갈수록 고도화되고 있으며 작은 모바일 환경을 통해 만나는 콘텐츠가 많아지는 한편 스마트폰 화면에 노출되는 정보는 매우 한정될 수밖에 없다는 점에 초점을 두고 다음 이야기를 시작한다. 이용자들은 수없이 많은 콘텐츠 중에서 추천 알고리즘이 일정한 규칙이나 사용 흔적에 따라 나에게 필요한 콘텐츠, 좋아할 만한 개인 맞춤형 콘텐츠를 제시해 주는 편리함에 익숙해져 있다. 이러한 생각과 함께 온라인에서 광범위하게 사용되는 알고리즘의 장점과 단점에 대해서도 고민해보는 시간을 갖는다.

 

AI 추천 뉴스, 믿을 만할까?

알고리즘의 일반적 특성은 원래 불공정하며 객관적이지 않다. 설계자의 의도나 다양한 사회적 요인이 개입될 수밖에 없는 논리 언어이므로 공정성과 객관성을 완벽히 구현하기 어렵고, 아무리 공정한 배열을 목표로 삼아 뉴스 순위를 매기는 알고리즘을 설계한다 하더라도 그 과정에서 설계자의 가치 기준이 개입될 수밖에 없다. 따라서 모두가 공정하다고 인정할 가치중립적이고 객관성을 담보할 수 있는 알고리즘은 세상에 존재하지 않는다는 뉴스 알고리즘 연구 도서 5)의 내용을 학생들에게 안내한다.

 

또한 알고리즘에 의한 뉴스 배열이나 콘텐츠 추천에 따른 부작용에 대한 우려가 높아지고 있으며, 조사 대상인 이용자 절반은 알고리즘이 선별한 뉴스의 선별 기준을 알 권리가 있다고 생각한다는 방송통신위위원회와 정보통신정책연구원에서 발표한 ‘지능정보사회 이용자 패널조사 2019’ 조사 결과 6)도 함께 읽어 보고 의견을 나눈다.

 

포털의 인공지능 알고리즘은 실시간 제공되는 수많은 뉴스의 순서를 배열하고 이용자 맞춤형 뉴스를 제공한다. 뉴스를 제공하는 포털 메인 화면에 걸리는 주요 기사의 중요도와 신뢰도에 물음을 가지고 우리에게 정말 유용한 뉴스를 제공하는지, 뉴스에 적용된 알고리즘이 잘 작동하고 있는지, 다양한 미디어를 통해 접하는 뉴스의 기준과 배열 원리를 우리가 왜 궁금해하고 알아야 하는지 ‘뉴스알고’ 프로그램에 기술되어 있는 학습 목표 부분을 학생들과 하나하나 살펴보며 수업을 진행한다.

 

그동안 인공지능 알고리즘이 선별해서 보여주는 뉴스를 일방적으로 소비했다면 뉴스 배열이 공정한가, 나에게 진짜 필요한 뉴스인가에 대한 질문은 잠시 미뤄두고 개인 스마트폰 속 포털 메인 뉴스는 어떻게 보이는지 두 포털의 뉴스를 비교해 본다. 네이버 알고리즘 에어스와 다음카카오 알고리즘 루빅스가 개인 뉴스피드에 어떤 뉴스를 추천해 보여주는지 확인해보기 위해서다. 네이버와 다음의 종합 뉴스와 개인 뉴스피드 화면에는 비슷한 뉴스가 추천됐지만 조금 다른 기사들도 추천되는 것을 볼 수 있었다. 이용자의 뉴스 선호도에 따라 유용하다고 판단되는 관심 정보를 제공받았는지 친구들끼리 비교해보면 서로에게 조금씩 다른 뉴스가 배치되고 있다는 사실을 확인할 수 있었다.

 

네이버와 다음의 뉴스 화면 비교. <사진 출처: 필자 제공>

 

‘뉴스알고’, 본격 실습

‘뉴스알고’는 뉴스의 배열 원리부터 알고 시작을 해야 한다. 뉴스를 자동으로 배열해 보여주기 위해 온전히 기사 제목, 내용, 기자 명 등 필요한 정보만을 남기고 나머지는 모두 제거하는 정제 작업을 진행한다. 정제된 기사에는 어떤 내용이 포함돼 있는지 자연어 처리 과정을 통해 AI가 형태소 분석을 한다. AI가 내용을 확인 후 ‘계량 요인’에 따라 점수 계산을 위한 계수를 부여하는 과정을 실습을 통해 확인할 수 있다.

 

학생들이 이해하기에 어려운 설명이 될 수 있기에, 먼저 뉴스트러스트 위원회 7)에서 도출한 11가지 저널리즘 가치(사실성, 투명성, 다양성, 균형성, 독창성, 중요성, 심층성, 독이성, 유용성, 선정성, 반복성)를 알아보는 시간이 필요했다. 또한 12가지 계량 요인(기자 명, 기사의 길이, 인용문의 수, 제목의 길이, 제목의 물음표, 느낌표 수, 수치 인용 수, 이미지의 수, 평균 문장의 길이, 제목에 사용된 부사 수, 문장 당 평균 부사 수, 기사 본문 중 인용문의 비중)의 저널리즘적 의미도 살펴보았다.

 

뉴스 평가 및 배열 공식에 따라 이용자가 계수를 직접 산정해 가중치를 더하게 되면 AI 판단에 영향을 미쳐 뉴스 배열 결과가 달라질 수 있음을 설명하고 뉴스 배열 샘플 기사를 읽도록 한다.

 

뉴스 샘플은 인포데믹, 환경오염, MZ세대, 퍼블리시티권 등을 주제로 클러스터링한 뉴스들이 높은 점수 순서대로 배열되어 있다. 각 기사를 클릭하면 계량 요인에 따른 상세 계산 과정을 확인할 수 있다. 특히 학생들이 주목한 것은 요인별 가중치 적용 패널을 통해 가치별 중요도를 직접 지정해서 배열이 어떻게 변하는지 확인할 수 있는 실습이었다. 학생들에게 친근한 주제의 기사 샘플 적용이 추가적으로 필요하다. 만약 학생들이 기사 읽기에 익숙하지 않을 경우 학급별 대상별에 맞는 뉴스 이해 수업이 먼저 선행되어야 프로그램을 좀 더 친숙하게 능동적으로 이용할 수 있을 것이다.

 

모바일로 ‘뉴스알고’를 실습 중인 인항고 1학년 수업 모습(좌). ‘뉴스알고’ 웹 실습 중인 박문여고 2학년 수업 모습(우). <사진 출처: 필자 제공>

 

박문여고 2학년 박문기자단 학생들은 실습을 한 후 “프로그램이 정한 일정한 기준에 따라서 뉴스 기사에 점수를 매긴다는 것이 신기했다. 가중치를 다르게 매기면 그에 따라 점수가 바뀌는 점 또한 인상 깊었다. 하나의 기사 속에 ‘이럴 수가, 충격’ 등 자극적이고 관심을 유발하는 내용이 있는지, 몇 개의 인용문을 사용했는지 같은 내용을 바로 분석해 볼 수 있어 신선했다”, “뉴스와 기사에 알고리즘이 적용되어 우리에게 보인다는 사실을 어렴풋이 알고만 있었는데, 어느 기준에 따라 선정되는지 배우고 난 뒤 직접 분석하고 결과를 비교할 수 있어서 좋았습니다” 등 후기를 남겼다.

 

인항고 1학년 글로벌경영반 장병준 선생님은 “학생들이 접하는 네이버나 다음카카오 등 포털 뉴스에 어떤 알고리즘이 적용되어 독자에게 전달되는지 짐작할 수 있었던 수업이었다. 남학생들이 흥미를 가질 만한 스포츠, 문화면 기사도 샘플로 함께 제시되면 좋겠다. 사전에 신문 기사 내용에 자주 쓰이는 말뭉치 교육이 선행되고, 배경 지식과 어휘 능력을 기를 수 있는 교육이 전제된 후에 수업이 진행된다면 교육 목적을 달성할 수 있을 것이다. 인문사회계열과 자연이공계열로 나누어진 뒤에 2학년 학생들에게 적용하면 더 효과적일 것”이라고 조언했다.

 

‘뉴스알고’의 체험 및 실습 기능 중에는 뉴스 배열 샘플 기사인 지정 주제를 기사로 작성하여 뉴스 평가와 배열, 가중치 적용 등을 통해 뉴스 분석을 해 볼 수 있으며, 기존 뉴스와 비교도 가능하다. 자유 주제로 나만의 기사를 작성하고 요인 분석을 살펴볼 수도 있다. 다른 사람의 기사를 읽고 평가해보는 수업을 넘어 스스로 기사를 작성해보면서 저널리즘 가치와 윤리의식까지 배움으로 연결할 수 있다. 단, 기사 작성을 위해서는 사전에 기사 쓰기 형식과 주제를 선정하고 취재하는 과정 등 좋은 글쓰기를 위한 연습이 필요하다.

 

 

‘뉴스알고’ 홈페이지(위) 및 학습 페이지(아래) <사진 출처: 필자 제공>

 

포털 뉴스를 볼 때 이런 점에 주의!

코로나19로 수업이 안정적으로 운영되지 못해 ‘뉴스알고’의 전체 기능을 고루 설명하고 진행될 수 없었던 상황이었다. 특강으로 진행돼서 아쉬웠지만 수업에 참여한 학생들은 뉴스 알고리즘에 대한 이론 수업과 포털 뉴스 분석·평가 경험만으로도 저널리즘의 의미가 무엇인지 살펴볼 수 있는 기회였다. 또한 학생들은 포털 뉴스를 소비할 때 뉴스 알고리즘이 적용되고 있다는 사실을 인식할 필요가 있음을 알게 됐다며 긍정적 반응을 보여주었다. ‘뉴스알고’ 프로그램을 이용해 수업할 때는 ‘뉴스알고’ 서비스의 특성 및 한계가 고지 8)된 점도 안내해야 한다.

 

‘뉴스알고’ 프로그램의 근본적인 목적은 포털에서 제공되는 뉴스를 소비할 때 이용자 태도에 변화가 필요함을 이해하고, 나에게 맞춤으로 추천되는 뉴스들의 획일적 소비에 갇혀 더 중요하고 꼭 보아야 하는 뉴스를 놓치지 않도록 하는 것이 아닐까 생각한다. 기준 없는 뉴스 평가보다 ‘뉴스알고’ 11개 저널리즘 가치만 체크하더라도 하루에도 수없이 제공되는 뉴스들의 가치를 대략적으로라도 가늠해볼 수 있을 것이다.

 

또한 뉴스를 생산해야 하는 입장에서는 11개 계량 요인에 맞춰 기사를 작성하는 것도 유익한 글쓰기 방법이 될 것이다. 뉴스를 더 쉽게 생산하고, 뉴스의 관점을 더 강조하고, 더 많이 뉴스를 확산시키기 위한 방법들이 클릭 수를 조장하고 불필요한 뉴스 소비로 이어지는 악순환을 만들지는 않는지 살펴보아야 한다.

 

‘뉴스알고’가 상용화되어 교실 수업에 적용되려면 학생들에게 조금 더 친절한 설명과 체계적인 수업 계획이 뒷받침되어야 한다. 뉴스 알고리즘, ‘뉴스알고’를 활용한 수업과 뉴스를 읽고 쓰는 힘을 기를 수 있는 뉴스 리터러시 수업안은 한국언론진흥재단 미디어교육팀의 지원 아래 2020 학습공동체 뉴스큐레이션팀과 한국미디어교육강사연합회가 중심이 되어 지속적인 연구가 이루어질 것이다.

 

 

 

1) 구글 검색 알고리즘의 원리.

https://www.google.com/intl/ko/search/howsearchworks/algorithms/

 

2) 알고리즘은 주어진 문제를 논리적으로 해결하기 위해 필요한 절차, 방법, 명령어 등을 모아놓은 것이다. 넓게는 사람 손으로 해결하는 것, 컴퓨터로 해결하는 것, 수학적인 것, 비수학적인 것을 모두 포함한다(네이버지식백과 참조).

 

3) ‘뉴스알고’의 전신인 ‘뉴스트러스트’는 저널리즘 가치에 기반한 공익적 뉴스 검색·배열 알고리즘을 개발하고, 신뢰도 높은 기사를 뉴스 소비자에게 제공될 수 있는 환경을 조성하기 위해 추진된 공개 프로젝트다. 현재 ‘뉴스알고’는 뉴스트러스트에서 고도화된 교육 플랫폼의 행태로 제공되고 있다.

 

4) <톡톡 코딩 중등 7회: 알고리즘의 이해, 문제 해결 방법을 찾아라!>. EBS.

 

5) 김병희 심재철(2016). 뉴스어뷰징과 검색알고리즘. 커뮤니케이션북스. 37P.

 

6) “뉴스·동영상 콘텐츠 추천 이유를 설명하라”. 석간 내일신문 2020.6.2. 17면

 

7) 뉴스트러스트 위원회. 저널리즘 학자, 언론 현장 전문가(신문, 방송, 인터넷), 컴퓨터 공학자 등 분야별, 전문가별, 신문협회, 방송협회, 인터넷신문협회, 국회 등 추천으로 구성됐다. 2016~2018년까지 운영되면서 19차 회의를 거쳐 11가지 저널리즘 가치와 185개의 이론적 계량 요인을 도출해냈다.

 

8) 뉴스트러스트 시스템은 인공지능과 알고리즘을 통해 뉴스 편집과 이용이 이뤄지고 있는 환경에서 인공지능 뉴스 편집 시스템에 대한 이용자 이해를 넓히고 그 결과에 대한 비판적 접근을 강화하기 위한 도구로 개발됐습니다. 인공지능이 배열·편집한 뉴스 또한 사람이 어떠한 기준과 가중치를 설정하고 적용했느냐에 따라, 그 결과가 달라진다는 것을 이용자가 체험해 볼 수 있는 서비스입니다. 제한된 뉴스에 대한 시범 서비스로 개발됐기에 뉴스 전체에 대한 적용이 이뤄지지 못한 한계점이 있음을 알립니다.