[저널리즘특강] 김양순 KBS '저널리즘토크쇼J' 팀장
주제② 데이터저널리즘

“숫자나 빅데이터만 데이터냐 하면 전혀 그렇지 않아요. 우리 주변 가로등이나 CCTV 개수, 소녀상 위치정보, 나랑 친한 사람들 인물관계도...우리가 구조화하고 의미 부여할 수 있는 모든 이야기들 모음이 다 데이터입니다.”

김양순 KBS <저널리즘토크쇼J> 팀장은 ‘데이터저널리즘’을 주제로 두 번째 강연을 했다. 김 팀장은 어떻게 우리 일상 속에 널린 자료를 구조화해서 의미를 가진 데이터를 만들어내는지 설명하며 강연을 풀어나갔다.

매일 바뀌는 미세먼지 풍경 데이터

▲ KBS 데이터저널리즘팀은 2019년 1월 1일부터 3월 31일까지 3달 간 서울 송파구 롯데월드 타워에서 바라본 북서쪽 하늘 사진을 찍어 이어 붙였다. 김 팀장은 “연출의 정확도를 기하기 위해 촬영시간을 통일하고, 그 날의 초미세먼지 수치와 대기 상황을 함께 표기했다”고 밝혔다. ⓒ KBS

데이터저널리즘을 이용하면 저널리즘이 드러내고자 하는 현상을 한눈에 알아볼 수 있게 구현할 수 있다. 김 팀장은 지난해 3월 KBS에서 데이터저널리즘을 활용해 보도한 미세먼지 시리즈를 소개했다. ‘미세먼지 달력’을 만들어 사진만 봐도 일정 기간의 대기 상황을 곧바로 알아볼 수 있도록 연출했다. 김 팀장은 “미세먼지로 전반적인 대기 상황이 얼마나 심각한지 극명하게 드러난다”며 “예컨대 초미세먼지 수치가 88마이크로그램(µg)에 이르렀던 3월 12일은 앞이 아예 안 보여서 촬영 카메라가 고장난 줄 알았을 정도”라고 말했다. 

데이터저널리즘의 핵심은 적확한 데이터의 수집과 가공이다. KBS 데이터저널리즘팀은 무슨 자료를 어떻게 수집할 것인지 시작 단계부터 세심하게 설계했다. ‘미세먼지 달력’의 경우 서울 송파구 롯데월드 타워에 설치한 KBS 파노라마 카메라에서 매일 같은 시각(정오)에 하늘을 찍은 데이터를 가져와 이어 붙였다. 누락된 데이터는 롯데타워 측에 요청해서 자료화면을 받았다. 김 팀장은 “날씨가 흐려서 화면이 어두운 경우까지 고려해야 데이터가 왜곡되지 않을 것이라고 생각했다”며 “기상청에서 받은 날씨 데이터와 미세먼지 농도를 실시간으로 측정하는 ‘에어코리아’를 통해 확보한 초미세먼지 수치를 교차 표기했다”고 말했다.

데이터저널리즘은 체계적 자료 정리부터

▲ 김양순 KBS 팀장이 지난해 3월 미세먼지 시리즈를 보도할 때 수집한 미세먼지 정책 데이터를 설명하고 있다. ⓒ 김성진

데이터저널리즘의 출발점은 자료 정리다. 보기 쉽게 자료를 정리해야 그 안에서 기사 거리를 찾을 수 있다. ‘정리벽’ 있는 기자가 데이터저널리즘을 잘 한다는 게 김 팀장의 설명이다. KBS 데이터저널리즘팀은 미세먼지 시리즈를 보도할 때 수도권 대기환경관리 기본계획 등 정부가 지난 20년간 미세먼지와 관련해 발표한 정책을 전부 데이터로 수집했다. 미세먼지 감축 목표치와 예산 편성 등 주요 항목을 구분해 구글 스프레드시트에 일목요연하게 정리했다. 데이터를 보면 미세먼지 저감 목표치를 달성하지 못하면서도, 계속 정책 목표만 강화해 왔다. 정책을 내용별로 정리했기에 실효성을 검증할 수 있었다고 김 팀장은 설명했다.

인터랙티브 콘텐츠로 맞춤형 정보 전해야

▲ 코로나가 빠르게 확산하던 지난 2월 KBS 데이터저널리즘팀은 지역, 연령 등 조건에 맞게 확진자 수를 알 수 있는 인터랙티브 콘텐츠를 공개했다. ⓒ KBS

김 팀장은 데이터저널리즘팀이 적극 활용해야 하는 기사 형식으로 ‘인터랙티브 콘텐츠’를 꼽았다. 인터랙티브 콘텐츠는 사용자가 직접 참여해 정보를 얻는 상호작용성 콘텐츠다. 지금까지 데이터저널리즘은 기자가 수집한 자료를 그래프로 그려서 독자에게 일방적으로 전달하는 데 그쳤다. 김 팀장은 한발 더 나아가 독자가 원하는 데이터를 직접 찾을 수 있도록 인터랙티브 콘텐츠를 만들어야 한다고 강조했다. 예를 들어, 미세먼지 시리즈를 보도할 때 지역별 데이터를 따로 올리면, 독자는 자기가 사는 동네를 클릭해 그 지역의 미세먼지 정보만 확인하는 방식이다. 

김 팀장은 “이제 독자들은 스마트폰 등 디지털 기기로 기사를 읽기 때문에 온라인 콘텐츠를 적극적으로 만들어야 한다”면서 “인터랙티브 콘텐츠로 독자들에게 맞춤형 데이터를 제공하는 것이 앞으로 데이터저널리즘이 추구할 목표“라고 말했다.

탈언론 시대 기자가 가야할 길 

김 팀장은 유튜브, 인터넷 언론 등 기성 언론이 힘을 잃어가는 탈언론 시대에 기자가 스스로 전문화할 수 있는 방법은 데이터저널리즘이라고 말했다. 이전까지 기자 전유물이었던 취재, 인터뷰를 이제 유튜버 등 일반 시민들도 하기 때문에 앞으로 기자는 사실 관계를 보다 정교하게 검증해야 한다는 것이다. 그는 기자가 두 개 서로 다른 데이터를 병합해 분석하는 등 일반인이 할 수 없는 부분을 찾아 나서야 한다고 강조했다. 그는 또 “굉장한 코딩은 아니더라도 기본적인 것, 엑셀로 피벗 테이블 다루는 능력 정도는 있어야 한다”고 말했다.

김 팀장은 기자들이 직접 코딩을 배워야 한다고 강조했다. 그는 “기사 쓸 때 단순 노동을 줄이려면, 팀에 개발자 한 명은 꼭 필요하다”면서도 “개발자가 없다면 기자가 직접 배워야 할 것”이라고 말했다. 기자가 개발자와 소통하다 보면 누락되는 부분이 생기기 때문에 기자가 직접 코딩을 배우는 게 좋다는 것이다. 직접 데이터를 다뤄야 머릿속 기획도 그대로 구현할 수 있고, 데이터를 분석하던 중 새로운 사실을 발견하면 기사에 바로 반영할 수 있다는 게 김 팀장의 설명이다. 그는 “미국은 데이터저널리즘 기자가 직접 코딩하는 경우가 굉장히 많다”면서 “개발자가 없다면 내가 코딩하겠다는 마음가짐으로 데이터저널리즘에 임하라”고 말했다.

언론사도 자체 데이터베이스 구축해야

▲ 김 팀장은 탈언론 시대에 기자는 일반인보다 팩트를 충실하게 검증해야 한다고 강조했다. ⓒ 김정민

김 팀장은 데이터저널리즘이 활발해지려면 데이터에 관한 접근성이 지금보다 개선돼야 한다고 강조했다. 한국이 정보공개청구 시스템을 상당히 잘 구축했지만 공개한 데이터의 형태가 분석하기에는 부적합하다는 게 김 팀장의 지적이다. 환경부가 발표한 ‘미세먼지 관리 종합계획’처럼 정부는 문서를 공개할 때 재편집이 불가능한 PDF 형태로 올리는 경우가 많다. PDF 파일로 올린 데이터는 프로그램으로 코딩해서 분석할 수가 없다. 코딩 가능한 파일로 변환하는 데 시간이 오래 걸리고, 이 과정에서 일부 데이터가 바뀔 우려도 있다. 김 팀장은 “우리나라 정보공개청구가 예전보다 좋아진 것은 사실이지만 아직 부족한 점이 많다”면서 “앞으로 데이터저널리즘이 더 활발해지려면 한글 파일(HWP) 등 분석할 수 있는 형태로 정보를 공개할 필요가 있다”고 말했다.

▲ 지난해 12월 문을 연 한국데이터거래소에서 국내 기업들이 자사 데이터에 가격을 붙여 판매하고 있다. ⓒ 한국데이터거래소(KDX)

또 언론사 스스로 데이터베이스를 구축할 필요가 있다고 말했다. 지난해 12월 한국데이터거래소(KDX) 출범을 시작으로 앞으로 데이터 유료화가 가속화할 것이라는 게 김 팀장의 전망이다. KBS와 SBS, <중앙일보> 등 데이터저널리즘에 별도 예산을 편성하는 언론도 있지만, 그렇지 못한 언론은 데이터저널리즘을 하기가 지금보다 어려워진다는 것이다. 그는 “데이터저널리즘 저변을 넓히려면 데이터에 값을 매겨서는 안 된다”면서도 “미국의 ‘피스칼노트’(Fiscal Note)가 데이터를 파는 것처럼 우리도 점점 데이터에 돈을 내야 할 가능성이 높으니 언론사들이 발빠르게 데이터베이스를 구축해야 한다”고 말했다.


세명대 저널리즘스쿨 특강은 [인문교양특강I] [저널리즘특강] [인문교양특강II] [사회교양특강]으로 구성되고 매 학기 번갈아 가며 개설됩니다. 저널리즘스쿨이 인문사회학적 소양교육에 힘쓰는 이유는 그것이 언론인이 갖춰야 할 비판의식, 역사의식, 윤리의식의 토대가 되고, 인문사회학적 상상력의 원천이 된다고 생각하기 때문입니다. 2020년 1학기 [저널리즘 특강]은 김언경, 김양순, 곽윤섭, 정연주, 강진구, 고경태, 민경중 선생님이 맡았습니다. 학생들이 제출한 강연기사 쓰기 과제는 강연을 함께 듣는 지도교수의 데스크를 거쳐 <단비뉴스>에 연재됩니다. (편집자)

편집 : 이예슬 기자

저작권자 © 단비뉴스 무단전재 및 재배포 금지