[이재형의 통계이야기] ⑪

▲ 이재형 박사

지난번에는 국민들의 체감실업률과 통계상의 실업률이 차이가 나는 원인이 고용 관련 통계에 있어서 ‘통계기준’과 ‘일반적인 인식의 차이에서 오는 부분이 크다는 점을 설명한 바 있다. 통계기준이라는 말이 나온 김에 이번에는 통계기준이 무엇인지 알아보도록 하자.

모든 사물에는 저마다 이름이 붙어 있다. 세상에는 밥, 김치, 책상, 책, 버스, 직장, 진돗개, 라면, 소주 등 생활 주변에서부터 한민족, 대한민국 등에 이르기까지 다양한 사물이 있다. 우리는 나름대로 사물의 정의를 막연하게나마 내리고 있고, 그 정도로도 일상생활에 문제될 게 별로 없다. 그런데 때로는 사물을 엄격하게 구분할 필요가 생긴다.

애매한 ‘한민족’의 통계적 정의

예를 들면 일상생활에서 ‘한민족’이라는 말을 사용할 때는 엄격하게 그 의미를 정의할 필요가 없지만, 이것을 구분할 사회적 필요가 생겼을 때는 분명한 정의가 필요하다. 현실적으로는 그것이 쉽지 않다. ‘한민족’이란 말은 생물학적 의미, 곧 DNA에 따른 건가, 아니면 문화적 공동체를 의미하는 건가? 표준국어대사전에는 ‘한민족’(韓民族)을 ‘한반도와 그에 딸린 섬에서 예로부터 살아온, 우리나라의 중심이 되는 민족, 한국어를 쓰며 한반도와 남만주에 모여 살고 있다’고 정의돼 있다. 그러면 부모가 미국으로 이민 가서 거기서 태어나 한국어조차도 전혀 못 하는 자녀들은 ’한민족‘에 포함되는가? 한국으로 시집와서 한국 국적을 취득한 외국 출신 여성은? 또 그들이 낳은 자녀는? 또 그 2세, 3세는? 구체적 사례로 들어가면 판단이 어렵고 애매한 부분이 너무 많다.

우리나라 사람이라면 누구나 좋아하는 쇠고기. 쇠고기 가운데서도 특히 한우는 맛이 있어 수입 쇠고기보다 값이 훨씬 비싸다. 그런데 ‘한우’란 무엇을 의미하는가? 우리 축산농가에서 전통적인 소 품종을 사육한 거라면 당연히 한우다. 그러면 우리나라 전통적인 품종의 소를 뉴질랜드에서 사육해서 들여온 소는 한우인가? 외국에서 개발된 품종의 소가 우리나라에서 송아지를 낳아 이를 우리 축산농가에서 사육한 것은 한우인가? 외국에서 태어난 송아지를 수입하여 우리나라에서 상당 기간 사육하면 한우에 해당하는가? 반대로 우리나라에서 태어난 송아지를 외국에서 사육하면 한우라 할 수 있는가? 식당에는 식자재의 원산지 표시가 의무화해 한우 대신 국내산 쇠고기로 표시하는 사례가 많다. 그러면 국내산 쇠고기와 한우는 무엇이 다른가? 생각해보면 아리송한 게 한두 가지가 아니다.

통계를 작성할 때도 이런 문제가 발생한다. 지난번 실업통계 사례에서도 보았듯이 우리는 일상생활에서 ‘취업자’라든가 ‘실업자’라는 말을 그저 직장이 있는 사람과 없는 사람 정도의 의미로 사용하지만 통계를 작성할 때는 그 의미를 분명히 정하지 않으면 안 된다. 통계작성에서 용어의 의미가 모호하게 사용되면 통계를 작성할 때마다 내용이 달라져 통계는 일관성과 객관성을 잃게 된다.

사고 뒤 언제까지 죽은 사람이 ‘교통사고 사망자’?

▲ 서울경찰청에 따르면 '인구 10만 명당 서울시 교통사고 사망자 수'가 최근 줄어드는 추세를 보였다. ⓒ YTN

우리나라 교통사고 사망자수가 이전보다 많이 줄었다는 뉴스를 얼마 전에 들은 적이 있다. 한때 우리나라가 교통사고 사망률이 세계 최고라는 불명예를 안고 있었는데, 사망률이 크게 줄었다니 참 좋은 일이다. 여기서 ‘교통사고 사망자’가 무엇을 의미하는지는 분명히 할 필요가 있다. 교통사고로 현장에서 사망한 사람은 당연히 교통사고 사망자라 인정할 것이다. 그러면 교통사고 후 그 사고가 직접적인 원인이 되어 하루가 지나 사망한 사람은? 일주일 뒤에 사망한 사람은? 일 년 뒤에 사망한 사람은? 지나치기 쉬운 이런 문제를 한번 곰곰이 생각해보면 여러 의문이 떠오를 수 있다. 교통사고 당일 사망한 사람을 교통사고 사망자라 정의하는 것과 교통사고 후 1년 이내 사망을 교통사고 사망자라 정의하는 것 사이에는 교통사고 사망자수 통계가 크게 달라질 것이다.

이처럼 통계를 작성하는 데 기준이 모호하다면 통계는 객관성을 잃게 된다. 따라서 통계를 작성할 때는 조사대상이 무엇인지 등 그 기준을 분명하게 정의할 필요가 있다. 이처럼 조사대상을 명확하게 규정한 것을 통계기준이라고 한다. 통계기준에는 두 종류가 있다. 첫 번째는 ‘통계분류’이며, 두 번째는 ‘통계용어 정의’다. 일반적으로는 통계기준이라면 통계분류를 의미하는데, 좀 더 넓은 의미에서는 통계용어까지도 통계기준에 포함하는 것이 타당하다. 통계기준은 한 국가의 통계를 체계적으로 조정하고 정리하는 기능을 갖는다.

통계분류는 조사대상을 체계화한다는 점에서 통계작성에서 매우 중요하다. 통계분류가 제대로 되어 있을 때 우리가 관찰한 사회현상이 국가전체에서 어떤 위치에 있는가를 종합적으로 파악할 수 있기 때문이다. 통계분류는 조사대상이 되는 사회현상이나 조사객체를 트리(tree) 형태로 체계적으로 분류한 것이다.

불국사는 어떤 산업으로 분류될까?

산업통계의 예를 보자. 우리나라에서 존재하는 모든 사업체는 반드시 ‘한국표준산업분류’(Korea Standard Industrial Classification, KSIC) 속의 한 산업에 속하게 돼있다. 삼성전자의 스마트폰 제조공장은 대분류산업 ‘제조업’ → 중분류산업 ‘전자부품, 컴퓨터, 영상, 음향 및 통신장비 제조업’ → 소분류 산업 ‘통신 및 방송장비 제조업’ → 세분류산업 ‘방송 및 무선통신장비 제조업’ → 세세분류산업 ‘이동전화기제조업’으로 체계적으로 분류된다. 문화유산인 경주 불국사는 대분류산업 ‘협회 및 단체, 수리 및 기타 개인서비스업’ → 중분류산업 ‘협회 및 단체’ → 소분류산업 ‘기타 협회 및 단체’ → 세분류산업 ‘종교단체’ → 세세분류산업 ‘불교단체’로 분류된다.

우리나라에는 6개 통계표준분류가 있다. ‘한국표준산업분류’ ‘한국표준직업분류’ ‘한국표준질병사인분류’ ‘한국표준무역분류’ ‘한국표준목적별지출분류’ ‘한국표준교육분류’가 그것이다. 이들 통계표준분류는 그 목적이 체계적인 통계 작성에 있지만, 해당 분야의 현상과 대상을 체계적으로 정리하고 있어 다른 행정목적으로도 널리 활용된다. 예를 들면 정부가 특정 산업을 지원하거나 규제하려면 정책대상이 되는 산업을 명확히 정의할 필요가 있다. 현실세계에서는 정책대상 산업의 경계를 선을 긋듯 명확히 규정하기 어려운 경우가 많다. 이때 통계분류체계를 빌려 정책대상을 분명히 함으로써 정책의 투명성과 객관성을 높일 수 있다. 통계행정 외에 일반행정에서도 이러한 이유로 표준통계분류가 널리 활용되는데, 이에 따라 생각지도 않은 문제가 발생하기도 한다.

▲ 이들 통계표준분류는 그 목적이 체계적인 통계 작성에 있지만, 해당 분야의 현상과 대상을 체계적으로 정리하고 있어 다른 행정목적으로도 널리 활용된다. ⓒ 통계청

통계표준분류는 통계작성을 위해 고안된 분류체계다. 그런데 정책목적이나 내용에 따라 이러한 통계분류체계가 일반상식과는 달라 정책대상자의 반발을 불러올 수 있다. 예를 들어 어느 공단에 입주한 업체들은 대부분 볼트와 너트를 생산한다고 치자. 이 가운데 어떤 업체는 제품을 자동차회사에 납품하고, 어떤 업체는 조선소에 납품한다. 볼트와 너트라는 제품 자체는 큰 차이가 없지만 전자는 자동차부품 산업에 속하고, 후자는 조선부품 산업에 속한다. 만약 정부가 조선 및 관련 산업 지원정책을 내놓는다면, 같은 공단에서 비슷한 제품을 생산하고 있는데도 자동차 부품업체로 인정된 업체는 지원정책에서 제외될 수도 있다. 통계분류와 실제 산업현장 사이 괴리는 어떤 경우에는 특정 기업에게 치명적인 손해를 가져올 수 있다.

통계청에는 가끔 자기 업체의 산업분류가 잘못돼 손해를 보고 있다고 강력한 항의가 들어오는 사례가 있다. 그렇다고 통계분류는 원칙에 따라 분류하는 만큼 특정 업체를 위해 원칙을 훼손하기는 어렵다. 정책당국이 특정 정책의 수행을 위해서는 거기에 걸맞게 정책대상자를 스스로 원칙에 의해 명확히 규정하는 것이 당연한데, 안이하게 통계표준분류를 가져와 이를 경직되게 운영함으로써 나타나는 문제라 할 것이다. 통계분류는 통계작성 체계에 적합한 분류체계라는 것을 이해하고, 현실 정책에서는 개별정책의 취지와 목적에 따라 정책당국이 다시 정책에 적합한 분류체계를 만드는 것이 타당하다.

우리나라에서 사용하는 통계분류로는 통계표준분류 외에 특별한 정책목적을 위해 만든 특수분류(특수목적분류)가 있다. 앞에서 말했듯이 정부가 특정 정책을 펼 때는 그 범위를 명확히 정할 필요가 있는데, 통계표준분류로는 이를 명확히 구분할 수 없는 경우가 많아 특별한 정책 목적을 위해 제정한 분류체계가 특수분류이다. 특수분류로는 ‘콘텐츠 산업분류’ ‘스포츠 산업분류’ ‘관광산업분류’ ‘정보통신산업분류’ ‘환경산업분류’ 등 현재 19종이 있는데, 대부분 경제 분야 분류다.

통계표준분류와 특수분류 사이에는 어떤 차이가 있을까? 관광산업분류 예를 들어보자. 우리나라가 외국인 관광객 유치를 위해 관광산업을 진흥한다고 할 때 관광산업에는 어떤 기업들이 포함될까? 먼저 외국인 관광객이 우리나라를 방문하려면 항공기를 이용해야 하고, 인천공항에 도착하면 택시나 버스, 기차로 서울시내에 들어오게 된다. 며칠간 한국에서 머물려면 호텔 등 숙박시설을 이용해 하고, 식당에서 식사를 한다. 한국의 명승지를 구경하고, 쇼핑도 한다. 이와 같이 해외관광객들이 이용하는 산업은 운수‧교통, 음식‧숙박, 도소매업 등 다양한 산업에 흩어져 있다. 이래서는 관광산업 진흥을 위한 효과적인 정책수립이 어렵다. 관광산업 진흥을 위해 한국표준산업분류에서는 여기저기 흩어져 있는 산업에서 관광산업과 관련된 업종을  한 곳으로 모아 이를 체계적으로 다시 분류한 것이 관광산업분류다.

4차산업도 이미 분류돼 있다

요즘은 4차산업혁명이 유행어처럼 사용되는데 정부도 4차산업혁명 관련 산업 육성을 위해 많은 노력을 기울이고 있다. 그런데 한국표준산업분류에는 4차산업혁명 관련 산업이라는 것이 없다. 우리가 흔히 4차산업혁명이라고 부르는 현상에는 많은 업종이 포함돼 있다. 이것은 기본적으로 새로운 업종은 아니며, 기존 업종에서 새로운 아이디어를 도입하여 운영방식을 혁신한 것이 대부분이다. 예를 들면 4차산업혁명의 총아로 등장한 에어비엔비나 우버 같은 공유경제도 실은 기본 아이디어에서는 우리나라에 수많은 업체가 난립하고 있는 대리운전이나 숙박대행업체와 별반 차이가 없다. 단지 이들 사업이 체계화, 첨단화, 글로벌화 했을 뿐이다. 자율주행차도 마찬가지다. 자율주행차 운행도 결국 고도의 컴퓨터 프로그램이나 인공지능에 의해 이루어지는데, 이들도 단지 고급기술이라는 점에서 차이가 있을 뿐이지 기존 한국표준산업분류의 어딘가에 속하게 된다.

이래서는 정부가 4차산업혁명 지원을 한다 해도 그 대상을 명확히 특정할 수 없다. 지원대상을 분명히 설정하려면 기존 산업분류를 참고하되, 기술적 특성 등 산업적, 정책적 특성을 고려하여 정책대상이 되는 새로운 분류체계를 만들 수 있을 것이다.

통계의 시작은 통계기준이며, 통계기준이 분명하지 않은 통계는 무의미하다. 통계청 홈페이지에 가면 통계분류포털과 통계용어사전이 있다. 통계를 이용할 때는 이와 관련된 통계분류와 용어에 대한 이해를 높여야 통계가 가지고 있는 정보를 정확히 포착할 수 있다.

6개월만 국내서 키워도 ‘한우’가 된다

▲ 통계의 시작은 통계기준이며, 통계기준이 분명하지 않은 통계는 무의미하다. ⓒ pixabay

마지막으로 앞에서 잠깐 제시한 두 질문에 답을 해보자. ‘한우’(韓牛)란 무엇일까? 우리나라에서는 아직 ‘한우’의 법률적 정의는 없는 것 같다. 일반적으로 우리나라 고유 품종의 소로서 우리나라에서 태어나 우리나라에서 사육된 소를 한우라 하는 것 같다. 법률적으로는 ‘국내산 쇠고기’란 말이 사용된다. 여기서 ‘국내산 쇠고기’란 도축 6개월 이전까지 국내에서 사육된 소를 말한다. 살아있는 소를 수입해 6개월 이상 국내에서 사육한 소도 ‘국내산 쇠고기’에 포함된다.

교통사고 사망이란 무엇인가? 1999년까지 우리나라에서는 교통사고 이후 72시간, 곧 3일 이내 사망하면 ‘교통사고 사망’으로 정의했다. 그 이후 법이 바뀌어 사고 후 30일 이내 사망하면 교통사고 사망으로 정의한다. 우리나라 차량수 대비 교통사고 사망자수는 1991년을 피크로 점차 줄어들었는데, 교통사고 사망자의 정의가 이처럼 확대되었는데도 사망자수가 크게 줄어들고 있는 것은 다행이다. 일본에서는 대개 사고 후 24시간 이내 사망하면 ‘교통사고 사망자’라 정의한다. 우리나라와 일본을 비교하면 실제 교통사고 사망자수가 같더라도 통계상으로는 우리나라가 일본보다 높게 나타날 수밖에 없다.

교통사고 관련 통계를 보면 인구 10만명당 교통사고 발생 건수는 2015년 기준으로 미국 513건, 일본 493건, 오스트리아 454건 등의 순서로 나타나고 있다. 아시아에서는 우리나라가 429건으로 일본 다음 순서다. 사망자수는 남아프리카, 말레이시아, 이란 등이 많은데, 의료 환경이 좋지 않기 때문일 것이다.


민주주의는 건전한 공론장 없이는 성립되지 않는다. 공론장이 건전해지려면 객관적 현실 인식을 공유해야 하며 그 바탕이 되는 게 통계다. 통계가 흔들리면 정책도 여론도 왜곡될 수밖에 없다. 가짜뉴스도 통계 왜곡에서 출발한다. 언론인은 통계 해석을 잘못하면 ‘사회의 공적’이 될 수 있지만 잘하면 ‘해석특종’을 할 수 있다. 통계전문가인 이재형 박사가 통계에 얽힌 재미있는 얘기들을 풀어낸다. 한국개발연구원(KDI)에서 일하는 그는 <국가통계시스템발전방안> <한국의 산업조직과 시장구조> 등 많은 연구와 저술을 해왔고 통계청 통계개발원장을 역임했다. [편집자]

편집 : 이자영 기자

저작권자 © 단비뉴스 무단전재 및 재배포 금지