통계청 표본, 39세이하 '과소대표' 60세이상 '과다대표'됐다
상태바
통계청 표본, 39세이하 '과소대표' 60세이상 '과다대표'됐다
  • 최광웅
  • 승인 2019.03.11 12:13
  • 댓글 0
이 기사를 공유합니다

[최광웅의 데이터 경제] ② 허용오차 2% 넘어서는 엉터리 표본
뉴스톱의 <소득분배 악화 원인 찾기> 시리즈

 

다소 황당하게 들리겠지만 최악의 소득분배악화의 주범은 바로 통계청의 엉터리 표본 때문이다. 통계법에 의해 공인된 유일한 국가통계 주무기관이자 1000명 넘는 공무원이 근무하는 통계청이 엉터리 통계조사를 작성하고 그 결과를 발표한다면 독자 여러분은 과연 믿겠는가? 통계청은 가계동향조사 소득부문(가계소득동향조사)을 실시·발표하면서 표본수를 2016년 8700개에서 2017년 5500개, 그리고 2018년 8000개로 각각 변경했다. 그때마다 나름대로 그 이유를 내세웠다. 2017년에는 소득부문과 지출부문을 통합했으나 2018년에는 소득부문을 떼 내어 분기별로 발표하고 있다. 이것을 2020년부터 또 다시 통합하겠다고 고시해놓은 상태이다. 통계청은 원칙적으로 상대표준오차 2.5% 이내로 관리하며, 가장 최근 발표한 2018년 4/4분기 가계소득동향은 더욱 낮은 2% 내외로 했다고 설명하였다. 이쯤 되면 외견상으로는 아주 믿을만한 통계조사라고 할 수 있다. 그러나 사실을 확인해보면 경악을 금치 못한다.

분기별로 발표하는 가계소득동향조사의 표본 모집단은 일반가구(전체가구 – 외국인가구 - 집단가구)에서 농림어업 종사가구를 제외한 2인 이상 가구주를 대상으로 한다. 통계청은 2017년 가계소득동향조사는 2010년 인구총조사를 기반으로 5500개 표본을 추출했지만, 2018년에는 정확도를 높이기 위해 가장 최근인 2015년 인구총조사 결과를 바탕으로 표본을 변경했으며 그 숫자 또한 8000개로 늘렸다고 공지한 바 있다. 한편 통계청장은 통계법 제5조의3(총조사의 실시) 규정에 따라 5년에 한 번씩 인구총조사 및 농림어업총조사를 실시·공개하고 있다. 이 조사는 국가 중장기 정책수립 등을 위해 엄청난 예산과 인력을 투입해 실시하기 때문에 품질이 매우 높기로 유명하다. 그래서 공공 및 민간에서 이루어지는 각종 전화여론조사나 면접조사의 표본은 대부분 이를 토대로 추출한다. 

통계청 역시 매월 실시해 분기별로 발표하는 가계소득동향결과도 이 인구총조사 및 농림어업총조사 모집단에서 표본을 가져온다고 밝히고 있다. 하지만 통계청 가계소득동향은 조사표본 자체부터가 모집단인 인구총조사 구성비율과 상당히 달라서 허용하는 오차범위를 크게 넘어서고 있다. 특히 소득이 낮은 노령층 가구주는 과다(過多) 대표하고, 소득이 높은 젊은층 가구주는 과소(過小) 대표하는 등 많은 문제점을 안고 있다. 

<표 1> 2018년 가계소득동향조사 대상가구 모집단 (단위 : 가구)

구분

2018년 조사 대상가구 모집단

일반가구 ①

농·림·어가 ②

1인 가구 ③

조사 대상가구 ④

비율

39세 이하

4,630,369

16,992

1,896,215

2,717,162

21.07%

40대

4,552,466

96,796

840,889

3,614,781

28.03%

50대

4,606,021

286,622

846,562

3,472,837

26.92%

60세 이상

5,322,174

833,411

1,395,742

3,093,021

23.98%

합계

19,111,030

1,233,821

4,979,408

12,897,801

100%

※ 2015년 인구총조사 및 농림어업총조사 자료 재가공 : 2인 이상 일반가구, 농·림·어가 제외 

※ 일반가구 = 전체가구 – 외국인가구 - 집단가구 

※ ④ = ① - ② - ③

통계청은 2018년 4/4분기의 경우 보도자료에서 상대표준오차가 2% 내외라고 밝히고 있다. 그런데 ‘2015년 인구총조사 및 농림어업총조사’를 ‘가계소득동향조사를 위한 연령대별 모집단’으로 재구성해보면 위의 <표 1>과 같다. 즉 40대 가구주 비중이 가장 많고 다음으로 50대, 이어서 60세 이상 순서이다. 그럼에도 불구하고 <표 2-4>를 보면 ‘2018년 4·4분기 연령대별 표본가구분포’는 60세 이상이 가장 많다. 그리고 ‘조사 대상가구 모집단(이하 모집단)’과의 격차도 오차범위(2%)를 3배 이상 넘어서는 6.27%이다. 그 대신에 전체가구주보다 평균소득이 높은 39세 이하 가구주는 5.32%나 과소 대표되었기 때문에 이 통계결과를 도대체 누가 믿을 수 있겠는가?

<표 2-4> 2018년 4·4분기 가계소득동향조사 연령대별 가구분포 및 가구 경상소득

 

2018년 4/4분기 조사가구 표본

모집단

가구분포

격차

경상소득

39세 이하

15.75%

21.07%

- 5.32%

4,658,535원

40대

28.14%

28.03%

+ 0.11%

5,278,730원

50대

25.86%

26.92%

- 1.06%

5,341,606원

60세 이상

30.25%

23.98%

+ 6.27%

3,199,383원

전체가구

100%

100%

 

4,568,356원

 

지난해 5월 29일 청와대에서 문재인 대통령이 주재한 청와대 가계소득동향 점검회의 결과를 보면 2018년 1/4분기를 기준으로 1분위(하위 20%) 가구주 분포는 전년 동 분기와 대비해 70세 이상 가구주는 43.2%, 60세 이상은 64.2%로 급증했다고 밝히고 있다. 하위 20%에 해당하는 1분위의 소득이 급감한 까닭은 바로 이렇게 60세 이상 가구주가 지나치게 과다 대표되었기 때문이다. 분배악화 문제로 여론이 들끓자 통계청은 2018년 8월 23일 보도참고자료에서 2/4분기 연령대별 표본가구분포에서 60세 이상 가구주 비중이 전년 같은 분기 대비 2.8% 증가한 29.4%라고 밝혔다. 즉 노령층 증가가 소득분배악화의 원인이라는 설명이다. 

2018년 5월 29일 청와대에서 문재인 대통령이 가계소득동향 점검회의를 개최했다. 출처: 청와대

필자가 통계청 공개자료를 재구성해 검증해본 바 역시 다르지 않다. 2018년 1~3분기 연령대별 표본가구분포와 모집단과의 격차는 마찬가지로 60세 이상 노령층은 5.12%~5.74%까지 과다 대표되었다. 이와 반대로 젊은 연령층인 39세 이하는 4.28%~4.86%까지 과소 대표되었다. 즉 2018년 1~4분기가 패턴이 똑같다. 통계로 나타난 결과는 소득이 높아 평균 중간정도(3분위) 벌어들이는 39세 이하 가구주는 과소 대표되고, 소득이 낮아 평균 1~2분위(최극빈층 및 차상위계층)에 주로 속하는 60세 이상은 과소 대표되었다는 사실이다. 그리고 그 격차는 약 ±5%이며 통계결과 자체를 근본적으로 신뢰할 수 없을 만큼 엄청나게 크다. 금액으로 환산하면 약 40만원 안팎이다.

위 <표 2-4>와 아래 표 3개는 2018년 1~4분기 가계소득동향조사 모집단과 조사가구 표본의 차이를 조사한 것이다. 39세 이하 가구와 60세 이상 가구의 비율을 중점적으로 살펴보자.

<표 2-1> 2018년 1/4분기 가계소득동향조사 연령대별 가구분포 및 가구 경상소득

 

2018년 1/4분기 조사가구 표본

모집단

가구분포

격차

경상소득

39세 이하

16.68%

21.07%

- 4.39%

5,121,026원

40대

29.14%

28.03%

+ 1.11%

5,449,528원

50대

25.08%

26.92%

- 1.84%

5,634,313원

60세 이상

29.10%

23.98%

+ 5.12%

3,211,619원

전체가구

100%

100%

 

4,721,445원

※ 2018년 1/4분기 조사가구 표본분포는 통계청 설명자료를 재구성한 것임

 

<표 2-2> 2018년 2/4분기 가계소득동향조사 연령대별 가구분포 및 가구 경상소득

 

2018년 2/4분기 조사가구 표본

모집단

가구분포

격차

경상소득

39세 이하

16.79%

21.07%

- 4.28%

4,450,980원

40대

28.13%

28.03%

+ 0.10%

5,030,879원

50대

25.68%

26.92%

- 1.24%

5,490,527원

60세 이상

29.40%

23.98%

+ 5.42%

3,130,447원

전체가구

100%

100%

 

4,492,900원

 

<표 2-3> 2018년 3/4분기 가계소득동향조사 연령대별 가구분포 및 가구 경상소득

 

2018년 3/4분기 조사가구 표본

모집단

가구분포

격차

경상소득

39세 이하

16.21%

21.07%

- 4.86%

4,703,225원

40대

28.06%

28.03%

+ 0.03%

5,358,294원

50대

26.01%

26.92%

- 0.92%

5,706,123원

60세 이상

29.72%

23.98%

+ 5.74%

3,211,619원

전체가구

100%

100%

 

4,704,939원

 

지난달 21일 통계청이 가계소득동향조사 결과를 발표하자 대부분 언론은 1분위(하위 20%) 소득이 급락했다고 보도했다. 경상소득(근로소득, 사업소득, 재산소득, 이전소득을 합친 것) 기준으로 전년 동 분기 대비 14.6% 하락이며, 금액은 21만원이다. 보수언론을 중심으로 최저임금인상 여파라고 근거 없는 비난도 함께 쏟아졌다. 하지만 위에서 설명한 바와 같이 오차범위 금액(40만원 안팎) 이내 감소라는 점을 감안하면 감소인지 증가인지 정확하게 알 수도 없다(<표 3> 참고). 1분위가 주로 포진해 있는 60세 이상 가구주가 표본에 정확하게 반영돼 있지 않았기 때문이다. 그리고 1분위 안에서도 근로자가구는 경상소득은 물론이고 주 소득원인 근로소득도 오히려 늘었다. 역설적으로 최저임금인상 효과 때문이다. 물론 1분위 내 비중 71.5%를 차지하는 근로자외가구(무직, 자영업자 등)의 사업소득이 3분의 2 가까이 급감하면서 1분위 전체 평균소득 하락을 이끈 것도 사실이다. 그렇지만 ‘1분위 근로외가구’도 24만원 정도 경상소득 감소가 있었으므로 마찬가지로 허용 오차범위 금액 이내이며, 여전히 통계청의 가계소득동향 통계는 신뢰할 수 없다.

 

<표 3> 2017ㆍ2018년 4/4분기 가계소득동향조사 1분위(하위 20%) 경상소득 비교

 

2017년 4/4분기

2018년 4/4분기

증감율

전체가구

경상소득

1,447,100원

1,236,470원

- 14.56%

근로자가구

경상소득

1,900,935원

1,977,508원

4.03%

근로소득

1,506,249원

1,589,332원

5.23%

근로자외가구

경상소득

1,009,690원

770,592원

- 23.68%

사업소득

229,491원

85,001원

- 62.96%

근로소득

124,542원

68,005원

- 45.40%

 

<표 4> 2018년 4·4분기 기준 가계소득동향조사 표본구성

 

표본수

(비중)

포본허용

오차범위 ①

실제표본

허용오차 ②

격차

(②-①)

실제 모집단과의 격차(가구)

39세 이하

1,685

21.06%

1,651~

1,719

1,235~

1,295

- 416~

- 424

-670,592~

-683,488

40대

2,242

28.03%

2,197~

2,287

2,206~

2,296

+ 9~

+ 9

+14,508~

+14,508

50대

2,154

26.93%

2,111~

2,197

2,028~

2,110

- 83~

- 87

-133,796~

~140,244

60세 이상

1,919

23.99%

1,881~

1,957

2,372~

2,468

+ 491~

+ 511

+719,492~

+823,732

※ 표본수 : 8,000개  ※ 상대표준오차 : 2% 내외

결론적으로 39세 이하는 과소대표되고, 60세 이상은 과다대표되는 통계청 표본 오류 때문에 가계소득동향조사를 신뢰할 수 없다. 소득지표가 악화됐는지도 확인이 되지 않는다. 소득감소가 오차범위 내이기 때문이다. 

아래 4장의 사진은 이 글을 작성하기 위해 통계청 보도자료와 통계청 사이트에서 직접 확인한 자료다.

‘전국가구 소득 5분위별 근로자가구 및 근로자외가구 분포’는 2018년 1~4분기 및 2017년 4분기 가계소득동향조사 연령대별 가구분포(표 2-1부터 2-4)를 계산하기 위한 기초자료다. 출처: 2018년 2월 21일 통계청 보도자료 14쪽
2017년 4분기~2018년 1분기 '가구주 연령별 가구분포' 출처: 통계청 캡처
2018년 2~4분기까지 '가구주 연령별 가구분포'. 출처: 통계청
2018년 1~4분기까지 '가구주 연령별 경상소득’ 출처: 통계청

 

최광웅   contact@newstof.com    최근글보기
데이터정치경제연구원 원장. 데이터로 정치현상을 풀어내는 분석가이자 정치인이다. 1990년 중앙당사무처 부장으로 정치에 첫 발을 담갔다. 국회의원 비서관, 서울시의원, 청와대 행정관 및 인사제도비서관, 항공우주연구원 상임감사 등으로 일했다. 저서로 <바보선거> <노무현이 선택한 사람들> 등이 있다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사