아이큐 테스트 기원에 '인종주의' 그림자가

[박재용의 과학사] 지능지수(IQ) 측정의 역사, 의미, 한계

여러분들 대부분이 지능검사 혹은 IQ 검사를 받으신 적이 있을 겁니다. 대략 40세 이상은 국민학교 혹은 중학교에서 필수적으로 받기도 했습니다. 그리고 이런 말들을 들은 적 혹은 한 적이 있을 겁니다. ‘그 집은 아빠가 똑똑하니까 아이들도 다 똑똑하더라.’ 뭐 이런 이야기지요.

과연 지능은 유전되는 걸까요? 아니 그 이전에 지능이라는 것의 정의가 뭘까요? 이 문제에 처음으로 천착한 사람 중 한 명이 시릴 버트Cyril Burt입니다. 우연하게도 그는 우생학의 창시자인 프랜시스 골턴의 주치의의 아들이었습니다. 그래서인지 시릴 버트의 이론에는 골턴의 주장이 꽤 많은 영향을 주었습니다. 버트가 영국 대학의 교수가 될 수 있었던 것에 골턴의 도움도 있었고요. 그는 지능이 유전된다는 가설을 증명하기 위해 쌍둥이의 지능을 조사하기로 했지요. 일란성 쌍둥이의 경우 하나의 수정란에서 발생하기 때문에 유전적으로 완전히 동일한 조건을 가지고 있습니다. 따라서 일란성 쌍둥이 중 같이 자란 경우와 떨어져 자란 경우를 살펴보면 지능의 유전 여부를 파악할 수 있을 것으로 생각한 거지요.

시릴 버트 박사(오른쪽)가 한 아이의 생각의 속도를 측정하는 실험을 하고 있다. ⓒwikimedia

1955년 발표한 바에 따르면 그는 21쌍의 일란성 쌍둥이를 대상으로 연구를 진행했습니다. 결과로 같은 곳에서 성장한 일란성 쌍둥이는 지능의 유사도가 완전히 동일한 경우를 1로 놓았을 때 0.944였고 다른 곳에서 성장한 경우 유사도는 0.771이었습니다. 후속 연구를 계속 해서 1958년과 1966년에는 30~53쌍의 쌍둥이를 대상으로 실시한 결과도 발표했는데 앞서의 연구결과와 완전히 일치했습니다. 그의 이런 연구 결과를 기반으로 영국에서는 11세의 모든 어린이들에게 지능 검사를 실시하였고 그 결과에 따라 어떤 교육을 실시할 것인지를 결정하도록 했지요.

그에게 영향을 받은 것은 영국만이 아니었습니다. 미국 하버드 대학의 리처드 헤른슈타인Richard Hermstein은 그의 이론의 확장시켜 개인이 속한 사회계층은 부모의 지능지수와 큰 관계가 있다고 주장합니다. 즉 가난한 계층이 가난한 이유는 낮은 지능이 부모에서 자식에게로 계속 유전되기 때문이고, 부유한 계층은 높은 지능이 물려지기 때문이라는 거지요. 이 이론은 부유한 계층을 중심으로 퍼져나갑니다. 자신들의 부가 쌓이는 것에 대한 정당한 이유가 밝혀졌다는 거지요.

그러나 버트가 죽고 난 뒤 그의 연구에 대한 문제 제기가 시작되었습니다. 그의 논문을 자세히 살펴본 결과 위조의 흔적이 드러난 거지요. 그가 논문에서 참조하라고 적어놓은 이들이 사실은 존재하지 않았던 겁니다. 런던 대학에서 박사학위를 취득했다는 메이버Maver라는 이는 런던 대학에 존재하지 않았고, 공동 연구를 했다는 무어와 데이비스라는 사람도 찾을 수 없었지요. 또 다른 논문에서 언급된 하워드와 콘웨이라는 여성 연구원들도 존재하지 않았습니다.

그리고 그가 논문에서 밝힌 데이터들도 조작되었다는 사실이 드러났습니다. 그의 첫 연구논문과 후속 연구에서 데이터는 소수점 뒤 끝자리까지 완전히 똑같은데 다른 쌍둥이를 대상으로 한 조사에서 데이터가 소수점 뒤 끝자리까지 그것도 모두 똑같을 확률은 0에 가깝지요. 그런 데이터에 대한 문제가 있었지만 그가 워낙 당시 권위가 있던 인물이라 아무도 지적을 하지 못했던 겁니다. 그리고 그는 가명으로 학술지에 논문을 발표하고, 그 논문에 대해 평을 자신이 발행인이 논문에 게재하기도 합니다. 그러나 그에 대한 비판과 별도로 지능과 유전에 대한 과도한 집착은 이후 지속적으로 학계와 대중에게 영향을 미치게 됩니다.

지능이 유전되는가에 대한 연구가 버트에 의해 시작되었다면, 지능 자체에 대한 제대로 된 과학적 연구는 사실상 프랑스의 과학자 알프레 비네Alfred Binet에 의해 시작됩니다. 앞서 말씀드렸듯이 19세기말에서 20세기 초에 이르는 시기는 우생학과 골상학이 유럽과 미국 사회를 휩쓸던 시기였습니다. 당시 프랑스도 마찬가지여서 파리 인류학회를 창립한 폴 브로카에 의한 인종주의적 주장이 대세였습니다. 브로카는 ‘일반적으로 뇌는 노인보다 장년에 다다른 어른이, 여성보다 남성이, 보통 사람보다 걸출한 사람이, 열등한 인종보다 우수한 인종이 더 크다. 다른 조건이 같으면 지능의 발달과 뇌 용량 사이에는 현저한 상관관계가 존재한다.‘고 주장했지요(인간에 대한 오해 스티븐 제이 굴드). 소르본 대학의 심리학실험실 실장이었던 비네도 처음에는 브로카의 주장에 동의했습니다. 그래서 실제로 여러 사람들의 머리 크기를 재보았지요. 그런데 암만 재어보아도 지능과 두개골 크기가 별 관련이 없다는 증거만 내리 나오는 겁니다.

그래서 그는 겉으로 보이는 외양에 의한 방법 대신 심리학적 방법을 택합니다. 당시 그는 프랑스 교육부장관으로부터 일반적인 학생들에 비해 학습 능력이 명확히 떨어지는 따라서 특별한 교육이 필요한 아이들을 구분하기 위한 실용적 연구를 위임받았지요.

그는 아이들에게 다양한 종류의 단순한 과제를 준 후 그 결과에 대해 점수를 매겨 모우는 방식으로 지능을 검사합니다. 하지만 그는 이 지능검사에 대해 엄격한 제한을 두어야 한다고 주장하지요. 먼저 테스트 결과는 일시적이며 영구적이지 않다는 겁니다. 즉 살아가면서 바뀔 수 있다는 거지요. 두 번째는 이 테스트가 특별히 학습 능력이 떨어지는 아이를 선별하는 용도로만 사용되어야 한다는 거지요. 즉 일반적으로 이 테스트를 가지고 아이들을 줄 세워서는 안 된다고 주장한 겁니다.

그 이유 중 하나로 그는 자신의 테스트 방법이 아이들의 지능을 완전하게 측정하기 힘들다는 점을 들었습니다. 그리고 이 테스트에서 실시하는 방식처럼 여러 가지 점수를 그저 합산하는 것이 진정한 지능을 나타내는 것이 아니라고 주장했지요. 그리고 지능 자체가 유전적으로 결정되며 극복할 수 없다는 주장에 대해서도 전혀 확인되지 않은 것이라고 말합니다.

하지만 그의 지능지수의 악용에 대한 우려는 미국의 심리학자들에 의해 전면적으로 현실화됩니다. 미국 전체 인구를 대상으로 지능테스트를 하고 그 평균 지능을 100으로 확정합니다. IQ라는 단어가 탄생합니다. 그 과정에서 앞서의 시릴 버트처럼 자신의 데이터를 조작하고, 실험 설계를 제대로 하지 않은 심리학자들에 의해 지능의 인종주의적 편견이 강화됩니다. 그 영향은 우리나라에도 이어져 모든 아이들을 대상으로 IQ검사를 실시하기에 이릅니다.

자 그럼 정말 우리 대부분이 받았던 IQ검사는 우리의 지능을 제대로 알려주는 걸까요? 그리고 지능은 유전되는 것일까요?

일단 우리 대부분이 학교에서 받아봤던 지능검사는 약식 집단검사입니다. 이런 검사의 경우 실험 자체가 엄밀하게 진행되기 힘들어서 결과가 엄밀하지 않은 것은 당연합니다. 이런 지능 검사의 경우 검사지 자체도 빈약하며, 환경 통제가 제대로 되지 않고, 검사를 처음 받는 경우와 두 번 이상 받는 경우의 차이도 나옵니다. 이런 검사의 경우 지적 장애나 경계선 지능 정도가 파악이 가능하며(그러나 지적 장애나 경계선 지능의 경우도 예비적 판정 정도의 의미를 가지며 실제 장애 정도를 확인하기 위해선 전문가에 의한 더 엄밀한 웩슬러 지능검사 등이 필요합니다.) 평균적 지능을 가진 경우 그 차이를 정확히 알 수 없습니다. 즉 학교에서 받은 지능검사에서 140이 나오든 100이 나오든 그 값을 신뢰하기 힘들다는 것입니다. 거기다 지능 검사를 여러 번 받아본 사람은 그렇지 않은 사람에 비해 더 높게 나타나기도 하구요. 또한 이런 지능 검사는 특정한 문화나 사회적 배경을 가진 사람에게 더 유리한 측면이 있습니다. 쉽게 말해서 수학 학원에 다니면서 수학 능력을 높인 아이들이 그렇지 않은 아이들에 비해서 훨씬 높게 나타난다는 거지요. 물론 논술학원을 다니는 경우도 마찬가지입니다.

한때는 인종간 지능지수가 다르다는 연구가 유행한 적이 있었다. 그러나 유전적인 요인이 아니라 사회적 요인에 의해 지능지수는 바뀔 수 있기 때문에 이 결과는 인종주의라고 비난을 받았다. 출처: 위키피디아

두 번째로 흔히 말하는 지능지수는 표준편차에 따른 비율을 나타냅니다. 즉 평균 지능인 100을 기준으로 110은 10% 더 높고 120은 20% 더 높은 것이 아니라 전체 인구 중 어느 정도의 비율에 해당되는지를 나타내는 것일 뿐입니다. 더구나 숫자로 나오는 120이니 130 등은 표준편차를 얼마로 잡느냐에 따라 달라집니다. 전 세계적으로 사용되는 것은 표준편차가 15인데 이 경우 160이 거의 최댓값입니다. 우리나라로 치면 전 국민 중 2000명이 안 되는 수치지요. 그런데 실제로 보면 지능지수 160이 넘는다는 사람이 주변에도 아주 흔하지는 않지만 꽤 됩니다. 이는 표준편차를 15가 아닌 24로 놓는 경우입니다. 멘사 코리아 등에서 사용하는 편차이지요. 물론 전체 인구 중 상위 몇 %에 속한다는 것이 개인에겐 자부심이 되기도 하고, 높은 점수를 받으면 기분이 좋기도 하겠지만 표준편차를 잡는 방식에 따라 달라진다는 겁니다. 더구나 지능지수에는 두 가지가 있는데 하나는 실제 연령에 비해 정신 연령이 얼마나 높은지를 판단하는 비율지능지수이고 다른 하나는 같은 연령대에서 얼마나 높은 위치에 있느냐는 편차지능지수입니다. 보통 언론에서 나오는 지능지수는 비율지능지수인데 이는 편차지능지수에 비해 높은 지능지수가 나옵니다. 거기에 비율지능지수는 연령대가 올라갈수록 결과가 부정확하지요. 즉 중학교 고등학교로 올라갈수록 검사가 부정확해지는 겁니다.

세 번째로 지능지수는 평균인 100을 중심으로 멀어질수록 그 신뢰도가 떨어집니다. 즉 머리가 아주 좋다거나 나쁘다면 그 정도가 어느 정도인지 지능지수 검사로는 밝힐 수 없다는 것입니다.

가장 관심 있는 지점인 지능지수와 성적의 연관 관계를 보면 실제로 일정한 상관관계가 있다고 나옵니다. 즉 지능지수가 높게 나올수록 성적이 높거나 흔히 창의적이고 대우 받는 직업을 가지는 경우가 높다고 나오는 것이지요. 하지만 이 둘이 완전히 일치하는 것은 아닙니다. 학업 성적과 지능지수의 비례는 약 10~30% 정도입니다. 즉 중요한 요인 중의 하나이긴 하지만 지능지수가 성적을 결정짓는 것은 아니란 것이지요. 그리고 지능지수가 높아질수록 둘 사이의 상관관계는 줄어듭니다. 특히나 흔히 IQ가 130 이상이라는 소위 영재로 가면 성적과 IQ사이의 상관관계가 아예 없습니다. 영재의 경우에는 지능과 성적은 아무 상관이 없고 성적을 좌우하는 건 다른 요인이라는 겁니다. 지능과 학업성적이 일정한 상관관계를 가지는 것은 90~ 120 정도 사이인 것이지요. 특히나 지능지수가 낮은 경우가 높은 경우보다 상관관계가 높은 것은 이들에 대해 특별한 교육적 관심이 필요하다는 걸 뜻하기도 합니다.

결국 현행 지능지수 검사는 얼마나 똑똑한가를 파악하기 위해서라기보다는 앞서 비네가 고려한 것처럼 일반적인 학교 수업을 받아들이기 힘든 경계성 지능이나 지적장애를 가리고 그 정도까지는 아니지만 학업 성취도가 아주 낮은 아이들에 대한 대책을 세우기 위한 용도 이상의 의미를 가지기 힘든 거지요.

*2019년 3월 6일 오전 10시 1차수정: 필자의 요청으로 <성적과 아이큐 비례는 10~30% 정도다> 제목을 <아이큐 테스트 기원에 '인종주의' 그림자가>로 교체했습니다.

박재용기자의 인기기사 전체보기

신한금융, 1Q 순익 1조3215억…‘리딩뱅크’ 탈환

尹대통령-이재명 첫 회담, 29일 열린다

HD현대마린솔루션, 일반청약에 증거금 25兆 몰렸다

어닝서프라이즈 ‘SK하이닉스’, 삼성전자 기대감 ‘솔솔’

아이큐 테스트 기원에 '인종주의' 그림자가

[박재용의 과학사] 지능지수(IQ) 측정의 역사, 의미, 한계

GMO 꼭 필요한가? 정말 유해한가?

천연섬유는 정말 합성섬유보다 환경과 건강에 좋을까

폭염이 끝이 아니다...지구온난화 대재앙의 시작