보험사가 의료 빅데이터를 노리는 이유

  • 기자명 박한슬
  • 기사승인 2019.07.17 10:33
이 기사를 공유합니다

최근 보건의료 빅데이터에 대한 관심이 높아지고 있습니다. 보건산업계에서는 세계 최고의 의료 빅데이터를 활용하지 못하게 한다며 정부에 대한 불만이 많은 상태지만, 시민단체에서는 개인정보 유출 우려와 의료 불평등이 커질 수 있다는 우려를 표명하며 관련 법률 개정을 반대하는 중입니다. 논란의 보건의료 빅데이터, 원하는 사람들은 누구고, 빅데이터로는 무엇을 할 수 있는 것일까요? 뉴스톱에서 짚어봤습니다.

 

2017년 10월 24일 더불어민주당 정춘숙 의원실에서 배포한 보도자료가 큰 논란을 불러일으켰습니다. 2014년 7월부터 2017년 8월까지 약 3년 동안 건강보험 심사평가원(이하 심평원)에서 국민들의 진료데이터를 외부에 판매해온 사실이 드러난 것입니다. 100만 명에서 140만 명 정도의 진료데이터 뭉치가 한 번에 30만 원 정도의 저렴한 가격으로 AIA생명, KB생명 등을 비롯한 민간보험사에 제공됐죠.

 

물론 해당 데이터들은 개인을 알아볼 수 없도록 비식별처리(De-identification)가 되어 있었지만, 당사자들의 동의를 받지 않았다는 논란이 커졌고 보건복지부는 심평원 데이터를 민간 기업에 제공하는 것을 일시 중단하겠다고 밝혔습니다. 해당 논란에서 주목해야 할 점은 두 가지입니다. 하나는 보건의료 빅데이터의 제공 및 사용이 개인정보 침해에 해당하는지고, 다른 하나는 애초에 왜 민간보험사가 이 데이터를 원했느냐는 것입니다.

 

‘빅데이터’는 개인정보인가

빅데이터(Bigdata)란 대략 “새로운 형태의 정보처리가 필요한 대용량 정보 자산” 정도로 정의됩니다. 기존에는 데이터화가 불가능했던 정보들 혹은 데이터가 있더라도 분석해서 활용하지를 못하던 정보들이 기술발전을 통해 처리가 가능해진 것이라고 이해하면 그리 틀리지 않습니다. 빅데이터 기술 덕분에 정부는 물론이고 기업이나 연구자들도 새로운 방식의 접근이 가능해졌지만, 빅데이터 사용에는 법적인 문제가 걸려있습니다. 빅데이터를 구성하는 개별적인 데이터들은 모두 개인이 생산한 것이라, 생산 시점에서는 대부분 ‘개인정보’이거든요.

 

현재 한국의 개인정보보호법상 개인정보는 “개인을 알아볼 수 있는 정보”로 정의됩니다. 이름이나 주민등록번호와 같은 직접적인 것들은 물론이고, 다른 정보와 결합하면 개인을 쉽게 특정할 수 있는 간접적인 정보도 모두 개인정보에 포함되고 있습니다. 예컨대 ‘서울 종로구 대학로 116 공공그라운드 4층’이라는 주소정보와 ‘대표’라는 직함은 직접 특정인을 지목하지는 않지만 두 정보를 연결하면 ‘뉴스톱 대표 김준일’이라는 개인을 알아볼 수 있으므로 둘을 묶은 정보가 있다면 이 역시 개인정보로 보호의 대상이 된다고 볼 수 있습니다.

 

빅데이터가 수백만 건의 데이터 모음집이라고는 하지만 개인정보인지를 판단하는 기본적인 원리는 동일하게 적용됩니다. 더군다나 보건의료 빅데이터의 경우, 일반적인 개인정보가 아닌 개인의 의료정보가 포함되기에 관련 정보는 모두 개인정보보호법 상의 ‘민감정보’로 분류됩니다. 일반적인 개인정보도 이용 및 수집에는 동의를 받아야 하는데, 의료정보와 같은 민감정보에 대한 이용 동의를 수백만 명에게 개별적으로 받기는 난망한 일입니다.

 

그래서 등장한 것이, 개인정보에 대한 비식별화를 통해 빅데이터를 개인정보가 아니게 만드는 방식입니다. 그런데 그 전에 먼저 짚어보겠습니다. 대체 보험사에서는 왜 보건의료 빅데이터를 얻으려던 걸까요?

 

 

수익 개선을 위한 보험사의 돌파구

현재는 다양한 요소를 모두 반영하여 보험료를 책정할 수 있는 방식인 ‘현금흐름방식’이 도입되었지만, 기존에는 보험사가 단 3가지 가격요소로만 보험료를 책정할 수 있었습니다. 실제로 지급된 보험금과 관련된 ‘위험률’과 보험사를 운영하는 과정에서 소요된 비용과 관련된 ‘사업비’, 그리고 시장의 금리와 관련된 ‘이자율’이죠. 현재 제도는 이런 세 가지 주요 요소에 더해 추가적인 요소들을 같이 고려해서 보험료를 책정하고 있습니다.

 

이런 구조에서 보험사가 수익을 늘리기 위해서는 가격요소를 바꿔야 합니다. 시장 금리를 보험사가 바꿀 수는 없습니다. 따라서 세 가지 주요 요소 중에서 보험사가 개입할 수 있는 것은 실질적으로 ‘사업비 절약’과 ‘위험률 계산’ 뿐입니다. 회사 운영경비를 최대한 절약하거나, 위험률 계산을 더 정확히 시행해서 보험금 지급액만큼 보험료를 많이 걷어야만 회사가 수익을 더 낼 수 있죠.

 

그렇지만 위험률 계산이 그리 쉬운 일은 아닙니다. 가입자들이 얼마나 보험료를 청구할지를 알아야 이를 토대로 보험료를 책정할 텐데, 이를 정확히 파악하려면 신뢰도 높은 통계자료가 필수적입니다. 그동안은 회사 내에서 자체적으로 수집한 고객들의 의료정보 데이터와 국가에서 제공하는 몇몇 통계지표를 토대로 위험률을 계산했지만, 위험률 결과가 썩 좋지 않았습니다.

 

실제로 고객에게 받은 보험료 대비 고객에게 지급한 보험금 비율인 ‘손해율’ 데이터를 살펴보면, 손해율이 100%를 넘는 보험사가 대부분입니다. 다시 말해, 고객에게 받은 돈보다 지급한 돈이 더 많다는 얘기죠. 물론 그렇게 받은 돈을 투자하고 운용하는 과정에서 수익을 올리므로 적자는 아니지만, 위험률 계산을 제대로 하지 못하고 있다는 방증은 됩니다. 그래서 보험사가 눈을 돌린 것이 보건의료 빅데이터입니다. 실제 환자들의 처방 데이터를 확인하면 위험률 계산을 상대적으로 정확하게 할 수 있고, 실질적으로 수익률이 개선될 수 있는 겁니다.

 

비식별처리 후에도 남는 문제들

비식별처리(de-identification)란 개인정보에서 개인을 식별할 수 있는 부분을 제거하는 과정을 말합니다. 그렇다면 무엇이 개인을 식별할 수 있는 정보를 판단해야 하는데, 대표적인 것이 미국의 「HIPAA 프라이버시 규칙」입니다. 국내에서는 이를 토대로 국내 상황에 맞게 변형한 「개인정보 비식별 조치 가이드라인」을 내놨죠. 이런 비식별 조치가 불완전해 개인을 추적할 수 있다는 반론도 나오고 있지만, 일반적인 빅데이터 이용 방식을 고려하면 그런 위험성이 높지는 않습니다. 중요한 것은 비식별처리 이후에도 문제점이 남아있다는 것입니다.

 

 

앞서 보험사의 사례를 다시 살펴보겠습니다. 보험연구원에서 발간한 <2018년 보험소비자 설문조사>에 따르면 2018년 기준 한국의 생명보험 가구 가입률은 85.9%에 달합니다. 그중 암보험과 같은 질병보장보험은 60%, 실손의료보험은 28.6% 정도를 차지했습니다. 정말 많은 수의 국민이 질병부담을 덜기 위해 생명보험에 가입하고 있는 것입니다. 위험부담이 다른 사람들이 서로 각자의 위험을 분담해주는 보험의 근본적 원리에 의해 혜택을 보는 것입니다.

 

그런데 보건의료 빅데이터와 같이 현실의 질병데이터를 성별에 따라, 연령에 따라, 혹은 고혈압이나 당뇨와 같은 기저질환의 유무에 따라 세세하게 뜯어서 분석할 수 있는 환경이 갖춰지면 이런 원칙이 깨질 가능성이 큽니다. 수익 추구를 위해 존재하는 민간보험사 입장에서는 이윤 극대화를 목표로 할 수밖에 없는데, 그러다 보면 실제로 보험제도의 도움이 필요한 고위험군을 배제하는 상품을 개발해야 하기 때문입니다. 결과적으로 보험의 도움이 그리 절실하지 않은 가입자들이 보험의 혜택을 받고, 그렇지 못한 사람들은 배제되는 건강불평등이 발생하게 되는 것입니다.

 

국내에서도 충분한 논의 후 확대해야

이런 문제점 때문에 유럽연합에서는 보건의료정보 등의 민감정보에 대해서는 원칙적으로 처리가 불가하단 입장을 세우고 있습니다. 일부 예외로 허용하는 것이 예방의학적 연구와 같은 공익적 목적으로 보건의료 빅데이터를 사용하는 경우인데, 이때에도 엄격한 보호 절차를 준수해야만 해당 데이터를 이용할 수 있도록 하고 있죠.

 

물론 일본 같은 국가에서는 보건의료 데이터도 비식별처리만 하면 상업적인 목적으로 사용할 수 있도록 하고 있지만, 그런 경우도 환자 본인이 거부 의사를 표명하면 본인의 정보가 빅데이터에 포함되지 않도록 하고 있습니다. 상업적인 이용 가능성을 열어주면서도, 정보 주체에게 충분한 결정권을 주는 셈입니다.

 

2013년에 있었던 약학정보원의 보건의료 빅데이터 판매 사건이나, 2017년에 있었던 심평원의 민간보험사에 대한 보건의료 빅데이터 판매사건은 아직 국내에서 보건의료 빅데이터의 이용에 대한 충분한 논의가 이루어지지 않았음을 보여주는 상징적인 사건이라고 할 수 있습니다. 보건의료 빅데이터 이용을 단순히 경제적인 측면에서만 접근하는 기사도 많지만, 이는 반쪽짜리 관점일 뿐입니다. 설익은 논의와 조급한 사용은 비슷한 사태만 양산하지 않을까요?

이 기사를 공유합니다
오늘의 이슈
모바일버전