한국보건사회연구원

보도자료

『보건복지포럼』 2020년 8월호 발간

작성일 2020-08-28

조회수 9,109

『보건복지포럼』 2020년 8월호 발간

이달의 초점 / 보건복지 데이터 활용 현황과 과제

□ 한국보건사회연구원(원장 조흥식·이하 보사연)은 보건복지포럼 8월호(통권 제286호)를 아래와 같이 발간했다.

▣ 권두언 : 보건복지 데이터 활용 현황과 과제 / 임근찬 한국보건의료정보원 원장

-주요내용-

360여 개의 복지사업을 통합하여 개인별·가구별 통합 관리 체계를 구축함으로써 복지 대상자 선정 시 필요한 데이터(소득, 일반 재산, 금융 재산, 자동차 재산 정보 등)를 동일하게 사용하며, 개인 및 가구가 받고 있는 복지급여와 서비스를 한눈에 볼 수 있도록 통합 관리 체계를 구축해 운영하고 있다. 그 전에는 시군구별, 복지사업별로 시스템이 구축되어 있어 복지 데이터의 기본 체계인 개인별·가구별 데이터가 생성되기 어려운 구조였기 때문에 전국 단위의 대상자별 복지서비스 통합 현황 데이터 생성이 어려웠다. 이러한 복지 분야 빅데이터를 기반으로 2016년부터 단전, 단수, 실직, 관리비 체납 등의 외부 데이터를 결합·활용하여 경제적 위기 가구를 예측·발굴하는 복지 사각지대 발굴 시스템을 운영하고 있다. 2018년부터는 위기 아동을 사전에 예측·발굴하여 아동학대 등을 예방하는 e아동 행복 지원 시스템을 구축해 사용하고 있으며, 최근에는 위기 변수들을 추가하여 발굴의 정확도를 높여 나가고 있다.

▣ 이달의 초점 / 보건복지 데이터 활용 현황과 과제

● 근거 기반 정책 지원을 위한 연구 데이터 관리와 개방 / 정영철 보사연 연구위원

● 아동통계 행정패널 구축 방안 / 오미애 보사연 연구위원

● 2020년 OECD 보건통계를 통해 살펴본 우리의 보건의료 현황과 통계 정보 생산 개선 과제 / 신정우 보사연 연구위원

● 패널 데이터 품질 개선을 위한 항목무응답 대체 방법 / 이혜정 보사연 부연구위원

▣ 보건복지 소식 광장

<붙임> 이달의 초점 각 주제별 요약

● 근거 기반 정책 지원을 위한 연구 데이터 관리와 개방 / 정영철

근거 기반 연구, 데이터 중심 연구가 부각하고 정보기술이 발전함에 따라 공적 자금으로 만들어진 연구 성과와 과정을 개방하고 공유하여 데이터의 가치 제고와 융복합 연구 성과 창출을 추구하는 ‘오픈 사이언스’ 운동, ‘오픈 사이언스 정책’이 전 세계적으로 확산되고 있다. 우리나라도 이에 부응하여 과학기술 연구에서 데이터 관리 계획을 도입하여 추진하고 있으며, 현 정부의 ‘한국판 뉴딜 정책’에서도 ‘데이터 수집·가공·거래·활용 기반 구축을 통한 경제 가속화(데이터 댐)’ 과제를 10대 대표 과제 중 하나로 선정하는 등 공적 자금으로 만들어진 연구 결과물 활용에 대한 필요성은 더욱더 커지고 있다. 그러나 과학기술계에 비해 경제인문사회계 연구 부문에서는 연구 데이터 개방·공유의 필요성, 중요성이 공론화되지 않고 있으며 그 현황조차 파악이 안 되고 있다. 그러므로 연구 데이터 통합과 재사용에 따라 새로운 지식과 가치가 창출되는 ‘오픈 사이언스’, ‘오픈 데이터’의 의미를 부여하기 위해서는 우선 경제인문사회계 연구기관들의 연구 데이터 관리 및 공유·활용 체계 현황과 이들 기관 연구자들의 인식을 파악하고 이를 토대로 경제인문사회계 연구기관의 실정에 맞는 가이드라인을 제시할 필요가 있다.

● 아동통계 행정패널 구축 방안 / 오미애

행정 데이터를 활용하면 예산을 절감할 수 있으며 행정 효율을 높여 저비용·고효율 통계를 생산할 수 있다. 또 각 정부 부처와 공공기관에서 누적·관리되고 있는 행정 데이터를 시계열적으로 활용할 수 있다면 패널 방식의 종단 분석이 가능해진다. 이 글에서는 아동통계에 초점을 맞추어 행정 데이터를 활용한 패널 구축 방안을 모색해 보고자 한다. 이를 위해 데이터 관점에서 아동통계 행정패널의 대상과 영역, DB 구축 방안, 활용 방안, 이슈를 살펴보았다. 아동의 기본적 권리를 보장하는 차원에서 아동통계 행정패널은 좋은 도구가 될 수 있으며 아동의 기본적 권리 수준 및 삶의 질 수준을 파악하는 데 기여할 수 있다.

● 2020년 OECD 보건통계를 통해 살펴본 우리의 보건의료 현황과 통계 정보 생산 개선 과제 / 신정우

지난 7월 1일 경제협력개발기구(OECD)는 보건통계 데이터베이스(DB)를 최신 정보로 업데이트했다. 보건통계 DB는 건강 수준, 건강 위험 요인, 보건의료 자원, 보건의료 이용 등 1000여 개 항목으로 구성되어 있다. 이들 정보는 국민의 삶과 보건의료제도의 모습을 잘 보여 준다. OECD는 각종 통계 정보가 우리의 현실을 보여 주는 것을 넘어서 국가 간 벤치마킹 대상이 되고 심도 있는 정책 분석에 활용되기를 기대한다. 비록 이 정보는 OECD에 의해 공표되지만, 모두 각 국가가 생산, 수집하여 OECD에 제공한 것이다. 기초 자료를 생산, 수집하는 과정에서 우리의 현실을 돌아보고, 국제적으로 공표된 통계 정보를 통해 우리의 모습을 다시 한 번 살펴봄으로써 더 나은 정책을 구상할 수 있을 것이다. OECD가 강조하는 근거 기반 정책은 통계 정보에 대한 우리의 수요와 적극적인 생산 의지에서 시작된다.

● 패널 데이터 품질 개선을 위한 항목무응답 대체 방법 / 이혜정

수집한 패널 데이터의 사후적인 품질 관리 방법으로는 데이터 정제를 통한 정합성 관리, 패널 이탈에 대한 지속적인 검토를 통한 표본 대표성 확보, 가중치 작성, 항목무응답에 대한 처리 등이 있다. 이 글에서는 한국복지패널조사 및 한국의료패널조사에서의 항목무응답 대체 방법을 소개하고 최신 통계 방법인 기계학습 통계기법을 기반으로 한 항목무응답 대체 방법의 효과를 파악하여 적절한 대체 방법을 제안하고자 한다. 이에 대한 종합적인 결과와 활용 방안은 세 가지로 요약할 수 있다. 첫째, 패널 자료에서의 항목무응답 대체 시 기계학습 통계기법을 적용할 수 있는 가능성을 확인하였다. 특히 랜덤 포레스트 대체 방법은 편향뿐만 아니라 다른 평가지표도 우수한 결과를 보여 실무에서 활용해 볼 수 있다고 생각한다. 둘째, 대체군 활용 여부에 따라 대체 효과가 확연히 달라지는 결과를 통해 무응답 대체 시 대체군 활용의 중요성을 다시 한 번 확인하였다. 셋째, 보조변수로 활용하는 설명변수 개수 증가에 따른 대체 효과를 확인하였다. 복잡하고 포괄적인 모형보다는 무응답 대체 대상 변수와 연관성이 큰 설명변수를 탐색하고 선정하는 것이 무응답 대체 효과 향상에 효과적이라고 생각한다. 바람직한 대체 방법은 통계적 추론에서 발생할 수 있는 무응답 편의가 감소하고 모집단 분포로부터 표본 분포가 왜곡되지 않고 비슷하게 유지될 수 있어야 한다. 이 점을 인지한다면 더욱 정확하고 신뢰성 있는 무응답 대체 자료를 제공할 수 있을 것이다.

※ 포럼 내용은 홈페이지 발간자료 → 정기간행물 → 보건복지포럼에서 원문 파일을 내려 받을 수 있다.

공공누리 공공저작물 자유 이용허락, 출처표시, 상업적 이용 금지, 변경금지

연구활동

연구주제

발간자료

알림공간

참여공간

연구원소개

정보공개

회원

사이트 안내

연구활동

연구주제

발간자료

알림공간

참여공간

연구원소개

정보공개

알림공간

보도자료

『보건복지포럼』 2020년 8월호 발간