This study aims to develop a severity-adjusted length of stay predictive model according to comorbidity index by using machine learning and propose a algorithm of severity-adjusted length of stay (LOS) predictive model. The dataset was taken from Korea Centers for Disease Control and Prevention database of the hospital discharge survey from 2006 to 2015 and the severity-adjusted length of stay predictive model was developed for the nervous system patients to need a urgent management for length of stay. when it comes to the severity-adjusted length of stay predictive model about nervous system discharging patients, three tools were used for the severity-adjustment of comorbidity: the CCI, the ECI, and the CCS. The models using Regression, Decision Tree, Random Forest, Support Vector Regression, Neural Network as a Machine learning analysis methods were developed and then evaluate. As a result, Severity-adjusted predictive model using CCS as the severity-adjustment of comorbidity and Neural Network method has the highest R-square and has the most excellent prediction capability. In conclusion, there is a need to develop a severity-adjusted predictive model using CCS as the severity-adjustment of comorbidity and make use of severity-adjusted predictive model to has high prediction capability by using various machine-learning analytics.
본 연구는 머신러닝을 이용하여 동반상병 보정 방법에 따른 중증도 보정 재원일수 예측 모형을 개발하고 이를 평가하여 중증도 보정 재원일수 예측 모형 개발의 알고리즘을 제시하기 위해 수행되었다. 본 연구를 위해 2006년부터 2015년까지 10년간의 질병관리본부 퇴원손상심층조사 자료를 수집하였으며, 재원일수 관리가 시급한 신경계통의 질환을 대상으로 중증도 보정 재원일수 예측 모형을 개발하였다. 신경계통의 질환 퇴원환자의 중증도 보정 재원일수 예측 모형 개발 시 동반상병 보정 방법은 CCI, ECI, CCS 진단군 분류 기준 등 3가지, 머신러닝 분석기법으로는 회귀분석, 의사결정나무, 랜덤 포레스트, 서포트 백터 회귀분석, 신경망 등 5가지를 적용하여 모형을 개발하고 개발된 모형을 평가하였다. 모형 평가 결과 CCS 진단군 분류 기준 동반상병 보정 방법 및 신경망을 이용하여 개발한 중증도 보정 예측 모형의 모형 설명력(R-square)이 가장 높았으며, 모형의 예측력이 가장 우수한 것으로 나타났다. 따라서 중증도 보정 재원일수 예측 모형 개발 시 CCS 진단군 분류 변수를 이용한 동반상병 보정 방법을 이용하여 중증도 보정 예측 모형을 개발하는 것이 필요하며, 머신러닝의 다양한 분석 기법 등을 이용하여 예측력 높은 중증도 보정 예측 모형을 개발하여 재원일수 변이요인 파악 등 재원일수 관리를 위해 활용하는 것이 필요하다.
본 연구의 목적은 다년간의 건강검진 및 문진 자료를 이용하여 고혈압 건강위험평가 모형을 개발하기 위한 것이다. 2010년 고혈압 미발생 수검자 11,632명을 대상으로 이들의 2009~2010년 건강행태, 신체계측 및 생화학검사 결과와 같은 건강위험요인 상태변화가 2011~2012년 고혈압 발생에 미치는 영향을 파악하기 위해 로지스틱 회귀분석으로서 고혈압 건강위험평가 모형을 개발하였다. 그 결과, 개발된 고혈압 건강위험 평가 모형을 통해 연령, 가족력, 음주습관 변화, 허리둘레 변화, 혈압 및 중성지방 수치의 변화가 주요 위험요인으로 선별되었다(C-통계량 =0.81[남=0.78, 여=0.87]). 특히 고혈압 전단계(120-139/80-89 mmHg) 수준을 유지하는 경우, 정상 수준을 유지하는 사람에 비해 3-4년 이내 고혈압 발생위험이 16.52배(95% CI, 9.36-29.16) 높았다. 건강행태, 신체계측, 생화학검사의 변화 정도를 위험 요인으로 구성한 고혈압 발생 예측 모형은 환자뿐만 아니라 임상의료인과 보건정책가에게도 유용하게 이용될 수 있을 것이며, 추후 외적 타당도 연구가 수행되어야 할 것이다.;This study aimed to develop a health risk appraisal model for predicting hypertension incidence by using measures based on multi-year (2008-2012) data of individuals who underwent a general health examination. A total of 11,632 subjects with a normal blood pressure in 2010 were enrolled to observe changes of health behavior, anthropometric measurements, and laboratory results from 2009 through 2010 affecting hypertension incidence in 2011-2012. A hypertension risk score model was developed using logistic regression. Also, the C-statistic (95% confidence interval) was used to develop the best-fitting prediction model. Hypertension risk model consisted of age, family history of hypertension, and changes in drinking behavior, visceral obesity, blood pressure level, and triglycerides level (C-statistic=0.81[male=0.78, female=0.87]). The incidence rate of hypertension was positively associated with change (Δ) in blood pressure level, especially sustaining level of prehypertension (odds ratio [95% CI], 16.52 [9.36-29.16]), independently from other risk factors. The health risk model will be helpful for clinicians and policy makers as well as individuals to prevent hypertension.