한국보건사회연구원 한국보건사회연구원

보도자료

[코로나19 특집④] “31번 확진자 발생 후 코로나19 관련 데이터양 급증”

  • 작성일 2020-03-17
  • 조회수 5,871

“31번 확진자 발생 후 코로나19 관련 데이터양 급증

             -한국보건사회연구원, ‘코로나감염-19’ 주제 보건·복지 ISSUE & FOCUS 시리즈 4

             -오미애 빅데이터·정보연구센터장 집필SNS·뉴스 등 데이터 약 260만 건 수집·분석

             -마스크, 분석 기간 지속적 높은 빈도국민 반응 실시간 모니터링 할 시스템 필요

 

한국보건사회연구원(원장 조흥식, 이하 보사연)17보건복지 ISSUE & FOCUS376호를 발간했다. 이번호는 중국에서 발생해 국내는 물론 전세계를 강타하고 있는 신종 코로나바이러스 감염증(코로나19)에 관한 특집호 4편이다. 코로나19 특집호 시리즈는 앞으로 세 편이 더 나올 예정이다.

 

특집호 4편 주제는 코로나바이러스감염증-19 소셜 빅데이터 기반 주요 이슈 분석으로 정보통계연구실 오미애 빅데이터·정보연구센터장과 보건정책연구실 전진아 건강정책연구센터장이 공동집필했다.

 

이번 호에서는 소셜 빅데이터 분석을 통해 코로나19 확산에 따른 주요 키워드의 변화 추이와 국민들의 반응을 다각도로 살펴봤다. 이를 위해 지난 120(국내 첫 확진자 발생일)부터 38일까지 뉴스, 블로그, 카페, SNS, 커뮤니티에서 수집한 키워드 관련 데이터(문서/댓글) 260만 건을 1~7주차로 나눠 수집·분석했다.

 

버즈양’(어떤 주제에 대한 온라인상에서의 언급 횟수)을 보면 첫 번째 확진자가 나온 1주차에 26000건이던 문서양은 슈퍼전파자로 추정된 31번째 확진자가 발생했다는 정부 발표 이후 23만건(5주차)에 이어 42만건(6주차), 41만건(7주차)으로 급증했다.

 

오미애 센터장은 확진자 수 발표, 신천지 집단 감염, 마스크 판매 이슈 등이 버즈양 증가를 견인한 것으로 보인다이에 따라 다양한 이슈들이 공유되고, 외부 활동 자제, 마스크 판매 급증, 사재기, 개학 연기, 오프라인 매출 감소 등 다양한 사회·경제적 파급효과를 불러왔다고 설명했다.

 

코로나19 연관어 빈도 순위 집계 결과를 보면 문서에서는 중국 확진 환자 신천지 마스크 순으로 높은 빈도를 보였고, 댓글에서는 중국 신천지 중국인 입국 순으로 빈도가 높았다. 특히 마스크는 분석 대상 기간 지속적으로 높은 빈도를 보였다. 오 센터장은 이는 예방에 대한 국민의 관심 급증과 마스크 수급 부족 등을 의미하는 것일 수 있다고 풀이했다.

 

정부’, ‘대통령이 주요 키워드로 부각되고 있는 것도 눈에 띤다. 이와 관련 오 센터장은 정부와 대통령에 대한 지지와 비판의 양가적인 입장을 보여 주는 것이라며 하지만 코로나19가 국내에서 발생한 이후부터 꾸준히 높은 빈도를 차지하고 주요한 네트워크로 표현되고 있다는 점은 정부와 대통령에 대해 어떠한 입장을 보이든지 간에 우리 사회가 정부의 코로나19 유행 대응에 높은 관심을 가지고 지켜보고 있음을 의미하는 것이라고 분석했다.

 

아울러 오 센터장은 국민의 정서 관리가 필요한 지금과 같은 국가 재난 상황에서는 현재의 이슈를 실시간으로 파악하고 전문가들이 객관적인 데이터를 통해 국민의 반응을 실시간으로 모니터링할 수 있는 시스템이 필요하다고 강조했다.

-------------------------------------------------------------------------------------

  

 

주요 내용

 

2020120일 국내에서 첫 확진자가 발생한 후 코로나바이러스감염증-19(이하, 코로나19)가 확산되면서 국민의 일상생활부터 국가와 경제·사회 전반에 걸쳐 영향을 미치고 있음. 이 글에서는 코로나19 관련 언론 보도 및 댓글들(2020120~202038)을 분석하여 시기별로 발생한 이슈들을 살펴보았음.

빈도 분석 및 네트워크 분석 결과, 중국과 관련된 키워드 중심에서 대구, 신천지 키워드 중심으로 변화하고 지역사회 2차 감염 관련 키워드로 확산되는 양상이 보임.

코로나19에 신속하게 대응하기 위해 현상을 전체적으로 모니터링하고 방향을 설정할 수 있는 데이터 기반 시스템 체계가 필요함.

 

 

분석 데이터 및 분석 방법

 

2020120(국내 첫 확진자 발생일)부터 202038일까지 뉴스, 블로그, 카페, SNS, 커뮤니티에서 수집 키워드 관련 데이터(문서/댓글) 260만 건을 수집함.

수집 키워드: ‘코로나’, ‘우한’ (*코로나19 발생 초기, ‘우한 폐렴이라는 표현을 사용하여 우한이라는 키워드를 포함함)

 

코로나키워드로 수집된 빅데이터를 활용하여 시계열 버즈양 분석, 연관어 분석, 네트워크 분석 방법을 적용하였음.

 

 

소셜 빅데이터 분석 결과 시계열 버즈양

 

2019. 12. 31. 국내에서 처음으로 우한 폐렴이라는 이름으로 코로나19 관련 보도가 이루어진 후, 2020. 1. 20. 국내 첫 확진자 발생 전까지 국내에서는 큰 반응이 없었음.

 

2020. 1. 20. 국내 첫 확진자가 발생한 후, 과거 대비 버즈양이 급증함으로써 다수의 사람들이 이전보다 관심을 가지기 시작함.

 

2020. 1. 31. 국내 확진자가 10명을 넘어서면서 버즈양이 증가하였고, 이후 국내 확진자 수가 큰 증가를 보이지 않으며 버즈양 또한 감소하는 양상을 보임.

 

2020. 2. 18. 국내에서 31번째 확진자가 발생하면서 버즈양이 증가함.

 

2020. 2. 20. 국내 첫 사망자 발생 및 국내 확진자 수가 100명 이상 증가한 시점에 다시 한번 버즈양이 급증하였고, 확진자 수와 버즈양 증가 추이가 궤를 같이하는 것을 확인할 수 있었음.

 

 

소셜 빅데이터 분석 결과 코로나19 연관어 순위 분석

 

코로나19 연관어 빈도 순위 분석 결과, 문서에서는 중국, 확진, 환자, 신천지, 마스크 순으로 높은 빈도를 보였으며, 댓글에서는 중국, 신천지, 중국인, 입국 순으로 빈도가 높음.

 

문서와 댓글에서 나타난 키워드들을 유형별로 구분해 보면, 코로나19 발생, 유행 및 확산과 관련한 중국, 대구, 신천지가 많이 언급되었으며 코로나19 확진, 환자, 증상에 대한 관심도 높은 것으로 나타남.

 

마스크 수급과 관련한 지속된 우려를 반영하듯 마스크가 주요한 키워드로 나타나며, 코로나19 유행 대응과 관련한 정부’, ‘대통령키워드 역시 많이 나타남.

 

주차별 코로나 연관어 빈도 순위 분석 결과, 문서와 댓글의 연관어 빈도 순위를 보면, 코로나19가 국내에서 대구와 경북 지역을 중심으로 확산되기 전에는 중국이 가장 높은 빈도를 보였으나, 코로나19가 신천지 신도 중심으로 확산됨에 따라 신천지가 가장 높은 빈도를 보임.

 

또한 국내에서 코로나19가 확산되기 전에는 중국, 일본, 교민, 크루즈 등의 이슈가 부각되었으나, 확산된 이후에는 개인 보건위생과 관련한 손, 물 등에 대한 키워드가 높은 순위를 보이고 있음. 이는 코로나19 유행 초기에는 코로나19혹은 우리의 문제로 바라보기보다 중국혹은 일본’, ‘크루즈에서 유행하는 문제로 보아 객관적 입장을 견지하였다면, 국내 확산이 본격화되면서 코로나19혹은 우리의 문제로 여기게 되었음을 의미함.

 

 

   

소셜 빅데이터 분석 결과 코로나19 연관어 네트워크 분석

 

3주차(2020. 2. 3. ~ 2. 9.)의 네트워크 결과에 보이는 태국, 일본, 크루즈 키워드는 태국을 여행한 한국 여성이 확진 환자로 판정받은 것과, 일본 대형 크루즈선에 한국인 9명이 탑승해 있었다는 사실과 관련이 있음. 중국, 공장, 부품, 가동 키워드는 코로나19 영향으로 중국 부품 업체가 가동을 중단함으로써 해당 부품 재고가 없어 한국의 공장 가동이 중단되는 상황과 관련이 있음.

 

5주차(2020. 2. 17. ~ 2. 23.)의 네트워크 결과를 보면 중국 중심의 키워드가 대구, 확진, 환자, 신천지 키워드 중심으로 변화한 것을 볼 수 있음.

 

7주차(2020. 3. 2~3. 8.) 네트워크 결과를 보면 마스크, 판매, 약국 키워드와 확진, 검사, 판정 키워드의 연관성이 높게 나타났는데, 이는 정부의 공적 마스크 공급, 한국의 코로나19 대처 및 대규모 검사 진단에 대한 외국의 보도와 관련이 있음.

 

 

코로나19, 국민 개개인 일상에 영향

 

코로나19가 국내에서 발생한 이후 매일 확진환자에 대한 기사들이 쏟아졌기 때문에 확진은 주요한 키워드일 수밖에 없음. 하지만 유행 상황에 따라 키워드를 통한 국민 혹은 사회의 관심도가 달라지는 것을 확인할 수 있었음.

 

발생 및 유행 초기에는 중국, 일본 등 해외에 대한 관심도가 높았던 반면, 코로나19 확산이 본격화됨에 따라 신천지, 대구에 대한 관심도가 높아졌음을 확인할 수 있었음. 또한 대구와 경북 지역 외 17개 시도에서 모두 확진자가 발생한 6주차부터는 지역이라는 키워드 역시 중요하게 부각되었음.

 

코로나19가 확산됨에 따라 마스크수급 부족 문제가 본격화되었으며, 여전히 다수의 국민은 마스크 부족 문제를 경험하고 있음.

 

정부 대응 과정에 대한 관심도는 정부’, ‘대통령이 주요한 키워드로 부각되고 있는 것에서 확인할 수 있음. ‘정부’, ‘대통령키워드는 정부와 대통령에 대한 지지와 비판의 양가적인 입장을 보여 주는 것임. 하지만 코로나19가 국내에서 발생한 이후부터 꾸준히 높은 빈도를 차지하고 주요한 네트워크로 표현되고 있다는 점은 정부와 대통령에 대해 어떠한 입장을 보이든지 간에 우리 사회가 정부의 코로나19 유행 대응에 높은 관심을 가지고 지켜보고 있음을 의미하는 것임.

 

현재는 전염병 확산 방지를 위해 실시간 지역별 확진자 현황 및 동선 정보 제공 등 객관적인 정보 전달을 위해 노력하고 있지만, 이를 전체적으로 살펴볼 수 있는 데이터 기반 시스템 체계가 필요함.

 

국토교통부와 과학기술정보통신부, 질병관리본부는 코로나19 확산 방지를 위해 국토부와 과기정통부에서 연구·개발 중인 스마트시티 기술을 활용해 역학조사를 지원하는 시스템을 시범 운영할 계획임. 이 시스템을 활용하면 확진자 동선을 확인하는 데 걸리는 시간을 평균 5시간에서 10분가량으로 줄일 수 있으며, 신속하게 정보를 전달할 수 있게 됨.

 

국민의 정서 관리가 필요한 지금과 같은 국가 재난 상황에서는 현재의 이슈를 실시간으로 파악하고 전문가들이 객관적인 데이터를 통해 국민의 반응을 실시간으로 모니터링할 수 있는 시스템이 필요함.

 

원문 보기 http://repository.kihasa.re.kr/handle/201002/34480


 

공공누리 공공저작물 자유 이용허락