[SGF시리즈#2] 인구이동분석, 접촉자 추적.. 팬데믹 극복을 위한 분석 기술

0

질병 확산을 억제하고 경제적 영향을 최소화하기 위해서는 인구가 어떻게 이동하는지 분석하고, 지역 내 접촉자를 추적하여 적절한 의사결정을 해야 합니다. 이번 SGF 시리즈에서는 인구 이동 분석과 접촉자 추적 등 SAS 분석 기술이 어떻게 팬데믹 극복을 위한 의사결정을 지원하는지에 대한 SAS 짐굿나잇 회장과 스티브 베넷 글로벌 정부기관 프랙티스 부문 이사의 세션을 소개합니다. 필리핀 최대 통신사 글로브 텔레콤(Globe Telecom)과 함께 이번 팬데믹에서 코로나 대응을 어떻게 지원하고 있는지 데모도 함께 소개해 드립니다.

대규모 인구 이동과 질병 확산 이해

대규모 인구의 이동성을 이해하면 세가지 인사이트를 얻을 수 있습니다. 첫째, 적절한 곳에 적절한 집합 제한 정책을 실행하고, 그 효과를 측정할 수 있습니다. 둘째, 지리적 질병 확산을 이해하고 이를 기반으로 의료 자원을 적절한 곳에 최적으로 분배할 수 있습니다. 마지막으로, 제한을 해제할 수 있는 시간과 장소를 파악하여 경제 영향도 최소화할 수 있습니다.

SAS는 질병 확산과 관련된 대규모 인구 이동 변화를 알아보기 위해서는 휴대폰 통신과 기지국 데이터를 분석했습니다. 필리핀에서 가장 큰 통신사인 글로브 텔레콤(Globe Telecom)과 2004년부터 파트너십을 맺고 지속적으로 협업하고 있으며, 이번 팬데믹에서 필리핀 내 코로나 대응을 함께 지원하고 있습니다.

SAS가 제공하는 ‘위치 네트워크 분석 대시보드’인구 이동을 시각적으로 보여줍니다. 3월~4월 마닐라와 주변 지역 지도를 보면 빨간색 음영이 있는 부분이 '코로나19 확진자가 발생한 지역'입니다. 파란색 데이터는 SAS VDMML 내 위치 관계망 분석 계산을 통해 시각화한 것으로, ‘확산 속도’를 보여주는 핵심 지표입니다. 질병이 다른 지역으로 퍼질 수 있는 잠재적 위험성을 판단하는 데 사용됩니다.

한편 ‘주간 정적 데이터 보고서’를 보면 확진자와 확산 속도가 북쪽과 남쪽으로 길게 이어진 것을 볼 수 있습니다. 이를 좀더 줌인하면 보면 철도와 고속도로 등 주요 교통수단을 따라 확진자가 형성된 것을 알 수 있으며, 이것이 지리적 확산에 영향을 미쳤을 것으로 해석할 수 있습니다. 다른 주간 보고서와 비교하면 더 많은 것을 알 수 있습니다.

확진자가 많아 진한 빨간색으로 표시된 3월 말, 마닐라 지역에서 어떤 일이 있었는지 자세히 살펴보기 위해 SAS Visual Analytics에서 기본 이동성 데이터를 끌어오면 다수의 꼭짓점에서 수많은 사람들의 이동이 확인됩니다. 지도를 실시간으로 필터링하여 1만 명 이상이 이동한 꼭짓점만 표시해보면 마닐라 수도권에서 수많은 사람이 어디로 움직이는지 확인할 수 있습니다.

사람들의 이동을 나타내는 이동성 대시보드에서 노란색 부분은 질병을 다른 지역으로 확산시킬 위험이 높은 지역을 의미합니다. 마닐라 시를 선택하면 주요 인구 통계 정보와 함께 확진자 유입 가능성을 보여주는 매핑 정보가 나타납니다. 여기서 무엇보다 중요한 것은 사람들의 평균 이동 거리, 이동 수단, 목적지 등을 나타내는 이동성 데이터입니다. 사람들의 이동 방식을 이해하면 사회적 거리 두기 등 여러 정책 결정을 통해 질병 확산을 막을 수 있습니다.

대시보드에서 이동성 다음으로 확인할 것은 연결성입니다. 이동성 데이터를 기반으로 얼마나 다양한 지역사회가 서로 연결되어 있는지 확인할 수 있습니다. 이 데이터를 보여주는 지도는 사실 상당히 복잡합니다. 따라서 SAS Visual Analytics에서 실시간으로 필터링을 하여 이동성이 큰 꼭짓점을 확인합니다.

해당 도시 주변의 확산 고위험을 표시하는 확진자 유입 가능성 데이터도 볼 수 있습니다. 이 데이터를 보면 사람들이 도시에서 빠져나가 남쪽으로 이동하고 있습니다. 확진자 지도에서 질병이 마닐라 진원지에서 남쪽으로 확산된 방식과 이동성 데이터가 일치하는 것입니다. 이처럼 이동성을 이해하면 대중교통 정책뿐만 아니라 선제적인 의료 자원 배분에 더 나은 결정을 할 수 있습니다.

이동성과 질병 확산 사이의 관계를 확인하면 질병이 어디로 향할지 예측할 수 있습니다. 대시보드 화면에서는 일주일 동안의 코로나19 분포도와 함께, SAS 머신 러닝이 예측한 다음 주 상황을 시각화하여 제시합니다. 이는 SAS VDMML에서 그래디언트 부스팅을 사용한 것입니다.

화면에서 짙은 빨간색 음영이 있는 부분은 확진자가 증가할 거라는 모델 예측이 적중한 부분입니다. 연한 핑크색은 증가하지 않는다는 예측이 적중한 부분으로, 실제로 유의미한 변화는 없었습니다. 이 기간에 모델 정확도는 94~97%를 기록했습니다.

정부 공공 보건 기관에서는 이러한 유형의 데이터를 통해 질병 확산의 향방을 예측하고 여러 정책을 결정할 수 있습니다. 가령 질병이 특정 지역에 퍼질 거라는 증거가 있다면 의료 자원을 사전에 배치할 수 있습니다. 또한 질병이 확산되지 않을 것으로 예상되는 지역을 파악하여 이동 제한을 변경하고 경제적 영향을 최소화할 수 있습니다.

접촉자 추적 조사

정부나 관계기관에서는 질병 확산을 제한하기 위해 많은 사람들을 고용하여 접촉자 추적 조사를 실시하고 있습니다. SAS는 이 조사의 효율성을 높이기 위해 SAS Viya에 구축된 Visual Investigator 를 사용하여 접촉자 추적 조사를 현대화하고, 확장하고, 가속화했습니다.

SAS는 별도의 앱 다운로드 없이 모든 모바일 브라우저에서 작동하는 가벼운 모바일 인터페이스 ‘Mobile Investigator‘를 구현했습니다. 접촉자 추적 담당자는 휴대폰을 이용하여 확진자를 검색하고, 그와 연관된 새로운 접촉자를 간단히 추가할 수 있습니다. 이처럼 모든 지역에서 접촉자 추적 조사 데이터를 입력하면 관계망을 보여주는 시각화 자료에 자동으로 업데이트됩니다.

한편, 확진자 조사자는 확진자의 관계망을 확인할 수 있습니다. 확진자와 연결된 기존에 알려진 접촉자가 있다면 그에 대한 정보는 물론, 관계망을 통해 수많은 연결고리를 차례로 확인할 수 있습니다. 몇 번의 클릭으로 잠재적인 전파 관계망을 빠르게 살피고 위험 요인을 이해할 수 있습니다. 공중 보건 기관의 경우 단순한 접촉자 추적뿐 아니라 시간 추이별 이동, 교통수단 이용, 장소 등 더 많은 데이터를 추가할 수 있습니다.

추적된 접촉자에게서 얻은 데이터에 기반하여 연결 고리를 만들어 가는 것은 공중 보건 담당자들이 며칠 또는, 몇 주에 걸쳐 처리하는 일이었습니다. 하지만 SAS Visual Investigator에서는 관계망이 자동으로 만들어지고 추가 조사를 쉽게 할 수 있도록 표시됩니다. 팬데믹에서는 속도가 생명을 살리기 때문에, 조사 관계망을 자동화하는 것은 매우 중요합니다.

SAS는 지난한 분석 과정을 최소화할 수 있도록, 일반적으로 우려되는 패턴을 조사자가 식별할 수 있는 기능도 제공합니다. 가령 확진자가 여러 요양원에서 근무하고 식품 서비스와도 관련된 사람이라면 관계망 전체에서 같은 패턴을 나타내는 사람이 있는지 검색해볼 수 있습니다. 아울러 접촉자 추적 데이터가 시스템에 유입되면, 기준을 만족하거나 해당 패턴이 나타나면 알림을 보내 조사자에게 새로운 지역 또는 위험 패턴이 나타났음을 선제적으로 알려줍니다.

이번 세션에서는 대규모 인구 이동부터 접촉자 추적까지, 생명을 살리고 경제를 보호하는 공중 보건 결정에 있어 분석이 얼마나 중요한 역할을 하는지 알 수 있었습니다. 다음 SGF 시리즈에서는 이코노미스트와 함께 진행한 ‘글로벌 비즈니스 바로미터’ 조사 결과와 관련된 세션을 소개할 예정입니다. 한편 SAS 글로벌 포럼의 주요 영상은 국문 자막과 함께 Virtual SAS Global Forum 2020 사이트에서 확인할 수 있습니다.

인구 이동 분석과 접촉자 추적 데모는 영상을 통해 확인해 보세요

Share

About Author

Jihye Yoo

Sr. Marketing & Communications Specialist

Related Posts

Leave A Reply

Back to Top