영상요약
과거에는 데이터를 단순히 수치로 표현되는 결과물로만 한정하여 생각하곤 했습니다. 하지만 현대 데이터 과학의 영역은 이를 넘어 이미지나 사물과 같은 비정형 데이터까지 폭넓게 포괄하고 있습니다. 한국인의 평균적인 얼굴형을 분석하거나 특정 집단의 대표적인 특성을 도출하는 과정 모두가 이제는 데이터의 영역에 들어온 것입니다. 이처럼 예전에는 미처 인식하지 못했던 다양한 형태의 정보들을 분류하고, 그 안에서 유의미한 대푯값을 찾아내어 공유하는 것이 데이터 과학이 수행해야 할 핵심적인 임무라고 할 수 있습니다.
데이터 과학은 코로나19와 같은 팬데믹 상황에서 그 진가를 발휘합니다. 감염병의 2차 유행 시점을 예측하거나 바이러스의 전파력을 분석하는 일은 모두 정교한 데이터 기반 연구를 통해 이루어집니다. 특히 실시간 치사율을 계산하거나 사회적 거리두기가 실제 방역에 미치는 효과를 측정하는 작업은 매우 실용적인 가치를 지닙니다. 치료 중인 환자 수와 사망자 수의 변화 추이를 데이터로 추적함으로써, 우리는 막연한 공포에서 벗어나 객관적인 지표를 바탕으로 현재의 위기 상황을 진단하고 대응 전략을 수립할 수 있게 됩니다.
코로나19는 기존의 감염병 확산 모형인 SIR이나 SEIR의 한계를 드러내며 전혀 새로운 형태로 전파되고 있습니다.
전 세계 국가들이 각기 다른 방역 정책을 시행함에 따라, 역설적으로 연구자들에게는 사회적 개입의 효과를 비교 분석할 수 있는 방대한 데이터가 축적되었습니다. 각국 자치단체별로 다르게 나타나는 데이터들은 사회적 거리두기와 같은 변수들이 실제 감염 확산에 어떤 영향을 주는지 파악할 수 있는 흥미로운 기초 자료가 됩니다. 이러한 데이터들을 면밀히 분석한다면 각 정책이 지닌 실질적인 영향력을 정밀하게 측정할 수 있으며, 이는 향후 더욱 효율적인 방역 전략을 수립하는 데 있어 매우 중요한 근거가 될 것입니다.
방역 당국이 매일 업데이트하는 확진자와 검사자 수 등은 매우 방대한 가치를 지닌 자산입니다. 그러나 연구자의 관점에서는 이러한 자료들이 일목요연하게 정리되어 공개되지 않는 점에 대해 아쉬움이 남기도 합니다. 데이터가 일반 연구자들에게 보다 체계적이고 투명하게 공유되었다면, K-방역의 성과를 넘어 과학 기술 분야에서도 더욱 혁신적인 연구 결과들이 쏟아져 나왔을 것입니다. 전 세계적으로 흩어져 있는 다양한 형태의 데이터를 하나로 모으고 정제하는 과정은 향후 발생할 수 있는 또 다른 위기에 대비하기 위해서라도 반드시 선행되어야 할 과제입니다.
데이터는 정책의 효율성을 국민에게 설득력 있게 전달하는 강력한 도구가 됩니다. 사회적 거리두기와 같은 정책이 왜 필요한지, 그리고 그것이 얼마나 실질적인 효과를 거두고 있는지를 데이터를 통해 증명할 때 비로소 대중의 자발적인 호응을 얻을 수 있기 때문입니다. 또한 코로나19가 초래한 사회적 파급력은 단순히 의학적 차원을 넘어 개인정보 보호와 사회 정책 전반에 걸쳐 있습니다. 따라서 통계학뿐만 아니라 다양한 학문적 배경을 가진 전문가들이 협력하는 융합적인 시각이 필요하며, 이러한 다학제적 연구팀의 노력이 복합적인 사회 문제를 해결하는 열쇠가 될 것입니다.
