[강연] 디지털인문학과 데이터과학 (4) _ by장원철 | 2018 봄 카오스 강연 '모든 것의 수數다' 4강 | 4강 ④
통계학은 우리 삶의 안전을 지키는 실질적인 도구로 활용됩니다. 뉴욕시의 노후화된 전기 배선으로 인한 맨홀 뚜껑 폭발 사고를 예측하는 사례가 대표적입니다. 복잡한 배선에서 발생하는 가스로 인해 맨홀 뚜껑이 날아가는 위험한 상황을 방지하기 위해, 통계적 모델을 통해 위험도가 높은 지역을 미리 파악합니다. 이를 통해 사고가 발생하기 전 선제적으로 수리를 진행함으로써 인명 피해를 줄이는 데 성공했습니다. 이처럼 통계는 보이지 않는 위험을 수치화하여 도시의 안전 시스템을 구축하는 데 핵심적인 역할을 수행하고 있습니다. 역사적 사건과 인문학적 자료를 해석하는 데에도 통계학은 강력한 힘을 발휘합니다. 제2차 세계대전 당시 영국은 독일군 미사일의 낙하 지점을 통계적으로 분석하여 적의 기술 수준을 파악했습니다. 또한, 디지털 인문학 분야에서는 1800년대 샌프란시스코의 마구간 위치나 미국 전역의 우체국 개폐 데이터를 시각화하여 도시의 팽창과 인구 이동 경로를 추적합니다. 직접적인 기록이 부족한 과거의 사회적 변화를 우체국의 흥망성쇠라는 간접 지표를 통해 과학적으로 재구성해내는 과정은 통계학이 가진 인문학적 가치를 잘 보여줍니다. 통계학은 모든 학문의 도구로서 자연과학뿐만 아니라 인문학적 의문을 해결하는 데 기여합니다. 영국의 작가 제인 오스틴의 미완성 소설 '샌디턴'을 다른 작가가 완성했을 때, 문체 분석을 통해 원작자의 스타일을 얼마나 잘 재현했는지 검증하는 것이 가능합니다. 특정 단어의 사용 빈도나 문장 부호의 배치 패턴을 수치화하여 비교함으로써 주관적인 감상을 넘어 객관적인 데이터로 저자를 판별합니다. 이는 통계가 단순한 숫자 계산을 넘어 언어와 예술의 영역에서도 현상을 설명하고 이해하는 정교한 분석 도구로 쓰일 수 있음을 증명합니다. 첨단 과학의 발견과 범죄 수사 현장에서도 통계는 필수적입니다. 2016년 중력파 탐지 성공의 이면에는 '4시그마'라는 높은 통계적 신뢰도가 있었으며, 이는 이론적 가설을 확고한 사실로 입증하는 근거가 되었습니다. 또한, 지문 인식 기술은 손가락의 특징점인 '미뉴셔'의 위치와 각도를 비교하여 일치 확률을 계산하는 통계 모델링을 기반으로 합니다. 단순히 전문가의 직관에 의존하는 것이 아니라, 수집된 데이터를 바탕으로 불확실성을 측정하고 정확도를 수치로 제시함으로써 과학적 증거의 객관성을 담보하는 역할을 수행합니다. 법정에서 제시되는 DNA 증거의 신뢰성을 평가할 때도 통계적 사고가 중요합니다. 흔히 범인일 경우 DNA가 일치할 확률과 증거가 일치할 때 범인일 확률을 혼동하는 '검사의 오류'가 발생하곤 합니다. 이를 바로잡기 위해 베이즈 정리를 활용하여 실제 범인일 확률을 정교하게 계산해야 합니다. 또한, 여론조사에서 제공되는 신뢰 구간과 오차 범위는 데이터에 내재된 불확실성을 투명하게 공개하는 방식입니다. 이처럼 통계학은 완벽하지 않은 데이터 속에서 진실에 가까운 결론을 도출하고, 그 과정의 한계를 명확히 제시하는 정직한 학문입니다.
![[강연] 디지털인문학과 데이터과학 (4) _ by장원철 | 2018 봄 카오스 강연 '모든 것의 수數다' 4강](https://i.ytimg.com/vi_webp/b5kW86Xaats/maxresdefault.webp)
![[강연] 자연에 숨어 있는 질서를 찾아서 (4) _ by하승열 | 2018 봄 카오스 강연 '모든 것의 수數다' 2강](https://i.ytimg.com/vi_webp/8WPjFSbQQHA/maxresdefault.webp)