영상요약
통계학은 데이터를 분석할 때 명확한 목표를 설정하는 것에서부터 시작합니다. 분석가는 평균이나 분산을 확인하거나, 두 집단 사이에 차이가 있는지를 파악하기 위해 구체적인 가설을 수립합니다. 예를 들어 특정 데이터군에 여러 포지션이 존재할 것이라는 가정을 하고, 실제 데이터를 통해 그 가정이 통계적으로 타당한지를 확인하는 방식입니다. 이러한 접근은 데이터의 활용 목적을 미리 정의하고 이를 입증해 나가는 과정이라 할 수 있으며, 수치적인 신뢰도를 확보하는 데 주력합니다.
통계학은 가설을 세워 유의미한 결론을 얻는 과정이지만, 위상수학적 데이터 분석(TDA)은 데이터를 모아놓고 패턴을 관찰하며 예전에 몰랐던 것을 찾아내는 탐색의 과정입니다.
위상수학적 데이터 분석(TDA)은 데이터 과학의 관점에서 접근 방식이 근본적으로 다릅니다. 특별한 목적을 미리 정해두지 않고, 일단 방대한 데이터를 확보한 뒤 그 안에서 어떤 형태가 나타나는지를 살핍니다. 이전에는 전혀 인지하지 못했던 데이터의 구조를 새롭게 포착하는 것에 초점을 맞추는 것입니다. 이는 미리 정해진 정답을 찾는 과정이 아니라, 데이터 자체가 스스로 보여주는 숨겨진 형상을 찾아내는 탐색과도 같으며 기존의 분석 틀을 깨는 새로운 시각을 제공합니다.
결국 통계학과 위상수학적 데이터 분석(TDA)의 차이는 입증과 탐색이라는 지향점에 있습니다. 통계학이 세워진 가설의 진위 여부를 확인하며 실용적인 결과를 도출한다면, 위상수학적 데이터 분석(TDA)은 데이터의 흐름을 통해 예상치 못한 통찰을 얻는 과정을 중시합니다. 처음부터 특정 용도를 염두에 두지 않았더라도, 데이터를 살피는 과정에서 결과적으로 유용한 가치가 도출되기도 합니다. 이러한 두 분야의 상호보완적인 성격은 현대 데이터 분석에서 매우 중요한 역할을 수행하며 복잡한 데이터 세상을 이해하는 열쇠가 됩니다.