영상요약
예술과 문학의 진위를 가리거나 특징을 분석하는 방법으로 '양식 측정학'이 주목받고 있습니다. 이는 단어의 길이나 빈도, 색상의 사용 패턴 등을 정량적으로 분석하여 작품의 유사도나 작가의 고유한 스타일을 찾아내는 학문입니다. 19세기 토마스 멘덴홀이 단어 길이 빈도를 조사하며 시작된 이 분야는, 오늘날 구텐베르크 프로젝트와 같은 대규모 디지털 도서관의 등장으로 비약적인 발전을 이루었습니다. 이제 데이터는 단순한 기록을 넘어 과거의 진실을 밝히는 강력한 도구가 되었습니다.
우리나라의 대표적인 기록 유산인 조선왕조실록 역시 이러한 데이터 과학의 훌륭한 연구 대상입니다. 태조부터 철종까지 약 470년간의 방대한 기록은 현재 모두 디지털화되어 한글로 번역되어 있습니다. 연구자들은 텍스트 마이닝 기법을 활용해 왕들의 통치 스타일을 분석하기도 합니다. 예를 들어, 신하들의 의견을 경청했던 세종대왕과 독단적인 결정을 내렸던 연산군의 차이는 실록에 등장하는 특정 단어의 빈도 그래프를 통해 명확하게 드러납니다. 이는 역사가 주관적인 서술을 넘어 객관적인 수치로 재해석될 수 있음을 보여줍니다.
역사는 대개 승자의 시선에서 기록되기에, 후대에 재작성된 기록은 작성 주체에게 유리하게 서술될 가능성이 큽니다.
실록의 기사에는 수많은 인물이 등장하며, 한 기사에 함께 언급된 인물들은 서로 밀접한 관계가 있다고 볼 수 있습니다. 이를 바탕으로 인물 간의 네트워크를 재구성하면 당시의 정치적 지형도를 그릴 수 있습니다. 이는 현대의 국회의원들이 공동으로 법안을 발의하는 관계를 분석하는 것과 유사한 원리입니다. 네트워크 분석을 통해 우리는 단순히 기록에 남겨진 관계를 넘어, 보이지 않는 곳에서 영향력을 행사했던 숨은 실력자나 인물들 사이의 복잡한 연결 고리를 정량적으로 파악할 수 있게 되었습니다.
현종 시기의 예송 논쟁은 서인과 남인 사이의 치열한 정치적 갈등을 보여주는 대표적인 사례입니다. 네트워크 분석의 다양한 중심성 지표를 활용하면, 이 시기 권력의 흐름이 어떻게 변화했는지 추적할 수 있습니다. 특히 2차 예송 논쟁 전후로 집권 세력이 교체되는 과정에서 인물들의 연결 중심성이 급격히 변화하는 양상이 관찰됩니다. 이를 통해 특정 인물이 언제 당적을 변경했는지, 혹은 어떤 인물이 중립적인 위치에서 가교 역할을 했는지 등 문헌만으로는 파악하기 힘든 세밀한 정치적 변화를 포착할 수 있습니다.
이러한 정량적 분석 기법은 동양의 역사 기록뿐만 아니라 서양 문학 연구에도 활발히 적용됩니다. 셰익스피어의 작품 전집을 분석하여 그가 실제로 사용한 어휘의 규모를 추정하거나, 새로 발견된 작품이 그의 진작인지 판별하는 연구가 대표적입니다. 통계적 모델링을 통해 작가가 알고 있었으나 작품에 쓰지 않은 잠재적 어휘량까지 계산해내는 것입니다. 이처럼 데이터 과학과 인문학의 만남은 과거의 유산을 현대적인 시각으로 재조명하며, 우리가 미처 알지 못했던 역사의 이면을 밝혀내는 새로운 지평을 열어주고 있습니다.

