요즘 경제신문이나 아니 일반 신문들에서도 인공지능 기사가 아주 많이 나온다. 특히 자율주행에 관련된 기사가 하루 최소 한편 정도 나온다. 이미 자율주행기계가 상업적으로 판매가 되고 있다. 자율주행차라고 이야기 안하고 자율주행기계라고 특별히 단어를 바꾼 이유는 우리가 생활 속에 타고 다니는 것이 아니라 산업에 적용되고 있는 것을 이야기 하고자 이렇게 표현을 한다.
아마존에 관련된 동영상을 보면 아주 빠른 배송을 위해서 완전 자동화 된 창고를 보여 준다. 이곳에서 물건을 이동시키는 로봇을 지칭할 때 자율 주행기계라 이야기 하기에는 무리가 있지만 그냥 그렇게 불러 보고 싶다. 그러나 이 로봇은 지정된 경로를 따라 움직이는 것이라 흥미가 없다. 그렇지만 농기계를 상상해보면 달라진다. 트랙터를 몰고 밭을 가는 모습은 이제 우리의 머리 속에서 쉽게 그려지는 것이다. 지붕이 없는 트랙터 위에 농부가 앉아서 핸들을 잡고 있는 모습, 그리고 한국인이 아닌 청바지를 입고 있는 미국 농부가 머릿속에 떠 오른다. 그런데 지금의 미국 농장 모습은 농부가 앉아 있는 모습은 안 보인다. 이런 환경에서 자율주행 농기계가 될 수 있는 것은 인공지능 기술이 있어야 하지만 그보다 더 필요한 것은 인공지능이 판단 할 수 있는 센스 데이터가 가장 중요하다고 보겠다. 데이터가 없는 인공지능은 휘발유가 없는 자동차와 같은 것이 아닐까?
우리의 역사를 기록한 유물이 다양하게 있다. 가장 원시적인 것으로 고인돌이 있고, 왕이나 귀족의 무덤 벽화와 유물, 그리고 역사책 등등이 될 것이다. 이런 유물과 유적, 역사서에서 수치화 할 수 있는 기록물이 있다면 이것은 정말 유용한 데이터가 될 것이다. 특히 천문학적으로 이용할 수 있는 자료는 수학적 방법으로 그 자료의 신뢰도를 알아볼 수도 있다.
얼마 전에 읽은 김진호 교수가 쓴 ‘빅데이터가 만드는 제4차 산업혁명’ 이란 책에서 케플러의 법칙은 어떻게 탄생했는가? 란 단원을 읽어 보았다. 요하네스 케플러 하면 우리가 잘 알고 있는 케플러 법칙 1,2,3 이다. 입시 시험에 잘 나오는 것이라 암기가 되어 있어 관심을 갖고 읽기 시작 했다. 사실 케플러는 독일의 수학자이자 천문학자 정도를 알고 있지만 케플러의 법칙이 탄생하는데 가장 중요한 역할을 한 사람은 튀코 브라헤 이다. 튀코는 귀족가문 출신으로 연구에 몰입 할 수 있는 환경에 있었다. 특히 천체에 관심이 있어 자신이 직접 관측기를 만들어 행성을 측정 할 수 있는 수준 정도로 능력을 갖추었다.
튀코는 20년 동안 덴마크 남부에 있는 섬에서 행성의 움직임을 관측해서 기록을 하였다. 그것도 매일 같이 한 것이다. 대단한 데이터가 된 것이다. 이것이 빅데이터 아닌가. 이 빅데이터를 케플러가 이용하여 행성의 공전에 대한 법칙을 만들어 낸 것이다. 케플러가 수학 천재이지만 이 데이터를 보자마자 법칙이 떠올린 것은 아닐 것이다. 데이터를 죽 나열해 놓고 그 데이터 속에서 무엇인가 의미를 찾기 위해 노력을 했을 것이다. 이 부분에 김교수는 패턴을 찾아 내는 것이라 이야기 한다. 케플러는 자기가 생각한 패턴을 공식화 하여 그 공식으로 튀코가 기록해 놓은 데이터를 대입 해보고 그 결과가 맞는지 찾아 내는 방법으로 시행 착오를 수없이 했을 것이다. 그 당시에도 하늘은 둥글다 라고 생각하고 있었고 지금도 그냥 하늘이 둥글다고 생각을 하는 사람이 많을 것이다. 그래서 케플러는 원 구조를 기본으로 패턴화 하여 적용을 하였지만 결과는 다르게 나온다. 원운동에서 타원 운동을 하는 것을 생각하고는 새로운 패턴을 만들어 적용하게 된다. 그것이 바로 케플러 법칙이다.
케플러는 법칙을 발견하므로 인류에 많은 공헌한 사람으로 기록되었다. 하지만 이런 이야기를 책으로 읽고 나서 케플러는 튀코라는 사람, 아니 아주 천체의 움직임에 미쳐 있는 사람이 아니었다면 이런 법칙이 태생했을까? 튀코 브라헤라는 특별한 사람을 더 기억하고 싶고 케플러 법칙을 케플러-튀코 법칙 이렇게 바꾸어 불러야 되지 않을까 하는 엉뚱한 생각도 해본다.
이런 행성의 기록이 우리 역사에도 기록이 많이 남아 있다. 이 기록을 연구한 분이 있는데 미국 프린스턴 대학교 박사인 박창범 교수다. 그분의 저서인 ‘하늘에 새긴 우리 역사’를 일전에 읽어 기억이 있어 빅데이터 관점에 한번 보기 위해 다시 읽어 보았다.
우리 천문 자산을 보면 확실히 빅데이터라 할 수 있다. 청동기 시대에는 암각화 그림, 고인돌의 성혈, 철기시대에는 방위와 별자리 그림, 단군조선시대에 천문 현상이 12개 기록 되어 있다. 삼국시대 신라, 고구려, 백제에는 천문 현상 기록 240개와 24기 고분 기록 등이 있다. 고려시대에는 천문 현상 기록이 5000여 개의 데이터가 고려사에 나오고 조선시대에는 조선신록과 승전원일기, 일성록에 무려 2만여 개의 기록이 나온다.
그럼 이 기록이 과연 믿을 수 있는 것인가 이런 관점에서 박교수는 확신을 하고 있다. 고대 기록이 정사서로 남아 있는 것이 없어 할 수 없이 역사가들이 인정 하지는 않지만 그래도 연구 대상으로 한 <단기고사>와 <한단고기>의 기록을 바탕으로 연구를 하였는데 그 기록이 상당히 일치 하는 것을 발견하였다고 상세히 기록을 하고 있다. 그러면서 ‘단군조선 시대의 일을 기록한 위 사서들에서는 일부 내용이라도 사실이 들어 있다고 생각할 수 있겠다. 그러므로 학자들은 이 책들을 마냥 무시할 것이 아니라 옥석을 가리는 마음으로 책의 내용을 진지하게 재고해 봐야 하지 않을까 생각한다’라고 이야기 하고 있다.
한편 박교수는 삼국사기에 나오는 일식의 기록을 가지고 역사의 기록이 신빙성이 있는지 확인 해보고 싶었다. 그래서 그 기록들을 신라, 고구려, 백제로 분류하여 나라별로 기록된 일식들의 자료로 가장 잘 볼 수 있는 곳을 찾아 보니 아주 엉뚱한 결과가 나왔다고 한다. 그래서 추정 방법의 신빙성을 입증하기 위해 고려사에 나오는 기록으로 일식의 관측지를 확인 해보니 확실히 정확하게 나오는 것이다.
그럼 이 기록이 과연 믿을 수 있는 것인가 이런 관점에서 박교수는 확신을 하고 있다. 고대 기록이 정사서로 남아 있는 것이 없어 할 수 없이 역사가들이 인정 하지는 않지만 그래도 연구 대상으로 한 <단기고사>와 <한단고기>의 기록을 바탕으로 연구를 하였는데 그 기록이 상당히 일치 하는 것을 발견하였다고 상세히 기록을 하고 있다. 그러면서 ‘단군조선 시대의 일을 기록한 위 사서들에서는 일부 내용이라도 사실이 들어 있다고 생각할 수 있겠다. 그러므로 학자들은 이 책들을 마냥 무시할 것이 아니라 옥석을 가리는 마음으로 책의 내용을 진지하게 재고해 봐야 하지 않을까 생각한다’라고 이야기 하고 있다.
한편 박교수는 삼국사기에 나오는 일식의 기록을 가지고 역사의 기록이 신빙성이 있는지 확인 해보고 싶었다. 그래서 그 기록들을 신라, 고구려, 백제로 분류하여 나라별로 기록된 일식들의 자료로 가장 잘 볼 수 있는 곳을 찾아 보니 아주 엉뚱한 결과가 나왔다고 한다. 그래서 추정 방법의 신빙성을 입증하기 위해 고려사에 나오는 기록으로 일식의 관측지를 확인 해보니 확실히 정확하게 나오는 것이다.
그럼 신라와 백제의 기록은 잘 못 된 것일까? 신라의 일식 관측지가 양츠강 유역으로 나오고 백제의 관측지가 요동으로 나오는 것을 어떻게 설명을 해야 하야하나 과연 이 관측을 누가 의도적으로 기록한 것일까 의문도 갖게 된다. 실제로 <삼국사기>에 백제 온조왕 25년(서기 7년)에 천문 관측을 담당했던 관리인 일자(日者)가 등장하고 일관부(日官部)라는 부서가 존재했다는 내용이 나온다. 이런 것을 보면 왕의 지시에 의해 하늘을 관측했다고 할 수 있다. 무려 2,000년 전에도 천문대가 있었다고 할 수 있는 것이다. 삼국시대의 초기부터 이런 기관이 있었다고 하면 여러 나라에 모두 하늘을 관측하는 기관이 있었을 것이고 그 기록이 삼국사기에 담겨져 있었던 것이라 보인다. 일식 기록 하나만으로도 나라의 영토를 가름 할 수 있는 것으로 아주 중요한 데이터가 될 것이다. 그럼 이런 데이터가 얼마나 정확하게 기록 되어 있는가가 정말 중요하다.
빅데이터에서 가장 중요하게 생각하는 것이 신호와 소음의 구분이다. 잘못된 기록을 믿고 판단을 한다면 소음을 신호로 착각하는 것이 될 것이고 암호를 잘 못 해독한 장군이 되어 전쟁에 패한 기록으로 남을 것이다. 일식 기록으로 우리와 중국, 일본의 역사서를 비교해보면 재미 있는 결과를 볼 수 있다. <삼국사기>에는 일식이 일어났다는 기록이 총 66번이 있는데 이중 53번이 사실로 확인되어 80%의 높은 실현율을 보였다. 특히 서기 200년까지의 초기 기록은 그 실현율이 89%에 이른다. 그런데 <삼국사기>가 그 천문 기록을 베꼈다던 중국 사서의 일식 기록은 오히려 이보다 실현율이 떨어진다. 중국 일식 기록의 실현율은 한나라 때 78%로 가장 높고 그 이후부터 당나라 말까지 약 63-75%의 수준을 보인다. 일본의 경우는 이보다도 훨씬 낮다. 일식이 처음으로 기록된 서기628년부터 950년대까지 일본의 초기 기록은 실현율이 35%에 불과하다. 이것은 우리의 역사서가 중국의 역사서를 베꼈다고 볼 수 없는 것이다 그리고 이 데이터는 모든 시기에 걸쳐 기록된 것을 보면 분명 각 나라마다 독자적으로 실제 관측하여 기록하였다고 볼 수 있다.
우리 나라의 기록 문화는 정말 대단하다 조선 600년 왕조의 기록이 고스란히 남아 있는 조선왕조실록은 무려 6,400만 자로 기록되어 활자화 하여 인쇄되었다. 특히 4곳에 분산되어 보관 보존 되었다. 그 보다 더 많은 기록은 승정원 일기인데 아쉽게도 임진왜란으로 반은 불타고 남아 있는 288년치가 무려 2억 5,000만 자이다. 이것을 번역하는데 무려 50년이 걸린다고 한다. 그리고 또 일성록이 있다. 왕이 실록을 못 보니 세자에게 정치를 어떻게 해야 하는지 알려주고 싶어 남겨 놓은 일기 이것이 150년치가 있는 나라 우리 선조들은 빅데이터 시대를 미리 예견한 것이 아닐까 생각해 본다.
우리 역사에 남겨진 기록들이 우리의 미래를 이야기해 줄 것이라 본다. 그렇지만 선조들이 남겨둔 이 빅데이터를 어떻게 활용하여 케플러의 법칙 보다 더 획기적인 것을 연구해 내어 놓아야 할 것이다. 박창범 교수와 같은 분이 많이 나와 우리의 기록문화가 미래의 후손에게 먹거리를 만들어 줄 수 있었으면 한다. ◆
<참고 문헌>
1. 박창범 2003 ‘하늘에 새긴 우리역사’ 김영사
2. 김진호 2017 ‘빅데이터가 만드는 제4차 산업혁명’ 북카라반
3. 허성도 ‘한국역사의 특수성’ 연설문