『마스터 알고리즘』 페드로 도밍고스

머신러닝에 대한 입문서를 찾고 있었는데, 마침 달무드님 블로그에 소개된 책 중에서 적당한 입문서를 하나 발견하게 되었다. 『마스터 알고리즘』이다. 머신러닝 입문서라는 측면에서 내 입맛에 딱맞는 선택이 아닐 수가 없다. 참고로 달무드님의 해당 포스팅 주소는 다음과 같다:
http://blog.naver.com/sosotaerang/220870308036

이제 A.I.라는 단어를 쓰기에는 세상이 너무 많이 발전했다고 생각한다. A.I.는 지나치게 추상적인 단어로 들린다. 그래서인지, 요즘은 머신러닝이라는 단어가 좀 더 자주 쓰이는 듯하다. 역시, 국내에서는 알파고와 이세돌9단의 바둑대결이 이런 추세의 시발점이 되었다. 그 이후 언론에 노출되는 횟수도 늘고, 관련 서적도 좀 더 자주 번역되어 출간되고 있다.

난 『마스터 알고리즘』를 읽은 후, 마침내 머신러닝에 대한 기본적인 개념을 깨닫게 되었는데, 머신러닝이란 알고리즘을 컴퓨터에게 만들게 하는 것이라고 정의할 수 있다. 예를 들면, 기존에는 인간 프로그래머가 입력값으로부터 도출해낼 수 있는 출력값이 나오도록 알고리즘에 맞는 코드를 만들었다면, 머신러닝의 경우, 수많은 입력값와 결과값을 던져주면 이것을 통하여 컴퓨터가 코드를 작성하게 된다.

『마스터 알고리즘』이 좋은 입문서라고 생각하는 이유로 머신러닝의 여러 가지 접근법을 크게 다섯가지로 분류하여 각각을 알기 쉽게 설명해 놓았다는 점을 꼽고 싶다. 그 다섯가지 분류를 나열해 보자면, 기호주의, 연결주의, 진화주의, 베이즈주의, 유추주의이다. 이 다섯가지 접근법들이 세월의 흐름에 따라 주도적이기도 하고 퇴색되기도 하며 발전해 왔다고 한다. 이 책을 다 읽은 후에, 각각의 접근법에 대한 좀 더 심화된 책을 읽으면서 자신이 추구해야할 방향성을 정하는 것이 효율적인 머신러닝 접근법이 될 수 있다고 생각한다.

최근에 가장 트렌디한 접근법은 연결주의인데, 인간의 뇌, 즉 뉴런들끼리의 연결을 본따서 만들어서 연결주의라고 하는 듯하다. 처음에는 요구하는 하드웨어 성능이 엄청나서 실용성 측면에서 주류가 되지 못했지만, 세월이 흘러 하드웨어 성능이 기하급수적으로 늘어난 지금에 이르러서는 대세로 자리잡고 있다고 한다. 퍼셉트론이라는 개념이 등장하는데, 잘 설명해 놓기는 하였지만, 실질적으로 이 개념을 사용하기 위해서는 좀 더 심도 깊은 이해가 필요하다.

아직 머신러닝에 대한 이해도가 낮아서 뭐라 말할 수 있는 상황은 아니지만, 금융시장에 머신러닝 기술을 사용하기 위해서는 베이즈주의와 유추주의 접근법이 유용하지 않을까라는 생각이 든다. 베이즈주의는 불확실성을 전제로 하여 확률의 관점에서 데이터를 바라본다는 특징이 있고, 유추주의는 앞으로 일어날 일에 대한 예측을 과거의 사례에서 나타난 연관성을 중요시 하여 판단한다는 특징이 있기 때문이다. 뭔가 그럴듯해 보인다. 고백하자면, 베이즈정리에 대하여 여러 가지 설명을 들어봐도 잘 이해가 되지 않았는데, 이 책을 보면서 이해가 되었다.

궁금한 점은 이 책을 읽은 후에 다음 단계로 읽어야 할 책이 무엇일까 하는 것이다. 레퍼런스에 대한 설명이 비교적 자세히 나와 있는 편인데, 이 레퍼런스를 이용하여 찾아 봐야겠다. 갑자기 공부하고 싶은 것들이 많아져서 살짝 설레인다.

이상욱