컴퓨터 엔지니어의 한 사람으로서 머신 러닝 시스템은 데이터를 이용해 자동적인 프로그램 학습이 가능하도록 했으며 컴퓨터 과학 분야에서 상당히 중요한 부분을 차지하고 있다고 생각한다. 과거 10년 동안 머신 러닝은 컴퓨터 과학 및 공학 분야에서 눈부신 발전을 이뤘다. 예를 들면 웹 검색과 스팸 이메일 필터링, 광고 시스템, 신용 점수, 위조 감지, 주식 거래 같은 여러 분야에서 응용, 발전해 오고 있다. 최근 맥킨지 컨설팅 회사는 머신 러닝이 향후 가장 큰 이노베이션의 선두 주자가 될 것이라고 예측하기도 했다.
현재 다양한 형태의 많은 머신 러닝이 존재한다. 하지만 이 책에서는 수 세기 동안 통계학과 공학의 중심이 된 확률 이론의 도구를 사용하며, 데이터로부터 습득되는 최적의 방식을 채택하는 머신 러닝을 다룬다. 일반적 표현으로 확률론적 접근이며, 사건 발생의 개연적 패러다임에서 확실하게 발생 가능한 최대 발생 가능도 추정 같은 기술을 다룬다.
또한 이 책에서 설명하는 모든 방법이 확률적 모델 개발 도구인 PMTK라고 하는 매트랩 소프트웨어에서 구현이 가능하다. PMTK 웹사이트를 통해 이러한 지원 파일들을 받아 볼 수 있으며, 독자들이 데이터와 알고리즘, 변수 설정의 변화에 따른 결과를 쉽게 참고할 수 있다. 이러한 방법의 근본적 이론을 이 책을 통해 자세히 살펴볼 수 있다.
결론적으로, 이 책은 현대 머신 러닝을 연구하는 이들에게 기본적인 참고서가 될 수 있다. 특히 이 분야에서 꼭 알아야 할 기본 개념에서부터 머신 러닝의 전체적 이해를 돕도록 폭넓게 다룬다. 현재 가장 강력하게 다뤄지는 이론과 방법을 이 책에서 또한 설명하고 있다. 머신 러닝에서 확률과 통계학은 외형적으로 분리된 알고리즘과 전략 및 접근 방법 사이에 중요한 연결 고리를 표현한다. 따라서 독자들은 확률과 통계학적 이론을 바탕으로 이 책을 통해 최신 기술의 전체적인 조망과 차세대 머신 러닝 알고리즘을 설계하는 데 좋은 기반을 다질 수 있게 될 것이다.