본문으로 바로가기
반응형

한빛미디어의 '핸즈온 머신러닝'은 이미 오랜 기간 사랑받아온 머신러닝 계의 베스트셀러이자, 교과서입니다.

덕분에 책의 이름만으로도 데이터 시각화 분야의 교과서가 등장했구나, 하고 짐작할 수 있었는데요.

 

사실 시각화는 참 매력적이면서도 어려운 분야입니다.

단순히 시각화 도구 하나를 쓸줄 안다고 해서, 원하는 시각화를 자유자재로 할 수 있는 것이 아닙니다. 또, 대부분의 케이스에서 다양한 배경 지식과 풍부한 경험을 필요합니다. 데이터를 다루는 데에도 능숙해야 합니다. 심지어, 도구도 너무나 다양합니다.

 

본 도서는 하나의 도구에 치중하는 것보다, 여러 케이스에 대응할 수 있는 다양한 경험을 할 수 있도록 하는 것을 목적으로 합니다. 또, '시각화 도구'보다는 '시각화' 그 자체에 집중하고 있습니다.

저 또한 Python의 Matplotlib, Seaborn부터 시작해서, R의 ggplot, Tableau 등 몇몇 툴을 사용해본 경험이 있지만, 이렇게 다양한 케이스의 시각화를 학습하는 경험은 처음이었습니다. 

 

굳이 책에서 사용되는 메인 도구를 찝어낸다면, 스프레드시트가 될 것입니다. 초반부에서도 스프레드시트를 이용하여 간단히 시각화 하는 방법을 학습하고, 이후의 챕터에서도 반복적으로 스프레드시트가 등장합니다. 하지만, 항상 스프레드시트를 사용하는 것이 아니라, 특정한 주제 (ex. 데이터 정제, 다양한 차트 생성 등)에서 스프레드시트를 도구로 사용하는 상황에 등장하게 됩니다. 즉, 비슷한 케이스를 스프레드시트로도 시각화하고, 태블로로 시각화하는 경우도 있습니다.

 

가장 인상적이었던 챕터는 'Chapter 7. 데이터를 지도로 시각화하기' 였습니다.

데이터를 지도로 표현하는 것은 무척 강력한 시각화 기법입니다. 하지만 그만큼 어려운 일이기도 합니다. 해당 챕터에서는 효과적으로 지도를 디자인 하는 방법과, 적절하게 데이터를 지도상에서 표현하는 방법, 여러 타입의 지도 생성 실습 등을 해볼 수 있었습니다. 특히, 데이터 정제와 디자인에 많은 주의를 기울여야 하는 코로플레스 지도 디자인을 학습하며, 앞으로 무척 써먹을 곳이 많을 것 같다는 생각이 들기도 했습니다.

 

생성된 시각화 자료를 웹 상에 임베딩하는 방법, 깃허브를 사용하여 시각화 코드를 관리하는 방법 등이 삽입된 것도 인상적이었습니다. 단순히 '시각화 하는 법'을 배우는 것이 아닌, '시각화를 활용하는 것' 자체를 배우는 콘텐츠이기 때문입니다. 이처럼, 세심함이 느껴지는 부분이 참 많았습니다. 

 

아무래도 한 권에 다양한 콘텐츠를 꽉꽉 눌러담은 만큼, 초심자가 읽기에는 다소 어려운 내용일 수 있겠습니다. 특히, 데이터를 다루어본 경험이 많이 없는 독자분들이라면 끝까지 완독하기에 어려움을 느낄 수 있습니다. 책의 구성 자체가, 초심자에게 기초를 하나하나 가르쳐준다기 보다는, 이미 어느정도 경험이 있는 이들에게 데이터 시각화를 담당하는 실무자가 알아야 할 필수사항, 디테일한 노하우, 다양한 방법론을 전수해주는 형태이기 때문입니다. 저 또한 읽으면서 상당히 어렵게 느껴지는 부분이 많았지만, 그만큼 새로운 지식과 기술을 많이 배울 수 있었습니다. 

 

보다 진지하게 데이터 시각화를 학습하고 익혀야 할 필요성을 느끼시는 분들에게는, 그 어떤 것보다 값진 콘텐츠가 꽉꽉 들어차 있다고 할 수 있겠습니다. 특히, '데이터 시각화의 교과서'가 필요하신 분들에게 강력 추천 드립니다.

 

 

본 리뷰는 한빛미디어의 도서 서평단 <나는 리뷰어다 2022> 프로그램의 일환으로, 무상으로 도서를 증정 받고 작성된 리뷰임을 고지합니다. 

반응형