본문으로 바로가기
반응형

 

분야를 막론하고 데이터 과학의 중요성이 대두되면서, 데이터 과학에 대한 지식이 점차 기본 소양이 되어 가고 있습니다. 제가 재학중인 대학에서도 과거에 없었던 데이터 과학 기본 소양 과목이 신설, 전교생에게 교양 필수로 지정되기도 했는데요. 

이 때문인지 국가공인 데이터분석 준전문가 자격증인 ADsP(Advanced Data Analytics Semi-Professional) 자격증 역시 응시자가 점점 늘어가는 추세라고 합니다.

 

통계학과 등 데이터 과학과 밀접한 관련을 맺고 있는 일부 학과/학부에서는 졸업 요건 중 하나로 ADsP 취득을 지정하고 있다고 하는데요. 이처럼 ADsP 자격증 취득은 본인의 기초적인 통계학/데이터분석 역량을 증명할 수 있는 편리한 방법 중 하나입니다. 워낙 난이도가 높지 않은 자격증이기에 이를 통해 실무적인 능력 또는 고도의 기술 역량을 증명하는 것은 불가능하지만, 적어도 기본 소양 정도는 갖추고 있다고 할 수 있는 것입니다.

 

사실 관련 전공자 또는 현업종사자는 문제지만 적당히 살펴보면 취득에 큰 문제가 없을 시험이고, 오히려 ADP가 본격적인 공부의 시작이 될 것입니다. 따라서, ADsP 취득에 어려움을 겪거나 고민이 있는 분들은 보통 비전공자 분들일 것 같습니다.

 

 

저 역시 응시해야지 생각만 하다가, 지난 해 말, 제27회 ADsP 시험에 응시하여 자격증을 취득하였는데요. 시간이 좀 지났지만, 생각난 김에 합격을 위한 팁을 조금 정리해보려 합니다.

저는 사회과학 계열과 컴퓨터공학을 함께 전공하고 있는 학부생으로, 양쪽 전공 모두 간접적인 관련성은 있으나 해당 자격증과 관련된 전공의 전공자라고 말하기에는 약간 애매한 감이 있습니다.

 

예컨대, 사회과학 계열은 사회조사방법론, 사회통계 등과 밀접한 연관이 있는 사회조사분석사 자격증 등에 밀접한 연관이 있을 것이고, 컴퓨터 전공은 한국데이터산업진흥원에서 운영하는 SQLD 자격증(국가공인 SQL 개발자), 또는 정보처리기사 자격증 등과 관련이 있을 것이나, ADsP와 밀접한 연관성을 맺고 있는 전공이라고 하기엔 다소 애매합니다.

ADsP에 응시하는데에 별 어려움이 없을 전공자라 함은, 통계학, 빅데이터, 인공지능 등의 전공자로 볼 수 있겠습니다. 실제로 최근 빅데이터, 인공지능 학부 등이 새롭게 많이 신설되고 있는 추세이고, 커리큘럼상 R, 전산통계, 머신러닝, 딥러닝 등과 같은 전공이 빠지지 않기에, 이를 이수한 전공자의 대부분은 ADsP 3과목에서 큰 어려움을 겪지 않을 것입니다.

 

 

ADsP는 ADP보다 적은, 총 3개의 과목으로 구성되어 있습니다. 1, 2과목인 데이터 이해, 데이터분석 기획 과목은 사실 누구나 쉽게 대비할 수 있는 과목입니다. 공식 기출서를 구입하여 기출문제 유형을 익히고, 단답형으로 출제 가능한 키워드를 암기하면 과락 커트라인 이상으로 충분히 높은 점수를 확보할 수 있습니다.

 

결국 문제는 R 기초, 통계학 개론과 기초 통계분석, 심화 통계분석, 데이터 마이닝 등으로 구성된 3과목인데요. 비전공자의 합격 요령으로 1, 2과목에 모든 것을 쏟아부은 후, 3과목은 과락만 면할 정도로 공부하라는 팁이 종종 보이는데, 저는 추천드리지 않습니다. 사실 ADsP에서 가장 중요한 과목이자, 그나마 공부한 덕을 볼 수 있는게 3과목인데, 3과목을 소홀히 하는 것은 사실상 자격증 취득의 의미가 없는 것이나 다름이 없습니다. 단순히 '취득'이 목표이고, '취득'에 의미가 있는 분들도 계시겠지만, 이런 식으로 취득할 바엔 저는 그냥 안 따는게 더 나을 것 같다는 생각이 듭니다.

 

 

3과목의 경우, R과 SQL의 기본적인 사용법(기초 문법) 정도는 알아두심이 좋습니다. 특히 R의 경우, 분석을 진행하여 Console에 나온 결과값을 보고 어느정도 해석할 수 있어야 합니다. 예컨대, 선형회귀 분석을 통한 결과값이 나왔을때,

p-value가 무엇인지, Coefficients가 무엇인지, t값은 또 뭔지, *이 붙은 것은 무엇을 의미하는지... 

통계 패키지를 사용하여 통계분석을 해보신 분들이라면 너무나 당연한 내용들이지만, 이러한 경험이 없는 분들이라면 난감한 부분이 많습니다. 결국 통계학 개론의 기초와, 통계분석을 함께 학습할 수 밖에 없습니다. 이것이 곧 3과목의 초반부와 일치합니다.

 

개인적으로 추천드리는 공부법은 다음과 같습니다. 

 

실제로 출제되는 기출문제가 담긴 공식 기출서 한 권, 시중에 판매되는 개념서를 한 권 준비합니다. 개념서는 어떤 출판사의 책이든 상관없지만, 인터넷에서 후기를 좀 찾아보고 너무 잘못된 내용이 많이 실린 책은 피하도록 합시다.

 

1과목과 2과목은 기출문제를 중심으로 공부합니다. 공식 기출서의 기출문제와 개념서의 기출문제(또는 모의고사) 정도의 내용만 알아도 충분합니다. 특히 공식 기출서와 동일한 문제가 꽤 출제되므로, 기출서의 기출문제는 추후에 동일한 문제가 출제되었을때 빠르게 정답을 집어낼 수 있어야 합니다. 단답형으로 출제되는 문제들도 언제든 툭툭 내뱉을 수 있을 정도로 잘 공부합니다.

 

데이터 분석 방법론이 나오는 부분에서는, 몇가지 유형의 분석 프로세스(예컨대, CRISP-DM 방법론)가 등장합니다. 이 부분은 기출문제 풀이만 가지고 해결 할 수 없는 경우가 종종 있습니다. 워낙 문제로 낼 수 있는 부분이 많아서, 기출 문제 풀이+개념에 대한 이해가 동시에 병행되어야만 오답을 줄일 수 있는데요. 만약 3과목에 자신이 있다면 이 부분은 과감히 기출 문제만 익히도록 하고, 만약 3과목에 자신이 없다면 분석 방법론 간의 차이와 특징 등을 좀 더 심도깊게 공부하여 변형 문제가 출제되어도 풀 수 있도록 공부합시다.

 

3과목의 핵심은, 일단 똑같이 나오는 기출문제는 모두 맞추는 것입니다. 공식 기출서와 여타 개념서의 기출문제와 동일하게 나오는 문제를 모두 맞추더라도, 나머지를 모두 틀린다면 과락을 피하지 못 할 가능성이 있습니다. 따라서, 풀어본적 없는 유형의 문제에 대해서 최대한 정답을 도출해내고, 정 안되면 보기를 소거해가면서 최대한 정답 가능성이 높은 보기를 선택하는 것이 중요합니다. 따라서, 해당 파트에서는 단순히 기출문제를 푸는 것 뿐만이 아니라, 비슷한 유형이 출제되었을 때 정답이 되는 보기를 선택할 수 있도록, 각각의 보기가 왜 오답이고, 왜 정답이 되는지를 이해하면서 학습하는 것이 중요합니다.

 

대충 이런 느낌으로 공부한다면, 비전공자 분들도 충분히 1~2주 안에 합격 할 수 있을 것이라 생각합니다. 

질문은 댓글로 남겨주세요. 읽어주셔서 감사합니다 :)

반응형