Brightics 서포터즈 개인 미션, 분석 프로젝트 분석 모델링 및 전처리 과정
3차 전처리 과정에서 진행한 것은, 도로명 우편번호를 기준으로 분류하기 위한 전처리 및 프랜차이즈 카페를 분류하는 Column을 추가하는 작업이었습니다. 도로명 우편번호가 포함되지 않은 약 9%의 Row를 모두 제거하고, Python Script 함수를 사용하여 프랜차이즈 카페 평판 순위 30위 권에 들어있는 카페를 1, 그렇지 않은 카페를 0으로 분류하였는데요. 오늘은 한단계 더 나아가서, 도로명 우편번호를 기준으로 그룹핑 하도록 하겠습니다. 일정상 데이터 모델링 단계에 진입해야 하나, 생각보다 전처리 작업에 시간이 많이 소요되어, 전처리 과정을 조금 더 진행하면서 병행할 예정에 있습니다. 그룹핑에는 어떤 방법이 효율적일지 여러가지로 고민을 해보았는데요. Brightics에 내장된 함수를 사용하여 작업..