1. 데이터 불러오기
+ 목표변수 제거
2. 목표변수 수치형 자료형으로 변경
3. 필요없는 데이터들 삭제
2) 데이터 확인
.head(), describe(), .info()등의 함수로 데이터 확인하기 -> 결측치 파악
3) 결측치 처리
범주형 변수의 경우 가장 간단하게 최빈값으로 처리, 다른 칼럼을 필터링해서 결측치를 처리 할 수 있음
loc함수로 조건을 걸어서 일괄변환
4) Log 변환
-데이터가 치우쳐 있을때
-쓸때 없는 값 지우기
'마케팅공부 > 데이터 분석' 카테고리의 다른 글
[Tacademy] One Hot Enconding, PCA (0) | 2021.05.12 |
---|---|
[Tacademy 데이터 분석캠프]피쳐 엔지니어링 (0) | 2021.05.12 |
[Tacademy 데이터분석캠프] 데이터 전처리 (0) | 2021.05.12 |
[Tacademy 데이터분석캠프] EDA (0) | 2021.05.11 |
[Tacademy 데이터분석캠프] 머신러닝 프로세스 이해 (0) | 2021.05.11 |
댓글