카테고리 변수를 수치로 바꾸는 경우
1) 원핫 인코더
2) 그리고 shape로 확인하기 oe_result.toarray().shape
workclass에 들어가는 값들이 하나의 칼럼으로 변경되어 데이터프레임을 만들고 기존의 데이터프레임에 더해준다
- pd.get_dummies(train)함수를 쓰게 되면 자동으로 onehot 인코딩을 시켜준다
3) LavelEncoder()
-각각의 유니크한 값 알아보기
train['컬럼명'].unique() -> 유니크한 value 값들이 나오는데 이것을 나의 기준으로 sort해서 순서부여하기
4) MeanEncoder()
비율을 알아내기 위해 남자의 값의 갯수와, 행의 갯수
차원을 줄이기 위해
'마케팅공부 > 데이터 분석' 카테고리의 다른 글
데이터 확인, 결측치 처리, Log변환 (0) | 2021.05.13 |
---|---|
[Tacademy 데이터 분석캠프]피쳐 엔지니어링 (0) | 2021.05.12 |
[Tacademy 데이터분석캠프] 데이터 전처리 (0) | 2021.05.12 |
[Tacademy 데이터분석캠프] EDA (0) | 2021.05.11 |
[Tacademy 데이터분석캠프] 머신러닝 프로세스 이해 (0) | 2021.05.11 |
댓글