본문 바로가기
마케팅공부/데이터 분석

[Tacademy] One Hot Enconding, PCA

by 여니여니여 2021. 5. 12.

카테고리 변수를 수치로 바꾸는 경우 

1) 원핫 인코더 

2) 그리고 shape로 확인하기 oe_result.toarray().shape

workclass에 들어가는 값들이 하나의 칼럼으로 변경되어 데이터프레임을 만들고 기존의 데이터프레임에 더해준다

 

 

- pd.get_dummies(train)함수를 쓰게 되면 자동으로 onehot 인코딩을 시켜준다

 

3) LavelEncoder()

-각각의 유니크한 값 알아보기

train['컬럼명'].unique() -> 유니크한 value 값들이 나오는데 이것을 나의 기준으로 sort해서 순서부여하기

 

4) MeanEncoder()

비율을 알아내기 위해 남자의  값의 갯수와, 행의 갯수

 

차원을 줄이기 위해 

 

댓글