본문 바로가기
카테고리 없음

데이터 쪼개기, 스케일링, 인코딩

by 여니여니여 2021. 5. 13.

1) 데이터 쪼개기

사이킷런의 train_test_split 함수 사용

사용예제

- 인덱스를 다시 초기화 (섞은 후 다시 초기화 )

 

2) 스케일링

Standard Scaler 모듈 사용

-범주형과 수치형 나누기

-train 기준으로 스케일링하기

3)인코딩

범수형 변수를 수치형 변수로 인코딩 Onehot Encoding

합쳐서 시키고 

-기존 범주형 변수 제거 

댓글