one-hot encoding1 머신 러닝 데이터 전처리 #2 - One-hot Encoding 머신 러닝에서 사용하는 데이터 > 수치형 데이터 : 나이, 몸무게, 키 > 범주형 데이터 : 혈액형, 성별 > 머신 러닝의 경우 입력 데이터가 수치형 데이터여야 한다. > 범주형 데이터는 수치형 데이터로 변환해야 한다. > 1,2,3 숫자로 근데 이렇게 하면 혈액형에서의 크기가 생긴다. > One-hot Encoding을 이용해서 하나의 새로운 열로 만들어준다! > A형 B형 -> A형 열 B형 열 A형 AB형 B형 O형 나이 0 0 1 0 25 1 0 0 0 36 > One-hot Encoding을 하면 엉뚱한 관계를 만들지 않으면서 수치형 데이터로 바꿀 수 있다. import pandas as pd TITANIC_FILE_PATH = 'C:/Users/user/Desktop/titanic.csv' t.. 2021. 2. 9. 이전 1 다음 728x90 반응형