ML
categorical data를 one-hot encoding시 feature개수가 너무 많아진다면
프리랜서를꿈꾸는자
2020. 9. 28. 00:39
728x90
one-hot encoding했을 때 feature 수가 너무 클 때
-유관 numerical features로 교체해서 사용(국가코드를 국가인구나 GDP같은 feature로)
-learnable, low-dimensional vector로 교체(즉 embedding vector 선택)
728x90