ML

categorical data를 one-hot encoding시 feature개수가 너무 많아진다면

프리랜서를꿈꾸는자 2020. 9. 28. 00:39
728x90

one-hot encoding했을 때 feature 수가 너무 클 때

-유관 numerical features로 교체해서 사용(국가코드를 국가인구나 GDP같은 feature로)

-learnable, low-dimensional vector로 교체(즉 embedding vector 선택)

728x90