차원의 저주 특성수가 많을수록 훈련은 느리고 모델의 성능은 나빠진다. 그런데 특성수가 많을 수록 데이터의 밀도가 낮아진다 --> 과대 적합. 중요한 데이터는 특정 영역에 집중된다. 차원의 저주를 해결하기 위해... 데이터를 늘려 밀도를 높인다. 차원을 낮춘다. 데이터를 늘려 밀도를 유지하는것은 고차원에서는 사실상 불가능하다. 따라서 차원을 낮추는 차원 축소가 유용하다. 차원 축소 원리 투영 D 차원의 데이터를 낮은 차원인 N 차원에 맵핑하는 것. 대부분의 데이터는 일부 공간(부분 공간)에 모여 있으므로 차원을 낮추더라도 식별이 가능하다. 하지만 반드시 차원을 낮춘다고 식별이 용이해 지는것은 아님. 예. 스위스롤을 절반으로 나누는 문제는 고차원에서 식별이 더 쉽다. 차원을 낮추면 말린 부분이 오버랩 되기 ..