과대적합(overfitting) 모델이 훈련 세트에 과하게 적합한 상태가 되었을 때 발생하는 문제를 말한다. 모델을 지나치게 복잡하게 학습하여 훈련 데이터 셋에서는 모델 성능이 높지만 다른 데이터가 주어졌을 때에는 정확한 예측/분류를 못한다는 것이다. 예를 들어, 중간고사 시험을 위해 중간고사에 대한 답지를 모델에게 학습 시켰을 때 중간고사 시험에 대한 테스트 점수는 높겠지만 기말고사 시험 문제를 주었을 때에는 점수가 낮게 나오는 것으로 비유할 수 있다. 발생 원인 데이터 세트 내 데이터가 충분하지 못한 경우 데이터 세트 내 분산이 크거나 노이즈가 큰 경우 모델의 복잡도가 큰 경우 과도하게 큰 epoch로 학습한 경우 해결 방법 데이터 양 늘리기 데이터 양이 적어서 해당 데이터의 특징 패턴, 노이즈까지 ..