TIL
본 캠프 51일차 TIL
Data 학습자
2024. 8. 13. 23:03
1. 이상 탐지의 정의
이상 탐지는 특이한 값이나 보기 드문 사건을 탐지하는 과정으로, 정상과 다른 데이터 패턴을 찾아내는 것이 목적입니다. 이를 통해 조기 경고를 보내고 근본 원인을 해결하는 데 사용됩니다.
2. Novelty와 Outlier
- Novelty는 이전에 본 적 없는 새로운 데이터로, 학습 데이터에 포함되지 않은 데이터를 탐지하는 것
- Outlier는 기존 데이터와 비교해 확연히 다른 데이터로, 학습 데이터 내에서 다르거나 벗어난 데이터를 제거하는 것
3. 방법론 차이
- Novelty Detection은 정상 데이터만으로 학습한 후 새로운 입력 데이터를 검사합니다.
- Outlier Detection은 정상 및 이상 데이터를 모두 학습하고, 학습 데이터 내에서 벗어난 데이터를 제거합니다.
4. 이상 탐지의 어려움
- 도메인 지식이 부족할 경우 정상과 이상 데이터를 명확히 구분하기 어려워질 수 있습니다.
- 데이터 불균형 문제로 인해, 이상 데이터가 매우 희귀한 경우 머신 러닝 모델의 성능이 저하될 수 있습니다.
5. 이상 탐지에서 사용하는 데이터
- 이상 탐지에는 다양한 종류의 데이터가 사용되며, 목표와 대상에 따라 단변량 또는 다변량 데이터, 시계열 데이터 등을 활용할 수 있습니다.