- 전통적(비신경망): K-means, 계층적 군집, DBSCAN/HDBSCAN, Mean Shift, GMM(EM), 스펙트럴 클러스터링, BIRCH, K-medoids/K-modes, PCA/Kernel PCA, t-SNE, UMAP, LDA, NMF, SVD/LSA, Louvain/Leiden, HMM, DTW-K-means/K-shape, LOF, Isolation Forest(트리 기반)
- 신경망 기반(비지도·자가지도):
- 표현학습: 오토인코더/변분오토인코더(VAE), 마스크드 오토인코더(MAE), 대조학습(SimCLR/MoCo/BYOL), CPC, iGPT 등
- 생성모델: GAN(예: AnoGAN 이상치 탐지), 확산모델, 정규화 플로우(RealNVP/Glow)
- 그래프: GAE/VGAE, GNN+커뮤니티 탐지
- 딥 클러스터링: DEC/IDEC, DeepCluster(특징학습→K-means), 임베딩 학습과 군집을 공동 최적화
실전에서 자주 쓰는 조합
- 신경망 임베딩 → 전통 군집: BERT/CLIP/SimCLR 등으로 임베딩을 뽑고, 그 벡터에 K-means/DBSCAN 적용(빠르고 성능 좋음).
- 오토인코더 잠재공간에서 군집: AE/VAE로 차원 축소+노이즈 제거 → 잠재벡터에 군집(DEC/IDEC).
- 이상치 탐지: AE 재구성오차, VAE likelihood, AnoGAN, Deep SVDD.
답글 남기기