다양한 분석 방법

  • 전통적(비신경망): K-means, 계층적 군집, DBSCAN/HDBSCAN, Mean Shift, GMM(EM), 스펙트럴 클러스터링, BIRCH, K-medoids/K-modes, PCA/Kernel PCA, t-SNE, UMAP, LDA, NMF, SVD/LSA, Louvain/Leiden, HMM, DTW-K-means/K-shape, LOF, Isolation Forest(트리 기반)
  • 신경망 기반(비지도·자가지도):
    • 표현학습: 오토인코더/변분오토인코더(VAE), 마스크드 오토인코더(MAE), 대조학습(SimCLR/MoCo/BYOL), CPC, iGPT 등
    • 생성모델: GAN(예: AnoGAN 이상치 탐지), 확산모델, 정규화 플로우(RealNVP/Glow)
    • 그래프: GAE/VGAE, GNN+커뮤니티 탐지
    • 딥 클러스터링: DEC/IDEC, DeepCluster(특징학습→K-means), 임베딩 학습과 군집을 공동 최적화

실전에서 자주 쓰는 조합

  • 신경망 임베딩 → 전통 군집: BERT/CLIP/SimCLR 등으로 임베딩을 뽑고, 그 벡터에 K-means/DBSCAN 적용(빠르고 성능 좋음).
  • 오토인코더 잠재공간에서 군집: AE/VAE로 차원 축소+노이즈 제거 → 잠재벡터에 군집(DEC/IDEC).
  • 이상치 탐지: AE 재구성오차, VAE likelihood, AnoGAN, Deep SVDD.

코멘트

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다