https://archive.ics.uci.edu/datasets
범주형 변수(categorical variable)는 적절한 변환 처리 필요
필요에 따라 스케일링(Scaling), 정규화(Normalization) 수행
(※ 거리정보에 기반한 군집화의 경우 특정 변수 값의 크기(스케일)에 크게 좌우될 수 있기 때문)
K-Means, Hierarchical clustering, DBSCAN, Affinity propagation 등 학습한 군집화 분석을 수행
각 알고리즘의 hyperparameter tuning 수행
군집화 적용 결과비교: metric(SSE, Silhouette score 등) 기반으로 군집 결과를 기술
※ 군집화 분석은 비지도학습 기법이나, 연구 수행 시 알고리즘의 유효성 평가를 위해 레이블이 있는 데이터에 대해 실험
예시> https://in2techs.com/mnist-visualization-using-pca-and-tsne-in-python/