SMOTE 알고리즘은 크게 오버 샘플링, 언더 샘플링, 취합 순으로 진행된다. 오버 샘플링 : 작은 표본을 크게 복원 추출하는 방법 언더 샘플링 : 큰 표본을 작게 복원 추출 하는 방법 [오버 샘플링] 문자형이나 범주형 자료를 KNN에 사용하기위해 숫자형으로 변경 빈도가 가장 작았던 자료의 관측치수( rare : 50 -> nT) 300 개에 대해서 관측치별로 KNN 진행 #default 옵션은 5개 분류로 진행 자료를 6배 해야하므로 KNN 5개중 랜덤하게 1개를 뽑고 I 번째 값과의 차이(difs)에 랜덤균등분포(min=0, max=1)을 뽑아서 I 번째 자료에 더하여 자료를 생성하는 작업을 6번 함. 이렇게 300개의 빈도가 가장 작았던 자료를 KNN기반으로 오버샘플링을 진행 [언더샘플링] 빈도가 ..