'imbalanced data' 태그의 글 목록

[SMOTE] 불균형 자료의 처리 알고리즘

SMOTE 알고리즘은 크게 오버 샘플링, 언더 샘플링, 취합 순으로 진행된다. 오버 샘플링 : 작은 표본을 크게 복원 추출하는 방법 언더 샘플링 : 큰 표본을 작게 복원 추출 하는 방법 [오버 샘플링] 문자형이나 범주형 자료를 KNN에 사용하기위해 숫자형으로 변경 빈도가 가장 작았던 자료의 관측치수( rare : 50 -> nT) 300 개에 대해서 관측치별로 KNN 진행 #default 옵션은 5개 분류로 진행 자료를 6배 해야하므로 KNN 5개중 랜덤하게 1개를 뽑고 I 번째 값과의 차이(difs)에 랜덤균등분포(min=0, max=1)을 뽑아서 I 번째 자료에 더하여 자료를 생성하는 작업을 6번 함. 이렇게 300개의 빈도가 가장 작았던 자료를 KNN기반으로 오버샘플링을 진행 [언더샘플링] 빈도가 ..

통계 및 인공지능 2021.02.28

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

R

imbalanced data 1

티스토리툴바