R

  • 홈
  • 태그
  • 방명록

imbalanced data 1

[SMOTE] 불균형 자료의 처리 알고리즘

SMOTE 알고리즘은 크게 오버 샘플링, 언더 샘플링, 취합 순으로 진행된다. 오버 샘플링 : 작은 표본을 크게 복원 추출하는 방법 언더 샘플링 : 큰 표본을 작게 복원 추출 하는 방법 [오버 샘플링] 문자형이나 범주형 자료를 KNN에 사용하기위해 숫자형으로 변경 빈도가 가장 작았던 자료의 관측치수( rare : 50 -> nT) 300 개에 대해서 관측치별로 KNN 진행 #default 옵션은 5개 분류로 진행 자료를 6배 해야하므로 KNN 5개중 랜덤하게 1개를 뽑고 I 번째 값과의 차이(difs)에 랜덤균등분포(min=0, max=1)을 뽑아서 I 번째 자료에 더하여 자료를 생성하는 작업을 6번 함. 이렇게 300개의 빈도가 가장 작았던 자료를 KNN기반으로 오버샘플링을 진행 [언더샘플링] 빈도가 ..

통계 및 인공지능 2021.02.28
1
더보기
프로필사진

https://ducj.tistory.com 가 메인입니다.

  • 분류 전체보기 (17)
    • R의 객체 (1)
    • package 설치 관련 (2)
    • SQL (0)
    • selenium (0)
    • 통계 및 인공지능 (11)
    • 시각화 (0)
      • ggplot (0)
      • leafleat (0)

Tag

tensorflow, LSTM, imbalanced data, r, ducj, terminal, Keras, Python, wavenet, Attention, 1dcnn, smote, Dummy, 차원축소, boruta, Symbolic Regression, Seq2Seq, rtorch GPU, elmo, rtorch,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바