R

  • 홈
  • 태그
  • 방명록

Dummy 1

트리모델과 더미화

우리는 범주로 구성되어 있는 자료를 분석할 때 흔히 더미화(원핫인코딩) 등을 통해 자료를 변화시킨다. 과연 이러한 더미화는 모델링에서 어떤 영향을 미칠까? 회귀모델에서의 더미화 회귀분석에서 주로 얘기되는 더미화는 해당 범주별로 y절편인 beta0를 다르게 주려고 사용한다. 예를 들어 회귀분석을 통해 몸무게를 예측할 때 성별이라는 변수가 고려되었다고 한다면, 다른 변수들의 기울기는 모두 같게 나타나지만, 성별이 남자일 때 beta0에 남성의 weight만큼 더해지고, 성별이 여성일 때 beta0에 여성의 weight 만큼 더해져 좀 더 정교하게 예측하게 된다. 트리모델에서의 더미화 Tree기반 모델에서는 과연 더미화는 어떤 역할을 할까? Tree 기반 모델에서는 더미화가 오히려 성능에 악영향을 주는경우가 ..

통계 및 인공지능 2021.02.28
1
더보기
프로필사진

https://ducj.tistory.com 가 메인입니다.

  • 분류 전체보기 (17)
    • R의 객체 (1)
    • package 설치 관련 (2)
    • SQL (0)
    • selenium (0)
    • 통계 및 인공지능 (11)
    • 시각화 (0)
      • ggplot (0)
      • leafleat (0)

Tag

smote, r, rtorch, wavenet, Seq2Seq, terminal, Attention, LSTM, imbalanced data, rtorch GPU, elmo, boruta, 차원축소, Python, tensorflow, Dummy, ducj, Keras, Symbolic Regression, 1dcnn,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/04   »
일 월 화 수 목 금 토
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바