[tensorflow]attention model

통계 및 인공지능

[tensorflow]attention model

cj92 2021. 6. 11. 01:43

https://diane-space.tistory.com/318?category=882603

[시계열] 케라스에서 Luong 어텐션을 활용한 seq2seq2 LSTM 모델 만들기 (번역)

원문 Building Seq2Seq LSTM with Luong Attention in Keras for Time Series Forecasting | by Huangwei Wieniawska | Level Up Coding (gitconnected.com) Building Seq2Seq LSTM with Luong Attention in Keras..

diane-space.tistory.com

https://rcj92.tistory.com/18

[tensorflow]Seq2Seq regression in R

https://diane-space.tistory.com/318?category=882603 [시계열] 케라스에서 Luong 어텐션을 활용한 seq2seq2 LSTM 모델 만들기 (번역) 원문 Building Seq2Seq LSTM with Luong Attention in Keras for Time Serie..

rcj92.tistory.com

앞선 Seq2Seq 모델의 연장선으로 Luong 어텐션을 활용한 회귀모델 예제를 만들어 공유해보고자 한다.

만약 틀린 부분이 있으면 얘기해주기 바란다.

활용 패키지는 아래와 같으며 시계열 예측할 때 자주 나오는 AirPassengers 자료를 분해시계열을 적용하여

진행하였다.

library(forecast)
library(abind)
library(keras)
library(tensorflow)
library(kerasR)
library(scales)
data=decompose(AirPassengers)
data=na.omit(data.frame(x=data$x,seasonal=data$seasonal,
                        trand=data$trend,random=data$random))

truncate=function(x,train_len=24,test_len=10,cols){
  in_=list();out_=list();label_=list()
  for(i in 1:(dim(x)[1]-train_len-test_len)){
    in_[[i]]=x[i:(i+train_len),cols]
    out_[[i]]=x[(i+train_len):(i+train_len+test_len),cols]
  }
  return(list(X_in=abind(in_,along=0),X_out=abind(out_,along=0)))
}
train=data[1:80,]
test=data[81:nrow(data),]
means=apply(train,2,mean)
sds=apply(train,2,sd)
train=(train-means)/sds
test=(test-means)/sds

train=truncate(train,train_len=24,test_len=10,cols=c('seasonal','trand','random'))
test=truncate(test,train_len=24,test_len=10,cols=c('seasonal','trand','random'))

n_hidden=100
input_train =keras::layer_input(shape=c(dim(train$X_in)[2],dim(train$X_in)[3]))
output_train=keras::layer_input(shape=c(dim(train$X_out)[2],dim(train$X_out)[3]))
encoder=keras::layer_lstm(input_train,units=n_hidden,activation = 'swish',
                          dropout = .2,recurrent_dropout = .2,return_sequences = T,
                          return_state = T)
encoder_last_h=keras::layer_batch_normalization(encoder[[2]],momentum = .6)
encoder_last_c=keras::layer_batch_normalization(encoder[[3]],momentum = .6)

decoder=keras::layer_repeat_vector(encoder[[2]],dim(train$X_out)[2])
decoder_lstm=keras::layer_lstm(units=n_hidden,activation='swish',
                               dropout = .2,recurrent_dropout = .2,return_sequences = T,
                               return_state = F)
decoder=decoder_lstm(decoder,initial_state=list(encoder_last_h,encoder_last_c))
attention=keras::layer_dot(list(decoder,encoder[[1]]),axes=c(2,2))
attention=keras::layer_activation(attention,'softmax')
context=keras::layer_dot(list(attention,encoder[[1]]),axes=c(2,1))
decoder_combined_context=keras::layer_concatenate(list(context,decoder))
out=keras::time_distributed(
         decoder_combined_context,keras::layer_dense(units=output_train$shape[[3]]))


model=keras::keras_model(inputs=input_train,outputs=out)
opt=keras::optimizer_adam(lr=0.01,clipnorm=1)
model$compile(loss='MSE',optimizer=opt,metrics=c('mae'))
model$summary()
library(kerasR)
# kerasR::plot_model(model,to_file = 'model_plot.png',show_shapes=T,show_layer_names=T)
dim(train$X_in)
dim(train$X_out)

es=keras::callback_early_stopping(monitor='val_loss',mode='min',patience = 50)
history = model$fit(train$X_in,train$X_out,validation_split=.2,
                    epochs=500L,verbose=1,callbacks=es,batch_size=30L)
pred=model$predict(test$X_in)
for(i in 1:dim(pred)[3]){
  pred[,,i]=pred[,,i]*sds[i]+means[i]
}
plot(data$x[1:(81+11)],ylim=c(0,500))
points(81:(81+10),apply(pred,c(1,2),sum)[1,],col=2)

저작자표시 비영리 동일조건

'통계 및 인공지능' 카테고리의 다른 글

Symbolic Regression in R (0)	2021.06.12
[tensorflow]Seq2Seq regression in R (0)	2021.06.10
WaveNet in R (0)	2021.05.02
1D-CNN & Multi input Multi output Model in R (1)	2021.05.02
R에서 ELMO 모형 사용하기 (0)	2021.04.26

현재글[tensorflow]attention model

https://ducj.tistory.com 가 메인입니다.

elmo, rtorch, Attention, 차원축소, Keras, ducj, Dummy, r, Symbolic Regression, Seq2Seq, terminal, wavenet, rtorch GPU, Python, tensorflow, LSTM, 1dcnn, imbalanced data, smote, boruta,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

R