imdb nn-data

Published onesixx on

https://onesixx.com/1d-conv/

imdb 로딩

R

dataset_imdb_word_index()

R

MAX_FEATURES 의미

R
R
R
R

정수벡터 decoding

R

1이나 2 값은 의미 없음.

R

train / test dataset 나누기

R

Preprocessing

List -> Matrix

R

IMDB movie-review sentiment-prediction task

  • 일단 raw 데이터를 받아서,
  • 감상평에서 , 많이 나온 순서대로 10,000개(feature로 생각되는 words 갯수)의 word만을 남겨둔다.
  • 뒤에서부터 20 words 만 남기고 잘라낸다.
    shape은 정수 List 에서 2D 정수 tentor 로 바뀐다.
  • Network은 10,000 words 대상으로 각각 8차원 embedding을 학습한다.
  • 입력 2d tensor 를 embedding하여 3d tensor로 만든다.
  • embedded 3d tensor를 flatten하여 2d tensor (sample, MAX_LEN*8)로 만든다.
  • 분류를 위해 single dense layer을 학습한다.
R
R
R
Categories: Keras

onesixx

Blog Owner

guest

0 Comments
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x