imdb nn-data
imdb 로딩
R
dataset_imdb_word_index()
R
MAX_FEATURES 의미
R
R
R
R
정수벡터 decoding
R
1이나 2 값은 의미 없음.
R
train / test dataset 나누기
R
Preprocessing
List -> Matrix
R

IMDB movie-review sentiment-prediction task
- 일단 raw 데이터를 받아서,
- 감상평에서 , 많이 나온 순서대로 10,000개(feature로 생각되는 words 갯수)의 word만을 남겨둔다.
- 뒤에서부터 20 words 만 남기고 잘라낸다.
shape은 정수 List 에서 2D 정수 tentor 로 바뀐다. - Network은 10,000 words 대상으로 각각 8차원 embedding을 학습한다.
- 입력 2d tensor 를 embedding하여 3d tensor로 만든다.
- embedded 3d tensor를 flatten하여 2d tensor (sample, MAX_LEN*8)로 만든다.
- 분류를 위해 single dense layer을 학습한다.
R
R
R