텍스트 분석 (2) 썸네일형 리스트형 [딥러닝/DL]8. 순환 신경망으로 IMDB리뷰 분류하기 이전 글에서는 순환 신경망의 개념과 동작 원리를 알아봤다. 이제 이 순환 신경망을 사용해 IMDB리뷰 데이터를 분류해보자. ※ 자연어 처리(NLP,Natural Language Processing) 컴퓨터를 사용해 인간의 언어를 처리하는 분야이다. 대표적으로 음성 인식, 기계 번역, 감성 분성(IMDB리뷰 분석) 등이 있다. 훈련 데이터를 종종 말뭉치(corpus)라고 부른다. IMDB리뷰 데이터 세트 유명한 인터넷 영화 DB인 imdb.com에서 수집한 리뷰를 감상평에 따라 긍정/부정으로 분류해 놓은 데이터 셋이다. 총 50,000개의 샘플로 이루어져 있다. 훈련/테스트 세트 데이터는 각각 25,000개씩 나누어져 있다. 긍정/부정 리뷰 데이터는 각각 25,000개씩 나누어져 있다. 신경망에 텍스트를 .. [딥러닝/DL]7. 순차 데이터와 순환 신경망 마케팅 팀장은 이번 이벤트의 후기를 분석하려고 했다. 하지만 너무 많은 양이라 할 엄두가 나지 않았다. 그래서 Pupbani를 불러 "후기 댓글들을 분석해 긍정, 부정을 판단할 수 없을까?"라고 했다. Pupbani는 전에 배운 순환 신경망이 떠올라 알겠다고 대답한 후 자신의 자리로 돌아 갔다. 순차 데이터 순차 데이터(sequential data)는 텍스트나 시계열 데이터(time series data)와 같이 순서에 의미가 있는 데이터를 말한다. 우리가 여태까지 사용했던 데이터는 순서에 상관이 없었기에 골고루 섞어서 사용하기도 했다. 하지만 순차 데이터는 순서를 유지 하면서 신경망에 넣어야하기 때문에 까다롭다. 그래서 순차 데이터를 사용하기 위해서는 이전에 입력한 데이터를 기억하는 기능이 필요하다. .. 이전 1 다음