nlp (2) 썸네일형 리스트형 RNNsearch RNNsearch 모델은 기존의 neural machine translation 시스템들이 보조적인 역할에 국한되었던 것에 반해, attention 개념의 alignment를 통해 기존 모델들과 달리 긴 문장 입력의 경우에도 효과적으로 번역하는 독립적인 시스템을 선보인 모델이다. Neural Machine Translation by Jointly Learning to Align and Translate Neural machine translation is a recently proposed approach to machine translation. Unlike the traditional statistical machine translation, the neural machine translation a.. 한국어 - 영어 번역 데이터 만들기 논문 보고 구현하기 카테고리에 있는 RNNsearch 모델을 구현해보려고 하는데 이때 한국어 - 영어 데이터가 필요해서 pytorch를 이용하여 만들어보기로 하였다. 이 포스팅에서 사용된 pytorch는 1.10.0이며 torchtext는 0.11.0 버전이다. 먼저 한국어-영어 번역 데이터는 AI Hub에서 한국어-영어 번역(병렬) 말뭉치 데이터를 이용하기로 하였다. 한국어-영어 번역(병렬) 말뭉치 AI 번역 엔진 개발을 위한 뉴스(80만 장), 정부/지자체 홈페이지, 간행물(10만 문장), 행정 규칙, 자치법규(10만 문장), 한국 문화(10만 문장), 구어체(40만 문장), 대화체(10만 문장)의 학습용 문장을 구 aihub.or.kr AI Hub에서 데이터 사용허가를 받고 다운로드를 하면 다음과 .. 이전 1 다음