논문 리뷰/MultiWordExpression

Supervised Disambiguation of German Verbal Idioms with a BiLSTM Architecture, (Rafael Ehren et al., 2020)

김아다만티움 2021. 8. 7. 15:44

Supervised Disambiguation of German Verbal Idioms with a BiLSTM Architecture

(Rafael Ehren, Timm Lichte, Laura Kallmyer, Jakub Waszczuk, 2020)

 

연구방법

 

1. 말뭉치

● Verbal Idiom을 위한 말뭉치 구축: COLF-VID

    -3명의 annotatoridiom/literal/undeciable/both 태깅

    -2명의 annotatorcontext에 대해서도 태깅

 

2. 실험 architecture

● 워드 임베딩을 얻기 위한 모델: Word2Vec(Skip-gram), FastText(CBOW), ELMo

    -세 모델은 모두 pre-trained, 각자 사전 훈련된 말뭉치가 다름

    -FastText의 경우 token-based, w2vlemmas로 이루어짐

    -ELMo3층위 임베딩의 평균값

● 사전훈련 후 bi-LSTM을 사용하여 binary classification

    -idiomatic vs literal