-
Supervised Disambiguation of German Verbal Idioms with a BiLSTM Architecture, (Rafael Ehren et al., 2020)논문 리뷰/MultiWordExpression 2021. 8. 7. 15:44
★Supervised Disambiguation of German Verbal Idioms with a BiLSTM Architecture
(Rafael Ehren, Timm Lichte, Laura Kallmyer, Jakub Waszczuk, 2020)
연구방법
1. 말뭉치
● Verbal Idiom을 위한 말뭉치 구축: COLF-VID
-3명의 annotator가 idiom/literal/undeciable/both 태깅
-2명의 annotator가 context에 대해서도 태깅
2. 실험 architecture
● 워드 임베딩을 얻기 위한 모델: Word2Vec(Skip-gram), FastText(CBOW), ELMo
-세 모델은 모두 pre-trained, 각자 사전 훈련된 말뭉치가 다름
-FastText의 경우 token-based, w2v은 lemmas로 이루어짐
-ELMo는 3층위 임베딩의 평균값
● 사전훈련 후 bi-LSTM을 사용하여 binary classification
-idiomatic vs literal