전체 글
-
2. Python의 함수(function)Python 2021. 9. 10. 18:02
*본 게시물은 21-2학기 연세대학교 일반대학원 온라인데이터수집과분석(이상엽 교수님) 수업 내용을 정리한 것입니다. 2. 함수(function) 파이썬 함수는 참 많이 들어본 단어인데, 이렇게 이야기할 수 있습니다. 함수란 어떤 인자(argument)를 받아, 작업(tsak or caculation)을 실행한 뒤, 실행 결과를 리턴하는 것. 가령 'print()'란 함수는 ()안에 어떤 것을 넣어 화면에 출력하도록 하는 함수입니다. ()안에 들어가는 것은 인자(argument)인데, 함수에 따라 ()안에 아무것도 들어가지 않는 경우도 있습니다. 또한 늘 값을 리턴하는 것이 아닌 '일부'의 함수들이 존재하기도 합니다. (1) 파이썬 함수의 종류 파이썬에서 사용되는 함수의 종류는 크게 2가지입니다. 빌트인 ..
-
1. Python의 변수(variable)Python 2021. 9. 10. 14:03
*본 게시물은 21-2학기 연세대학교 일반대학원 온라인데이터수집과분석(이상엽 교수님) 수업 내용을 정리한 것입니다. 파이썬은 기본적으로 두 개를 이용해 코딩을 하게 되는데, 바로 변수(variable)와 함수(function)입니다. 1. 변수(variable) (1) 변수란? 변수는 데이터를 저장하는 곳이라 할 수 있습니다. 변수에 데이터를 저장하면 그 변수를 다시 불러오거나 기타 다른 곳에 사용하게 됨으로써 변수에 할당(assign)된 데이터를 언제든지 사용할 수 있습니다. 변수에 특정 값을 할당하는 기호는 '=' 입니다. a = '온라인데이터수집과분석' b = 1 위에서 볼 수 있듯이 변수 a에는 '온라인데이터수집과분석'이라는 문자열이, b에는 숫자(int) 1이 할당되었습니다. (2) 변수와 데이..
-
When does a Compliment become Sexist? Analysis and Classification of Ambivalent Sexism using Twitter Data( Akshita Jha, Radhika Mamidi, 2017)논문 리뷰/Error Analysis 2021. 8. 25. 20:13
When does a Compliment become Sexist? Analysis and Classification of Ambivalent Sexism using Twitter Data( Akshita Jha, Radhika Mamidi, 2017) ● 노골적인 성차별 댓글(hostile)과 겉으로는 성차별적이지 않으나 성차별적 내용을 담은 댓글(benevolent) 분류 ● 실험 전 연구 대상 데이터셋에 대한 사전 고찰 -내용어 단어 빈도 순 고찰, tri-gram 빈도, 형용사 빈도 ● ML 기법(SVM)과 DL 기법(Seq2Seq, fastText 자체 classifier) 간 비교 ● 데이터셋 및 태스크 Twitter 데이터, Multi task 분류: 라벨 3개(hostile, benevol..
-
Challenges for Toxic Comment Classification: An In-Depth Error Analysis(Betty van Aken et al., 2018)논문 리뷰/Error Analysis 2021. 8. 25. 20:11
Challenges for Toxic Comment Classification: An In-Depth Error Analysis(Betty van Aken et al., 2018) ● 멀티 라벨 분류 데이터셋에 대한 아키텍처의 분류 태스크 에러 분석 중심 ● 분류 세부 결과 분석은 ensemble에 대해서만 시행 ● 사용 데이터셋 및 태스크 Wikipidia talkpages(Kaggle Toxic Comment Classifiction): 6 labels Twitter Dataset : 3 labels ● 사용 아키텍처: Logistic regression, bi-RNN(LSTM, GRU), CNN + classifier에서 발생할 수 있는 idiosyncratic wors문제와 misspell wor..
-
Metaphor Detection Using Contextual Word Embeddings From Transformers(Liu, J., O’Hara, N., Rubin, A., Draelos, R., & Rudin, C. 2020)논문 리뷰/Disambiguation 2021. 8. 7. 16:06
Liu, J., O’Hara, N., Rubin, A., Draelos, R., & Rudin, C. (2020, July). Metaphor detection using contextual word embeddings from transformers. In Proceedings of the Second Workshop on Figurative Language Processing (pp. 250-255). ●구 automatic metaphor detection: hand-creafting informative features에 집중& supervised machine learning algorithm 사용 -features: POS tag, concreteness, iageabilitym semanti..
-
The Impact of Word Representations on Sequential Neural MWE Identification(Nicolas Zampieri, Carlos Ramisch, Geraldine Damnati, 2019)논문 리뷰/MultiWordExpression 2021. 8. 7. 15:48
Nicolas Zampieri, Carlos Ramisch, Geraldine Damnati. The Impact of Word Representations on Sequential Neural MWE Identification. Joint Workshop on Multiword Expressions and WordNet (MWE-WN 2019), Aug 2019, Florence, Italy. pp.169 - 175, ff10.18653/v1/W19-5121f 1. finding MWEs in running text(Constant,2017) 2. PRSEME 1.1(Ramisch et al. 2018) 3. FastText(character n-gram, Bojanowski et al. 2017) 4..
-
Supervised Disambiguation of German Verbal Idioms with a BiLSTM Architecture, (Rafael Ehren et al., 2020)논문 리뷰/MultiWordExpression 2021. 8. 7. 15:44
★Supervised Disambiguation of German Verbal Idioms with a BiLSTM Architecture (Rafael Ehren, Timm Lichte, Laura Kallmyer, Jakub Waszczuk, 2020) 연구방법 1. 말뭉치 ● Verbal Idiom을 위한 말뭉치 구축: COLF-VID -3명의 annotator가 idiom/literal/undeciable/both 태깅 -2명의 annotator가 context에 대해서도 태깅 2. 실험 architecture ● 워드 임베딩을 얻기 위한 모델: Word2Vec(Skip-gram), FastText(CBOW), ELMo -세 모델은 모두 pre-trained, 각자 사전 훈련된 말뭉치가 다름 -F..
-
현대 국어 관용구의 결합관계 고찰, 이희자(1995)언어학/관용표현 2021. 8. 7. 15:38
이희자(1995), 현대 국어 관용구의 결합관계 고찰, 대동문화연구 제 30권 ●관용표현: 구, 문장단위도 존재, 발생 원인에 공통점(습관적인 말의 사용), 습관적인 말의 사용에서 야기된 어절들의 의미·통사·형태적 결합 관계 ========== ● 관용성: collocability, 다른 어휘적 단위와 특정한 결합을 이루는 특정 어휘의 결합 성향 ● 관용구는 숙어/연어로 구분 -숙어 -의미적 연어, 통사적 연어, 형태적 연어 -NP+NP, V+V, NP+V(관용 표현 용언구) ● 숙어(익은말) -둘 이상의 어절이 습관적으로 결합하여 쓰이면서, 이들 낱말의 의미 합으로는 산출되지 않는 제 3의 의미를 지니는 구절들 -반드시 결합구조를 보이는 구가 글자 그대로의 직설적 의미로도 사용됨 ● 숙어 vs 의미적 ..