Python
-
file read and write 코드Python/NLP용 python 2021. 10. 23. 12:13
*본 게시물은 21-2학기 연세대학교 일반대학원 온라인데이터수집과분석(이상엽 교수님) 수업 내용을 정리한 것입니다. 약 2년 가량 자연어 처리 코드들을 만지면서 제일 많이 접했던 코드는 파일(주로 말뭉치)을 읽어오거나 쓰는 것(주로 전처리한 내용들)이었습니다. BUT 해도해도 맨날 헷갈림 ㅋㅋㅋ 수업 내용 정리할 겸 계속 기억해놓을 겸 정리하려고 합니다. 1. 파일 열고 읽기(open and 'r'ead) 일단 파일을 읽어오는 함수 open()이 있습니다. 이 open()은 인자로 '파일 이름/경로', 와 '모드'를 받습니다. 가령 test.txt라는 파일이 있습니다. 이 파일은 다음과 같은 내용을 담고 있습니다. -------------------- 1 2 3 4 5 -------------------..
-
4. 자료형(data types)- 리스트(list)Python 2021. 9. 11. 14:48
*본 게시물은 21-2학기 연세대학교 일반대학원 온라인데이터수집과분석(이상엽 교수님) 수업 내용을 정리한 것입니다. 대망의 리스트입니다. 리스트는 자연어 처리를 하는 사람이라면 정말 모를 수가 없을 정도로 유명하고, 또 저같은 문과 쪼렙들(?)에게는 딕셔너리와 더불어 두려움의 대상으로 다가오는! 도대체가 [:-1]은 뭐고 [:]가 뭔지 눈물을 흘리게 만드는 자료형입니다... 리스트 겹괄호 쓰여지면 토크나이징도 제대로 안되는거 아시져 흑... 1. 리스트의 정의 아무튼 리스트는 '여러 개의 데이터, 값을 저장하기 위해' 사용되는 데이터 타입입니다. 저장되는 데이터들은 타입이 달라도 상관 없습니다. 리스트 선언은 '[]'(각괄호; square brackets)로 선언하며, 데이터들은 쉼표로 구분됩니다. 또한..
-
3. 자료형(data types)- 숫자 numbersPython 2021. 9. 11. 13:11
*본 게시물은 21-2학기 연세대학교 일반대학원 온라인데이터수집과분석(이상엽 교수님) 수업 내용을 정리한 것입니다. 앞선 게시물에서 데이터 타입에는 6개가 있다고 말씀드렸습니다. 숫자, 리스트, 문자열, 딕셔너리, 튜플, 집합인데 여기서는 먼저 숫자에 대해 정리하려 합니다. 1. 숫자 종류(4) (1) 정수(int; integer) 보편적으로 생각하는 그 숫자입니다. 자연수와 0, 그리고 음의 정수 모두를 말합니다. -1000, -23, 0, 1, 2, 100000000... (2) 소수(float; floating point numbers) 소숫점 달린 애들입니다. -3.141592, -1.1, 0.00001, 2.4 (3) 복소수(complex numbers) 실수(real number)와 허수(im..
-
2. Python의 함수(function)Python 2021. 9. 10. 18:02
*본 게시물은 21-2학기 연세대학교 일반대학원 온라인데이터수집과분석(이상엽 교수님) 수업 내용을 정리한 것입니다. 2. 함수(function) 파이썬 함수는 참 많이 들어본 단어인데, 이렇게 이야기할 수 있습니다. 함수란 어떤 인자(argument)를 받아, 작업(tsak or caculation)을 실행한 뒤, 실행 결과를 리턴하는 것. 가령 'print()'란 함수는 ()안에 어떤 것을 넣어 화면에 출력하도록 하는 함수입니다. ()안에 들어가는 것은 인자(argument)인데, 함수에 따라 ()안에 아무것도 들어가지 않는 경우도 있습니다. 또한 늘 값을 리턴하는 것이 아닌 '일부'의 함수들이 존재하기도 합니다. (1) 파이썬 함수의 종류 파이썬에서 사용되는 함수의 종류는 크게 2가지입니다. 빌트인 ..
-
1. Python의 변수(variable)Python 2021. 9. 10. 14:03
*본 게시물은 21-2학기 연세대학교 일반대학원 온라인데이터수집과분석(이상엽 교수님) 수업 내용을 정리한 것입니다. 파이썬은 기본적으로 두 개를 이용해 코딩을 하게 되는데, 바로 변수(variable)와 함수(function)입니다. 1. 변수(variable) (1) 변수란? 변수는 데이터를 저장하는 곳이라 할 수 있습니다. 변수에 데이터를 저장하면 그 변수를 다시 불러오거나 기타 다른 곳에 사용하게 됨으로써 변수에 할당(assign)된 데이터를 언제든지 사용할 수 있습니다. 변수에 특정 값을 할당하는 기호는 '=' 입니다. a = '온라인데이터수집과분석' b = 1 위에서 볼 수 있듯이 변수 a에는 '온라인데이터수집과분석'이라는 문자열이, b에는 숫자(int) 1이 할당되었습니다. (2) 변수와 데이..