koNLPy

코드 from konlpy.tag import Twitter twitter=Twitter() 오류 UserWarning: "Twitter" has changed to "Okt" since KoNLPy v0.4.5. warn('"Twitter" has changed to "Okt" since KoNLPy v0.4.5.') 위의 코드를 실행하면 Twitter는 KoNLPy 버전 0.4.5.부터 Okt로 바뀌었다는 warning이 나온다! 사실 warning이기 때문에 코드는 실행되긴 하지만 Okt패키지를 실행해주고 Twitter대신 Okt패키지를 사용해서 분석하면 경고문이 발생하지 않는다. 해결 from konlpy.tag import Okt okt = Okt() Okt로 패키지를 바꾸고 나서도 다음 코드가..
한글 NLP 처리의 어려움 영어의 경우 띄어쓰기를 잘못하면 잘못된 단어 또는 없는 단어로 인식됩니다. 하지만 한글의 경우, '아버지가 방에 들어가신다'를 잘못 띄어쓰기하면 '아버지 가방에 들어가신다'가 되어 의미가 왜곡되게 됩니다. 또한 주어나 목적어를 위해 추가되는 조사의 경우 전처리를 할때 제거하기가 까다롭습니다. '너희 집은 어디 있니?'에서 '집은'의 '은'이 뜻하는 것이 조사인지 아니면 금은동할때 은인지 구분하기가 어렵습니다. 띄어쓰기가 잘못돼어 '집 은'으로 쓴 경우 더욱 그렇습니다..! 이러한 문제들 때문에 한글 언어 처리가 라틴어 처리보다 어렵다고 합니다. 실습 KoNLPy는 파이썬의 대표적인 한글 형태소 패키지입니다. KoNLPy는 자바 형태소 분석 엔진을 래퍼한 것이기 때문에 Java설..
xod22
'koNLPy' 태그의 글 목록