반응형
자연어처리 오픈소스
-
자연어처리 관련 오픈소스 정리프로그래밍/자연어처리 2017. 12. 16. 18:38
자연어처리 관련 오픈소스 정리 1. koNLPy (한국어, python) : 한국어 정보 처리를 위한 파이썬 패키지말뭉치, 사전과 한국어 형태소들을 제공하고 있다. 홈페이지 바로가기 github 바로가기 데이터(말뭉치) - 한국법률 말뭉치, 대한민국 국회 의안 말뭉치 사전 - Hannanum 시스템 사전, Kkma 시스템 사전, Mecab 시스템 사전 형태소 분석기도 다양한 클래스를 제공하고 있는데 형태소 분석기 사용 비교도 참고할 만하다. 비교 자료로는 로딩/실행 시간과 몇 개의 사용 예제가 제공되고 있다. (형태소 태깅 정확도 정보가 없는 것은 아쉽다(...)) http://konlpy-ko.readthedocs.io/ko/v0.4.3/morph/#comparison-between-pos-taggin..