자연어처리
-
elasticsearch 2.3.2 에 한국어 형태소 (은전한닢) 사용하기프로그래밍/검색 2016. 10. 8. 12:30
elasticsearch 를 새로 설치하면서 한국어 형태소 open plugin 은전한닢도 같이 설치하였다. 은전한닢 프로젝트는 검색에 사용할 만한 오픈소스 한국어 분석기를 만드는 프로젝트로 형태소 분석과 사용자 사전등의 기능을 제공하고 있다. 은전한닢 프로젝트 홈페이지 바로가기 elasticsearch 사용버전: 2.3.2은전한닢 plugin 버전: 2.3.2.1 https://bitbucket.org/eunjeon/seunjeon/src/ad2e2655ac940d2a6cc8d002c1dad1b5f807a01c/elasticsearch/?at=es-2.3.3.0 아래는 형태소 분석기 옵션이다. index_poses 옵션에서는 추출할 품사를 선택할 수 있는데 아래는 선택 가능한 품사 리스트이다.
-
weka 사용법 - weka 설치프로그래밍/자연어처리 2015. 3. 15. 02:51
WEKA(Waikato Environment for Knowledge Analysis)는 Waikato 대학교에서 개발한 기계학습 툴로 간단한 decision tree, neural network부터 support vector machine등의 다양한 기계학습 알고리즘을 제공하고 있다. 알고리즘이 달려져도 대부분 동일한 데이터 format을 사용하기 때문에 동일한 데이터에 여러 알고리즘을 적용해보고 결과를 비교해보기 편리하여 종종 사용하게 되는 것 같다. 일단 아래 사이트에서 WEKA를 다운받아보자. 웹사이트 : http://www.cs.waikato.ac.nz/ml/weka/다운로드 사이트: http://www.cs.waikato.ac.nz/ml/weka/downloading.html 자신의 개발환경에..