은전한닢
-
한국어형태소 분석기 mecab 태그셋프로그래밍/자연어처리 2017. 4. 14. 14:47
사전에 들어가는 단어 형식 확인하기 https://docs.google.com/spreadsheets/d/1-9blXKjtjeKZqsf4NzHeYJCrr49-nXeRF6D80udfcwY/edit#gid=6 1.6 버전의 태그셋 태깅셋 예시 부국증권 NNP,*,T,부국증권,*,*,*,*경영 NNG,*,T,경영,*,*,*,*권 XSN,*,T,권,*,*,*,*위 NNG,*,F,위,*,*,*,*기설 NNG,*,T,기설,*,*,*,*부각 NNG,*,T,부각,*,*,*,*… SE,*,*,*,*,*,*,*왜 MAG,문장부사/양상부사,F,왜,*,*,*,*? SF,*,*,*,*,*,*,*EOS 강윤근 NNP,인명,T,강윤근,*,*,*,*㈜ SY,*,*,*,*,*,*,*화승알앤에이 NNP,*,F,화승알앤에이,*,*,*,*..
-
elasticsearch 2.3.2 에 한국어 형태소 (은전한닢) 사용하기프로그래밍/검색 2016. 10. 8. 12:30
elasticsearch 를 새로 설치하면서 한국어 형태소 open plugin 은전한닢도 같이 설치하였다. 은전한닢 프로젝트는 검색에 사용할 만한 오픈소스 한국어 분석기를 만드는 프로젝트로 형태소 분석과 사용자 사전등의 기능을 제공하고 있다. 은전한닢 프로젝트 홈페이지 바로가기 elasticsearch 사용버전: 2.3.2은전한닢 plugin 버전: 2.3.2.1 https://bitbucket.org/eunjeon/seunjeon/src/ad2e2655ac940d2a6cc8d002c1dad1b5f807a01c/elasticsearch/?at=es-2.3.3.0 아래는 형태소 분석기 옵션이다. index_poses 옵션에서는 추출할 품사를 선택할 수 있는데 아래는 선택 가능한 품사 리스트이다.
-
elasticsearch 2.3 에 plugins 설치하기프로그래밍/검색 2016. 6. 26. 19:24
환경 : Ubuntu 14.04elasticsearch version: 2.3.2설치할 plugin : head, hq, kopf, 한국어 형태소 분석기 (은전한닢) elasticsearch 2.3을 신규 설치하여 plugin도 새로 설치해야 한다. 엘라스틱 검색이 2로 업그레이 되면서 아쉬운것은 bigdesk plugin을 사용 못한다는 것 ㅠㅠ 아쉬운 대로 hq와 kopf를 대신 설치하려고 한다. 일단 plugin 기본 설치 문법은 아래와 같다. // elastic core plugin sudo bin/plugin install [plugin_name] // community and non-core plugin sudo bin/plugin install [org]/[user|component]/[ve..