2017/09
-
한국어 뉴스 데이터로 딥러닝 시작하기- 6. doc2vec으로 문사 유사도 측정하기프로그래밍/자연어처리 2017. 9. 11. 18:05
한국어 뉴스 데이터로 딥러닝 시작하기 6. doc2vec으로 문사 유사도 측정하기 과거 관련 포스팅 리스트 1. 한국어 위키 덤프 다운로드 받기 바로가기 2. 위키 덤프 데이터 파싱하기 바로가기3. 위키 데이터 한국어 형태소 태깅하기 바로가기4. doc2vec 모델 훈련하기5. 한국어 word2vec 데모 만들기 최근에 관심이 있는 프로젝트에서 부동산 관련 뉴스들만 자동으로 필터링 해야 하는데 doc2vec에서 있는 n_similarity 함수 기능이 생각나서 간만에 doc2vec API 문서 로 가보았습니다. ???? Deprecated 되고 다른 모듈로 기능이 옮겨졌네요 ㅠㅠ 넘 간만에 doc2vec을 사용했더니 ㄷㄷ 새로운 함수 설명으로 이동해봅니다. https://github.com/RaRe-Te..
-
도로명 주소 (아파트 주소) DB 구축부동산 2017. 9. 8. 20:22
아파트 가격 예측 정보를 검색에서 찾게 하는 것 뿐만 아니라 아파트 실거래가/예측 정보를 지도에서 표시하기로 했다. 검색해보니 주소 검색 API를 사용하는 방법도 있긴 한데 (http://postcode.map.daum.net/guide)일단은 직접 구축을 해보기로 했다. 데이터 구축에 필요한 데이터는 아래 링크에서 제공하고 있다. 1. 도로명주소 안내 시스템 건물 DB 데이터를 다운로드 받으면아래와 같이 빌딩 정보와 지번 정보가 지역별로 들어있다. 아래 우정사업본부 데이터와 비교해서 뭘 사용할지 좀 고민했는데 이 데이터는 각자 테이블을 세 개 만들어야 하는 등 관리가 좀 더 복잡한 것 같아서 걍 우정사업본부 데이터로 일단 진행해보겠다. 2. 우정사업본부 (참고 블로그) 위 링크에서 지역별 주소 DB를 ..
-
유칼립투스 키우기 (과습 조심 ㅠㅠ)일상 2017. 9. 8. 18:00
유칼립투스가 잎마름 현상이 있어서 찾아보니물 부족보다 과습 현상이 가까운것 같다. 원인을 생각해보니 장마철에 배송받았는데 물을 좋아한다고 해서 이틀에 한번꼴로 물을 주었다 ㅠㅠ 우리집에 처음 배송된 날 (이렇게 싱그럽고 건강했던 아이를 ㅠㅠ) 참고한 까페 게시물을 따르면 겉 흙이 바짝 마르고 속 흙도 어느정도 말랐을때 바께스로 물을 들이부어야 한다고 한다. 27.5도/실내일 때 큰 화분에서 3일 정도가 지나야 저 정도로 마른다고 한다. 물을 더 자주 주고 싶으면 차라리 작은 화분이 낫다고 한다. 배송받았을 때 받았던 유의사항. 지금 보니 다 적혀져있었네 OTL 그래도 변명을 해보자면 위에 자갈이 촘촘히 깔려있어서 배송후 이틀 지났는데도 흙이 약간 촉촉하길래 위에 자갈이 있으니 이 정도면 살짝 마른거 아닌..