분류 전체보기
-
sklearn CountVectorizer 클래스 사용법프로그래밍/자연어처리 2017. 2. 9. 13:34
Sklearn CountVectorizer 클래스 사용법 CountVectorizer 는 문서를 token count matrix로 변환하는 클래스입니다. 여기서 feature는 문장의 토큰 단위로 아래 TfidfVectorizer함수의 analyzer, tokenizer, token_pattern, stop_words 등의 분석 단계를 거쳐 나온 토큰들을 의미합니다. CountVectorizer 클래스 설명 문서 바로가기 feature extraction 설명 문서 바로가기 class sklearn.feature_extraction.text.CountVectorizer(input=u'content', encoding=u'utf-8', decode_error=u'strict', strip_accents=..
-
sklearn TF-IDF vectorizer 사용 예시프로그래밍/자연어처리 2017. 2. 8. 15:36
Sklearn TfidfVectorizer 클래스 사용법 TF-IDF vectorizer 는 문서를 tf-idf의 feature matrix로 변환하는 클래스입니다. 문서에 CountVectorizer를 사용하고 TfidfTransformer를 사용한 것과 똑같은 결과를 가집니다. ,where is the total number of documents, and is the number of documents that contain term . The resulting tf-idf vectors are then normalized by the Euclidean norm:. 여기서 feature는 문장의 토큰 단위로 아래 TfidfVectorizer함수의 analyzer, tokenizer, token_pa..
-
도깨비 엔딩 & 종방연 사진 몇 장일상/TV 2017. 1. 23. 03:34
정주행을 한지 얼마나 되었다고 벌써 엔딩이네요 ㅠㅠ본방사수 3회만에 엔딩이라니 ㅠㅠ 오랜 기다린 끝에 결국 다시 환생한 은탁이를 만난 김신의 모습으로드라마는 엔딩을 맞게됩니다. 분명이 해피엔딩인 것 같은데 그런것 치고 여운이 넘 오래 남는듯.... 은탁이의 남은 세번의 삶이 끝난 후에도 계속 불멸의 삶을 살고 있는 김신을 자꾸 생각하게 되네요. 인생의 처음이자 마지막인 도깨비 신부를 보낸후소멸의 희망도 없이 오롯히 소중한 기억들을 안고 계속 살아간다는 것은 과연 어떤 기분일까 그래도 김신이 선택의 시간에서 소멸을 선택했다면 은탁이는 아마 그 생에서 비가 오고 눈이 올때마다 이유도 모른채 오열을 하면서 지내야했겠죠. 적어도 김신을 다시 만난 후 짧은 기간이지만 그 둘은 분명히 아주 많이 행복했으니.그것으로..