프로그래밍
-
sklearn TF-IDF vectorizer 사용 예시프로그래밍/자연어처리 2017. 2. 8. 15:36
Sklearn TfidfVectorizer 클래스 사용법 TF-IDF vectorizer 는 문서를 tf-idf의 feature matrix로 변환하는 클래스입니다. 문서에 CountVectorizer를 사용하고 TfidfTransformer를 사용한 것과 똑같은 결과를 가집니다. ,where is the total number of documents, and is the number of documents that contain term . The resulting tf-idf vectors are then normalized by the Euclidean norm:. 여기서 feature는 문장의 토큰 단위로 아래 TfidfVectorizer함수의 analyzer, tokenizer, token_pa..
-
mysql 테이블 구조 및 내용 복사하기 (insert into select 구문)프로그래밍/DB 2017. 1. 13. 09:44
테이블 구조 복사하여 새로운 테이블 생성하기 CREATE TABLE new_table LIKE old_table; 기존 테이블에 있는 모든 칼럼 복사해서 새로운 테이블에 입력하기 INSERT INTO new_table SELECT * FROM old_table; 기존 테이블에서 복사할 칼럼들을 일부 선택하여 새로운 테이블에 입력하기: column 이름은 동일할 필요가 없음. 순서가 중요. INSERT INTO new_table (column_name(s)) SELECT column_name(s) FROM old_table1; 예시 ) suppliers 테이블에서 suppliername과 country 칼럼들을 custumers 테이블에 custumerName과 country 칼럼으로 입력한다 INSERT..
-
mysql query 실행 결과를 파일로 저장하기프로그래밍/DB 2017. 1. 5. 20:17
select 문 등의 mysql query를 실행한 후에 파일로 저장하는 법은 생각보다 간단하다. 예를 들어 필드1, 필드2를 선택해서 파일로 저장하려고 하면 아래와 같이 query 문 뒤에 into outfile을 사용하면 된다. SELECT `필드1`, `필드2` FROM `테이블이름`INTO OUTFILE '/tmp/result.txt' 이렇게 저장한 파일은 기본적으로 필드가 탭으로 분리되어 있다. 파일 저장할 때 옵션은 아래와 같이 설정한다. SELECT `필드1`, `필드2` FROM `테이블이름`INTO OUTFILE '/tmp/result.txt'FIELDS TERMINATED BY ','ENCLOSED BY '"'LINES TERMINATED BY '\n' 필드 구분자는 fields ter..