프로그래밍/자연어처리

자연어처리 오픈소스 프로젝트 시작하기

kugancity 2017. 3. 10. 20:37
반응형






자연어처리 관련 오픈 소스 프로젝트 시작했습니다!

프로젝트 주제는 일반인도 쉽게 사용하는 자연어 처리를 이용한 기계학습 입니다. 


 문서 기반의 classification 관련 작업들을 간단하게 할 수 있도록 

document embedding + machine learning을 옵션으로 지정할 수 있게 하려고 

일단은 생각 중입니다. 






프로젝트 사이트: https://github.com/roboreport/doc2vec-api



깃허브 설명

https://guides.github.com/activities/hello-world/

 - https://nolboo.kim/blog/2013/10/06/github-for-beginner/

 - https://git-scm.com/book/ko/v2/Git의-기초-수정하고-저장소에-저장하기



자주 쓰는 github 명령어 정리





git config --global user.name roboreport

git config --global user.email ****@****.com


git add README.md


git commit -m "update README.md"

[master 4c07bfe] update README.md

 1 file changed, 2 insertions(+), 2 deletions(-)


git status

On branch master

Your branch is ahead of 'origin/master' by 1 commit.

  (use "git push" to publish your local commits)

nothing to commit, working directory clean


git push

Username for 'https://github.com': roboreport

Password for 'https://roboreport@github.com':

Counting objects: 7, done.

Delta compression using up to 12 threads.

Compressing objects: 100% (2/2), done.

Writing objects: 100% (3/3), 287 bytes | 0 bytes/s, done.

Total 3 (delta 1), reused 0 (delta 0)

remote: Resolving deltas: 100% (1/1), completed with 1 local objects.

To https://github.com/roboreport/doc2vec-api.git

   5ef4664..4c07bfe  master -> master







...


실수로 대용량 파일을 올렸을 때 사용하는 명령어  



git filter-branch -f --index-filter "git rm -rf --cached --ignore-unmatch data/wiki_pos_tokenizer_with_taginfo.txt" -- --all

Rewrite a9ad7fd6594dcc80c6d043da6540bf51e86a5818 (2/3)rm 'data/wiki_pos_tokenizer_with_taginfo.txt'

Rewrite 11141d1646b1b285eb024cd9239246f601445aa2 (3/3)

Ref 'refs/heads/master' was rewritten


참고: http://stackoverflow.com/questions/21168846/cant-remove-file-from-git-commit

728x90
반응형