분류 전체보기
-
리눅스(CentOS)에 자바 설치하기프로그래밍/Etc 2014. 3. 30. 21:43
뉴스 크롤링 하기 위해 nutch을 설치한 후 실행하려는데 아래 메세지가 나왔다. Error: JAVA_HOME is not set. 자바가 안깔려있었나? 일단 환경 확인 # which java (자바위치 확인) /usr/bin/java 링크를 따라가보니 리눅스에 기본으로 깔려있는 openJDK만 있는 듯 하여 내친 김에 oracle jdk 다운로드 ㄱㄱ 일단 32비트인지 64비트인지 확인하니 64비트였다. # getconf LONG_BIT 64 http://www.oracle.com/technetwork/java/javase/downloads/java-archive-downloads-javase7-521261.html#jdk-7u45-oth-JPR 오라클 홈페이지에 가서 64비트 리눅스용 jdk를 다운..
-
체인크로니클 시작!일상 2014. 3. 22. 23:47
드디어 체인크로니클이 오픈을 했다. 예전에 프리미엄 테스트를 재밌게 해서 정식으로 오픈하길 기다렸는데 이렇게 빨리 오픈할 줄이야 +_+ 심지어 오픈당일에 테스터에게 오픈 안내 문자도 없어서 오픈한 줄도 몰랐다가 첫날 출석이벤트 놓칠 뻔했다. 다음날에서야 오픈 안내가 왔다는...그리고 테스터 보상은 27일에야 준다고...아... 금요일 저녁부터 오늘까지 쭈욱 달리고 싶었지만 문제는 극악 AP 회복 속도 -_- 8분에 1씩차고 다 차려면 무려 5시간!이나 걸린다. 초반에는 렙업이 금방되니까 랭크10까지는 달렸지만 지금은 달리고 싶어도 달릴 수가 없어 포스팅이나 작성(...) 체인크로니클은 SEGA에서 만든 모바일 게임으로 지난해 7월 오픈해서 일본에서 200만 다운로드를 달성했다고 한다. 화려한 일러스트들과..
-
robots.txt 사용하기프로그래밍/Etc 2014. 3. 15. 13:30
최근에 개인 홈페이지를 만들고 있는데 외부에 노출되기 싫어서 robots.txt 작성법을 알아보았다. robots.txt는 검색 엔진이나 웹 크롤러등의 웹 로봇이 사이트를 방문했을때 사이트의 수집 정책을 알려주기 위해 사용한다. wget에게도 사용 가능하다. 다만 정책을 알려주는 것 뿐이라 웹 로봇 작성자가 이걸 무시하고 수집해갈수도 있다. 이런 나쁜 로봇을 검출하기 위해서는 웹 로그 확인이나 트래픽 확인 등의 추가적인 작업이 필요하다. 사용법은 간단하다 웹 서버의 최상단 디렉토리에 robots.txt를 작성해서 넣어두면 된다. http://www.sample.com/robots.txt 참고로 robots.txt는 누구나 볼 수 있다는 점을 기억하자. 간단한 작성법과 사용법은 아래와 같다. 좀더 자세한 ..