-
기계학습 추천 알고리즘 참고 리스트프로그래밍/기계학습 2020. 5. 14. 16:33728x90반응형
https://arxiv.org/pdf/1703.04247v1.pdf
https://m.blog.naver.com/PostView.nhn?blogId=urbanbaseinc&logNo=221564766809&proxyReferer=https:%2F%2Fwww.google.com%2F
https://orill.tistory.com/entry/%EB%85%BC%EB%AC%B8-%EB%A6%AC%EB%B7%B0-DeepFM-A-Factorization-Machine-based-Neural-Network-for-CTR-Prediction
1) Criteo Dataset : 4,500만 명의 유저 클릭 기록을 포함하고 있다. 13개의 continuous feature와 26개의 categorial feature가 있다. 실험에서는 무작위로 90%는 train set으로 나머지 10%는 테스트용으로 나눈다.
2) Company* Dataset(저자가 속해 있는 Huawei 데이터를 말하는 것 같습니다) : 실제 산업에서의 CTR 예측 성능을 평가하기 위해 회사 데이터에서 실험을 해보았다. 회사의 App store에서 연속된 7일의 유저 클릭 기록을 training용으로 사용했고 다음 하루치를 test용으로 사용했다. 전체 데이터는 10억 개가량의 기록이 있다. 이 dataset에서는 app에 관련된 feature(e.g. identification, category and etc)와 user와 관련된 feature(e.g. 유저가 다운로드한 앱 등), context feature(e.g. operation time 등)이 있다.
출처: https://orill.tistory.com/entry/논문-리뷰-DeepFM-A-Factorization-Machine-based-Neural-Network-for-CTR-Prediction [이제 며칠 후엔]
출처: https://orill.tistory.com/entry/논문-리뷰-DeepFM-A-Factorization-Machine-based-Neural-Network-for-CTR-Prediction [이제 며칠 후엔]
728x90반응형'프로그래밍 > 기계학습' 카테고리의 다른 글
chatgpt prompt 사용법 (0) 2023.03.14 RuntimeError: CUDA error: no kernel image is available for execution on the device (0) 2022.09.11 MLP에서 적절한 hidden unit 개수 산정하기 (0) 2021.01.25 pandas : TypeError: Only valid with DatetimeIndex, TimedeltaIndex or PeriodIndex, but got an instance of 'Index' (0) 2020.10.14 ml tool 사용기 (0) 2019.10.06