ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • zillow prize
    부동산 2017. 10. 1. 13:52
    728x90
    반응형



    zillow는 미국 부동산 정보 회사인데 

    현재  kaggle에서 내년까지 부동산 가격 예측 콘테스트를 열고 있다. 


    원래 시간이 되려면 참가해볼까 했는데

    창업 프로그램 여기저기 지원하다보니  

    벌써 10월 ㅠㅠ 


    어제 데이터나 다운받아볼까 그러고 홈페이지 들어가보니 

    현재 참가팀만 3448팀 ㅋㅋㅋㅋㅋㅋㅋ



    올해 first round에서 (~10월 12일)

    상위 100팀을 선발하여 내년 second round에서 그 팀들끼리 경쟁을 하게 되는데 


     

    우승 상금이 커서 그런지 (최종우승이 무려 10억!)

    미국에서 기계 학습을 하는 팀들은 다 참가하고 있는듯 

    ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ



    직접 참가하지는 않아도 

    zillow 가 부동산 예측에서 사용하는 기본 속성들과 

    예측 알고리즘 평가 방법을 확인할 수 있다. 



    zillow prize  바로가기 




    아래는 zillow의 부동산 가격 예측(zestimate)의 기본 설명이다.


    “Zestimates” are estimated home values based on 7.5 million statistical and machine learning models that analyze hundreds of data points on each property. And, by continually improving the median margin of error (from 14% at the onset to 5% today), Zillow has since become established as one of the largest, most trusted marketplaces for real estate information in the U.S. and a leading example of impactful machine learning.



    기본 거래 내역 데이터와 예측을 할 수 있는 테스트 데이터를 제공하는데 

    특이한게 집 가격을 그대로 예측을 하는것이 아니라 

    아래의 logerror (zestimate와 saleprice의 차이값)을 예측하라고 한다 


    음 -_-? 




    이것에 대해서는 질문이 많이 들어왔는지 

    FAQ 첫번째 질문에 대답이 있다. 



    Q: Why are we predicting the Zestimate residual error instead of sale prices in the first round?


    When you have an existing model that you think is pretty good (like the Zestimate) but not perfect, modeling errors can be a very powerful way to find areas to improve your existing model. Models that are able to reliably predict error for out of sample sales have identified additional signal in the source data that is not currently exploited. Additionally, you still gain valuable experience with our housing data and grapple with the problem of home valuation which will be beneficial for your work in the second round. So, these residual error models are beneficial for your submissions in both rounds and also will help “boost” the current Zestimate directly when we analyze the winning solutions after the sales observation period ends in late December 2017.



    질로우 예측 모델에 대한 이해도를 높일 수 있다고 하지만
    뭐랄까 엄밀히 말하면 집 값을 예측하는 콘테스트라고 생각하고 참여하려고 했는데 
    1차는 zillow 예측 모델 성능 예측하는 게 과제이니 좀 이상하긴 하다 ㅎㅎㅎ


    지금은 좀 많이 늦은 것 같긴 한데 
    관심있는 사람은 아래 주요 일정을 참고해서 참여하면 될 것 같다 ㅇㅇ








    주요 일정



    728x90
    반응형
Designed by Tistory.