Py学习  »  机器学习算法

机器学习预测房价

悦智网 • 5 年前 • 508 次点击  


2019年将是令人眼花缭乱的技术发酵的一年,我们对今年科技界即将发布的新闻做出最佳预测,并展开报道。它将涵盖24个主题,包括低成本的高效太阳能电池、一种不浪费能源的加密货币、容量更大的硬盘、利用漂浮在平流层的基站向非洲农村提供的移动电话服务等。2019年,我们将继续带来最重要的技术发展资讯,请和我们一起持续关注。

房地产巨头Zillow将提供100万美元奖励最佳估价

━━━━

1714年,英国议会通过了《经度法案》,授予任何能够提出测量海上经度实用方法的人一大笔奖金。在当今智能手机和GPS卫星的世界里,确定经度似乎是微不足道的事情,但在当时,这却是一项巨大的技术挑战。这一策略是有效的,多年来一直不断推动航海天文钟的发展,这一手持机械奇迹般地挽救了无数海员的生命。

从那以后,许多领域都在用奖金推动创新。哈佛商学院的乔希•勒纳(Josh Lerner)研究了此类奖金的有效性。他说,“奖金通常由政府提供”,但也有私营企业提供的。勒纳指出,2009年Netflix的百万美元奖金授予了一个设计出一种可击败Netflix公司Cinematch推荐系统的算法的团队,帮助重振这些奖金的名声。

尤其值得一提的是,Netflix大奖催生了现有的Zillow大奖赛,该比赛要求数据科学家设计出一种计算机化系统,击败目前Zillow称为Zestimate的房价预测方法。

位于西雅图的Zillow集团首席分析官斯坦•汉弗莱斯(Stan Humphries)说,Zestimate是Zillow在2006年成立后开发的首款产品,这对Zillow达到成为房地产市场第一信息门户的目标至关重要。

汉弗莱斯说,Zestimate早期经常偏离目标:在估算房屋售价时,算法的中值误差为14%。他和同事可将误差水平降至4%左右。但他们希望进一步改善。因此,他们决定“邀请全球数据科学界”来参加此次活动。如果你够聪明、够幸运,你就有可能赢得100万美元的Zillow奖金,奖金将于2019年初发放。汉弗莱斯说:“Netflix大奖让我看到了一线希望。”

2017年,约有4 000个小组参与了Zillow推出的第一轮房屋估价大赛。100个团队进入第二轮即最后一轮比赛,目前正在进行评判。评判标准是,参赛者的系统在2018年7月预测美国大量住宅9月和10月实际售价的准确度。

第一轮比赛的参赛者只能使用Zillow提供的输入数据,这些数据包括各类城市房地产数据库或典型房地产清单中的信息。但在第二轮比赛中,参赛者也可从其他渠道获取数据。

第一轮比赛排名第一的是Zensemble团队,团队由来自澳大利亚、以色列和美国的3位数据专家组成,他们分别是德米特罗•波普拉夫斯基(Dmytro Poplavskiy)、乔纳森•格拉德斯坦(Jonathan Gradstein)和沃斯•沃克恩斯(Russ Wolfinger)。

沃克恩斯是统计分析软件开发公司SAS(位于北卡罗来纳州凯瑞市)的科学发现和基因学主管。这并非沃克恩斯第一次参加这类比赛。实际上,他在举办各种机器学习比赛的Kaggle网站上非常活跃。沃克恩斯说:“我本人很好胜。我一直喜爱体育运动。”他指出,这类比赛明显倾向于具有计算机或数据科学背景的男性。他说:“没想到,并没有很多统计学专业的人参与。”

鉴于竞赛所需的计算能力,参赛成本是否很高?从沃克恩斯的角度看来并不尽然。他说:“Kaggle上很多人都在构建自己的机器学习平台。”他提醒,如果用这些平台进行大量数据处理,你的电费将上涨。但他也指出,两个团队之间较量的更多是脑力而非计算能力。

目前Zillow的房屋估价方案已经相当不错。参赛者是否真的会在其基础上有所改进,目前尚未可知。汉弗莱斯说:“我们有一个由人工智能专家组成的庞大团队,专门解决这一问题。”但他仍然认为,他将从竞争Zillow奖金的许多外部人士那里学到很多东西。此项奖金不仅仅是宣传做秀。他表示Zillow真心希望改进Zestimate。这就是Zillow要求100个团队在最后一轮比赛中将其软件知识产权转让给公司的原因。

诚然,如棒球名人尤吉•贝拉(Yogi Berra)所言:“不到最后一刻难见分晓。”一个或多个团队可能会大大超越今天的Zestimate,为首者将赚到百万美元大奖。沃克恩斯当然期望能获此大奖,Zillow的人工智能专家也有机会做得和他人一样好。我们拭目以待。

作者:David Schneider


IEEE Spectrum

《科技纵览》

官方微信公众平台



往期推荐

“钢铁侠”工装即将进入工厂

以太坊计划削减过高能耗

没有方向盘的无人驾驶出租车

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/31181
 
508 次点击