链家网彭永东:16万亿的房地产市场对数据的需求很大
钛媒体注:“大数据的挖掘,在房地产行业还有无限空间”,在2016 钛媒体 T-EDGE 年度盛典上,链家网 CEO 彭永东如是说。
在他看来,现在房产行业2500分之一的转化率,正说明了这个行业的数字化水平做的不够。他认为一个超过16万亿的大市场,对于数据挖掘来说有非常大的空间。在现场的演讲中,他对于现今房产中,大数据的应用和未来做了一番剖析。
房地产行业的四大特征
- 在中国,线上有买卖房产需求的人约有3600万人,这个领域的用户非常的稀薄;
- 买房是一种冲动消费,用户有着独特的需求,但同时这是一个很难表达需求的领域;
- 买房持续的时间长,能够达到21周的时间,而过程中有高频的信息获取需求;
- 行业的转化率极低,2500线上活跃用户转化成线下的成交率是万分之四。
彭永东认为,大数据离这个行业还有一定的距离。但是作为一个16万亿的市场,大数据这样低速的行业应用普及,便存在着非常多的机会。
链家网则有着自己的一套数据构成:
- 房的数据
链家大概使用300个字段来形容每一套房产,更丰富的描述则成了一个挑战。在中国,很多概念的定义都很模糊,比如商圈就没有什么明确的边界。彭永东表示,对于房源数据的采集,本身没有太高的门槛,关键是要长期把事情做下去。
- 人的数据
用户在链家网的APP上有三个高频率行为:刷新、check房子信息与查看竞争房源。链家尝试通过107个维度,对用户的行为进行描述,并建立模型。 比如0到100的区间内给用户打分,综合评估60分以上的用户,转化几率能高出4倍;评估房产的价格,在房子销售之前,便大概有一个正负5%的偏差房价区间。
- 流程的数据
从线上服务到线下看房,链家把流程做了很多的切分,通过用户点评的模式,产生更多丰富的信息。 彭永东现在的房屋交易流程,有很多需要优化的地方。比如很多客户不能在购房的同时确定下来房贷,而通过数据分析用户的信用值,对贷款进行审批的预测,则多少降低了风险。(本文首发钛媒体)
以下是彭永东在2016钛媒体 T-EDGE 年度盛典上的演讲实录:
全中国每年在线有买房卖房需求的人,加一块大约是3600万。这个量其实是非常低的,很多行业都能达到这个量值,而像是快销品则多以亿为单位来衡量。这个领域的用户群体非常的稀薄。
同时,买房是一个冲动消费,它跟很多需求完全不同。如果我打车,在滴滴上输入我的起点和终点,我的需求就表达完成了。但如果是想买房的话,很多人根本就不知道自己要买什么房。甚至面对搜索框,需要输入一些特征的时候,很多人都很难表达出自己到底要买哪里、多少钱、什么样的居室,链家则是用400个字段来描述一个房源。总之,这是一个很难表达需求的领域。
再者,买房的过程时间非常长,跨度非常大。刚才谈到,3600万人的用户其实是蛮稀薄的。但是在买房的过程中,信息的获取其实是高频的。在我们的APP上,一个潜在买房的用户每天打开APP的次数是5次左右,而这个过程前后将延续近21周的时间,时间非常长。
第四个特征,是这个行业的转化率极低。很多行业的转化率都是百分之几,我们这个行业转化率是万分之几:2500个UV或者线上的活跃用户转化成线下的成交率是万分之四。
所以大数据,可能离这个行业还有点距离。因为在这个行业,数据的应用现在可能才到第一个阶段。有更多的数据进入进来,才能真正地影响这个行业的形态。2500分之一也好,用户更容易表达自己的需求也好,大数据的应用还有很长的路要走。
但是,数据或者说互联网对房产行业的帮助是可以期待的,因为中国的第二大行业就是房产。第一大行业造就了像淘宝、京东这样的公司,整个行业规模在20万亿。那么房产就是全中国第二大行业,2016年的交易额已经超过了16万亿。
大数据在这个行业应用的速率,相对来说是慢的。正是这样的现状。留给了大数据非常多的机会。
链家房产的数据,基本分为三部分:房的数据,人的数据和流程的数据。
第一个是房的数据。链家现在进入到了25个城市,涵盖一亿套房子,而针对每个房子大概有300个字段来描述。从某种意义上来说,这就是三百亿个数据字段。如何把一套房子描述出来,如何把三百亿个字段填满,或是填的更加的丰富,这可能是我们遇到的一个挑战。链接现在在搜集数据,已经完成了将近7千万套房源的数据。只有通过这些数据,用户才能得到更好的体验。
我们可以完善很多房源的数据,比如小区的别名,房子在几栋几号楼,有没有飘窗,厨房多大,这些字段都是静态的数据。
第二个是人的数据。房子是静止的,但是人的行为是不断变化的。我们让业主可以在APP上管理自己的卖房过程,而这中间的行为非常有意思。在我们的APP上,业主的卖房行为有非常典型的特征。比如很多业主,每天在APP就做三件事:
第一件事是点击刷新,这样他的房子可以排更靠前;第二件事是他会去check一下,看一下自己的房子的排名情况;第三件事是查看竞争房源,看那些和他卖同类别的房子,大概是什么样的情况。这个过程中会产生很多的行为数据,包括了卖房的过程中用户在关注什么,而这里面有很多的内容可以供用户去消费。
对于买家的行为,也是一样的情况。像现在买房的人,在整个买方的过程中平均会有26次看房的过程。这会产生很多的行为数据,比如看了哪些房源,看相同房源用户的特征是什么,倾向于什么样的房型……全北京700多万套房子,一共有10万个户型,这些户型里面和用户需求最匹配的是什么,这些都是人的数据。
第三个是流程数据。链家把流程做很多的切分,从用户的线上服务开始,到呼出电话也好、和经纪人线下看房也好,我们会让买家和卖家在APP上产生更多的交互,而买家在看完房以后,也可以对经纪人进行点评。每天大概有1.8万的用户点评,评价产生的经纪人带看的行为数据,业主自己在线上公开的数据,这些就让流程数据变得更加的丰富。
关于房源的事情,可以谈的有很多。比如商圈这个概念,北京多少个真正的商圈呢?其实是没有定义的,中国的房产领域基础设施极度的不发达。像是望京商圈到底有什么边界,望京商圈里面还有哪些商圈,定义是很模糊的。还有什么叫一室一厅,什么叫单间,中国都没有明确的定义。说到房屋、楼盘以及商圈的很多的数据,链家在8年以前就开始建立采集数据的团队。其实房屋的数据本身,门槛并不是特别高,但问题是你能否长期一件事情干8年,这个才是一个核心的优势。因为没有房屋的数据,就很难与用户产生交互。到今天为止我们已经搜集到全国7千万套房源的数据,包括小区、楼栋、户型都可以讨论。
对于人的数据,我们会通过107个维度来对用户的行为进行描述,之后可以便可以做很多建模分析的事情。比如链家最近在做的项目,是把线上用户买房的这些行为,做了一个打分系统:从0分到一百分进行赋值,分析哪些用户看房的概率更高。以60分为标准,把用户划分成两个对照组,一个是60分以上,一个是60分以下,60分以上用户群体在往线下转化的几率会高出4倍,更有可能性去看房。这些数据本身是来源于用户的行为,但同时也包含了很多经纪人的数据,这也便能分析出什么样的经纪人更适合卖豪宅,什么样的适合卖平层,什么样的经纪人和什么样的用户更适合对接。
现在每天会产生约30G的数据,链家的整个数据库里面有2千万用户。为了提高转化率,链家最近也在做一个事:评估每个房子的价格。即在房子还没卖之前,通过建模、通过业主与房主的信息、通过买家的行为数据,来估测这个房子大概能卖多少钱。国际上的惯例是正负5%的偏差,比如一百万的成交价格,评估到95万和105万都认为是正负5%的偏差。在北京、深圳和南京三个试点城市,我们估价准确度大概在75%,在四套销售的房子中有三套估价都在正负5%的范围内。
对于房屋交易的整个过程,存在很多流程优化的空间。比如买房的时候,在签合同的那一刹那,客户不一定就能确定能从银行中把房款贷下来。但是我们可以通过数据的分析往前回推,从买家或卖家的行为特征,预估一个用户的信用值或者是购房款可能存在的风险,这样便可以提前确定银行能不能审批下来贷款。这种贷款预审批,就是要在用户进入到银行之前,预先评估贷款的可能性,依靠的都是一些流程的数据。
当然这个行业的流程其实特别复杂。对于流程过程中产生的大数据进行分析,提升2500分之一的转化率,这是我跟很多人分析一件事情。现在的2500分之一的转化率,某种意义上也说明这个行业的数字化水平做的不够。如果这个行业的数据的运用水平,能够有一个提升的话,整个用户的体验会变得更好,这个转化率也会有更大的提高,在房产这个领域也将有更多可能的机会。一个超过16万亿的大市场,对于数据挖掘来说有非常大的空间。
通过行为数据建立更多的模型、更多的预估,来让连接变得更加有智慧。对于链家网来说,我们在不断建立的规则,希望未来中国的房产交易的标准,是由我们提出来的;希望通过用户的动态数据,重新定义行业的很多流程和标准;同时也推动我们的品质和效率的提升,我想这个机会是非常非常大的。