中国电信北京研究院柯欣:数据不会说谎

原标题:中国电信北京研究院柯欣:数据不会说谎

2016年4月29-30日,第八届中国旅游科学年会在北京唐拉雅秀酒店隆重举行。本次年会以“大数据、旅游研究和旅游智库建设”为主题。中国电信北京研究院柯欣博士发表圆桌论坛主题演讲《数据不会说谎——旅游大数据浅析》,以下为文字实录:

作为一个数据工作者,我在工作中经常遇到这样的质疑和挑战,其实数据会不会说谎这个问题是来自于数据分析和经验判断的不一致而产生的。拿运营商来说,通过我们的数据会发现很多有意思的点。比如投诉多的用户反而不容易离网,流量使用少的用户更愿意升级自己的手机终端,使用不足的用户反而愿意花钱买更多的套餐流量,这些情况不断出现不用咱们李局长说,包括我都怀疑我的分析师不是出错了,数据是不是在说谎。

我们运营商的套餐都是包月制,一个用户流量使用不足也是按月说的,但是如果把月使用流量细化成天使用流量,再把它的走势画出来就可以深刻洞察出用户的行为特征和心理特征。月初放开使,到了月中月末,这个月再这么使下去流量该超了,要省着点用,于是流量增长变得很慢,我们管这种用户定义叫做需求抑制性,还有一种用户正好反过来,在月初的时候使的是小心翼翼谨谨慎慎,每天流量增长很慢,但是到了月中月末还有这么多流量没用,不能浪费,我们把它定义成憎恨损失性。无论需求抑制性还是憎恨损失性,这些用户不会突破套餐上限,但是并不代表没有能力去突破他的套餐上限,不代表他没有这样的流量需求,只不过用户对于资费非常敏感,对于资费敏感的用户而言,一旦出现性价比更高的套餐资费的时候,通过合理的引导,往往愿意花更多的钱追求更高的性价比,造成为什么我使不完还要多花钱再去买的现象。通过这个例子可以看到,数据不会说谎,只是需要细化挖掘。

今天是旅游论坛,我们看一个旅游的例子,拿海南来说,一直以来大家有一个概念在海南的东北游客非常多,甚至在网上有这种讨论,海南是不是变成了东北的第四省,三亚市不是成了黑龙江省三亚市,这都体现出这种引向深入人心。从数据来看又是另一种情况,今年春节在海南的所有外省游客人数做了一个分析,确实不是这个样子。人数最多的省是广东不是东三省,这是其一。其二人数最多的前十个省中只有黑龙江是东三省,其它的辽宁、吉林都没有进入到这个名单中,黑龙江也只有7.7%,跟广东比只有广东的60%左右,从数据来看很难验证东北第四省的概念。难道我们的数据出了问题?其实数据是不会出问题的,只是我们没有找到合适的口径。在刚才的统计中我们一直用的是人数这个概念,一个人去海南待了一天走了计为1,一个人去海南待了10天、20天走了还计为1,但是这个人在海南待的天数是不一样的,显然这样的统计不是对等的统计,我们不应该再用人数去统计这样的情况,而改为人天,我在海南停留10天就计10,停留了1天就计1。黑龙江省超过广东变成了第一,其次在排名前十的十个省中,东三省全部进入。换句话说在春节期间在海南大街上碰到一个外地游客每四个人当中有一个就是东北人,所以你会觉得东北第四省果然名不虚传。

既然提到海南再举一个例子,170万和210万,都是海南今年春节过夜游客的数据,海南官方统计数据172万,210万是运营商提供的数据,春节期间这几天漫游到海南三家运营商加起来超过230万,90%以上都起码在海南呆了两天以上,在海南过夜的游客保守估计210万,远远超过官方的172万,而且还没有加上海南本地的过夜游客。在传统的用户统计中,一般有几种模式,一种在机场码头车站来统计入境入岛的到达数。根据大数据的分析,今年春节在海南的外省游客40%都在春节前已经到达海南岛,如果还有传统手段在春节开始数机场码头,这40%的游客是找不着的。还有一个趋势,现在很多游客都是家庭游、亲子游,这种游客去旅行的时候未必选择酒店,因为酒店只能让你睡觉,不能做饭不能洗衣服,这些游客选择公寓或者租房子甚至都有可能。对于外省游客在海南住宿地点的热度分布图,结合地图位置的PUI信息得到统计结果,住宿地点方圆五公里以内没有酒店,这样的住宿占整个住宿的比例是8.1%,如果说把这个范围缩小一点变成3公里上达到12.6%,如果放到1.5公里范围内的酒店,这样的比例高达20.5%。这么多的游客在传统的酒店跟宾馆统计中也不会出现,这是不同的统计手段造成数据上不同的差异。

今天论坛的主题大数据视角下的旅游经济,从这些例子中可以看到,通过合理的手段合理的数据来源可以为我们传统的旅游统计进行优化和提升。

谈到大数据,中国电信还是很有优势,我们有海量的数据规模,手机用户两亿,宽带1.5亿,固话1.3亿,IPTV四千万,更难得的是可以实现数据的跨屏,大家在外面用手机PAD回家看电视电脑都覆盖了,在外面有网的时候用WIFI,没有网的时候用3G、4G,我们可以提供数据的跨屏完整用户画像。我们有上千结点的计算能力,上千节点的处理能力。作为网络运营商,刚才讲到数据的客观性,作为第三方可以提供行业以外更为中立客观的评价。不仅如此,我们运营商在做大数据旅游还有一个号码实现数据的关联,团购票要发验证码到手机上,去酒店入住也要填手机号码,去值机也要填手机号码,通过这些号码我们可以将原来各个数据孤岛关联起来,形成真正的旅游大数据。从游客到用户要关联,把游客各个地方的数据关联起来记录下来,正是运营商数据非常大的优势。

旅游大数据情况下我们运营商和旅游有天然结合的点,中国电信和中国旅游研究院成立了共同的合作实验室,总而言之,旅游大数据还是很有价值,数据真的很大,我们可以去看一看。

谢谢!返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
免费获取
今日搜狐热点
今日推荐