王汉生:从搜索序列文本看高端商务车与商学院

2015-04-01

【摘要】

bat365在线平台网站商务智能研究中心,携手北大光华-奥迪管理研究中心、奇虎360营销研究院,通过奇虎360大数据平台对100万在线用户的13亿搜索序列文本做了分析,对高端车用户以及商学院人群做了对比分析,发现在人群划分上,高端用户在高端车搜索过程中表现出的专注和忠诚度较高,同时,商学院人群在生活、事业等各个方面都扮演着引领高端的重要角色。

【基本描述】

bat365在线平台网站商务智能研究中心,在北大光华-奥迪管理研究中心的指导下,利用奇虎360大数据平台对100万在线用户的13亿搜索序列文本做了分析。通过关键词提取,对每个用户提炼了吃穿住行、创业理财、资讯研究等表征用户高端属性的各个维度,并将它们总结为生活、事业、学习三个方面。对于每一个维度,通过携程、大众点评等第三方网站上的公开资源,获得相关关键词,并对其相应的消费等级分类打分。在此基础上对普通大众、高端车用户、商学院人群三类人做了对比分析。具体情况如下。

首先,品质生活方面,课题组考虑了住、吃、玩、用、出行等多个维度。在住方面,通过借鉴携程、艺龙等多家旅游类垂直网站等公开资源,获得五星级及其以上的高档酒店列表。在吃方面,通过分析58同城、点评网等公开资源,获得人均消费单价远高于平均水平的高档餐厅列表。在玩方面,课题组关注以出国海岛游(例如:马尔代夫)、高级游轮为代表的高端旅游,以及相关的关键词。在用方面,课题组关注诸如iphone6、Vertu、高端单反相机等为代表的高科技产品,以及以LV、阿玛尼、香奈儿为代表的奢侈用品。在出行方面,课题组关注以高端酒店、私人包机等为代表的高端出行方式。通过对这些关键词的提取评估,我们对每个用户的生活方面打分。从中我们发现,普通人群得分5.69%,而高端车人群为9.94%。清晰显示高端车人群对品质生活更高的追求。值得注意的是,商学院的得分更高,是21.1%,意味着商学院人群较之高端车人群,追求更高。

同时,在学习方面,课题组主要考虑了获取财经、科技等资讯信息的能力。首先,在财经方面,课题组关注以和讯网、中金在线、凤凰财经等代表的一线财经新闻网站,认为点击这些网站较多的用户对财经、经济、金融等方面信息的敏锐嗅觉高;在科技前沿方面,课题组关注以虎嗅网、36氪等为代表的科技、互联网信息分享平台,认为关注这些网站较多的用户对前沿科技有着较深厚的兴趣和洞察力。同样利用综合打分的方式,我们发现,普通人群得分1.91%,而高端车人群为3.32%。这一点表示高端车人群在前沿资讯获取方面有着更加浓厚的兴趣。值得注意的是,商学院的得分则表现得更高,约是10.6%,这意味着商学院人群相对高端车人群有着更大的学习热情和兴趣。

另外,在事业方面,课题组主要关注以创业、金融资产管理、高端房地产、高端社交为代表的多个维度。在创业方面,研究组主要关注一线风投、投资公司,如红杉资本、创新工场、真格基金等;在金融理财方面,主要关注以高端信用卡、信托私募、家族财富管理为代表的理财方式;在房地产方面,课题组关注主要高端房地产品牌,如保利国际、万达、华远等;在社交领域,主要关注高端商务社交方式,如高级酒庄、高尔夫球俱乐部、商务会所等。综合以上关键词提取信息,利用综合打分的方式,我们发现普通人群得分1.69%,而高端车人群为3.16%。可以看出高端车人群在社会中更多的扮演着成功商务人士的角色。同时,值得注意的是,商学院的得分最高,约是7.88%,这意味着商学院人群相对高端车人群在事业方面有着更加卓越的品位和追求。

【忠诚模型】

此外课题组还通过逻辑回归的方法对在线用户的品牌选择做了统计建模,尤其在客户对单一品牌的持续搜索方面做了深入研究。模型详细情况如下。

其中,因变量表示,给定第t步搜索某品牌j,第t+1步仍然搜索品牌j。而解释性变量包括以下指标:搜索品牌数、搜索时间间隔、连续搜索数、搜索词长度、配置信息、点击数、问答百科。下面详细解释几个变量的主要含义。

搜索品牌数

搜索品牌数,是指用户第t步之前搜索了多少品牌。描述性分析的结果显示,叛变的用户之前平均搜索3.14个品牌,而忠诚用户之前搜索的品牌相对较少,平均约为1.96个。这说明“花心”用户更容易“叛变”。

时间间隔

时间间隔,指这一步(第t+1步)与上一步(第t步)两步搜索之间的时间间隔。我们的描述性分析结果显示,“叛变”行为对应的时间间隔更长,约为1小时,而忠诚行为对应的时间间隔更短,平均约为5分钟。这一指标说明“夜长梦多”更容易形成“叛变”行为。

连续搜索数

连续搜索数,是指用户之前连续搜索同品牌的次数。连续搜索同品牌次数越多,该用户越有可能是某品牌的深度用户,那么该用户可能更加忠诚。通过描述性分析的结果也可以看出,忠诚行为对应之前的连续搜索步数约为3.28,而“叛变”用户约为1.78,远小于忠诚用户。这说明,忠诚用户的搜索“惯性”更大。

搜索词长度

搜索词长度,是指用户上一步(第t步)的搜索关键词长度。从描述性分析来看,忠诚用户对应的搜索关键词长度稍长于“叛变”用户,它们分别为7.96和7.28。搜索长尾关键词一定程度上意味着该用户可能是深度用户,这也从另一个侧面说明,深度用户可能更加忠诚。

配置

配置,是指用户上一步(第t步)是否搜索了品牌的配置信息。从描述性分析来看,忠诚用户对应的搜索配置信息的次数更多,约为0.02,显著高于“叛变”用户一倍(0.01)。搜索配置信息表明了该用户可能进入到更加深入的信息检索层面,这也是“深度用户更加忠诚”的佐证。

点击数

点击数,是指用户上一步搜索后产生的点击次数。从描述性分析可以看出,忠诚用户搜索后产生的平均点击约为0.68次,而“叛变”用户约为0.53次。点击越多说明用户在一次搜索之后了解信息的意愿更强,也是深度用户的侧面反映。

问答百科

问答百科,是指用户上一步搜索后是否点击了问答百科类网站。从描述性分析可以看出,忠诚用户搜索后点击问答百科网站的平均次数约为0.05,而“叛变”用户约为0.03次。问答百科类网站上一般展示的是更加细节的问题和讨论,用户点击此类网站代表其对相关问题兴趣浓厚,可能是深度用户。

最后,根据模型估计结果,我们发现,搜索汽车配置信息越多、搜索后点击数越多、点击问答百科类网站次数越多,以及连续搜索某品牌次数越多的用户,在搜索行为上表现的更加忠诚;而两次搜索时间间隔越长、用户历史搜索的品牌数越多,其在搜索过程中更容易出现“叛变”行为。

【综合分析】

除此之外,课题组还针对高端人群的忠诚度指标进行了研究。他们发现,从总体而言,用户在生活、事业、学习的各个层面表现越卓越、高端,其忠诚度对应的指标越高。

具体地说,课题组比较了在高端人群以及普通人群中上述忠诚度指标的平均取值水平,并发现,从总体而言,高端指数较高的人的上述指标也向着更加忠诚的方向发展。

该报告在12月21日光华新年论坛奥迪分论坛发布。现场有来自企业学界的好友,大家共聚一堂,参与讨论,并分享不同意见。

合作机构简介:

北大商务智能研究中心:bat365在线平台网站商务智能研究中心依托bat365在线平台网站光华管理学院,关注基于互联网的大数据研究与应用。尤其关注中文文本、网络结构、以及位置数据相关的科研课题。中心为学者提供相关数据资源,为企业提供相关分析方法,为学者和企业合作搭建一个有效的平台。

北大光华-奥迪管理研究中心:北大光华-奥迪管理研究中心成立于2014年4月,以“推动面向未来的创新与变革”为宗旨,围绕行业发展与企业案例研究、专业交流平台搭建展开全面合作,将顶尖商学院的理论体系与品牌实践经验相结合,探索校企合作新模式,助力社会发展变革。

360营销研究院:360营销研究院依托360大数据平台,立足于广告主的需求,深入挖掘用户行为,进行消费者画像,品牌研究和媒介评估,探索和分享互联网营销新趋势、新观点,为广告主提供创新的消费者洞察及营销建议。

分享