bat365在线平台网站光华管理学院商务统计与经济计量系王汉生教授于2015年12月19日在第十七届北大光华新年论坛“大数据驱动力”奥迪分论坛上发布研究报告,与大家分析了对“车联网数据与商业价值”的研究成果。
报告摘要
随着互联网的发展和完善,数以千万级的海量数据正不断兴起,车联网数据便是其中之一。车载设备提供的车联网大数据为分析用户驾驶行为提供了数据基础,该设备记录了用户驾驶过程中的车辆硬件数据、地理信息数据以及司机行为数据。车辆网大数据的出现带来了新的商机,基于驾驶人行为的保险(UBI)便是其中之一。本报告将通过车联网数据,探究影响车辆出险的重要因素,并据此构建相应的指标体系,对车辆未来出险情况进行预测,从而为车险公司提供合理的评判用户出险率的依据。
UBI商业模式探索
随着道路交通行业的持续发展,我国民用汽车保有量呈现逐年快速增长的趋势。2014年底,我国汽车保有量达到15447万辆(图1),比2013年增长了12.4%。由此导致的交通事故也更为频繁。交通事故发生的主要原因有:汽车硬件发生故障、外界环境急剧变化、司机的不良驾驶行为。据统计,超过70%的道路交通事故是由司机的不良驾驶行为引起的(资料来源:2014年国民经济和社会发展统计公报)。
图1我国汽车(私人汽车)年保有量
由于交通事故频发,汽车保险产品具有广阔的市场。在我国,主要车险产品是由中国人保,太平洋保险和中国平安三家保险公司所提供。目前市场上的车险产品比较单一,保费的制定主要依据前一年的出险情况(图2)。然而,随着车联网大数据的出现,基于司机驾驶行为的分析带来了新的车险费率厘定模型,即驾驶人行为保险(Usage Based Insurance, UBI)。UBI的理论基础是驾驶习惯良好的司机应该获得保费优惠,保费取决于实际驾驶时间、驾驶里程和驾驶习惯等指标的综合考量。更具体地,驾驶习惯可以包括:习惯在白天或者夜间出行;经常在山路或是城市驾车等。UBI的推广不仅可以为保险公司带来利润,还可以产生良好的个人和社会效应,引导司机形成良好的驾驶习惯,优化道路的安全管理方式等。
图2传统保费制定依据:是否出险
车联网数据也称车载数据,该类数据的采集是通过车载的可以接受信号的“盒子”,将用户的驾驶行为以二进制格式记录下来,之后以秒为单位,通过无线信号打包上传到云端服务器进行存储。目前,有一种使用范围十分广泛的车载系统——车载自诊断系统,简称为OBD。OBD连接汽车内部的一个接口,通过这个接口,OBD可以返回多个汽车驾驶记录的参数值,如车辆硬件参数:发动机转速、行驶里程数、车门开关状况、行李箱开关状况等;地理参数:当前经纬度等;司机行为参数:行驶速度、加速度、方向盘转角等。通过分析车载数据,可以实现:(1)帮助司机了解其驾驶习惯和预警不良驾驶行为;(2)帮助车厂及时了解车辆问题,提供安全服务;(3)帮助保险公司了解司机出险的可能性,为其制定保费提供更有力的依据。
图3车联网系统示意图
前面提到,车联网数据的采集,主要依赖一个可以接收信号的“盒子”,即数据采集设备(图4)。车联网数据采集设备的安装,主要分为前装市场和后装市场。前装即在汽车出厂前已将数据采集设备作为车辆的一部分安装在车上;而后装的含义是,车上有终端接口,将数据采集设备作为移动终端,在使用车辆过程中自行安装。前装市场的进入门槛相对较高,设备作为车辆的一部分,安装后难以取下;而后装市场门槛相对较低,但存在说服成本较大,不同品牌终端竞争激烈,用户在安装后可能放弃使用或更换品牌,导致数据收集难以持续进行的问题。对于厂商而言,前装市场使得厂商配套生产相对容易,且可保证数据的完整性;对于用户而言,前装市场可以节省用户自己寻找配套终端设备的时间成本。
图4车联网“盒子”示例
UBI在国外已经有了相对成熟的探索,在国内,这部分市场也具有极大的潜力和发展空间。基于车联网大数据,我们的目标是探索能否通过分析用户的驾驶行为对其在未来的出险情况进行有效预测和划分。主要的任务是通过统计分析,寻找影响出险的重要因素,区分“好孩子”和“坏孩子”。
图5区分“好孩子”(未出险)和“坏孩子”(出险)
出险因素统计分析
基于车联网大数据,本报告对于司机驾驶行为进行统计分析,重点讨论了急刹车、急加速和驾驶平稳性这三个影响出险的指标的构造体系。这三个指标的构造,依赖于对车辆的瞬时速度和加速度的准确测量。下面首先明确这两个指标的测量方法。
瞬时速度的测量,有两种常用的方法,一是通过距离的变化进行计算,二是通过测量车轮的转速计算速度(图6左)。本报告使用的数据,瞬时速度读取的是仪表盘上的时速,也就是通过测量车轮的转速得到的。加速度的测量,也有两种常用的方法,一是通过加速度的公式直接计算速度的变化,二是读取车上的陀螺仪设备测量到的加速度。本报告使用的加速度指标,是通过陀螺仪测量得到的加速度。在清楚了这两个关键变量的测量方法之后,讨论急刹车、急加速和驾驶平稳性这三个指标的构造过程。
图6(左)瞬时速度的测量;(右)瞬时加速度的测量
1、 急刹车
图7(左)是某段路程的速度时间序列图和加速度时间序列图。从中可以明显看出,这段路程出现了若干急刹车,对应的加速度取值非常小。而图7(右)是速度的变化和加速度的散点图,左下角的点体现的就是急刹车现象。由于速度和加速度是分别通过不同的仪器测量得到的,因此考虑将“速度的变化”和“加速度”综合成一个指标(可以通过主成分分析实现)判断急刹车。
图7急刹车的构造体系
2、 急加速
既然速度的变化和加速度能够综合反映急刹车的现象,同样也能够体现急加速。通过对车联网大数据的深入挖掘,我们发现,另外一个指标:发动机转速(图8),同样也能够很好的反映急加速的现象。当司机瞬间猛踩油门,产生一个极大的加速度,发动机转速也会瞬间增加。因此,对“速度的变化”,“加速度”以及“发动机转速”做主成分分析,构造综合指标,判断急加速现象的发生。
图8发动机转速
3、驾驶平稳性
图9是两段不同的路程,从图上能够容易的判断,路程1是相对平稳的。如何严格定义“平稳性”是一个巨大的挑战。为了解决这一问题,我们探索性的绘制了每段路程的前后时速关系图(图10)。可以发现,上一秒的瞬时速度,和当前的瞬时速度呈现很强的正向相关关系。这说明,“平稳”体现在过去一秒的瞬时行为(时速)能够高度预测当前时刻的瞬时行为(时速)。计算每段路程的前后瞬时速度的线性相关系数,作为驾驶平稳性的度量。
图9两段平稳性差异较大的路程
图10两段路程的前后时速散点图
除了以上三个指标,还可以考虑很多其他的因素,比如天气、路况、司机是否疲劳驾驶等。出险因素指标体系的不断扩充和完善,能够帮助我们更加准确的预测司机的出险行为。
图11出险因素指标体系(路况)
行业发展前景
车联网数据在推进UBI之余,在广告投放、智能交通以及车辆维修保养等多个领域也具有广阔的发展前景。
在广告投放方面,基于车联网数据在云端的整合,可以分析司机的驾驶行为和习惯,例如,司机的惯例行驶路段,频繁出行时间,是否存在疲劳驾驶等信息;在增值服务方面,能够发现司机青睐的车辆维修网店,加油站,经常出没的商圈等;基于对数据集的分析,本报告可以得到用户的驾驶情况与消费行为的用户画像,从而能够有针对性的对不同用户采取广告的精准投放,为用户提供个性化的加油站推送、维修优惠服务以及代价等业务,并通过广告投放方面的商业价值。
图12云端数据整合
在智能交通方面,当车联网得到普及并使得道路上绝大对数车辆处于车联网中时,本报告可以通过车辆位置信息以及车速等指标获取实时路况,从而形成智能调度系统。对交通管理部门而言,本报告可以通过分析预测交通状况,预警交通拥堵路段,及时协助交通管理部门发现问题并制定相应的交通分流、疏导方案;对于驾驶者而言,本报告通过对路况的分析,可以帮助驾驶者合理规划线路,规避拥堵路段,减少拥堵时间。
图13智能调动系统
在车辆维修保养方面,基于车联网设备提供的各项车辆实时指标情况,本报告可以帮助车主发现车况问题,并为车辆维修保养机构提供问题原因以及解决方案。对于车主而言,这将帮助其提早发现车辆异常情况,及时挺行车主检修,防止潜在问题引起的突发事故或是不必要的时间成本;对于维修保养机构而言,该类机构可通过数据共享及时得到车辆问题,并通过在线诊断功能和在线客服,实现动态监测车辆状况,从而可在车主报修后更快锁定车辆问题,提供解决方案。
图14自助下单服务
根据安信证券研究中心的数据,中国汽车后市场营业额从2005年的不到900亿,增长到2015年将近7000亿的规模,未来这个市场将会进一步扩大至万亿级别。如此巨大的市场既存在着大量机会,也有许多问题。比如,不成熟的大型市场中,市场秩序在初期较为混乱,可能存在信息不对称等问题;同时,由于市场处于初创阶段,市场不存在成熟的管理机制以及监管机构,可能将存在消费者甚至商家间不公平的现象等。但与此同时,这个市场可以容纳多个利益相关方相依共存,比如车厂、4S店、保险公司、加油站等,商家间的相互合作将促进信息的传递,从而使得商家更好的了解消费者,提供更优质的服务;商家间的相互竞争也将促进优质企业进一步凸显价值,形成良好的淘汰机制。而这一切的基础,就是如今的车联网数据。到底哪一方能够争取到更大的市场份额,车联网的数据将如何在不同的业务类型下、用怎样的模式创造更多的商业价值,这些都将是各个行业所关心的,同时也是本报告将继续探索的方向。
合作机构简介:
北大光华-奥迪管理研究中心:北大光华-奥迪管理研究中心成立于2014年4月。中心以“推动面向未来的创新与变革”为宗旨,依托光华管理学院雄厚的学术力量与一汽-大众奥迪丰富的品牌实践经验,致力于支持和推动中国的管理学研究。
北大商务智能研究中心:bat365在线平台网站商务智能研究中心依托bat365在线平台网站光华管理学院,关注基于互联网的大数据研究与应用。尤其关注中文文本、网络结构、以及位置数据相关的科研课题。中心为学者提供相关数据资源,为企业提供相关分析方法,为学者和企业合作搭建一个有效的平台。