对于大数据,王汉生教授认为,数据产业实践的核心任务是让数据产生价值。更确切地说,是在真实的产业环境中,让数据产生可被产品化的商业价值。
王汉生教授的新著《数据思维:从数据分析到商业价值》,探讨的正是利用数据思维结合具体的业务场景,将数据转化为成为可感知的商业价值。全书围绕三大方面的内容进行阐述。第一,讲数据和价值。第二,谈回归分析,这是统计学在数学技术上的手段,是“术”的层面;更高层面是“道”的层面,把业务问题定义为数据可分析问题,这是特别重要的方法论。最后,通过大量案例来分析“数据模型是如何产品化的”。
什么是数据?王汉生教授给出的定义是,凡是可以电子化记录的其实都是数据。比如:几千年前记录的图像、声音等都可以算数据,因为这是被记录下来的。但如果从数据产业的角度来看就不算数据,因为在那个时代无法谈自动化、产生商业价值,服务某些场景等。从这个角度看,王汉生教授对数据理解具有强烈的时代观。
什么是价值?他认为,不是深度学习、人工智能,而是业务最核心的诉求,在业务场景中每天很细微的工作中可见的诉求。
价值怎么体现?第一是收入:例如:为什么一些医药的民营企业和教育行业对百度特别依赖,因为它带来很好的流量,直接产生销售额,这是看到数据分析带来的收入增加。第二是支出:包括人力、物力、时间、空间等各类支出,对数据的增进了解才会改进支出的行为,比如电视机背后的插口,有了物联网技术后根本无需那么多。第三是风险:现在到处讲金融征信,都是在各种业务场景中试图通过数据分析抹平你的风险。
任何数据产品,如果可以帮助客户,在这三个方面中的任何一个方面实现可量化的改进,那么这个数据的商业价值就比较明朗。数据分析的价值除了体现在这三个要素上,还需要一个重要的因素:可量化的参照系。比如说推荐系统做到90%的转化率,行业会说很高,但如果没有参照系呢?其实预测不准是常态,在不能百分百准确预测的过程中怎么样让人感受到价值是一个核心问题。
如何把数据转化为价值?回归分析是最基本的方法。回归思想其实是人们可以把一个业务问题定义成一个数据可分析问题。但一个问题是不是数据可分析问题,需要回答两点:第一,Y是什么;第二,X是什么。
所谓Y,就是实际业务的核心诉求,或者是科学研究的关键问题。比如,我们的合作伙伴说,他想理解什么样的客户价值高,这是他的业务诉求。这其实也要求合作伙伴不停地梳理业务诉求把“Y”提出来,然后才能继续分析。
X,是用来解释Y 的相关变量,可以是一个,也可以是很多个。X也是我们特别宝贵的业务知识,可能来自刷卡交易、简历、APP、社交网络等等。你的业务知识扩张将让你对价值理解更深入。
简言之,所谓“回归分析”,从“道”的层面而言,就是一种把业务问题定义成为一个数据可分析问题的重要思想。而从“术”的层面,要完成三个重要使命:哪些X变量是同Y真的相关;他们之间的相关关系是正的还是负的;不同变量的相对重要性。
事实上,前述所提及的内容,被王汉生教授称之为“朴素的数据价值观”。此外,本书还有一部分重要内容即“数据模型如何产品化”,通过各行各业的案例进行详解,行业分布包括互联网金融、车联网、学校、企业、电影、电商等多个行业。
“光华思想力”是北大光华的思想平台,旨在用国际通行的研究工具和方法做具有国际水准的立足中国、辐射世界的中国学问,提供政策建议和咨询意见,服务经济社会发展,用扎根中国经济社会的政策研究和前沿商业实践研究反哺商学教育。