$20入了沃顿商学院教授的《Decision Driven Analytics》,拿到就后悔了

从亚马逊官网的介绍来看,《Decision Driven Analytics》一书的主旨深得我心。

图片

过去四年的数据分析工作经历,让我对这一职业领域产生了深刻的反思。尽管面临的问题外表多样,但解决方案却往往单一且重复,加之组织架构的繁琐低效,导致多数努力未能显现成效。若非人工智能技术的飞跃性进展,以及我将重点转向决策制定的探索与研究,我对未来的职业路径或许会感到更加迷茫。

超越我所在组织的局限,数据分析的基本原理和思维方式,实则能助力企业乃至个人应对各类决策挑战。AI技术降低了代码工具的使用门槛,而这些工具与办公软件的融合,正逐步赋予普通用户前所未有的强大分析能力。

因此,在当前时间节点,出版一本务实地聚焦决策与分析的书籍,无疑将惠及广泛读者。

   

我在看书之前是很赞同《Decision Driven Analytics》的理念:成功的数据分析并不纯粹依赖技术堆砌或海量数据,其核心在于将决策融入分析之中,智慧与科技并重。不过,此书更像是对教学概念和思路的梳理,内容略显浅尝辄止。

例如,在讨论如何有效提问时,作者虽以客户流失为例,指出基于数据预测并采取措施的普遍做法,但仅触及“客户流失概率”这一层面,而对于“赠送礼物如何影响流失概率”这类需额外数据收集与分析的问题探讨不足。实际上,多数企业已建立起分析后复盘机制,预测绝非终点。

另一案例涉及Twitter为品牌提供的数据产品,旨在证明其平台价值。书中指出,简单比较接触品牌内容与未接触内容的消费者如同比较苹果与橘子,忽略了两者间本就存在的诸多差异,以及因果关系的复杂性。这种对于相关性与因果性的区分,也已是业务人员常识,无需赘述。

学院派的文章,如《哈佛商业评论》(HBR)和麻省理工斯隆管理评论(MIT Sloan),通常避免效仿自媒体制造焦虑的倾向,也不会空洞地宣称“未来已至”。它们擅长提供引人入胜、值得铭记的案例分析,而这恰恰是本书有所欠缺之处。事实上,我最近观看的一部关于冷战的Netflix纪录片,其中关于决策与数据利用的案例,留给了我更为深刻的印象。

该纪录片中的两个场景尤其令人难忘。第一个案例讲述了苏联为预测美国是否可能率先发动核打击,部署了大量间谍以窥探对方决策内幕。直接渗透诸如国防部或中央情报局(CIA)等核心部门风险极高,故苏联另辟蹊径,派遣间谍监视主要城市的医院,留意是否出现大规模储存血液和医疗物资的情况,以此间接推断美国的真实意图。

图片

第二个案例发生在1983年冷战紧张局势的高峰时期。苏联雷达防御军官Petrov在值勤时,雷达系统突然报警,显示美国在短时间内连续发射了五枚核导弹。按既定程序,他应立即向上级乃至国家领导层汇报。然而,这一举动极可能导致苏联启动核报复,因为在等待前线雷达确认的宝贵时间内,苏联将处于被动挨打的不利地位。

Petrov灵机一动:若美国真欲发起全面攻击,为何只发射区区五枚导弹,而非倾尽数千枚核武之力彻底摧毁苏联?片刻权衡后,他决定不报告这一警报,坚信这是系统的误报。历史证实了他的判断,苏联新建成的导弹预警系统确实存在技术故障,Petrov因此被誉为“拯救世界的人”。

显然,若要阐述如何在决策中恰当地利用数据,这两个案例提供了生动且富有启发性的叙事。这种级别的案例,是我在《Decision Driven Analytics》书中觉得尤为缺失的。

   

回到(不关生死的)商业场景下,若由我执笔决策和数据主题,我将构建“无数据/少量数据”、“适量数据”及“海量数据”三种场景的解决方案框架。

以产品销量预测为例,在缺乏历史数据的新产品发布前(如2007年首代iPhone),可能的解决方法包括(1)外部市场调查和通过消费者访谈获得目标消费者群体的倾向数据,(2)参考其他智能手机的销售初期表现做推测,(3)各种宏观指标,比如消费者的可支配收入,以及对手机的花费等做推算。

在这个场景下,AI的作用是可以帮助你理清思维,特别是销量和其他各个因素的逻辑关系。你可以让AI帮助你建立基本的算式,明确你所需要做的假设(也就是日常工作中的拍脑袋),共同推演出你最后的预估。

图片

值得一提是,在这个场景中也会有不少创新解法。我在一个视频里曾经提到了我向Kaggle CEO Goldbloom提出的这个问题,而他给到的答案也很有启发意义,那就是去做一个预售网页(类似于京东和小米所做的,让用户点击下表示要参与抢购)。这个点击参与量,和初期的成交量是有很强的映射关系。

至于预测成熟产品(如2024年的第16代iPhone)销量,则属于数据丰富的场景毫无疑问我们会先去看过去所有iphone的历史销售数据和趋势,再考虑到用户的升级周期等等,使用各种机器学习方法来对做足够精准的预测。

在这个场景中,AI能帮助你写出复杂高效的代码,你基本只需要告诉它:我有什么数据,我要解决什么问题,它就能提供详细的python代码(并且可以给你解释每一行是做什么)。你可以和它一起解决各种奇怪的报错,一起探讨如何检验模型和如何让模型更精准。

   

《Decision Driven Analytics》书中列出的一个简单的图示,倒和我这个思路比较接近:复杂的数据分析方法使用,很大程度取决于你的数据是否丰富,以及整个分析过程是否能带来你想要的结论。

图片

希望我下一本买的书,能够在这个论证过程中做地更好。

Scroll to Top