上周我从自己工作角度,写了AI面试商业数据分析师的可能。现在我们换个角度(比如站在微软的角度),我们怎样能让AI更快地胜任商业数据分析的工作。
一、提升对行业的商业理解(Bing + Azure+Teams)
(1) 行业的商业模式与竞争
结合Bing的搜索引擎能力和ChatGPT的语言能力,AI能够提供及时(ChatGPT目前对2021年后的信息知之甚少)且有深度的洞见。这些可能性包括:
-
高度自动化的舆情分析:ChatGPT可以用来对与公司的行业、竞争对手和产品有关的社交媒体和在线新闻文章进行情感分析。这将使公司了解客户对其产品和服务的感受,以及对新兴趋势和问题的洞察力。
-
行业竞争与新趋势:ChatGPT可用于分析公共数据源,如在线评论和社交媒体提及,以了解客户对公司竞争对手的看法。这将使公司能够确定他们可以区分自己的领域并获得竞争优势。
(2) 提升会议效率
理解存储于数据库或者服务器上的信息并非难事,但在企业中很多关键的决策信息是在各种正式或者非正式的会议中。这可能也是为什么微软正在将ChatGPT背后的技术整合到旗下的Teams产品中,作为其付费服务的一部分。一个重点的功能是,通过对会议的记录实现自动地总结和列出会议todo。

根据相关负责人介绍,”很快,这些个性化的会议亮点将扩展到包括发言人时间轴标记,显示谁在会议期间发言,他们何时发言,并允许你跳到那个时刻。发言者时间轴标记是按照与你工作关系最密切的人智能组织的,所以你再也不会错过你的经理在会议上分享的反馈。”
(3) 挑战企业管理者的决策误区
如果是一个AI跳出来说老板们,你们这么规划就是傻X行为,我们也许能避免更多决策失误,且不用担心任何人被扫地出门。
即便是高瞻远瞩的CxO们也无法避免很多个人和群体决策误区,而AI可以用来讲出这些让人不舒服的事实。ChatGPT可以被训练来识别常见的认知偏差,如确认偏差或光环效应,并在高管们可能基于这些偏差做出决定时发出警告。这将使高管们能够反思他们的决策过程并考虑其他观点。更重要的是,ChatGPT可以使用自然语言处理,根据会议中提出的数据生成其他观点。这将有助于高管们考虑更广泛的观点并做出更明智的决定。

二、从数据到洞见的挖掘 (PowerBI + Azure)
前文我们已经看到了Chatgpt能将SQL问题几乎完美的解答,现在它只需要能将业务人员的商业问题理解成为SQL类问题,并且能够将数据用人类可以理解的形式(比如各种图形)展示出来。可巧的是,微软旗下已经有了PoewrBI这个极佳的可视化工具用来实现这个桥接。
目前PowerBI已经有一定程度的理解自然语言能力,比如我们的同事可能会问你,哪一个月我们的产品销售最成功。为了得到答案,你可以执行一个SQL查询,根据利润列的值对月份列进行排序,这个过程如下图所示

由于我们本质上是在翻译,这背后的逻辑主要是基于将文字从一种语言翻译成另一种语言的工作。在撰写本文时,问答视觉很可能使用结构化和序列化的上下文表述(ScoRe),这是由微软研究院设计的一种语言模型。SCoRe模型旨在将自然语言翻译成SQL等编程语言,以便查询数据库。这个模型的一个重要方面是,它是经过预训练的,在不同的数据库中具有良好的通用性。
不过为了能在PowerBI中实现该功能,对数据的处理还是有一定的要求:
-
使表和列的名称更符合人类的直觉。避免使用缩略语和组合词。因此,不要用sls或salesamount,而用sales或sales amount。
-
为每一列选择正确的数据类型。检查是否选择了正确的数据类型,如日期、数字或文本。
-
为每一列选择适当的数据类别。通过选择数据类别,如城市、国家或邮政编码,为每一列添加额外的语义信息。
-
添加缺失的关系。如果你正在处理多个表,使用主键和外键定义表之间的关系。该模型将只使用现有的关系。
我们使用了微软所提供的示例数据(参见教程:从 Excel 工作簿变为 Power BI Desktop 中的出色报表 – Power BI | Microsoft Learn)
从可视化面板中,选择Q&A,得到下面这样的图

举例问盈利最高的年月

对于这个问题我们可以做更多的优化, 打开Q&A设置,可以看到我们可以做的事情的概述,以改善语言模型。

-
字段同义词。对于每个表和列的名称,你可以添加同义词或替代术语,让用户可以参考同一个字段。问答设置会给你建议添加同义词,由语言模型生成。如果你希望某个字段不被用来形成对用户问题的回答,你可以将其从问答中排除。
-
回顾问题。显示过去28天内通过可视化方式提出的所有问题。你可以看到用户提出的问题,包括用下划线表示模型是否理解,以及用户是否因为理解错误的词语而要求修复。
-
教导问答。测试可能的问题,并通过添加字段同义词和定义术语立即改善结果。
-
管理术语。在教导问答选项卡中定义术语后,你可以在管理术语选项卡中对其进行修改。
-
建议问题。添加建议的问题,当用户与你的报告互动时,他们会在搜索栏的下方看到这些问题。这将指导用户可以提出的问题,或者作为一个快速链接到常见问题。
可以预见的是在未来PowerBI和ChatGPT若能融合,可以爆发出更惊人的分析能量。ChatGPT可以用来生成自然语言叙述,描述数据集中的关键见解和趋势。这些叙述可以与可视化一起显示,提供一个更完整的数据画面,帮助用户更好地理解洞察力的背景和影响。
此外,ChatGPT可以用来根据用户的查询历史、数据来源和偏好提供个性化的建议。例如,如果用户经常查询销售数据,ChatGPT可以推荐相关的可视化或洞察力,用户可能觉得有用。最后,当数据集中的某些条件得到满足时,ChatGPT可以用来生成自然语言警报。例如,如果一个销售团队的业绩低于某个阈值,ChatGPT可以向相关的团队成员发送自然语言警报,强调这个问题并建议采取的行动。
除了用可视化方法,机器学习类的模型也将迎来新的机会。在ChatGPT中,用户已经可以非常方便的让系统进行预测模型,比如图中我提供了用户流失数据(经典的电信用户流失预测数据)

(由于目前ChatGPT的限制,只提供了几十行数据)



截图我省略了中间代码部分,但整个流程非常顺畅,让这个工具更强大的卡点只有目前测试版对输入数据的限制。可以想到的是,ChatGPT+机器学习,可以根据客户的兴趣、偏好和行为识别不同的客户群。这将使公司能够开发有针对性的营销活动和个性化的产品和服务,以满足不同客户群体的独特需求。



