都有AI了,数据分析该干什么?这是最好的回答!
AI能秒算GMV,却算不出“为什么”?当“就数论数”的SQL Boy沦为工具人,数据分析师的生存底线究竟在哪里?本文通过一个预测案例,拆解从“被动取数”到“主动破局”的进阶路径,揭示AI时代真正的护城河:不是拼手速写代码,而是拼对业务逻辑的深度洞察。

还有同学在焦虑:AI时代的数据分析师该怎么生存?今天陈老师用一个简单例子,系统跟大家讲解下,话不多说,上案例!问题场景
先看看一个简单的例子如下,看图回答问题:6月GMV是多少???

有多少同学是脱口而出:400!
恭喜你,如果直接把数据扔给AI,它们也是这么说的。
也就是说,如果你只会就数论数,那真的可以被AI取代了

问题是:如果你把过往三年数据拖出来,很可能如下图。
此时你恍然大悟,说:“数据长这样,咋不早说呀!”你也没主动问呀。
人,是有主动性的,主动提问才是人的价值。
另外,难道看到这张图,就是预测的全部了吗?
1)为什么6月、11月会高涨?
2)是自然原因,还是618/双十一活动?
3)如果是自然原因,是什么业务逻辑?
4)如果是活动原因,那么当时投入力度多大?
不是都不知道?是不是都要补充?这些都是主动思考的一部分

想做好预测,就不能只对着数据本身就数论数,而是得找到数据背后的原因。
比如上图中6月,11月大涨,可能有几个原因:
- 行业因素:行业本身就是夏季、冬季前有一波高峰(比如旅游相关机票、酒店、住宿,赶在寒暑假前大量预定)
- 促销因素:618,双11是主战场,要拼命做大GMV
- 产品因素:这个行业每年6,11月上新品
- 其他因素……
在做预测之前,我们要先了解业务,掌握影响因素。根据影响因素的可辨识程度,大致可分成三类,我们一类一类来看:

第一类:宏观事件型
宏观事件往往备受关注,但是你也没本事预测下个月国际大事,国内政策。所以,利用数据,总结常规季节性、业务发展周期性、突发事件的可能影响范围,做好事件记录(如下图),才是可以提前准备的。

有了上述经验积累后,才可以建立事件薄,每周/每月定期检查:
1)本周/本月有哪些事件预计会发生
2)本周/本月到了什么季节
3)本周/本月是XX业务发展的成熟期/衰退期
这样才好做出相对准确的评估。你要建知识库,训练模型,要写提示词。这些输入都是要提前准备好的,不然AI也只能像个傻子一样念个“预计400”
第二类:投入产出型
投入产出型事件,往往是:大家都知道有影响,但具体影响多少不清楚。这时能体现一定的数据价值。
计算投入产出的常用方式有三种(如下图)

这里最重要的,当然也是数据记录。因为业务做的活动描述,都是非常感性的,充满了你看不懂的说法, 你得敏锐的从报告里剔除无关术语,找到和投入产出有关的部分(如下图)

在这个过程里,你甚至可以发现:业务部门干事情不见得是为了效益最大化,很有可能有政治任务——
比如:
- 老板要大力转型新零售,所以非得强迫客人微信下单
- 我们的KPI是抓老用户,所以效果不好也得强行做
- 部门费用不够了,但活动还得做,所以券全部面额减半
这时候,如果在第一阶段建立过事件薄,就通过历史数据,提前发现问题:
- 微信下单就是垃圾,影响销售
- 老用户响应率就2%,咋做都是死
- 面额减半,响应率不是减半而是减3/4
AI不能替代你和业务开会,不能替代你主动提醒业务埋点缺失,方案有漏洞。上边这些提醒都是你体现价值的地方。你才是能为业务解决问题的人。
那AI干啥呢?当然是帮你搓代码啦!以前搓个预测代码要好久,现在两句话搞完……哪怕不用国外的产品,你就下载个TRAE国内版,都能体验“口述机器学习建模”的爽快感

第三类:内部结构型
当你充分做好1、2步,已经有下边丰富数据(如下图):

即使是这样,还是很难区分:到底影响因素是个案还是趋势。。比如我们总是说:经济下行,消费降级,需求不足,可真具体到某一月某一日的数据上,你真把特定活动抽出来看,差异不见得太大。
有时候自以为观察到一个变化,可持续看几天,丫又消失了……短期内,永远是宏观事件&投入产出型影响占主导。所以想要观察到一个内部结构变迁的影响,需要长时间观察(如下图)

大家会看到:AI取代表哥表姐,SQL boy,查数姑,工具人,是不可抵挡的。
在数据领域,AI搬砖的效率比人高。但是,做数据的同学,不是最讨厌自己成为工具人吗!提升数据思维,站在“解决业务问题”而不是“这个SQL怎么搓”角度思考,打造专业级的知识库+行业理解,才是我们在这个时代生存法则。AI,他就是个帮我们搓代码的工具。
本文由人人都是产品经理作者【接地气的陈老师】,微信公众号:【接地气的陈老师】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
- 目前还没评论,等你发挥!

起点课堂会员权益




