数据分析入门:初识数据埋点(一)

产品老司机手把手教写文档,10天线上课程,零基础掌握产品经理必备7大文档撰写法。了解一下>

Hi,各位看官老爷大家好,今天跟大家分享的主题是“初始数据埋点”,本文主要面向的对象是0-1岁刚入门或者即将入门的看官老爷们,本汪把自己实际工作中数据相关的经验写出来分享给大家,一起交流学习。

在流量红利基本消失殆尽的大背景之下,流量逐步呈现愈发明显的马太效应,智勇双全的前辈们遂提出了精细化产品探索之道,等各种方法论,通过数据分析团结一切可以团结的力量,利用可以利用的一切工具通过数据驱动产品迭代,通过数据驱动产品优化从而在激烈的同行竞争中杀出一条血路来,谋生存,求发展;最终通过数据始终在战略上比竞品(同行竞争对手)快一步,在战略上藐视敌人,在战术上重视敌人,让对手摸不着套路。

我们出一个新功能,如果竞品立即跟进就会陷入被牵着鼻子走的尴尬境地,慢一拍,即使是大团队有钱有人模仿的再快,跟上了迭代速度,如果没有看透竞品迭代的本质原因,数据逻辑,则很可能输掉整场游戏,从而让对手无法模仿,跟不上、看不懂—(surprise O(∩_∩)O~老司机的会心一笑)

基于以上背景首先培养的就是以数据思维驱动产品迭代,精细化产品探索,及时发现产品问题,持续优化,提升用户体验让用户用的爽、满足用户的深层次情感需求,来达到“大吉大利,今晚吃鸡”的目的。

文章背景

通过随机抽样调查,发现关于数据产品经理、数据分析、产品设计等关键词的单篇文章多如牛毛,不乏干货、或者大佬写的24K干货文章。但像每一篇文章只写一个点,每个点连成线写成一个系列,甚至组成一个面,让看官老爷能系统性的了解某一条线的系列文章却少之又少,看官老爷很难系统性的提升对某一个知识分支的认知,或者只能凭文章中提及的一些线索自己去探索,归纳(葛优瘫..生无可恋的看官老爷可能会说:我能怎么办,我也很无奈呀),就像:

  1. 我听了好多大道理,但是依然过不好这一生。
  2. 我看了好多恋爱秘籍,搭讪攻略,但是却依然找不到女盆友,比如本汪(双狗特效加持:单身狗+产品狗)buling buling…的效果是一样一样的。

基于知识点分散,系统性归纳整理低效的场景,面向0-1岁或者即将入坑数据产品的看官老爷,解决数据产品入门的问题,带来帮助看官老爷整体理解数据产品基础,系统性入门的价值。

文章更新规划

计划将实际工作中最高频的与数据相关的一些工作经验以及技巧与大家做一个交流沟通,初步计划整体分6-8篇文章、每篇1-2周的频率由外到里,由浅入深,并伴随实际工作中案例系统性的分享。根据看官老爷的反应调整后面要写的内容,以及更新文章的速度。

以上都是废话,分割线以下是重点。

———————————————我是可爱的分割线—————————————-

埋点概述

数据埋点是数据产品经理、数据运营以及数据分析师,基于业务需求(例如:CPC点击付费广告中统计每一个广告位的点击次数),产品需求(例如:推荐系统中推荐商品的曝光次数以及点击的人数)对用户行为的每一个事件对应的位置进行开发埋点,并通过SDK上报埋点的数据结果,记录数据汇总后进行分析,推动产品优化或指导运营。

埋点分析,是网站分析的一种常用的数据采集方法。数据埋点分为初级、中级、高级三种方式。数据埋点主流部署的方式有:

  • 私有化部署(即部署在自己公司的服务器上,如果期望提高数据安全性,或者定制化的埋点方案较多,则适合私有部署,并开发一套针对自己公司定制化的数据后台查询系统保证数据的安全性和精确性,缺点是成本较高)。
  • 接入第三方服务,比如国内的某盟和国外的GA(Google Analytics)统计,在以后的文章中会单独介绍,此处不再展开。(优点是成本较低,部分基础服务免费,缺点是:数据会存在不安全的风险,另外一个就是只能进行通用的简单分析,无法定制化埋点方案)

此处只展开初级:在产品、服务转化关键点植入统计代码,据其独立ID确保数据采集不重复(如收藏按钮点击率);

主要的埋点事件分类:

点击事件:

点击事件,用户点击按钮即算点击事件,不管点击后有无结果;如下图红框标注所示,点击一次记一次。

曝光事件:

成功打开一次页面记一次,刷新页面一次记一次,加载下一页新页,加载一次记一次。home键切换到后台再进入页面,曝光事件不记;如下图页面所示,打开一次记一次。

页面停留时间事件:

表示一个用户在X页面的停留时长记为停留时长。例如:小明9:00访问了X网站首页,此时分析工具则开始为小明这个访问者记录1个Session(会话)。接着9:01小明又浏览了另外一个页面列表页,然后离开了网站(离开网站可以是通过关闭浏览器,或在地址栏键入一个不同的网址,或是点击了你网站上链接到其他网站的链接……)为了简单,我们把这个过程当做一个Session。

则最终小明在首页的页面停留时间:

(Time on Page,简称Tp)Tp(首页) = 9:01 – 9:00 = 1 分钟

如下图所示:

When?什么时间做?

产品经理的需求来源众多,可能来自一线市场人员,可能来自身旁油腻的领导。可能来自用户反馈的一条吐槽…无论需求来自哪里,首先要搞清楚的就是这个需求涉及的问题:

  • 在什么样的场景下?
  • 面向哪些目标用户?
  • 解决了哪些问题?
  • 带来了什么价值?

梳理清楚问题后,拆分问题:

  • 哪些是主要问题?
  • 哪些是次要问题?
  • 重不重要?
  • 紧不紧急?

将每个问题拆解后下一步就是带着PRD文档找亲爱的数据分析师童鞋与产品经理汪一起沟通,解决以下问题:

  • 每个问题应该怎么量化?
  • 量化指标是什么?
  • 怎么通过数据定义每个问题以及整个需求的成功与否?
  • 有哪些辅助指标?

定义好数据指标后,此时则需要数据产品或者数据分析师定义埋点。

同时为帮助各位看官老爷理解,可参考以下流程图:

How?怎么定义埋点?

无规则不成方圆,良好的定义规范可以帮助埋点相关人员更好的维护,以及理解,极高的提升工作效率,降低推倒重来的风险,基于此分享一份埋点的定义规范帮助各位看官老爷以后维护自己产品的埋点。

使用此规范后,本汪一人就可以维护一个APP版本(包含点击事件、曝光事件、停留事件)累计1500多个埋点,井然有序,完全不会乱。

(怀念那些加班维护埋点跑数的日日夜夜,让我与看门大叔成了挚友,结下了深厚的友谊。咳咳,此处应该有掌声…)

埋点分类概述:

  • 首先从事件属性这个维度上分为三份Excel(点击事件表、曝光事件表、停留事件表)
  • 其次每一个事件表中新建三份子表(Sheet),以点击事件表为例拆分为:首页事件集合、列表页事件集合、详情页事件集合
  • 每当APP发布新版本时,从上一个版本的埋点中做一份Copy,新版本中新增了哪些埋点,删除了哪些埋点?都用不同的颜色,或者时间标记进行标注说明。

真实环境中分类更为复杂,仅以上面例子说明分类思路,各位看官老爷可以根据业务需求做针对自己产品更合适的分类。

字段明细:

功能字段:

用于说明当前埋点是在哪个页面的哪个功能。例如:收藏功能,对应功能字段名:自定义为我的收藏

中文名字段:

用于描述X功能模块内X位置,例如起名叫:收藏功能-文章收藏

事件类型字段:

用于说明当前埋点是点击事件还是曝光事件还是其他

事件ID字段:

如果是自己公司开发的数据查询系统,则每一个埋点都对应一个事件ID,上线后用于拿着事件ID去后台取数使用。事件ID的命名规范:事件英文简写_哪一端的产品_产品名称简写_页面名称_模块名称_功能名称。

例如:点击事件_APP端_二手车_个人中心_收藏_文章收藏 对应事件ID==  click_app_2sc_ Personal Center_ Collection_ Article Collection

如果是用的第三方统计工具:例如某盟,同理定义好事件ID,上线后去X盟后台,输入事件ID查询相应的数据。

Key字段与value字段:

当一个埋点对应不同类型的多种位置的埋点时,则需要命名当前埋点的key参数与value参数,一个key可以对应1个value或者多个value,但一个value不能对应多个key.只能对应唯一的一个key  例如:二手车信息网站有2个关键按钮,一个是砍价按钮,一个是拨打电话按钮,但是在多个频道中每个频道都有多个砍价按钮多个拨打电话按钮,在这样的场景下就可以设计2个KEY值:

  1. key01=source用于标记当用户点击了一次按钮后是在哪个频道的页面点击的这个按钮X value01=X1,value2=X2用于标记不同位置同属性的按钮。
  2. Key02=type用于标记用户是点的砍价还是点的拨打电话按钮,例如:01value用于标记砍价按钮,02value对应的拨打电话按钮。

记录规则字段:

定义什么情况下触发埋点,例如:在列表页点击一次记录一次

备注:

用于描述当前埋点什么时间新增?什么时间修改过?原因?什么时间被删除?谁删除的?等信息记录,此处好多看官可能以为写不写无所谓,但是为了信息的完整性和可追溯性最好每一次变动都要备注。(认真脸)

结语:

本篇主要介绍了工作中埋点相关的基础,以及阐述了埋点在产品流程中应在什么时间实现,怎么实现,定义埋点时对应规则规范等细节内容,以期帮助各位看官老爷理解以及实践。

下篇预告:

如果各位看官老爷已经对埋点有了初步的了解,则下一篇文章会基于以上内容更深入一步,具体是实际案例分析还是涉及埋点方案的设计相关,或者各位看官老爷留言问题对应的解决方案,或者其他,敬请期待~

牺牲了给开发爸爸捏肩捶背的时间加一个周末,赶出了这一篇,如有错误之处还请批评指正。

不说了,先来两个葛优瘫,好累ヽ( ̄▽ ̄)و

最后一句:以上我说的都是错的,只有适合你的才是正确的!

再加一句:各位看官老爷,如果您觉的本文对您有帮助,记得给个赞哦,(*  ̄3)谢谢啦。

 

本文由 @Aaron 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自 Unsplash ,基于 CC0 协议

给作者打赏,鼓励TA抓紧创作!
13人打赏
评论
欢迎留言讨论~!
  1. 内容很翔实,是很好的入门文章。

    回复
  2. 你好能留各微信交流下嘛

    回复
  3. 有点复杂,我们用的易观方舟Argo可视化埋点,刚开始摸索。不过你这个埋点思路还是不错的

    回复
  4. 哈喽,有个问题想听听你的想法,为什么要按页面去埋点呢?
    我理解,科学的埋点规范应该是按照应用的功能结构去埋点,再以一个字段(如source)区分不同的页面来源,神策的建议是一个应用是不超过20个埋点。按您的埋点建议,一个产品1000+个埋点,很难维护的样子

    回复
    1. 一个应用不超过20个埋点不太可能吧,比如表单有5个必须输入的文本框,每个文本框都按照光标离开触发上报数据事件。算上点击注册成功加上报名,就7个点了。页面的按钮点击事件,一堆堆的

      回复
    2. +1

      回复
    3. Event不等于埋点,神策建议是不超过20个Event,一个Event包含很多不同的数据类型(Who、When、where、what、how)。

      回复
  5. 有个疑问:假如我打开一个网页,什么都没干,直接最小化窗口,是不是也算入浏览时间了?或者网页没关,打开了另一个网页的时候呢?这个并不是跳转。而是不同平台新页面哦~例如,我打开人人都是产品经理首页,然后去百度搜索去了。

    回复
    1. Session跟Cookie有关吧,不杀就一直在,

      回复
  6. 请问一下,移动端产品也可以做停留时长埋点吗?比如 用户进入页面A -> 从A跳转新页面 -> 一段时间后返回A,在用户从A跳转新页面的这段时间是否统计为A的停留时长?

    回复
    1. session是一直没有变得,然后在这个session时间段内,计算停留在a页面的总时长,即可

      回复
    2. 我是指源生代码写的app页面,不是嵌入网页哦

      回复
    3. 之前我们ios做埋点,根据入口和出口来统计,统计一个页面有哪些入口和出口,然后规定,从入口进,开始计时,即使离开了页面,只要没有从指定的出口出,那么就会一直计算时间;如果从指定的几个出口出了,那就结束计时

      回复
    4. 这样啊,了解了!谢谢

      回复
  7. 素质三连

    回复
  8. 大神,关注您很久了,可以加大神微信吗?

    回复
  9. 我想知道1500个数据埋点是不是要做至少1500个接口来进行数据采集与获取

    回复
    1. 不一定,我之前看过公司的埋点数据文档,有一个埋点对应了多个接口。

      回复
    2. 接口用一个事件接口和用户接口就可以了吧。

      回复
  10. 可以加微信吗?

    回复
  11. 曝光和浏览量不是一个指标吧,比如列表页,如果按照列表页浏览量来计算,有可能列表页分页了,我要统计具体的这个列表页面某一个产品独自的曝光次数,如果按浏览量来算,那岂不是所有的产品都是一个数据?

    回复
    1. 页面浏览量是页面的曝光次数,单个产品的浏览量可以统计这个商品的曝光次数

      回复
  12. 可以介绍一下关于数据分析学习的书吗 或者您对于数据分析的一些大纲总结 非常感谢 求回复求回复 很急

    回复
    1. 精益数据分析

      回复
  13. 还有个问题:,一个按钮点击它会进入到新的页面,是不是在做数据埋点的时候就没有必要在对这个按钮做点击事件的埋点,只需要统计对应页面的曝光时间就行了?

    回复
    1. 首先,曝光时间是一种时长记录,你上文应该是想问“只需要统计对应页面的曝光次数就行了?”吧?
      我个人理解是,如果新页面只有一个来源入口,那么新页面的曝光次数=按钮的点击次数;但如果新页面有多个来源入口,那么两者不相等(因为曝光还可能是从其他渠道引发的,不一定是点击该按钮带来的),还是要对按钮做点击埋点,这种是偏向于渠道分析了。

      回复
    2. 再请教一下:比如记录登录成功/操作成功这种状态的事件应该归为什么事件?

      回复
  14. 由衷的像up主表达感谢,能看出是用心写的,很不容易,真的很感谢,希望能一直高产。有一点疑问就是,之前在这个网站上看了篇写埋点文档的文章(http://www.woshipm.com/data-analysis/861908.html),上面的文档excel字段格式,好像和up主的不太一样,但是内容又能大致对上(人家有五个字段:event、triggered、parameters、values、version),event应该是对应up主的“事件ID”,triggered对应“事件类型”,parameters对应“key”,values对应“value”,version应该对应“备注”,不知道对不对,如果up主能看到的话,还请解答一下,感激不尽。(为啥没有打赏功能,忍不住想打赏up主)

    回复
  15. 埋点 统计停留时长 用户点击后,用户跳出APP,过一段时间再次进入APP,相当于彩瓷登录,这个问题怎么解决 :mrgreen:

    回复
    1. 看session会话有没有结束,如果有,则还继续统计时长,如果没有,则重新计时;你想想在用苹果手机,切换应用时,有时候是可以直接继续当前操作,有时候是重新加载app,这就是session是否结束的判断标志。这个跟手机有关,有的手机就会杀死后台进程,那么这个连接肯定就断掉续不上了

      回复