关于数据埋点采集，你需要了解这些

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

赵小洛

2019-11-11

3 评论 17035 浏览 131 收藏

12 分钟

数据采集是数据分析的基础，而埋点是最主要的采集方式。那么数据埋点采集到底都包括哪些问题？本文作者从什么是埋点、埋点怎么设计、埋点的应用三个方面对这个问题进行了梳理，与大家分享。

一、数据采集以及常见数据问题

数据采集有多种方式，埋点采集是其中非常重要的一部分，不论对c端还是b端产品都是主要的采集方式。

数据采集，顾名思义采集相应的数据，是整个数据流的起点，采集的全不全，对不对，直接决定数据的广度和质量，影响后续所有的环节。在数据采集有效性，完整性不好的公司，经常会有业务发现数据发生大幅度变化。

数据的处理，通常由以下5步构成：

大体知道数据采集及其架构之后，我们看看工作中遇到的问题，有多少是跟数据采集环节有关的：

我们需要根源性解决问题：把采集当成独立的研发业务来对待，而不是产品研发中的附属品

所谓埋点，就是数据采集领域的术语。它的学名应该叫做事件追踪，对应的英文是Event Tracking 指的是针对特定用户行为或事件进行捕获，处理和发送的相关技术及其实施过程。

数据埋点是数据分析师，数据产品经理和数据运营，基于业务需求或者产品需求对用户行为的每一个事件对应位置进行开发埋点，并通过SDK上报埋点的数据结果，记录汇总数据后进行分析，推动产品优化和指导运营。

流程伴随着规范，通过定义我们看到，特定用户行为和事件是我们的采集重点，还需要处理和发送相关技术及实施过程；数据埋点是服务于产品，又来源于产品中，所以跟产品息息相关，埋点在于具体的实战过程，跟每个人对数据底层的理解程度有关。

埋点就是为了对产品进行全方位的持续追踪，通过数据分析不断指导优化产品。数据埋点的质量直接影响到数据，产品，运营等质量。

埋点的方式都有哪些呢，当前大多数公司都是客户端，服务端相结合的方式：

准确性：代码埋点>可视化埋点>全埋点

所谓的顶层设计就是想清楚怎么做埋点，用什么方式，上传机制是什么，具体怎么定义，具体怎么落地等等；我们遵循唯一性，可扩展性，一致性等的基础上，我们要设计一些通用字段及生成机制，比如：cid, idfa,idfv等。

用户识别：用户识别机制的混乱会导致两个结果：一是数据不准确，比如UV数据对不上；二是涉及到漏斗分析环节出现异常。因此应该做到：a.严格规范ID的本身识别机制；b.跨平台用户识别；
同类抽象: 同类抽象包括事件抽象和属性抽象。事件抽象即浏览事件，点击事件的聚合；属性抽象，即多数复用的场景来进行合并,增加来源区分；
采集一致：采集一致包括两点：一是跨平台页面命名一致，二是按钮命名一致；埋点的制定过程本身就是规范底层数据的过程，所以一致性是特别重要，只有这样才能真正的用起来；
渠道配置：渠道主要指的是推广渠道，落地页，网页推广页面，APP推广页面等，这个落地页的配置要有统一规范和标准。