线上调研数据处理的四个原则

3 评论 9813 浏览 35 收藏 5 分钟

在进行线上调研的时候,注意以下四个原则,可以帮助你少走弯路,少踩坑。

通过线上调研的方式收集的数据,因其调研方法有别于传统的面对面调研,所以在进行数据处理分析时需要额外注意一些细节。

原则一:数据完整

在线调研的数据,是通过网页或手机app收集而来,难免会存在因为浏览器插件、安全软件、不兼容等因素导致的数据丢失情况。因此在调研上线前首先要进行测试,多尝试几种浏览器进行测试,看能否正常递交数据;其次,在分析数据时,首先要进行数据完整性检查,包括是否有漏答、跳题逻辑是否正确,否则你可能会在报告写到一半时,发现数据有缺失。

原则二:数据干净

在线调研不可避免会存在乱答题的情况,如果乱答题的人太多,容易影响数据质量,所以在检查了数据完整性后,需要对数据进行清洗,可以从以下几个方面进行:

  • 答题时长,一方面可以邀请几个同事进行试填答,做好计时,另一方面可以计算平均(去掉极端值)答题时间,也可以考虑一个成年人的阅读字数来计算参考,以上述几个时间都可以作为标准来进行清洗。另外,答题时间太久了也需要清洗掉。(注意不同逻辑条件下,用户回答的问题数可能会不一样,需要考虑此方面)
  • 填空题答题质量,填空题的内容能反映出一个填答者的态度,如果很敷衍、甚至乱答的,可以进行剔除;
  • 题目或选项之间隐藏逻辑,比如:年龄25岁以上,还说自己在读高中;个人年收入大于家庭年收入;同时选择了两个明显互相矛盾的选项;
  • 选项个数,所有多选题的选项都只选1个,尤其是明显不是一个答案的选择题(比如,你知道哪些洗发水品牌);
  • 矩阵题(表格形式)都选同一个选项的;
  • 建议在问卷设计时,设置1-2个可以进行验证的地雷题,以便筛选出去那些不认真填答的人;(如:前面题目询问家中拥有的设备,如汽车、ipad。。。,后面题目询问家中是否有私家车);

原则三:数据代表性

问卷数据一般是通过抽样调查的方式获得,因此抽样方法不一样,回收回来的数据代表性意义也不一样;如果是随机抽样(受限于各种条件,一般无法做到真正意义上的随机抽样),则回收的数据可以认为具有代表性-能代表总体;若采用分层抽样(如分地区各抽取10万用户),这样的抽样获得的数据,由于事先进行了样本配比,所以其不能代表总体,在结果统计时,需要对不同地区的样本进行加权(权重可以参考不同地区用户的实际占比)处理。

原则四:数据处理过程可回溯

在进行数据检查、清洗的过程中,往往需要进行多步骤操作,难免发生在处理的过程中出错的情况,因此需要在一些关键步骤上进行数据保存,并进行备注,以防止需要回溯的情况;在编写查错程序时,也要将程序保存下来,防止出错,也方便进行反查;

在线调研数据处理时要特别注意上述原则,能让你的工作更有效率、少走弯路。(什么,你们有DP?那这篇文章你就当看看热闹!)

 

作者:李兆平

来源:http://ued.ctrip.com/?p=5614

题图来自unsplash,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 这篇文章,需要再改进,数据完整其实可以提出一些实际的案例来支撑,剩余的三个观点也都可以利用实际的案例来支撑。这样就更有价值了

    来自河南 回复
  2. 写的什么几把

    回复
    1. 哈哈哈,这个评论可还行,但是我们还是支持一下作者,毕竟他们愿意写东西出来

      来自河南 回复