网站是如何「看到」用户的:独立IP与cookie

产品经理就业班,12周特训,测、练、实战,22位导师全程带班,200+名企内推,保障就业!了解详情

用户在访问网站的时候,如何通过技术手段识别每一个用户?

不知道大家在访问网站的时候,会不会疑惑为什么我的所有信息都会被网站“看到”呢?比如说我上网的地理位置、点击了哪个页面、在网站停留了多长时间、花了多少钱等等。

其实我们的所有操作都会被网站“看到”,也就是被统计起来;网站统计之后的数据就是大家常常听到的 UV、PV、Session 等等之类的网络术语(之后我会展开阐述各个概念)。

但是作为一名求知欲旺盛的少年,怎么能止步于 What 层面,我们还要知道 Why and How。

网站是如何看到用户的问题,其实专业来讲,是用户识别的问题。接下来,我们一一来展开分析:

一般而言,我们会使用 MAC Address、IP、Cookie、User Agent、Mobile Number、User ID、SIM ID、Email 作为识别用户身份的手段。这些方法都有各自的优劣,比如,移动端常用 Mobile Number、SIM ID 等来识别用户,网站常用 Cookie 来识别用户。而在此,我们也关注 IP 和 Cookie,重点阐述下两者的概念和优劣。

因此,特将常用网站数据分析方面的概念整理出来,分享给大家。

IP,Internet Protocol,独立IP

IP 为计算机网络相互连接进行通信而设计的协议,是连接到网上的所有计算机网络实现相互通信的一套规则,我们每台可以上网的电脑都有一个 IP,且在全世界范围内是唯一的。因此 IP 的唯一性被用来作为网站表现的一个指标。

插播插播:在向具体说明IP和Cookie的使用之前,先向大家介绍一个实用的工具 GA,知道 GA 是什么的小伙伴儿可以直接略过这段了。

GA,即 Google  Analytics,是 Google 提供的一个统计网站、App 等互联网产品数据的数据分析工具,可以对用户的年龄、性别、地理位置,PV、UV、访问时长、访问页面、跳出率、等指标进行统计,对分析网站或是 App 有很好的帮助作用。

如果还是比较抽象的话,可以理解成国外的百度统计——当然百度统计要比 GA 开发的晚得多了。

之前做过网站站长或是App运营的人可能使用过这个工具,但由于 Google 如今退出中国,可能有很多小伙伴儿们不太清楚 GA 是什么,因此插播此段。

GA 不使用 IP 地址来识别访问者的身份,但是会追踪每个访问者的 IP 地址信息,且整个追踪过程是在 Google 服务器端完成的,不会在 GA 的返回数据中看到。

那么 GA 统计 IP 地址的意义仅是用来识别访问者的地理位置信息。这个地理位置信息会以地图的方式展现给我们,告诉我们用户活跃的大致位置。

Cookie,浏览器缓存

Cookie refers to an HTTP cookie, which is a small piece of data sent from a website and stored on the user’s computer by the user’s web browser

while the user is browsing. At the same time, it also called a web cookie, Internet cookie, browser cookie, or simply cookie.

网站为了辨别用户身份,追踪 session 等数据跟踪而预先储存在用户本地终端上的通常经过加密的数据。Cookie 是网站以一小段文本的形式存放在用户本地终端的信息,以便网站之后的读取,基本能够唯一对应到用户的访问终端,但要预先写入访问终端,同时还是在用户允许使用 Cookie 的前提下。

听起来 Cookie 也有劣势,那为什么我们要放弃使用 IP 的统计而转向使用 cookie 的方式呢?

当用户使用客户端第一次访问某个网站服务器时,比如 Baidu.com,那么 Baidu.con 的网站服务器就会预先写入一段 Cookie 到客户端上。GA 通过随机数和时间戳来生成字符串来唯一标识用户,且还会记录一些访问信息,比如访问的页面、访问的时间等,而当我们再次访问 Baidu.com 的时候,服务器会直接找到 Cookie 信息,更新一些访问信息,但是并不会更改唯一表示的用户信息。

之后也会使用 Cookie 对用户的 session、UV、PV 等数均进行统计,也就是生成了大家平日里常见的数据指标了。显而易见,Cookie 比 IP 更准确,这也就是为什么网站现在都使用 Cookie 来识别用户了。

那么问题来了,网站是如何通过 Cookie 来识别用户身份的呢?

 

作者:产品美景,公众号:产品美景,带你领略产品的美~

本文由 @产品美景 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自 Unsplash ,基于 CC0 协议

赞赏是对原创者的最大认可
5人打赏
评论
欢迎留言交流
  1. 那么移动端是根据什么呢,因为手机好像是没有IP的吧?

    回复
    1. 抱歉,回复晚了。

      移动端也是有 IP,我们手机通过电信运营商转发请求到相关域名,而我们的每一部手机在电信系统都有独一无二的互联网标识的(这个标识不是我们电信系统中的手机序列号)。在互联网系统中,用户设备与网页本质上都是通过 IP 与 IP 的互相连接而实现的。

      回复
  2. :cry: 好奇怪,不知道哪个环节疏忽了,漏了一段话,补充到评论好了。

    显而易见,Cookie 比 IP 更准确,这也就是为什么网站现在都使用 Cookie 来识别用户了。那么问题来了,网站是如何通过 Cookie 来识别用户身份的呢?

    当用户使用客户端第一次访问某个网站服务器时,比如 Baidu.com,那么 Baidu.con 的网站服务器就会预先写入一段 Cookie 到客户端上。GA 通过随机数和时间戳来生成字符串来唯一标识用户,且还会记录一些访问信息,比如访问的页面、访问的时间等,而当我们再次访问 Baidu.com 的时候,服务器会直接找到 Cookie 信息,更新一些访问信息,但是并不会更改唯一表示的用户信息。当然,Cookie 有一定的有效时期,比如 GA 等会提供自定义 Cookie 的有效期,我们可以设置为 6 天、6 小时、6 秒,那么在第 6 天/小时/秒之后的 1 秒更新 Cookie 信息,甚至可以设置为 0,也就意味着 Cookie 将变成基于会话的 Cookie,并在当前浏览器会话结束后马上过期。

    网站之所有能“看到”用户,权杖它有了 Cookie 这个利器,才能对用户的 session、UV、PV 等数均进行统计,生成了大家平日里常见的数据指标及报告。

    回复
  3. 写的挺好的学习一下,但是貌似你没有写Cookie 有效期这个问题哦。

    回复
    1. 谢谢同学,被你一提醒,我才发现不知道为什么文章少了一段,缺少的部分里稍微提了一句 Cookie 的有效期问题,已以评论的方式添加上了,很简单的一句,供参考,一起学习。

      再次,感谢肯定及建议。

      回复