用社会网络分析评估KOL投放价值

47
4 评论 2611 浏览 15 收藏 9 分钟

社会网络分析方法(SNA)是一类考虑了多个行动者间社会关系的方法论,适用于研究诸如学校、企业、组织到国家的一个整体单位。考虑到网络中存在的巨大关系网络,本文从社交和内容产品角度出发,介绍这一方法论的基本概念和实际运用。

一、社区中的关系建立

首先要明确SNA中的两个重要元素:行动者(actor)和关系。

行动者:以个体为单位,在图中用圆圈代表一个行动者。

关系:两个行动者间是否存在联系,用连线表示,区分无向和有向。

关系矩阵是一个N*N的矩阵,纵横分别表示行动者,1代表存在关系,0代表不存在关系。

在无向图中,可以以对角线为分割;有向图中,仅看下半部分必须画出完整矩阵。

以知乎用户为例:用户有权选择关注或不关注他人,粉丝相对被关注者就是一个有指向性的关系;而被关注者也有权选择是否关注这个粉丝,所以有向图中含有的信息更丰富。

以用户A-E为例:最多可以产生25个关系(第一行代表A关注了B和D,第一列代表A被B和E关注)。

在社群图中,可以看更直接清晰看到两两用户间的关系,这个五个用户构成的局部网可以看做是知乎用户网络的一个缩影。

二、KOL形成

上图中反映的指向和指出每个用户的线条数不尽相同,而衡量这一指标,有助于理解整个社区内的“权力”流向。简单理解:即一个行动者获得越多的箭头指向数,那他在这个社区中的位置和威望越高。

这里通常用中心度来量化这一指标,指代某点的密集性,这一指标被称为度中心性(Degree Centrality)。

  • 局部中心度(绝对):某点的出入度之和;
  • 局部中心度(相对):实际度数/可能产生联系的最多度数;
  • 整体中心度:某点与其他点的捷径距离(到其他点的最短途径)之和。

计算上图五个用户的中心度关系,可以发现A/B/C/D四个用户的局部中心度和整体中心度相等,E用户则处于边缘状态。

利用软件分析度数,可以更直观看到这个微型社区的权力关系。

以八个用户的相互关注关系重复上述步骤,可以看到更加直观的显示,很明显A用户在小世界中与最多的用户产生联系,是中心人物。

除了度中心度,衡量指标还有接近中心度、中间中心度(分别用来表示和KOL有关联的关键人物以及作为中间人的程度)。

三、兴趣圈拓扑图

以上图八个用户为例,ADCE用户间构成一个“循环”,其长度为4(其中间还包含ABCD这个长度也为4的环,和ABD、BCD两个长度为3的环)。

考虑到关系的有向性,ABD是一个有向环,可以遵循A-D-B完成完整闭环;而ADCE虽然用线相连,但不在一个固定方向的持续链上,只能算作是半环。

派系是环概念的延伸,n-派系中的n指的是派系成员之间联络的最长途径之长;我们最开始的例子(五个用户)给出的就是一个2-派系群体。

现在我们来定义形成一个“社圈”的标准,如果派系的三分之二的成员完全相同,则把这些派系合并为一个圈,接下去可以定义不同的标准,对这个圈进行扩大。

对应知乎,可以把最先形成的这个小圈理解为互相间有关系的又对某一问题同样感兴趣的人群,扩大后的大圈则是对某一话题有同样兴趣的人群。

四、聚类

聚类技术在互联网产品中已经被广泛运用,但放在SNA下,聚类更强调等级结构性(即根据个体的社会关系进行分层)。

以八个用户的案例为例,进行了3次聚类,其中最左边的数字指代度中心性的排名,A用户因为有最大的中心度所以排名为1。

第一层聚类结果:FGH边缘用户为一类,BD排名靠中的用户为一类。

之后继续聚类,直到所有用户归为一类停止。

圈和聚类两者之间的区别在于:派系概念依据成员相似性进行划分,形成的圈子以兴趣为交点;聚类则是按成员关系数量进行划分,是对权力等级的分类。

以知乎为例,这8名用户可能同为科技互联网话题爱好者,以3/3/2的结构分别对物联网、JAVA和人工智能感兴趣,则这三类就可以单独成为一个派系;但每个用户对用的关注和被关注关系不同,FGH用户产生的关系少,但他们可以不在同一派系中。

五、总结

感谢广大网民贡献的用户数和关系链,目前SNA分析的应用场景已经拓展到多个领域的运用,如社交产品中的社交圈分析——基于社交关系进行的商品和内容推荐、网络信息传播等,只要有人的地方,都可以用SNA来分析强弱关系、紧密度、群体分类。

就本文探讨的KOL形成和发现来说,就可以作为商业广告投放的量化参考标准之一

社交网络中,用来评估KOL的核心指标一般为KOL本身制造的内容及影响人群(后者量化到可收集的指标上,一般为粉丝数,即社群图中的单向关注关系,可以用多条有向线标注)。

KOL粉丝重合度和SNA中派系的概念重合。根据自定义标准:广告主可以计算出两个KOL粉丝的重合度,从而根据预期的触达次数选择重合程度。

根据不同体量KOL的圈层推算预期渗透率:SNA其实可以帮助广告主在前期就省下投放费用,当然投放后还要继续关注APRU、ROI等指标。

反推一下思考,也可以理解为什么现在买粉丝已经成为了行业普遍乱象之一。

因此在关注的基础上,很多社交产品也开始考虑其他互动因素作为参考指标,以排除僵尸粉的作乱。

 

作者:47,关注内容&社交产品,信奉keep exercising , keep learning , keep optimistic

本文由 @47 原创发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于CC0协议。

给作者打赏,鼓励TA抓紧创作!
更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 派系是根据边聚类,这里作者是重新定义了它的形成过程。派系和聚类的区别,作者解释的似乎不太正确。

    回复
    1. n派系是根据点的捷径距离来划分的

      回复
    2. 距离难道不就是通过边(链接)数吗?再者,因为作者在派系那一块分析,看起来很奇怪,所以才说您对派系与聚类的解释不太正确。我又看了下,您之前节点之间的网络关系,是根据关注与被关注形成,但是在分析派系的时候,又是从节点的另一个属性,即节点本身兴趣属性来划分派系。嗯,就是这里奇怪。似乎就是很表象的用了派系概念或者说没有深层次研究这个网络自身的局部特征,这样来看这个兴趣圈拓扑图,套上派系这个概念上似乎没有太大的意义。个人认为其实可以根据,被研究用户的兴趣共同性,来形成用户兴趣共现矩阵,由此形成兴趣网络,再此基础之上沿用派系的概念,来生成兴趣拓扑圈,比较合理

      回复
    3. 社交网络上的相互关注很大一部分原因就是因为兴趣哈,网络的形成本就假设基于兴趣形成的,才沿用了派系的概念衍生了兴趣拓扑圈,希望你不要产生误解和曲解我原文的意思

      回复