大数据舆情分析:全方位解读《战狼2》

零基础学产品,BAT产品总监带,2天线下集训+1年在线课程,全面掌握优秀产品经理必备技能。了解详情

作者从大数据舆情角度出发,对《战狼2》进行了全方位的解读,文章从全网舆情、微博传播、文本分析三个方面展开。

上个月,笔者去电影院看到战狼2分数这么高,9.6分,这在人人审美感官都不同,一部片子总有人喊烂电影的时代,9.6分的国产电影这是多么不容易的成绩啊;最近几天,笔者的朋友圈和微博都被《战狼2》刷了个遍,这让笔者产生了对《战狼2》进行全面大数据分析的冲动。

《战狼2》是吴京执导的动作军事电影,由吴京、弗兰克.弗兰克·格里罗、吴刚、张翰、卢靖姗、丁海峰等主演。该片于2017年7月27日在中国内地上映 。讲述了脱下军装的冷锋被卷入了一场非洲国家的叛乱,本来能够安全撤离的他无法忘记军人的职责,重回战场展开救援的故事。

最近几天《战狼2》票房纪录一遍一遍的刷新票房纪录,截止8月6日晚19:32,《战狼2》票房已经突破30亿,目前票房位居2017年电影票房首位。按照排期及市场预期,《战狼2》有望超越2016年票房第一的周星驰执导的《美人鱼》,登顶华语电影票房冠军。

笔者将从以下3个角度进行分析:

  • 全网的舆情分析:该电影在全网的传播趋势、热度、关注人群、关注人群画像,以及整体的口碑概况。
  • 微博传播分析:基于该电影在微博的某条强大影响力和传播情况的分析,了解该条微博的传播规律,互动粉丝的画像,以及水军的辨识。
  • 文本分析:通过对该电影豆瓣影评的文本数据进行分析,给主角“冷锋”画一个词云画像。

一、全网热度分析

1.1“战狼2”的全网传播走势

(1)全网传播走势

通过微指数近一个月的热词趋势,我们可以看出,战狼2的热度从7月27日,即“战狼2”的上映日开始成爆发式直线趋势飙升,自上映以来,大幅度飙升后,有小小幅度下降趋势,但由成上升趋势,并且热度值已达到342k,并且以图线趋势,还再不断上升。

(2)全网关注度来源

从PC&移动近一个月的趋势图,我们可以看出,移动端的热度是PC端热度的三倍,“战狼2”的大多数热度来源自移动端,移动端的当月均值达到了67k,最高热度值达到了271k,这说明移动端(包括自媒体和网民)对该电影的讨论和发声较多。

1.2“战狼2”的全网72h热度走势

(1)全网72h热度概况

通过微博微舆情72小时内的热度指数概况,我们可以看出通过大数据平台从新闻媒体、微博、微信、网站、论坛等互联网平台采集的数据信息通过加权计算,“战狼2”近72小时内热度均值达到了74.63(0-100,数值越大,代表网络的关注度越高),其中微博的信息声量最高,这说明,这些平台的对于“战狼2”的舆情传播影响力最大,推进了“战狼2”的票房。

(2)全网72h热度走势

通过微博微舆情72小时内的热度走势,我们可以看出每日的15:00到23:00是热词的最高走势位置,周末的最高走势位置在11:00-23:00,说明这段时间的看电影人数居多,热词的趋势随着电影排期和客户的观影人数和场次走势。

(3)72h内峰值信息聚类

从72h内的指数变化趋势来看,“战狼2”的热度在08月04日16时达到了96.8的峰值(满分100)。

主要刷屏及10w+信息主要包括(你一定在你的朋友圈看到过,哈哈哈):

  • 《看了“战狼2”才知道有中国护照才是最骄傲的事》
  • 《战狼刘镇伟&吴京导演“战狼2”大火》
  • 《“战狼2”中国护照不一定能带你去世界任何地方》

1.3全网热度来源

(1)全网热度媒体来源

以上图表可以看出,该电影在微博上的信息量占据主导地位,微博仍然是目前娱乐影视的主要营销宣传增强影响力的主要渠道,也是主创团队与粉丝进行互动的主要方式。

以上图表可以看出,除微博外,该电影的主要信息量来自论坛,其次来自网站和微信,论坛作为泛娱乐化社区关于该电影的讨论颇多,论坛是“粉丝文化”的起源地,“找组织来贴吧”,它的宣传造势能力推动了人们对该电影的关注度。

(2)全网热度地域来源

从地域分布来看,与“战狼2”相关的信息主要来源广州、江苏和北京。有点意外,前三竟然没有我大浙江,排名第一的不是帝都不是魔都,竟然是广东。然后笔者去了解了一下,广州为什么信息量在第一?

因为在8月5日的广州路演,吴京首次回应,茅台不是植入。吉普车也不是植入。吴京说:“这次无论是茅台,还是北京吉普,都不是植入的。我就是想宣扬一下我们的国货,让中国制造在世界上横行无阻。”ps:这句话必须燃!哈哈。

1.4友好度指数

(1)媒体友好度TOP10

媒体友好度TOP10,搜狐排名第一,百度贴吧第十,毕竟贴吧是网友吐槽水军泛滥发声发泄的地方。

(2)友好度指数

此数据来源微舆情,如图显示,媒体友好指数0.58,相对较为友好,网民指数没有媒体友好指数那么好,但是也是友好,综合友好注数为0.3。

1.3全网信息关键词

(1)全网信息关键词云

以上是全网关于“战狼2”的文本信息的关键词提取,总计60个,利用自然语义分析法,对战狼2的人物、事件、品牌、地域中所提及的关键词进行分词聚合,呈现出被提及次数最多的关键词,主要来源信息媒体报道、推文内容或者评论UGC等。

除了本剧的片名“战狼2”外,还有一些比较反映该电影特征的标志性关键词。

  • 评价关键词:高能、燃爆、喜剧、战争、大片
  • 内容关键词:祖国、中国人、英雄主义、中国军人、军魂
  • 创作团队关键词:吴京、张翰、刘镇伟、奶爸、拍摄、导演

(2)全网信息关联词分析

通过对“战狼2”相关信息进行分析可看出,与其核心核心词“战狼2”关联度最高的词语为“战狼”(100%)、电影(46.07%)和中国(41.28%)。另外,“护照”(18.70%)、“怒怼”(12.51%)。

不得不说,说到“战狼2”就不得不说电影最后那个彩蛋。

关注粉丝用户画像

(1)性别比例

(2)年龄分布

二、重要微博舆情传播

对单条具有影响力的微博的影响力、传播节点等进行分析。

新浪微博“3D战狼2官方微博”如下:

官微最具影响力的一条微博是:

1、传播节点分析

由以上传播节点图可以看出:吴京的老婆功不可没,转发次数和带动影响力最大,另外还有很多吴京好友的大V明星的互动转发,节点影响力扩散最为剧烈,如:戚薇、刘诗诗、赵丽颖吧等。

2、转发层级分析 

微博层级越高,代表转发的越多,覆盖的微博用户最多,该条微博在传播中形成17个转发层级,经微博反垃圾系统处理后,剩余有效转发数294624条,覆盖微博用户455,370,456人;第3层级转发者共转发95600次,占总转发数的32.45%,第3层级是该条微博传播的主要力量。

此条文博传播关键用户是谢楠,她的粉丝数6195835人,带动了此条微博363639次的转发。

引爆点:

3、转发评论趋势图

由上图可知,该微博于7月26日发布后,于7月28日00:00达到转发、转发峰值79458条、评论峰值10175条,此后微博传播速度逐渐降低。

4、意见领袖影响力排行榜

可以看出,明星和媒体的转发助阵功不可没。

5、互动粉丝画像分析

(1)地域分析

由上图可以看出转发者北京排第一,而第二名是海外,以11.10%占据第二,由此“战狼2”不但引起国内的巨大反响,最为剧烈的是海外的反响共鸣。评论者数以广州排名第一,想必跟上面讲到的吴京在广州路演的回应有很大关系。

(2)性别分析

由上图可以看出,转发者和评论者都以女性粉丝居多,大概是因为女性比较喜欢追剧看电影,然后女性追剧看电影还比较感性,深深的被“冷锋”的英雄形象吸引了,哈哈哈。

(3)兴趣标签

由上图可以看出,转发者和评论者的兴趣标签主要是名人明星,电影,旅行,美食。

(4)评论热词

由此图表可以看出,有点好笑的是,“刘诗诗”这个词竟然是提及最多的(吴京会不会笑哭),由此可以看出,刘诗诗的影响力有点大啊,另外排名第二的热词是燃爆,嗯,看了“战狼2”确实很燃爆。

(5)转发概况

转发评论表情:

表情以抠鼻最多,哈哈哈哈。

粉丝数量区间:

看出来大V小V都有转发。

三、文本分析

1、词云画像

豆瓣评分(一向比较苛刻,哈哈哈):

豆瓣影评:

笔者从豆瓣爬取了200条数据,精选了100条(样本有点少,下次多爬一点)。

给“冷锋”做了一个词云画像,如下:

总结

分析完了,《战狼2》的公众好评传播和大V微博传播力量对“战狼2”的成功起到了绝大作用,当然,公众的好评传播的根本原因还是在于《战狼2》的作品从制作上引起了群主共鸣,从剧情上以“祖国的力量”激起了民心。

那一句经典相必一定触碰了你的内心,中华人民共和国公民:当你在海外遭遇危险,不要放弃!请记住,在你身后,有一个强大的祖国!

参考资料及工具:

  1. 微指数:全网热度分析
  2. 新浪微舆情:微博事件分析、微博传播效果分析
  3. 极搜客及tagul:数据爬取与词云制作

#专栏作家#

玲子,人人都是产品经理专栏作家,微信公众号:玲子奋斗史。不卑不亢,从容优雅,面对一切,我是玲子。职业产品经理,关注互联网人工智能、商业产品,擅长需求挖掘和运营管理。我是个励志气质聪颖漂亮的女青年。

本文原创发布于人人都是产品经理。未经许可,禁止转载。

打赏也是一种认可
5人打赏
评论
有话不说憋着难受!
  1. 分析很不错,不过战狼的热度应该还有很强的营销成分。传播节点那块的数据分析的工具能分享下吗?

    回复
  2. 不错啊!从折耳猫看到来这的,只是很多分析还需要更加深入,不要只给个工具生成的图就算了哦,哈哈哈。还有爬取的数据量真的少得可怜,下次需要的话可以告诉我,我可以Share给你,嘿嘿。

    回复
  3. 买了WYQ的数据?

    回复
  4. 数据女神 赞

    回复
  5. 数据分析得不错!点赞一个。
    但是从电影角度来看,这部电影上不了8分才是正常的,不能因为票房、热度、主旋律来定义一部电影本身的质量。
    这部电影取得的成绩不能否定!
    但是要知道为什么票房火爆,得注意以下几点:
    ①国产电影保护月(7月和8月外国电影是进不来的)
    你会发现整个暑期没有什么大作出现,7月底到8月底你去电影院会发现没有什么可以选择的!
    如果在正常情况下的众多优质影片竞争的情况下,这部电影票房不会超过15亿;
    ②档期选择
    选择在了这个非常合适的日子,电影本身确实比同期电影质量要好很多,但纵观电影史(仅从中国电影来说),从电影本身来说,并非盲目崇拜者捧得那么夸张
    ③主旋律的营销
    在同期没有竞争对手的情况下,其团队肯定是抓住一切可以营销的点,最开始你会发现,最早的宣传是突出票房高(当时并没有打破多个记录),随后市场没有可选择的电影情况下,更多人被吸引,随后打破记录;然后便是接下来的主旋律营销了。

    甚至被水军营销夸张到,提出异议便是不爱国,看这部电影才是爱国的情绪….等一系列不理智的情绪。
    这样的反应,竟然没有声音站出来说话,国内很多导演、演员对此都沉默,因为真话不被接纳时,只能沉默。
    营销得这么夸张毫无任何人敢提出异议(无疑营销是非常成功的,但是爱国情怀的营销有点走钢丝了),是一件细思极恐的事情

    回复
    1. :mrgreen:

      回复
  6. 怎么将打包的数据通过文本学习提取关键词呢

    回复
  7. 小编分析得很全面很棒 但是对于广东热度最高的观点也表示不苟同 首先在所有新浪用户中,广东的占比本来就是最高的,搜索任何一部电影,或者是任何不带地域特性的关键词,也几乎都是广东最高,并不能说明和在广州路演有很大关系

    回复
  8. 会数据分析的产品经理才是好运营

    回复
  9. 玲子,妹子赞,赞赞 ;-)

    回复
  10. 分析的好全,前因后果~ 膜拜

    回复
  11. 我告诉你为什么不是北京上海第一,面积小总人口是少于广东的,如果换成广州或许就不一样了。

    回复
    1. 是这样么?对于北京上海总人数是否少于广州-》活跃用户是否少于广州-》转发评价是否少于广州,小编表示怀疑?

      回复
  12. 我做不到你这样的…佩服

    回复
  13. asa

    回复
    1. ;-)

      回复
  14. 这么多好看的数据图都是哪里的0.0

    回复
    1. :shock: :shock: :shock:

      回复
    2. 同问

      回复
  15. 其实电影最感动我的瞬间是舰长那句“开火”。
    1、电影的题材也好,以前很少看到展现中国国际影响力的题材, 其中的民族自豪感和爱国情怀
    2、电影宣传的比较早,电影还没拍的时候,整个宣传就跟上了;拍摄过程中,也是很多宣传,工作人员被文字咬伤、换角之类
    3、剧组、吴京确实也很努力,观众感受到久违的诚意了

    回复
  16. 感谢分享,就是有些地方莫名其妙就没有后文了,比如说作者去了解了下为什么广州评论量是第一……

    回复
    1. 冤枉啊冤枉,答案不就是下一段么。
      ——“因为在8月5日的广州路演,吴京首次回应,茅台不是植入。吉普车也不是植入。吴京说:“这次无论是茅台,还是北京吉普,都不是植入的。我就是想宣扬一下我们的国货,让中国制造在世界上横行无阻。”ps:这句话必须燃!哈哈。”

      回复
  17. 学习了

    回复
    1. 加油加油加油 ;-)

      回复
  18. 数据做得真好,学习~ps:豆瓣给的分真是低,怎么着也应该八分往上走吧~

    回复
    1. +1 :shock:

      回复
  19. 但是现在,豆瓣影评的参考性下降了很多,基本都是国产电影低分,日韩欧美高分,所以完全拿豆瓣影评做数据是没有太大的参考价值了

    回复
    1. 也是~豆瓣一向给分很低,目前影评剧评爬数据还是豆瓣居多的啦

      回复
  20. 女性观众和关注量占比这么高出乎我的意料,不知道这和微博女性用户量占比有多大关系,是否可认为女性受意见领袖的影响更大,更积极。微博大V的主动或被动传播,是否对上升到国家层面的文化响应,是否代表着文化传播市场已经有市场,关键在于电影制作是否用心精良。国家经济高度发展,政治主体稳固,文化影响在电影这块是否会开始发力。基于作者辛苦收集的数据,让我能深入思考很多东西。受益颇多

    回复
    1. 上升到国家层面的文化响应 :mrgreen: 爱国题材电影市场要开始被挖掘咯~

      回复
  21. 最后的词频,“有用”和“回应”是不是应该剔除 :!:

    回复
    1. 是的 :shock: 不完美1:样本数据不够多;不完美2:有些词可以剔除,小编下次会注意 :!:

      回复
  22. GooSeeker集搜客 吧~

    回复
    1. 小编哭晕在厕所,本文还有很多错别字 :evil:

      回复
  23. 有理有数据,赞你一个

    回复
    1. 谢谢,大家一起进步,一起加油

      回复
    2. 有空多介绍下数据分析工具,like 你哦

      回复
    3. 好的哦,我记下了,么么哒 :cool: ,对了楼下那个苏格兰折耳喵是数据鼻祖,有很多数据文章介绍,你可以搜一下哦

      回复
  24. 数据女神,赞!

    回复
    1. 不不不,上面技能全都是跟前辈您学的,您是数据鼻祖 :oops:

      回复