26 篇文章 1.1m总阅读 9515订阅量 3608被赞
苏格兰折耳喵
社交媒体数据挖掘爱好者
数据分析

文本挖掘从小白到精通(二):料库和词向量空间

写笔者最近在梳理自己的文本挖掘知识结构,借助gensim、sklearn、keras等库的文档做了些扩充,会陆陆续续介绍文本向量化、tfidf、主题模型、word2vec,既会涉及理论,也...

苏格兰折耳喵
数据分析

文本挖掘从小白到精通(一):语料、向量空间和模型的概念

本文给大家介绍几个在使用gensim进行文本挖掘所需了解的基本概念和术语,并提供一些简单的用法示例。enjoy~ 笔者最近在梳理自己的文本挖掘知识结构,借助gensim、sklea...

苏格兰折耳喵
数据分析

干货| 如何利用Social Listening从在线垂直社区提炼有价值的信息?

在本文中,笔者将焦点集中在对互联网在线垂直社区的内容挖掘上,并且利用了多种数据挖掘方法和商业模型,以汽车之家的口碑数据挖掘为例,进一步对Social Listening的分...

苏格兰折耳喵
数据分析

数据挖掘实操|用文本挖掘剖析近5万首《全唐诗》

本文作者将使用多种文本挖掘方法,来分析《全唐诗》。篇幅略长,请耐心阅读^_^ 楔子 近些年来,弘扬中华传统文化的现象级综艺节目不断涌现,如《中国汉字听写大会》、...

苏格兰折耳喵
数据分析

以虎嗅网4W+文章的文本挖掘为例,展现数据分析的一整套流程

本文作者将结合自身经验,并以实际案例的形式进行呈现,涉及从数据采集、数据清洗、数据分析再到数据可视化的一整套流程分析,力求条理清晰的展现外部数据分析的强大威...

苏格兰折耳喵
数据分析

不会机器学习,你照样可以预测用户流失

即使不会高深莫测的机器学习,你照样可以利用统计学来预测用户流失。 什么是用户流失率?我们为什么需要关注用户流失率? 简单来说,用户流失率是指用户的流失数量与全...

苏格兰折耳喵
数据分析

干货|作为一个合格的“增长黑客”,你还得重视外部数据的分析!

在本文中,作者引出了“外部数据”这一概念,并实例分析,如何从海量的外部数据中获取可以对自身业务起到指导作用和借鉴意义的insight,并借助外部环境数据来优化自己。 ...

苏格兰折耳喵
数据分析

【干货】用大数据文本挖掘,来洞察“共享单车”的行业现状及走势

对于当下共享单车在互联网界的火热状况,笔者想从大数据文本挖掘的角度来做一番分析,主要是从海量的文本数据中找到有价值的讯息和观察视角,透过文本挖掘了解共享单车...

苏格兰折耳喵
数据分析

【干货】从社交媒体传播和文本挖掘角度解读《欢乐颂2》

作为数据分析爱好者,本文作者将想从数据的角度去解读《欢乐颂2》这部热播剧的方方面面,包括舆情传播、网络口碑、人物社交网络分析及,以及小说内容的文本分析。 5月1...

苏格兰折耳喵
创业学院

不懂数理和编程,如何运用免费的大数据工具获得行业洞察?

当我们想要创业却对市场行情不甚了解,该如何迅速了解市场行情,以便我们能更好的切入市场?本文作者介绍了一种零成本用大数据获悉市场行情的方法,对你想要了解市场行...

苏格兰折耳喵
产品运营

干货|如何利用Social Listening从社会化媒体中“提炼”有价值的信息?

在本文中,笔者将会介绍大数据分析主要的处对象—社会化媒体(Social Media),以及对社会化媒体进行分析的重要手段——社会化聆听(Social Listening)。最后,笔者...

苏格兰折耳喵
数据分析

以《大秦帝国之崛起》为例,来谈大数据舆情分析和文本挖掘

本文作者将以《大秦帝国之崛起》作为分析对象,来详细阐述在大数据时代数据分析会涉及到的全网舆情分析、微博传播分析以及文本挖掘。 今年开年,因饰演白起的演员王学...

苏格兰折耳喵