数据分析-采集

PM的主修课程之一就是数据分析,没有经过分析做出来的产品很难取得成功,分析是在用户市场上做的一项统计,以了解用户的关注点、使用习惯等一系列的过程。

既提到数据分析,则需要有数据才行,数据的获取途径很多,可通过共享网盘、数据市场、qq群文件、网页复制、网页采集软件、python爬虫等多种方式获取到。

本文为大家介绍适合初学者并且有比较高效率的方式-网页采集软件(八爪鱼)
八爪鱼目前仅支持windows平台,使用其他平台的小伙伴只能切换下平台了,这点八抓鱼做的不太好,话说采集数据在linux服务器上采集效率不是更高?或许八抓鱼公司可能有云端版本的商业利益上的考虑,话不多说,我们一起来看下如何进行采集。

第一步,点此访问官网下载软件

八抓鱼官网下载页面

第二步,注册八抓鱼账号

该账号用于同步采集配置、换取积分、充值管理等
八抓鱼账号注册

第三步,启动登录软件

输入注册时填写的登录名和密码进行登录,登录后加载介绍页以帮助使用
login

第四步,登录到主界面

main

第五步,开始采集

八抓鱼采集数据提供两种采集手段,一种适合新手快速上手的“向导模式”,另一种适合熟练后采集的“高级模式”
还未用过这个软件的朋友我们先选择“向导模式”,具体操作步骤请移步至《采集单个网页教程》
以上是通过软件采集数据的入门教程,如需采集更复杂的数据结构信息,请访问八抓鱼官方帮助页面,那里有更详细的各规则的介绍
点此进入

第六步,数据导出

采集完成的数据我们要导出到excel或数据库进行存储以便后续处理和使用
点此查看

经过以上的操作我们就把相应网页的数据通过采集软件采集下来并存储在excel文件或数据库中以便数据处理之用。

下一节我们来聊聊通过excel的各种公式进行数据的清洗工作,敬请期待。