【Bmob+安卓项目开发】【鸿图社区软件开发计划】【图鉴篇】【非编码部分】
文章目录
在开始这个项目之前…
不BB了,直接进入正题吧。
一、获取数据
1. 准备爬取工具
首先你需要使用一个好的工具来爬取相关数据——八爪鱼采集器:下载链接
2. 选择目标网站
由于我们选择的实例为鸿图图鉴,那么这里我们将爬取鸿图之下图鉴的官网数据。我们的目标网址为:https://war.qq.com/a20200818web/generallist.shtml
我们在搜索框输入目标网址,点击识别。
3. 采集目标数据
采集的具体步骤这些就靠大家自己看八爪鱼的官网教程了:八爪鱼图文教程
由于八爪鱼爬取的都是代码中的数据,所以我们并不能直接爬取到像图片这样的数据,只能爬取到带格式的图片网址
如下图的黑框预览部分,我们可以知道我们需要的图片网址应该是 src= 后面用双引号括起来的数据,即预览中的http:/…II_169.png部分
在我们采集完所有数据之后,我们将数据导出为CSV文件
二、处理数据
我们导出的CSV文件可以直接用Excel打开。在Excel我们要对带格式的数据进行处理,这里我们将用到Excel里面的 =SUBSTITUTE(A1,B1,"") 函数,假设A1对应的表格内容是ABCD,B1对应的表格内容是C,那么我们放置该函数的表格内容就是ABD。下图为例:
最后我们下载Notepad++,将我们的CSV文件转换成UTF-8编码(就是UTF-8无BOM格式编码)。
三、上传数据
我们在任何一个表里面点击导入数据
然后点击浏览文件,选择我们之前完成的CSV文件
各列数据选择对应的数据类型,点击导入
抛开代码不谈,提前给大家看一看图鉴的最终效果吧。