网络爬虫返回json处理数据

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。它基于JavaScript(Standard ECMA-262 3rd Edition - December 1999)的一个子集。

JSON 表示名称 / 值对的方式

按照最简单的形式,可以用下面这样的 JSON 表示"名称 / 值对":

{ "name": "Brett", "lage":22,"sex": "女" } ,这表示了一个JsonObject。

[{name:"张三:",age:21,sex:"女"},{name:"李斯",age:21,sex:"女"},{name:"王五",age:21,sex:"女"}],使用中括弧表示JsonArray,是json对象数组。

一、解析第一种单个json对象的json数据。数据从网络上获取。演示实例为 查询手机号码归属地。

  1. URL url;
  2. StringBuffer sb = new StringBuffer();
  3. String line = null;
  4. try {
  5. url = new URL(
  6. "http://api.showji.com/Locating/default.aspx?m=13763089126&output=json&callback=querycallback");
  7. HttpURLConnection conn = (HttpURLConnection) url.openConnection();
  8. InputStream is = conn.getInputStream();
  9. BufferedReader buffer = new BufferedReader(
  10. new InputStreamReader(is));
  11. while ((line = buffer.readLine()) != null) {
  12. sb.append(line);
  13. }
  14. catch (MalformedURLException e) {
  15. e.printStackTrace();
  16. catch (IOException e) {
  17. e.printStackTrace();
  18. }
URL url;
StringBuffer sb = new StringBuffer();
String line = null;
try {
url = new URL(
"http://api.showji.com/Locating/default.aspx?m=13763089126&output=json&callback=querycallback");
HttpURLConnection conn = (HttpURLConnection) url.openConnection();
InputStream is = conn.getInputStream();
BufferedReader buffer = new BufferedReader(
new InputStreamReader(is));
while ((line = buffer.readLine()) != null) {
sb.append(line);
} } catch (MalformedURLException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}

此处获取的数据为:

querycallback({"Mobile":"13763******","QueryResult":"True","Province":"广东","City":"湛江","AreaCode":"0759","PostCode":"524000","Corp":"中国移动","Card":"GSM"});

需要截取这个json对象出来。

String js = sb.substring(sb.indexOf("{"), sb.indexOf("}") + 1);

下面函数解析json对象,返回一个Callerloc对象

Callerloc是一个实体类

  1. private Callerloc parse(String json) {
  2. Callerloc my = null;
  3. if (json == null || json.length() < )
  4. return null;
  5. try {
  6. my = new Callerloc();
  7. JSONObject jsonobj = new JSONObject(json);
private Callerloc parse(String json) {
Callerloc my = null; if (json == null || json.length() < 1)
return null;
try {
my = new Callerloc();
JSONObject jsonobj = new JSONObject(json);
  1. my.setQueryResult(jsonobj.getString("QueryResult"));
  2. my.setProvince(jsonobj.getString("Province"));
  3. my.setCity(jsonobj.getString("City"));
  4. my.setAreaCode(jsonobj.getString("AreaCode"));
  5. my.setPostCode(jsonobj.getString("PostCode"));
  6. my.setCard(jsonobj.getString("Card"));
  7. my.setCorp(jsonobj.getString("Corp"));
			my.setMobile(jsonobj.getString("Mobile"));
my.setQueryResult(jsonobj.getString("QueryResult"));
my.setProvince(jsonobj.getString("Province"));
my.setCity(jsonobj.getString("City"));
my.setAreaCode(jsonobj.getString("AreaCode"));
my.setPostCode(jsonobj.getString("PostCode"));
my.setCard(jsonobj.getString("Card"));
my.setCorp(jsonobj.getString("Corp"));
  1. } catch (JSONException e) {
  2. e.printStackTrace();
  3. }
  4. return my;
  5. }
		} catch (JSONException e) {
e.printStackTrace();
}
return my;
}

二、解析json数组

json数据为:[{name:"张三:",age:21,sex:"女"},{name:"李斯",age:21,sex:"女"},{name:"王五",age:21,sex:"女"}]

返回list

  1. private ArrayList<myjson> parsem(String json) {
  2. myjson my = null;
  3. if (json == null || json.length() < )
  4. return null;
  5. try {
  6. JSONArray jsonary = new JSONArray(json);
  7. ArrayList<myjson> objlist = new ArrayList<myjson>();
  8. for (int i = ; i < jsonary.length(); i++) {
  9. my = new myjson();
  10. JSONObject jsonobj = jsonary.getJSONObject(i);
  11. my.set_name(jsonobj.getString("name"));
  12. my.set_age(jsonobj.getInt("age"));
  13. my.set_sex(jsonobj.getString("sex"));
  14. objlist.add(my);
  15. }
  16. return objlist;
  17. catch (JSONException e) {
  18. e.printStackTrace();
  19. }
  20. return null;
  21. }
上一篇:Hadoop源码学习笔记(3) ——初览DataNode及学习线程


下一篇:Humble Numbers(丑数) 超详解!