开发Android网站客户端通常有两种方法:第一种,通过服务端的开放平台,调用提供的API接口来开发,比如说淘宝开放平台,新浪微博之类的;第二种,服务端没有提供任何接口,你也没有服务端任何数据库访问权限,就是一个纯纯粹粹的网站,要你做客户端。今天,我要和大家分享的正是第二种情况。首先需要准备一个工具:httpWatch.这是一个网页数据分析工具.可以查看到你发送/接受的数据.特别是post提交的数据,在某些需要登录的网页中尤为重要.附件下载
这个软件是以插件的形式存在于IE中的,支持IE6-9,使用的时候像这样就可以了.点击录制,然后在浏览器输入地址打开.就可以看到数据哦.以百度为例可以看到百度的首页其实包含了很多链接.有图片的,有css样式的,当然我们最关心的还是那个目标地址为的get请求.在这个请求的"内容"标签里面可以看到网页返回的html数据.里面包含了各个链接的地址.如何解析出来呢?当然你可以用xml的解析方法.但是这个html的标签实在太多了...不管用xml的哪种解析方式都是折腾人.还好我们有一个专门解析html的工具jsoup.jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据.android使用的时候,导入这个jar包就可以了.附件下载 下面来一个解析示例,是我代码里面的一部分.
01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 | publicvoidhandResponse(MyHttpResponse myHttpResponse) { Document doc; if(myHttpResponse.getPipIndex() == NetConstant.HOMEPAGE) { doc = myHttpResponse.getData(); Elements hidden_inputs = doc.select("input[type=hidden]"); for(Element ele : hidden_inputs) { String[] arr =newString[] { ele.attr("name"), ele.attr("value") }; Globe.sHideParams.add(arr); } hidden_inputs = doc.select("input[type=submit]"); Globe.sHideParams.add(newString[] { hidden_inputs.get(0).attr("name"), hidden_inputs.get(0).attr("value") }); System.out.println("获取首页信息成功"); // System.out.println(doc); } }
|
Elements hidden_inputs = doc.select("input[type=hidden]"); 这是关键的一句,是从这个html字符串转化来的doc文件中,查找所有type属性等于hidden的input标签.doc.select后面放的是css选择器.我也不会用,不过用着用着就熟练了~~~比如查找所有的超链接就是.select("a[href]");至于找到以后的Elements相关方法更是丰富,具体可以看看这个API:找到了之后就简单了对吧,点击按钮,发送请求,然后解析数据,获得下一批链接地址.关于cookie的应用:(可能是我第一次用这个,又或者是我试验的网站比较简单,所以可能有不完善的地方)cookie可以理解为一些信息,你每次请求数据的时候都会用,但是当你做登陆之类的操作时,如果你登陆成功了,服务器会保存记录你登陆成功时用的cookie.下次你访问的时候就可以选择了.如果在请求的header里面附上这个cookie,服务器就认为你登陆了.那么你请求一些需要登陆才能查看的信息时,就不会提示你登陆了.获取cookie的代码:
01 02 03 04 05 06 07 08 09 10 | if(req.getPipIndex() == NetConstant.LOGIN) { CookieStore store = client.getCookieStore(); List<Cookie> cookies = store.getCookies(); if(cookies.isEmpty()) { }else{ mCookie = cookies.get(0); mCookieString = mCookie.getName() +"=" + mCookie.getValue(); } }
|
将这个cookie保存起来待用.附加cookie的代码:post.setHeader("Cookie", Globe.sCookieString);