开发Android网站客户端通常有两种方法:

第一种,通过服务端的开放平台,调用提供的API接口来开发,比如说淘宝开放平台,新浪微博之类的;
第二种,服务端没有提供任何接口,你也没有服务端任何数据库访问权限,就是一个纯纯粹粹的网站,要你做客户端。今天,我要和大家分享的正是第二种情况。
首先需要准备一个工具:httpWatch.这是一个网页数据分析工具.可以查看到你发送/接受的数据.特别是post提交的数据,在某些需要登录的网页中尤为重要.
附件下载 

 

这个软件是以插件的形式存在于IE中的,支持IE6-9,使用的时候像这样就可以了.

spacer.gif
点击录制,然后在浏览器输入地址打开.就可以看到数据哦.以百度为例
spacer.gif
可以看到百度的首页其实包含了很多链接.有图片的,css样式的,当然我们最关心的还是那个目标地址为get请求.
在这个请求的"内容"标签里面可以看到网页返回的html数据.里面包含了各个链接的地址.如何解析出来呢?
当然你可以用xml的解析方法.但是这个html的标签实在太多了...不管用xml的哪种解析方式都是折腾人.还好我们有一个专门解析html的工具jsoup.
jsoup 是一款Java HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOMCSS以及类似于jQuery的操作方法来取出和操作数据.android使用的时候,导入这个jar包就可以了.
附件下载 
下面来一个解析示例,是我代码里面的一部分.

01

02

03

04

05

06

07

08

09

10

11

12

13

14

15

16

17

18

19

publicvoidhandResponse(MyHttpResponse myHttpResponse) {

        Document doc;

        if(myHttpResponse.getPipIndex() == NetConstant.HOMEPAGE) {

            doc = myHttpResponse.getData();

            Elements hidden_inputs = doc.select("input[type=hidden]");

            for(Element ele : hidden_inputs) {

                String[] arr =newString[] {

                        ele.attr("name"), ele.attr("value")

                };

                Globe.sHideParams.add(arr);

            }

            hidden_inputs = doc.select("input[type=submit]");

            Globe.sHideParams.add(newString[] {

                    hidden_inputs.get(0).attr("name"), hidden_inputs.get(0).attr("value")

            });

            System.out.println("获取首页信息成功");

            // System.out.println(doc);

        }

    }

 

Elements hidden_inputs = doc.select("input[type=hidden]"); 这是关键的一句,是从这个html字符串转化来的doc文件中,查找所有type属性等于hiddeninput标签.
doc.select后面放的是css选择器.我也不会用,不过用着用着就熟练了~~~比如查找所有的超链接就是.select("a[href]");
至于找到以后的Elements相关方法更是丰富,具体可以看看这个API:
找到了之后就简单了对吧,点击按钮,发送请求,然后解析数据,获得下一批链接地址.
关于cookie的应用:(可能是我第一次用这个,又或者是我试验的网站比较简单,所以可能有不完善的地方)
cookie可以理解为一些信息,你每次请求数据的时候都会用,但是当你做登陆之类的操作时,如果你登陆成功了,服务器会保存记录你登陆成功时用的cookie.下次你访问的时候就可以选择了.如果在请求的header里面附上这个cookie,服务器就认为你登陆了.那么你请求一些需要登陆才能查看的信息时,就不会提示你登陆了.
获取cookie的代码:

01

02

03

04

05

06

07

08

09

10

if(req.getPipIndex() == NetConstant.LOGIN) {

                                        CookieStore store = client.getCookieStore();

                                        List<Cookie> cookies = store.getCookies();

                                        if(cookies.isEmpty()) {

                                        }else{

                                            mCookie = cookies.get(0);

                                            mCookieString = mCookie.getName() +"="

                                                    + mCookie.getValue();

                                        }

                                    }

 

将这个cookie保存起来待用.
附加cookie的代码:
post.setHeader("Cookie", Globe.sCookieString);