java 采集网页信息
想做一个采集网站信息的工具,就是采集网页的源代码,然后把订单信息分离出来。
获取网页源文件的代码我已经找到了,还有一个问题:
我要采集的网页是需要登录的,所以应该是需要在Frame中有一个类似浏览器的东西,登录进网页,然后定时刷新网页。
这个类似浏览器的东西怎么写呢?
谢谢
httpclient连吧
httpclient
麻烦稍微具体一点 我不是专业的java人
给你个地址自己看下http://www.javayou.com/diary/471
httpclient发送参数抓取网页
htmlparser来解析html中的节点
两者的用法网上搜下,具体不好展开
已经实现显示网页了 用的eclipse 的swt 但是不会刷新
你的意思是订单会实时刷新,而你要定期取得订单列表?
如果这样的话,你定期发送一次请求就可以了。
另外,需要登录跟浏览器没关系,在浏览器输入的参数可以预置在文件或者程序中。
有人做过类似的吗? 还是没头绪
相关问答:
我的开发的平台是Myeclipes6.0 + tomcat5.x + mysql
我所有的编码方式都是用的UTF-8
我只用了Strtus框架
在一个form中如下用的是post的提交方式:
<form class="form" action=&quo ......
我的java applet 嵌入html后无法显示,而用appletviewer显示正常为什么,还有就是用html converter转化后可以显示,为什么?请大侠赐教!
HTML code:
<HTML>
<HEAD>
<TITLE>TEST.HTML< ......
在安装Java编译器的Eclipse的时候,对环境变量进行了配置,在安装MySQl的时候也要对环境变量进行配置;那么后面的配置会影响前面的Eclipse的配置吗?
请大家多指教~!谢谢!
不会把,我这都装了的 我系统里 还装了 ......
import java.util.*;
class Tiger{}
public class P378 {
public static void main(String[] args) {
//为什么可以这么做
List<String> ls=new Test1().makeArrayList(new Tiger());
}
}
clas ......