易截截图软件、单文件、免安装、纯绿色、仅160KB

python urllib urllib2 httplib 访问url的问题

我想用python解析网页中的url 在下载之前, 我想先发一个head请求 不需要下载整个网页, 先获得该网站的head信息, 读取一些信息之后 在调用这些库的read方法来读取整个网页 该怎么操作呢 多谢
帮顶了

有人能指教一下么 多谢

e.g.,
...
try:
content = None
content = urllib.urlopen(_url).info()['Content-Type']
print "*"*10, content, _url, urllib.urlopen(_url).info()

stext = 'text/plain'

if content[0:len(stext)] == stext :
urllib.urlretrieve(_url, _dest)

except IOError:
return 0

...

urllib.urlopen(_url).info()是只临时提交一个head请求, 把页面头部down下来么??

也就是说 我在调用urlopen的时候 是down下来一部分网页信息还是把整个网页信息都down下来放到缓存中,然后再调用read将数据打印出来呢? 现在这里不理解urlopen的过程 请指教 多谢了

有人能指教一下么 多谢


如果用的是 urllib2.urlopen呢 是不是也是先down个头信息, 然后在 read的时候才开始再次连接网站开始down具体内容呢? 多谢


相关问答:

[提问]Python 如何忽略 whitespace 读入

像 C 的 scanf() 那样
比如读入 1 2 3 a b c
每次读入一个
下面这个应该是你想要的吧:
Python code:

>>> k = raw_input()
0 0123 ds dsl sd
>>> k
'0 0123 ds dsl sd'
>>> ......

python正则表达式 如何取出以下字符串 多谢

s='aaa111aaa,bbb222,333ccc,444ddd444,555eee666,fff777ggg'
用正则表达式取出 前后字母相同的数据 结果如下:
111 ddd
谢谢~
Python code:

import re
s='aaa111aaa,bbb222,333ccc,444ddd444,555eee666,ff ......

python怎么print 'hello world'

大家好,我是一个新手,刚开始学python,但是刚开始的helloworld都没法打印,让我很无奈。
我的python安装路径为f:\python31。在path中也设置对了,在windows下运行是这样显示的,希望各位前辈指点一下。谢谢
Pyth ......

python如何设置CLOSE_WAIT状态占用的端口重用

发现python2.6
import httplib
conn=httplib.HTTPSConnection('x.x.x.x')
conn.request('','')
rd=conn.getresponse()
conn.close()
这样结束后会变成CLOSE_WAIT状态,我 ......

python访问网页带cookie问题

我现在要用python访问一个网站的网页,取得一些信息
但是网站要求先登录,然后才能继续访问,登录过程就是写了个cookie
请问下python访问网页怎么保持住cookie呢?

我用的是python3.1,只有urllib和htt ......
© 2009 ej38.com All Rights Reserved. 关于E健网联系我们 | 站点地图 | 赣ICP备09004571号