python urllib urllib2 httplib 访问url的问题
我想用python解析网页中的url 在下载之前, 我想先发一个head请求 不需要下载整个网页, 先获得该网站的head信息, 读取一些信息之后 在调用这些库的read方法来读取整个网页 该怎么操作呢 多谢
帮顶了
有人能指教一下么 多谢
e.g.,
...
try:
content = None
content = urllib.urlopen(_url).info()['Content-Type']
print "*"*10, content, _url, urllib.urlopen(_url).info()
stext = 'text/plain'
if content[0:len(stext)] == stext :
urllib.urlretrieve(_url, _dest)
except IOError:
return 0
...
urllib.urlopen(_url).info()是只临时提交一个head请求, 把页面头部down下来么??
也就是说 我在调用urlopen的时候 是down下来一部分网页信息还是把整个网页信息都down下来放到缓存中,然后再调用read将数据打印出来呢? 现在这里不理解urlopen的过程 请指教 多谢了
有人能指教一下么 多谢
如果用的是 urllib2.urlopen呢 是不是也是先down个头信息, 然后在 read的时候才开始再次连接网站开始down具体内容呢? 多谢
相关问答:
像 C 的 scanf() 那样
比如读入 1 2 3 a b c
每次读入一个
下面这个应该是你想要的吧:
Python code:
>>> k = raw_input()
0 0123 ds dsl sd
>>> k
'0 0123 ds dsl sd'
>>> ......
s='aaa111aaa,bbb222,333ccc,444ddd444,555eee666,fff777ggg'
用正则表达式取出 前后字母相同的数据 结果如下:
111 ddd
谢谢~
Python code:
import re
s='aaa111aaa,bbb222,333ccc,444ddd444,555eee666,ff ......
大家好,我是一个新手,刚开始学python,但是刚开始的helloworld都没法打印,让我很无奈。
我的python安装路径为f:\python31。在path中也设置对了,在windows下运行是这样显示的,希望各位前辈指点一下。谢谢
Pyth ......
发现python2.6
import httplib
conn=httplib.HTTPSConnection('x.x.x.x')
conn.request('','')
rd=conn.getresponse()
conn.close()
这样结束后会变成CLOSE_WAIT状态,我 ......
我现在要用python访问一个网站的网页,取得一些信息
但是网站要求先登录,然后才能继续访问,登录过程就是写了个cookie
请问下python访问网页怎么保持住cookie呢?
我用的是python3.1,只有urllib和htt ......