python 匹配url正则表达式
我现在有一个这样的字符串str1="http://hi.baidu.com/rubylang/blog/item/1661ad50d600c46784352445.html#/html/body/table[1]/tr/td"
怎么写一个表达式来匹配它,需要python语言,并且能够把
http://hi.baidu.com/rubylang/blog/item/1661ad50d600c46784352445.html,跟/html/body/table[1]/tr/td提取出来,
放到两个变量里,url地址不一定就上面那个,可以是其他的url地址,后面的也不一定只是一个table,或者一个也没有,
也可能有很多个
就是要匹配
str2="url地址#/html/.../.../"这样的情况,麻烦各位大侠帮忙,急用,thx
既然这样,何必非要用正则。用# split就可以了。
因为我要先判断字符串 里面是不是有url地址,如果没有的话就不需要上面的做法了,有的话才需要按照上面的来做,因为刚学,我也不清楚split怎么用,麻烦详细解释一下,最好有代码,thx
Python code:
str = "http://hi.baidu.com/rubylang/blog/item/1661ad50d600c46784352445.html#/html/body/table[1]/tr/td"
m = str.split('#')
print m
不知是不是你想要的。
or
>>> from urlparse import urlsplit
>>> s='http://hi.baidu.com/rubylang/blog/item/1661ad50d600c46784352445.html#/html/body/table[1]/tr/td'
>>> urlsplit(s)
SplitResult(scheme='http', netloc='hi.baidu
相关问答:
python和pyqt以及Eric4都已经配置好了,打开Eric4写个python程序比如简单的
print“hello,world”,怎么编译运行了,Start菜单的所有命令都出现和图中差不多的对话框,应当怎么运行了?
求大家指教
没有人用 ......
像 C 的 scanf() 那样
比如读入 1 2 3 a b c
每次读入一个
下面这个应该是你想要的吧:
Python code:
>>> k = raw_input()
0 0123 ds dsl sd
>>> k
'0 0123 ds dsl sd'
>>> ......
发现python2.6
import httplib
conn=httplib.HTTPSConnection('x.x.x.x')
conn.request('','')
rd=conn.getresponse()
conn.close()
这样结束后会变成CLOSE_WAIT状态,我 ......
在文本文件中匹配项包含中文
如内容为:gamename=中文
key=天下
文本文件的编码的文件为utf-8
python代码如下:
# -*- coding:UTF-8 -*-
contents=open(from_pa ......
我想用python解析网页中的url 在下载之前, 我想先发一个head请求 不需要下载整个网页, 先获得该网站的head信息, 读取一些信息之后 在调用这些库的read方法来读取整个网页 该怎么操作呢 多谢
帮顶了
有人能指教一 ......