Python的模块urllib.parse对URL进行操作,例如解析或者创建URL。解析Parsing使用urlparse()函数解析URL,返回的是一个ParseResult对象。
执行:
函数urlsplit()和urlparse()功能类似,但是有一点点的不同,因为它不会解析路径中的参数,这样支持标准RFC2396。
执行:
查看输出,参数到了路径path上面,属性params没有了。urldefrag()函数去掉URL中的fragments。
执行:创建URLurljoin()根据当前URL,从相对路径(relative)构造新的URL。
执行:编码、解码URL参数当构造URL的参数时,需要编码特殊的字符,例如空格转换为加号,使用urlencode()函数,把一个字典转为URL格式字符串。
执行:使用doseq参数,把一个序列属性值在URL中分隔开。使用parse_qs()和parse_qsl()解码URL中的查询字符串(querystring),他们之间有什么不同请看下面的例子。
执行:parse_qs()转换为键值的字典,而parse_qsl()转换为一个键值元组的序列。quote()和quote_plus()为添加到URL的字符串进行转义,防止服务端解析URL时出现问题。
执行:quote_plus()函数要比quote()转义更多字符。unquote()函数和unquote_plus()反解析由quote()和quote_plus()编码的字符串。
执行:
领取专属 10元无门槛券
私享最新 技术干货